جمعه ۲۵ آبان ۱۴۰۳ |  عضویت / ورود

چگونه بفهمیم یک کلمه در یک سایت کلمه کلیدی است؟ (معرفی الگوریتم «فراوانی وزنی»)


در مطلب قبل (یعنی الگوریتمِ پیدا کردن مطالب مرتبط با یک مقاله از بین صدها مقاله) در بخشی از مطلب به این موضوع اشاره کردم که برای اینکه ما مطالب مرتبط با یک مطلب را از دیتابیس پیدا کنیم، نیاز داریم که کلمات کلیدی مطلب فعلی را به دست آوریم و اشاره کردم که برای این کار نیاز به دیتابیسی داریم به نام Go List و گفتم که چنین دیتابیسی فعلاً برای رشته کامپیوتر وجود ندارد. اما بعد از آن مطلب، دنبال راه حلی گشتم که بشود بدون داشتن هر نوع دیتابیسی (حتی اگر دیتابیس Stop Words یا کلمات بازدارنده مثل «از» و «به» و ...) را نداشته باشیم، بتوانیم کلمات کلیدی را از داخل یک متن استخراج کنیم. دقت کنید که اگر حتی دیتابیس Go List موجود می‌بود، ممکن بود کلماتی که در آن دیتابیس است برای یک سایت خاص کلمه کلیدی به حساب نیاید. به طور مثال فرض کنید دیتابیس کلمات کلیدی بگوید که کلمه &laqu... (ادامه)

الگوریتمِ پیدا کردن مطالب مرتبط با یک مقاله از بین صدها مقاله


همانطور که در مطلب «لیستی از کلمات بازدارنده در زبان فارسی - Stop Words in Persian» گفته بودم، می‌خواهم بخشی از یکی از درس‌های جالب دانشجویان رشته کامپیوتر (در دانشگاه علمی-کاربردی، رشته فناوری، مقطع کارشناسی) به نام «نمایه‌سازی» را اینجا توضیح دهم. نمایه‌سازی همان کلمه Indexing است که موتورهای جستجو مانند گوگل از آن برای یافتن صفحات مرتبط با عبارتی که جستجو کرده‌اید از بین ۶۰ تریلیون صفحه روی اینترنت، استفاده می‌کنند. (شما وقتی یک عبارت را روی هارد خود جستجو می‌کنید می‌بینید حداقل چند ثانیه و گاهی چند دقیقه طول می‌کشد که بگوید این عبارت روی هاردی که در نیم‌متری شما است وجود دارد یا خیر. اما فقط کافی‌ست یک کلمه را در گوگل جستجو کنید تا میلیون‌ها نتیجه را در کمتر از نیم‌ثانیه به شما نشان دهد! این عظمت ... (ادامه)

نام روزهای انگلیسی به چه معناست و از کجا آمده؟


احتمالاً می‌دانید که این ترم، من یک دانشجوی «ترم اولی»(!) در رشته کارشناسی «مترجمی زبان انگلیسی» به حساب می‌آیم. (در دانشگاه پیام نور قبول شدم) (احتمالاً از این پس مطالب سایت کمی رنگ و بوی انگلیسی به خود بگیرد! شما که بیشتر مطالب کامپیوتری را می‌پسندید دعا کنید که امسال دکترای سیستم‌های نرم افزاری قبول شوم تا به آن بهانه مطالب ناب و سطح بالاتر کامپیوتری آماده کنم) چون ۸ صبح تا ۸ شب خودم به عنوان مدرس کلاس دارم، طبیعتاً نمی‌توانم در کلاس‌ها حاضر باشم. بنابراین در یک حرکت ابتکاری از یکی از دانشجویان عزیز که این ترم با من کارآموزی دارد خواستم که به جای من در کلاس‌ها حاضر شود و یادداشت‌برداری کند و صدا را هم ضبط کند و به من برساند تا در اوقات بیکاری پیگیر درس‌ها باشم. تعطیلی تاسوعا و عاشورا فرصت خوبی را فراهم کرد که مروری داشته باشم بر درس‌ها و مشق‌هایم را بنویسم! در درس «خواندن و درک مفاهی... (ادامه)

ابوالفضل درست است یا اباالفضل؟


اکنون که می‌نویسم عصر تاسوعای ۹۳ است. در اخبار شبکه اول سیما دیدم که یک کلیپ برای پشت سر مجری ساخته‌اند که روی آن نوشته شده «یا ابوالفضل العباس»!!! تعجب کردم! گفتم این را اینجا بگویم، نکند کسی باشد که از این سوتی‌ها در کارهای کامپیوتری‌اش بدهد! گاهی فکر می‌کنم چقدر کوته‌فکر است کسی که فکر می‌کند عربی را باید فقط کسانی یاد بگیرند که در رشته‌های دینی تحصیل می‌کنند!! در حالی که شاید نیمی از کلمات و جملاتی که ما در فارسی به کار می‌بریم این روزها از زبان عربی وارد شده. دوست عزیز، می‌بینی که تو اگر حتی میکس و مونتاژ فیلم هم انجام می‌دهی باید به اندازه کافی به عربی مسلط باشی. هر چند در دبیرستان به اندازه کافی عربی به ما و شما گفته‌اند اما اگر شما نداشتی یا سهل انگاری کردی و یاد نگرفتی، می‌توانی کتاب «صرف ساده» را بگیری و مطالعه کنی... برویم سر اصل مطلب: ابوالفضل درست است یا اباالفضل؟ ببینید،... (ادامه)

لیستی از کلمات بازدارنده در زبان فارسی - Stop Words in Persian


کلمات بازدارنده یا Stop Words یا Stop List به کلماتی گفته می‌شود که در اکثر متون یافت می‌شوند و جزء کلمات کلیدی به حساب نمی‌آیند. حروف اضافه (مانند «به»، «از» و ...) و حروف ربط (مانند «که»، «پس» و ...) و ضمایر (مانند «من»، ««او» و...) جزء این لیست خواهند بود. کلمات بازدارنده برای برنامه‌نویسان جهت تحلیل کوئری‌های جستجو و حذف کلمات اضافه بسیارمهم هستند. (در مورد محل و روش استفاده، در مطالب بعد صحبت خواهم کرد) در جستجوهای من متأسفانه یک دیتابیس خوب و کامل از این کلمات پیدا نشد. ای کاش شورای عالی انفورماتیک و سازمان‌های مربوطه یک دیتابیس تأیید شده و رسمی ارائه کنند. به هر حال، لیست زیر از این PDF با عنوان A List of Farsi StopWords که ظاهراً یک مقاله چاپ شده در مجلات است استخراج شده و... (ادامه)

برای تو آفتابگردانی عزیز...


شاید این پست بهتر می‌بود در وبلاگم منتشر شود اما خوب، ترجیح دادم همه (به خصوص دانشجویان خودم) بخوانند... امروز در چند کلاس، صحبت از آفتابگردان شد و گشتی در سایت زدیم و من هر بار نگاهی به کارهای مختلفی که انجام داده‌ایم و کاربرانی که امروز (مانند هر روز دیگر) به سایت سر زده‌اند انداختم. شاید شما با دیدن آن لیست، جز نام کاربری خودتان یا یکی دو تای دیگر، هیچ کدام را نشناسید اما اجازه دهید من به عنوان کسی که  اکثرشان را می‌شناسم و با هر کدامشان که شاید حتی در دورترین نقطه از این کشور باشند کار کرده‌ام، به شما چیزهایی بگویم: یکی از چیزهایی که من اگر صبح تا شب بابت آن شکرگزار خدا باشم قطعاً کم است، این است که الحمد لله برترین‌های هر کلاسی که داشته‌ام و یا بسیاری از برترین‌های هر شهر یعنی آن‌ها که اگر من برخی‌شان را معرفی کنم و از استعدادها... (ادامه)

اسپم چیست؟ چرا ایمیل ما اسپمی می‌شود؟ +راه‌های جلوگیری از Spam


اگر شما یک ایمیل داشته باشید، که به احتمال زیاد دارید، خیلی بعید است که بمباران Spamها نشده باشید. Spam چیست؟ به طور خلاصه، Spam نام یک نوع کنسرو بوده است که در زمان جنگ جهانی، در جبهه‌ها غذای هر روز سربازان بوده است! (مانند کنسرو لوبیا که در سربازی غذای همیشگی سربازهاست!) آنقدر Spam به خورد سربازهای بیچاره می‌دادند که هر وقت اسم Spam می‌آمد از آن به عنوان «یک چیز زیاد و ناخواسته» یاد می‌کردند. به مرور به ایمیل‌های تبلیغاتی که انصافاً این روزها اعصاب انسان را خرد می‌کند، Spam گفته شد. (گاهی نیز کلمه Bulk به معنی دسته‌ای و گروهی به این نوع ایمیل‌ها اطلاق می‌شود) گاهی مثلاً می‌بینم امروز ۵۰ ایمیل تبلیغاتی رسیده. همه را انتخاب می‌کنم و روی دکمه Delete کلیک می‌کنم، بعد، می‌بینم که در همین لحظه دو تا اسپم جدید رسید!!!! یعنی امان نداد یک لحظه پوشه Spam من خالی باشد!! Spammer کیست؟ به کسی ... (ادامه)

مجموع خبرها 1776 (254 صفحه | درهر صفحه 7)
[ 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 |

برای اینکه برنامه‌نویس و طراح وب حرفه‌ای شوید:

۱

آموزش HTML5 و CSS3 و SEO و CPanel

خریــد

۲

آموزش الگوریتم و مبانی برنامه‌نویسی به زبان C++‎

خریــد

۳

آموزش زبان جاوا اسکریپت (JavaScript)

خریــد

۴

آموزش وردپرس (WordPress)

خریــد

۵

آموزش طراحی وب پیشرفته با PHP & MySQL (طراحی پرتال)

خریــد

۶

آموزش فتوشاپ مقدماتی

خریــد

۷

آموزش فتوشاپ پیشرفته

خریــد

۸

آموزش مبانی تجارت الکترونیک

خریــد

۹

آشنایی تخصصی‌تر با فونت در وب و گرافیک

خریــد

برای اینکه یک شبکه‌کار حرفه‌ای شوید:

۱۰

آموزش نتورک پلاس (مبانی کاربردی شبکه)

خریــد

۱۱

آموزش مدیریت حرفه‌ای شبکه‌های مایکروسافتی (MCITP)

خریــد

آدرس فید (RSS) آفتابگردان:
http://feed.aftab.cc/Aftabgardan-cc

RSS چیست و چه كاربردی دارد؟

‎با وارد کردن ایمیل خود در کادر زیر می‌توانید اخبار ارسالی در سایت را در ایمیل خود دریافت و مطالعه کنید:


موضوعات  پاسخها نویسنده بازدید آخرین ارسال
 پیشنهادات شما 59 Hamid 598 alimot 
 ایجاد بارگزار مجدد PDF 4 manager 40 misagh20 
 مشکل در اتصال به بانک تستا و نمرا 2 h.shafiee 15 h.shafiee 
 مشکلات و سؤالات مربوط به آپدیت‌های جدید را اینجا مطرح کنید 386 Hamid 5516 Hamid 
 حضور و غیاب در محیط کاربری مدرس 5 mk01 112 Hamid 
 موتور جستجو یـــوز جانشین گوگل خواهد شد! 42 mahnazSALAS 38303 SaeidF 
 مشکل در ساعت آزمون گیر ( جلوبودن) 5 m_dastjerdi2002 23 Hamid 
 آپدیت‌های Testa و تغییرات در هر آپدیت (از اینجا تستا را آپدیت نمایید...) 27 Hamid 7714 Hamid 
 مشکل در شماره سوالات در آزمون تشریحی 1 m_dastjerdi2002 15 Hamid 
 آپدیت‌های نمرا ۳ 11 Hamid 1342 Hamid 
 بارگذاری سوالات از فایل ورد (word) به تستا همراه با لینک عکس ها 4 ariakhodro 91 misagh20 
 صفحه سفید هنگام نصب 6 hfkatebin 28 hfkatebin 
 عدم نمایش کد «کبچا» 1 hfkatebin 8 hfkatebin 
 کپی کردن آزمون ها 7 heedaal 76 MILWORM 
 گزارش گيري در تستا 3 1 hfkatebin 16 Hamid 
موضوعات:6135 | ارسالها: 32921 | بازدیدها: 52159054 | پاسخها: 26779 | کاربران:  21068
[ تالار گفتمان ]   [ 50 پست آخر انجمن‌ها ]   [ جستجو ]