درس: سازماندهی ذخیره و بازیابی اطلاعات در اینترنت. ویژگی های استفاده از اینترنت در جستجوی اطلاعات برای فعالیت های آموزشی دانش آموز. رتبه بندی نتایج جستجو

مشکل جستجو در شبکه جهانی وب این نیست که اطلاعات کمی وجود دارد، بلکه این است که تعداد زیادی از آنها وجود دارد. جستجوی اطلاعات در اینترنت سنگ بنای وبگردی موثر است. برخورداری از مهارت های جستجو باعث می شود که اینترنت چه در زمان کار و چه در اوقات فراغت برای کاربر مفید باشد.
برای سازماندهی جستجو در اینترنت، خدمات تخصصی به نام موتورهای جستجو وجود دارد.

موتورهای جستجو.

موتورهای جستجو یک مجموعه نرم افزاری و سخت افزاری با رابط وب هستند که امکان جستجوی اطلاعات در اینترنت را فراهم می کند.
اکثریت موتورهای جستجوبه دنبال اطلاعات در وب سایت های جهانی باشید، اما سیستم هایی نیز وجود دارند که می توانند فایل ها را در سرورهای FTP، اقلام موجود در فروشگاه های آنلاین و اطلاعات گروه های خبری Usenet را جستجو کنند. برای جستجوی اطلاعات با استفاده از موتور جستجو، کاربر یک عبارت جستجو را فرموله می کند. به درخواست کاربر، موتور جستجو صفحه ای از نتایج جستجو را ایجاد می کند. چنین نتایج جستجو ممکن است ترکیب شوند انواع متفاوتفایل هایی مانند صفحات وب، تصاویر، فایل های صوتی. برخی از موتورهای جستجو نیز داده ها را از پایگاه های داده و فهرست منابع موجود در اینترنت می کشند.
هدف یک موتور جستجو یافتن اسنادی است که حاوی کلمات کلیدی یا کلمات مرتبط با کلمات کلیدی هستند. موتور جستجو بهتر است، هر چه اسناد مربوط به درخواست کاربر بیشتر باشد، باز خواهد گشت. نتایج جستجو به دلیل ویژگی‌های الگوریتم‌ها می‌تواند بدتر شود. به عنوان مثال، برای درخواست حیوانات خانگی، سرور جستجوی Yandex (در زیر بیشتر در مورد آن را ببینید) بیش از 14000000 پیوند به صفحات حاوی اطلاعاتی که فکر می کند به آن نیاز دارد ارائه می دهد. با این حال، همه چیز چندان هموار نیست: هنگام بازدید از برخی از صفحات یافت شده، معلوم می شود که اطلاعاتی که آنها به دنبال آن هستند کافی نیست، یا حتی اصلاً وجود ندارد.
برای جستجو با حداکثر کارایی، باید بدانید موتورهای جستجو چگونه کار می کنند و درخواست جستجوی اطلاعات را به درستی تنظیم کنید.

اصول موتور جستجو

موتورهای جستجو با ذخیره اطلاعات بسیاری از صفحات وب که از صفحات HTML دریافت می کنند، کار می کنند. اجزای اصلی موتور جستجو: ربات جستجوگر، نمایه ساز، موتور جستجو. سیستم ها معمولاً به صورت مرحله ای کار می کنند. ابتدا خزنده محتوا را دریافت می کند، سپس محتوای وب سایت ها را می خزد. تنها در این صورت است که نمایه ساز یک نمایه قابل جستجو ایجاد می کند. نمایه ساز ماژولی است که یک صفحه را پس از تقسیم آن به بخش ها با استفاده از الگوریتم های واژگانی و مورفولوژیکی خود تجزیه و تحلیل می کند.
کار اکثر موتورهای جستجوی مدرن مبتنی بر نمایه استنادی است که توسط نمایه ساز در نتیجه تجزیه و تحلیل پیوندهای صفحه فعلی از سایر صفحات اینترنتی محاسبه می شود. هر چه تعداد آنها بیشتر باشد، هرچه شاخص استناد صفحه تجزیه و تحلیل شده بالاتر باشد، این صفحه در نتایج جستجو بالاتر نمایش داده می شود و صفحه بالاتر در فهرست منابع یافت شده ارائه می شود.

قوانین ساخت پرس و جوهای جستجو

همانطور که قبلا ذکر شد، موتورهای جستجوی زیادی در اینترنت وجود دارد، داخلی و خارجی.
سرورهای جستجوی روسی: Yandex (www.yandex.ru)؛ Rambler (www.rambler.ru)؛ آپورت (www.aport.ru) و گوگو (www.gogo.ru).

سرورهای جستجوی خارجی: Google ( www.google.com) Altavista (www.altavista.com) و Yahoo! (www.yahoo.com).
سرورهای روسی برای جستجو به زبان روسی مناسب‌تر هستند، سرورهای خارجی برای جستجو به زبان خارجی مناسب‌تر هستند، اگرچه گوگل در جستجوی بسیاری از زبان‌ها به خوبی کار می‌کند. علیرغم ادعای بسیاری از صاحبان موتورهای جستجو مبنی بر اینکه پرس و جوها را می توان تقریباً به زبانی که افراد برای برقراری ارتباط با یکدیگر استفاده می کنند، نوشت، این موضوع چندان درست نیست. به لطف معرفی فن آوری های زبان جدید، موتورهای جستجو در درک کاربر بسیار بهتر شده اند. اکنون موتورهای جستجو نه تنها به دنبال کلمه درخواستی، بلکه به دنبال فرم های کلمه آن هستند که به شما امکان می دهد نتایج جستجو را دقیق تر کنید. به عنوان مثال، اگر عبارت جستجو حاوی کلمه smart باشد، نتایج آن نه تنها حاوی این کلمه، بلکه مشتقات آن نیز خواهد بود: هوشمند، هوشمند، و همچنین ذهن و حتی ذهن. طبیعتاً صفحاتی با فرم های کلمه در اولین نتایج جستجو قرار نخواهند داشت، بلکه عناصری هستند هوش مصنوعیروی صورت در نظر گرفتن این واقعیت هنگام ساخت مفید است پرس و جوهای جستجو.
لازم به یادآوری است که موتورهای جستجو هنگام پردازش یک درخواست، مورد کاراکترها را در نظر نمی گیرند و اصلاً لازم نیست از علائم نگارشی در جستارهای جستجو استفاده شود، زیرا سرورهای جستجو نیز از آنها چشم پوشی می کنند. با این حال، هنگام ساخت پرس و جوهای پیشرفته پیچیده، که نتایج جستجو برای آنها معمولاً به آنچه انتظار دارید بسیار نزدیکتر است، از علائم نگارشی سنتی استفاده می شود. اکثر موتورهای جستجو می توانند با اشتباهات املایی مقابله کنند. اگر به نظر سرور جستجوگر اشتباه یا غلط املایی در کلمه وجود دارد، با همان عبارت هشدار می دهد: شاید شما به دنبال ....

کلمات برای پرس و جو از سرور جستجو

یک تعبیری وجود دارد که «ماشین باید کار کند، مرد باید فکر کند» و دقیقاً در مورد چنین وضعیتی گفته می شود. وظیفه کاربر هنگام کامپایل یک عبارت جستجو برجسته کردن کلمات کلیدی است، وظیفه سرور جستجو این است که درخواست وارد شده را به بهترین شکل ممکن پردازش کند. مثالی را در نظر بگیرید که نشان می دهد اشتباهات معمولیکاربران مبتدی هنگام جستجو در اینترنت به درخواست "اسرار در مورد آلات موسیقیموتور جستجو هیچ نتیجه مفیدی نداشت. سپس کاربر تصمیم می گیرد درخواست را با تکمیل آن و نوشتن آن تصحیح کند: "معماهایی برای کودکان در مورد آلات موسیقی" - نتایج جستجو حتی بدتر از قبلی بود. برای این مثال تصمیم بدی نیستجستجو برای کلمه کلیدی "معماها" بود. از این قبیل سایت ها در اینترنت زیاد هستند و با مراجعه به خود سایت و کمی جستجو در بخش های آن می توان به اطلاعات مورد علاقه خود دست یافت. ما چندین قانون برای کامپایل پرس و جو تدوین می کنیم:

  • فقط مهم ترین کلمات کلیدی مرتبط با موضوع مورد بررسی را انتخاب کنید.
  • کلمات نباید زیاد باشد، اما خیلی کم نباشد.
  • در صورت عدم رضایت از نتایج جستجو، از شرایط "نرم" بیشتری برای پرس و جو استفاده کنید یا در موتور جستجوی دیگری جستجو کنید، زیرا مکانیسم های موتور جستجو یکسان نیست، بنابراین، نتایج نیز ممکن است متفاوت باشد.

جستجوی پیشرفته

برای ارائه جستجوی کارآمدتر در اینترنت، موتورهای جستجو امکان جستجوی پیشرفته و همچنین جستجو با استفاده از زبان پرس و جو را فراهم می کنند. جستجوی پیشرفته - توانایی جستجو با بسیاری از پارامترهای مختلف. برای انجام این کار، موتورهای جستجو صفحات جداگانه ای را ارائه می دهند که می توانید چنین پارامترهایی را در آنها تنظیم کنید. اصول جستجوی پیشرفته برای اکثر موتورهای جستجو مشابه است.
در نظر گرفتن ویژگی های اضافیجستجو در نمونه های موتورهای جستجوی Yandex و Google زیرا Yandex محبوب ترین موتور جستجو در اینترنت روسی زبان است و گوگل محبوب ترین موتور جستجو در جهان است. هنگام جستجو در اینترنت، Yandex یکی از اولین کسانی بود که مورفولوژی زبان روسی را در نظر گرفت، یعنی از اشکال مختلف کلمه استفاده کرد، همانطور که در بالا ذکر شد. با ورود به سایت www.yandex.ru، کاربر می تواند یک پرس و جو را وارد کند و بلافاصله نتایج جستجو را دریافت کند، یا می توانید از پیوند جستجوی پیشرفته با استفاده از نماد استفاده کنید و به صفحه مربوطه بروید (شکل زیر را ببینید)، جایی که می توانید جریمه کنید. تنظیم پارامترهای جستجو

صفحه جستجوی پیشرفته Yandex

بیایید ویژگی های اضافی را در نظر بگیریم که می توان در صفحه جستجوی پیشرفته استفاده کرد: مکان خود را مشخص کنید (مسکو)، مشخص کنید که اطلاعات باید به چه شکل ارائه شود (نوع فایل)، دوره زمانی که در آن به دنبال اطلاعات هستیم (در روز، 2 هفته، در هر ماه، از ..Do)، به چه زبانی باید اطلاعات ارائه شود (روسی، انگلیسی More) و همچنین می توانید آدرس سایت و غیره را مشخص کنید.
انتخاب (دقیقاً مانند پرس و جو) به موتور جستجو نشان داده می شود تا مورفولوژی کلمات پرس و جو تغییر نکند، بلکه فقط شکل کلمه ای که مشخص شده است جستجو شود.

زبان پرس و جو

زبان پرس و جو یک سیستم دستوری است که به شما امکان می دهد پارامترهای پرس و جو را از رشته جستجوی اصلی با استفاده از دستورات خاص تغییر دهید. برای کاربران پیشرفته
از آنجایی که زبان پرس و جو بسیار پیچیده و حجیم است، ما فقط ساختارهای اصلی آن را ارائه می کنیم که ممکن است بیشترین تقاضا را برای کاربران داشته باشد. برخی از دستورات زبان پرس و جو Yandex در جدول ارائه شده است.

اپراتور

شرح

نحو

درخواست نمونه

اسنادی را جستجو کنید که کلمه انتخاب شده لزوماً در آنها وجود دارد.

استفاده از چند عملگر + در یک کوئری قابل قبول است.

کلمه 1 + کلمه 2

اسنادی پیدا می شود که لزوماً حاوی کلمات "بولوار" و "مسکو" هستند و ممکن است حاوی کلمه "شولوخوف" باشند.

جستجوی نقل قول

جستجوی اسناد حاوی کلمات پرس و جو در یک ترتیب و فرم معین.

"کلمه 1 کلمه 2 ... کلمه N"

اسناد حاوی نقل قول داده شده پیدا می شود.

جستجو بر اساس نقل قول با کلمه(های) گمشده

عملگر یک * با یک کلمه گمشده مطابقت دارد.

توجه! فقط به عنوان بخشی از اپراتور استفاده می شود.

"کلمه 1 * کلمه 2 ... کلمه N"

اپراتور با فاصله از هم جدا شده است.

اسناد حاوی نقل قول داده شده، از جمله کلمه گمشده، یافت می شود.

اسناد حاوی نقل قول داده شده، از جمله کلمات گم شده، یافت می شوند.

ساختار کامل زبان پرس و جو Yandex را می توان در صفحه راهنما (http://help.yandex.ru/search/?id=481939) یافت. زبان جستجوهای جستجو در Google با Yandex متفاوت است، اگرچه برخی از نکات مشترک وجود دارد. با بررسی جدول برخی از دستورات اساسی این زبان را در نظر بگیرید (به زیر مراجعه کنید)

ساختار کامل زبان پرس و جو گوگل را می توان در صفحه راهنما یافت:

هدف، واقعگرایانه:مطالعه اصول سازماندهی جستجو در اینترنت و کسب مهارتهای عملی در تدوین پرس و جوهای جستجو.

2.1 ترفندهای جستجوی سادهوب-صفحات

تکنیک‌های جستجوی ساده شامل استفاده از قابلیت‌های جستجوی قدرتمند اینترنت نمی‌شوند و مبتنی بر آگاهی از اصول شکل‌گیری نام‌های دامنه نمادین و شهود هستند.

جستجوی تجاریوب-سایت های.برای دریافت آدرس مورد نظر خود می توانید یک دامنه به نام یک شرکت، شرکت، سازمان یا یک اسم ساده انگلیسی (کلمه کلیدی) اضافه کنید. com، جایگزین www. صفحات وب با نام دامنه سطح بالا. com.، اغلب حاوی اطلاعات به زبان انگلیسی است.

مثال 1 نام شرکت SONY را انتخاب کنید، یک دامنه اضافه کنید. com و جلوتر از www. - آدرس صفحه وب SONY را دریافت کنید: www. سونی. com. به طور مشابه، می توانید دریافت کنید:

www. cnn. com- CNN World News;

www. ام تی وی. com- اخبار موسیقی MTV;

www.- مجله COSMOPOLITAN.

اگر کلمه کلیدی را وارد کنید نوار آدرس اینترنت کاوشگرو فشار دهید ctrl+ وارد, سپس مرورگر سعی می کند با افزودن خودکار نام پروتکل و تگ وب، مانند http://www، به URL دقیق حرکت کند. و دامنه سطح بالا com به عنوان مثال، اگر من را در نوار آدرس تایپ کنید و Ctrl-Enter را فشار دهید، سپس مرورگر اینترنت کاوشگرسعی می کند یک وب سایت با آدرس باز کند http:// www. من. com. اگر گره باز نشود، وجود ندارد.

جستجو بر اساس مناطقبرای روسیه و سایر مناطق، روش فوق معتبر است. در این حالت، دامنه سطح بالای منطقه (کد کشور دو حرفی) برای دادن آدرس صفحه وب به کلمه کلیدی اضافه می شود. به عنوان مثال، برای جستجوی سرورهای روسی، می توانید یک دامنه را به یک کلمه کلیدی اضافه کنید. ru.

مثال 2. شناخته شده به داشتن یک سرور www. آئودی. com. می توانید با جایگزین کردن دامنه، شعبه آن را در روسیه پیدا کنید. com به دامنه ru- www. آئودی. en.

جستجو برای موسسات آموزشی اصلیدامنه ای به نام یا مخفف موسسه آموزشی اضافه می شود. edu (عمدتا برای مناطق آمریکا و اروپا)، که معمولا آدرس صحیح را می دهد.

مثال 3. دانشگاه آکسفورد را انتخاب کنید، یک دامنه اضافه کنید. edu و جلوتر از www. - آدرس صفحه وب دانشگاه آکسفورد را دریافت کنید: www. آکسفورد. edu. اغلب هیچ دامنه ای در آدرس صفحه وب موسسه آموزشی وجود ندارد. edu. دامنه ثبت شده سطح دوم (یا نام مستعار دامنه) می تواند نام اختصاری انگلیسی موسسه آموزشی باشد. برای جستجوی یک موسسه آموزشی روسی، می توانید مخفف انگلیسی آن را انتخاب کنید، به عنوان مثال MSU (دانشگاه دولتی مسکو)، یک دامنه اضافه کنید. en- www. msu. en- دانشگاه دولتی مسکو.

اغلب در آدرس یک صفحه وب وجود دارد نام دامنهارائه دهنده خدمات اینترنتی که این صفحه وب روی رایانه او نصب شده است، به عنوان مثال، www. kgtu. runnet. en- آدرس دانشگاه فنی دولتی کراسنویارسک، که در آن ***** نام دامنه ارائه دهنده خدمات اینترنت است.

بسیاری از کشورها دارای دامنه سطح دوم ثبت شده برای موسسات آموزشی هستند. به عنوان مثال، برای انگلستان، این دامنه AC (آکادمیک) است. هر صفحه وب می تواند چندین آدرس مستعار داشته باشد که در صورت دسترسی، کاربر را به همان صفحه وب می برد. به عنوان مثال، برای دانشگاه آکسفورد این آدرس ها هستند www. گاو نر. ac. انگلستانو www. آکسفورد. edu.

جستجوی دیگروب-صفحاتمی‌توانید کلمات کلیدی و دامنه‌های سطح بالا را برای جستجوی دولت (.gov)، ارتش (.mil) و سایر سازمان‌ها (.org) دستکاری کنید. به عنوان مثال، آدرس کاخ سفید دولت ایالات متحده: www. کاخ سفید. دولت.

2.2 موتورهای جستجوی وباینترنت

ATاینترنت در دسترس است ابزار قدرتمندجستجو برای هر گونه اطلاعات: اسناد، تصاویر، برنامه ها، صفحات وب و غیره. جستجو در به اصطلاح انجام می شود. موتورهای جستجو،که به آنها نیز گفته می شود موتورهای جستجو، موتورهای جستجو، موتورهای جستجو.موتورهای جستجوی زیادی در اینترنت وجود دارد. معروف ترین سیستم های بازیابی اطلاعات در جدول 2.1 نشان داده شده است. لیستی از پیوندها به موتورهای جستجوی مختلف در صفحه وب قرار می گیرد www. راهب. newmail. en.

جدول 2.1 - محبوب ترین موتورهای جستجو

نام موتور جستجو

نشانی

Yandex (روسی)

http://www. *****

رامبلر (روسی زبان)

http://www*****

آپورت (روسی زبان)

http://w ww. *****

یاهو (انگلیسی)

AltaVista (انگلیسی)

گوگل (روسی)

http://www. *****

سیستم جستجوپیاده سازی شده به عنوان یک صفحه وب با یک آدرس منظم، که شامل به اصطلاح رشته جستجوو دکمه جستجو کردن (جستجو کردن), و همچنین ممکن است حاوی فهرست موضوعی منابع،پیوند به صفحات محبوب و غیره

برای فراخوانی یک موتور جستجو، باید آدرس آن را در نوار آدرس یک مرورگر اینترنتی وارد کنید. پس از بارگیری موتور جستجو در نوار جستجو، باید وارد شوید درخواست (پرس و جو), که یک رشته متن است (به هر زبانی) - عبارت عبور از اسناد جستجو شده در اینترنت و کلیک بر روی دکمه جستجو کردن.برای جستجوی کارآمدتر، لازم است که پرس و جو حاوی کلمات یا عبارتی باشد که در صفحه وب جستجو شده یا در سند جستجو شده وجود دارد (آنها باید "حدس زده شوند"). پس از مدتی صفحه نمایش ظاهر می شود لیست آدرسوب-صفحات،حاوی پیوندهایی به اسناد مورد نظر شما است که معمولاً با نظرات همراه است. با کلیک بر روی لینک، می توانید به هر یک از اسناد یافت شده بروید.

برای رفتن به صفحه بعدی لیست اسناد یافت شده باید در پنجره اصلی با نتیجه جستجو بر روی عدد مربوطه (1، 2، 3، ...) کلیک کنید. معمولاً اسناد ده مورد اول یافت شده تا حد امکان با درخواست مطابقت دارد.

اساس هر موتور جستجو یک برنامه خاص است - ربات شبکهیا عنکبوت (عنکبوت)،گاهی اوقات می توانید نام ها را ببینید کرم (کرم)،خزنده (خزنده).موتور جستجو چنین «عنکبوت‌هایی» را به اینترنت می‌فرستد که حداکثر (در صورت امکان) صفحات وب ارائه شده در اینترنت را مرور می‌کنند و سپس آدرس (URL) و محتوای آنها را در پایگاه داده خود ثبت می‌کنند. پس از اینکه کاربر درخواستی را وارد کرد و روی دکمه کلیک کرد جستجو کردنموتور جستجو پایگاه داده را اسکن می کند و نتیجه جستجو را نمایش می دهد.

علاوه بر این، تقریباً تمام موتورهای جستجو به شما امکان می دهند یک صفحه کاربری واقع در اینترنت را ثبت کنید. برای این کار، در صفحه یک موتور جستجوی بزرگ، مثلاً YAHOO!، باید حالت ثبت نام را فراخوانی کرده و آدرس و توضیحات صفحه خود را وارد کنید. سپس موتور جستجو اطلاعات ثبت نام شما را به تمام گره های جستجوی اصلی دیگر منتشر می کند که به نوبه خود به سایر گره ها و غیره سرایت می کند. سرورهای ثبت جهانی نیز وجود دارد.

دایرکتوری ها را جستجو کنیدبرای مثال در سرورهای جستجو Rambler، Yahoo!، AltaVista و غیره در دسترس هستند. برای جستجوی کاتالوگ، باید موضوعات را با ماوس انتخاب کنید، دایره جستجو را عمیق تر و باریک کنید تا لیست پیوندهای نمایش داده شده به چندین صفحه کاهش یابد. که می تواند به صورت دستی مرور شود، یا در یک گروه به اندازه کافی بزرگ که در آن می توانید یک جستجوی معمولی انجام دهید (به عنوان مثال، در موتور جستجوی Yandex: مطالعات آموزش عالی دانشگاه دولتی مسکو).

2.3 قوانین برای اجرای پرس و جو در موتورهای جستجو

هنگام اجرای پرس و جو، قوانین خاصی وجود دارد که ممکن است تا حدی در موتورهای جستجوی مختلف متفاوت باشد، اما مراحل اساسی مشابه هستند. قوانین اجرای پرس و جوها را همیشه می توان در صفحه وب یک موتور جستجوی خاص در بخش یافت کمک(این بخش ممکن است نامیده شود کمک، نحوه جستجو، نکات جستجو، قوانین اجرای پرس و جوو غیره.). قوانین پرس و جو معمولاً شامل استفاده می شود زبان پرس و جو برای جستجوی پیشرفته

ساده ترین قانونی که برای همه موتورهای جستجو وجود دارد این است که هر عبارتی را وارد کرده و کلیک کنید جستجو کردن.

در پاراگراف بعدی، برخی از قوانین برای اجرای درخواست ها با استفاده از سیستم Yandex به عنوان مثال در نظر گرفته می شود. بسیاری از این قوانین برای سایر موتورهای جستجو نیز اعمال می شود. نمونه سوالات از صفحات راهنمای موتور جستجوی Yandex گرفته شده است.

2.4 نمونه هایی از پرس و جوهای ساده در موتور جستجوی Yandex

معمولا یک پرس و جو فقط یک یا چند کلمه کلیدی است، به عنوان مثال: ریزپردازنده های شرکتاینتل. برای چنین پرس و جوی، اسنادی یافت می شوند که حاوی تمام کلمات پرس و جو هستند. برخی از کلمات در پرس و جو نادیده گرفته می شوند (حروف ربط، حروف اضافه و غیره)، زیرا بار معنایی ندارند. به عنوان مثال، در صورت درخواست سیب در برفتمام اسنادی پیدا می شوند که حاوی دو کلمه به طور همزمان هستند: "سیب" و "برف" (با این حال، ترتیب نمایش آنها در لیست متفاوت خواهد بود). اینکه کلمات در کجای سند قرار دارند، به چه شکل دستوری هستند، مهم نیست. بهانه، مستمسک بر روینادیده گرفته شده است. بنابراین، پرس و جو فوق را می توان به صورت زیر نوشت: برف روی سیبنتیجه جستجو یکسان خواهد بود.

یک ویژگی مهم و بسیار مفید موتورهای جستجو: مهم نیست که کلمه ای را با چه دستوری در یک پرس و جو بنویسید، در اسناد به تمام اشکال آن وجود دارد. به عنوان مثال، در صورت درخواست مرد راه رفتاسنادی که حاوی متن "مردم در حال راه رفتن هستند" در میان سایر موارد یافت می شود. تشخیص همه اشکال برای کلمات معمولی روسی کار می کند. برای کلمات عجیب و غریب، نئولوژیزم ها و غیره انجام نمی شود.

اپراتورهای Yandex، هدف و نمونه های استفاده از آنها را می توان در نقطه راهنمای سیستم یافت.

می توانید از ویژگی های جستجوی پیشرفته در صفحه جستجوی پیشرفته برای ایجاد پرس و جوهای پیچیده به صورت بصری استفاده کنید.

1. با اطلاعات نظری آشنا شوید.

2. آدرس وب سایت یک شرکت معروف دنیا (اینتل، آی بی ام، سونی و غیره) را بنویسید و آن را در اینترنت کاوشگر. صفحات وب یافت شده را در یک پوشه جداگانه ذخیره کنید.

3. با استفاده از همین تکنیک، به وب سایت دانشگاه دولتی سنت پترزبورگ رفته و به همین ترتیب وب سایت دانشکده ریاضیات کاربردی همان دانشگاه را باز کنید. صفحات وب یافت شده را در یک پوشه جداگانه ذخیره کنید.

4. در هر موتور جستجو (جدول 2.1)، چندین پرس و جو را اجرا کنید که بر مشکلات مورد نظر شما تأثیر می گذارد و اسناد یافت شده را باز کنید.

5. سعی کنید فهرست های موضوعی را جستجو کنید.

6. با استفاده از جستجوی پیشرفته در Yandex، محبوبیت سایت های زیر را با تعداد صفحات پیوند دهنده به آنها مقایسه کنید: رئیس جمهور و دولت فدراسیون روسیه; دانشگاه دولتی مسکو و دانشگاه دولتی سن پترزبورگ؛ ارمیتاژ و لوور. صفحات وب یافت شده را در یک پوشه جداگانه ذخیره کنید. ایجاد کردن فایل متنی، که در آن تعداد پیوندهای هر یک از آنها را ثابت کنید.

7. اطلاعاتی در مورد زمان و محل تولد خود بیابید. فهرستی از آثار او تهیه کنید. عکس های او را در سال های مختلف زندگی پیدا کنید. تمام اطلاعات را در یک پوشه جداگانه ذخیره کنید.

8. جستجوی اطلاعات در اینترنت در مورد موضوع انتخابی کار درسی. با توجه به نتایج جستجو، در متن ایجاد کنید ویرایشگر وردجدول مطابق نمونه (جدول 2.3) و پر کنید.

جدول 2.3 - نمونه گزارش نتایج جستجو

و و

ویژگی های نتایج جستجو

URL منبع یافت شده

شرح مختصری از منبع

9. یک معلم را برای گزارش پیشرفت دعوت کنید.

10. فایل های ذخیره شده در حین کار را از پوشه کاری حذف کنید.

2.6 سوالات امنیتی

1. روش های ساده جستجوی اطلاعات در اینترنت را شرح دهید.

2. اصول موتورهای جستجوی اینترنتی چیست؟

3. قوانین اساسی برای کامپایل پرس و جوهای جستجو را فرموله کنید.

4. کدام یک از موتورهای جستجویی که در نظر گرفته اید توانایی استفاده از زبان پرس و جو را دارند؟

5. کدام یک از موتورهای جستجویی که در نظر گرفته اید دارای کاتالوگ موضوعی از منابع هستند؟

6. کدام یک از موتورهای جستجویی که در نظر گرفته اید توانایی جستجوی دسته های مختلف منابع اطلاعاتی را دارند؟

جستجوی اطلاعات وظیفه ای است که بشر قرن هاست آن را حل کرده است. با افزایش حجم منابع اطلاعاتی به طور بالقوه در دسترس یک نفر، ابزارها و تکنیک های جستجوی پیچیده و پیچیده تری برای یافتن سند لازم توسعه یافتند.

با توجه به کتاب "مقدمه ای بر بازیابی اطلاعات" نوشته K. Manning، می توان گفت که عملکرد مؤثر هر IPS بر اساس سرعت و امکانات نمونه برداری چند بعدی از داده های لازم از یک آرایه بزرگ (بازیابی اطلاعات) است. کار درونیبا داده ها این امر الزامات خاصی را بر سازماندهی قوانین جستجو، ساخت رابط کاربری و نرم افزار و شکل ارائه اطلاعات تحمیل می کند.

اجرای الزامات فوق به مجموعه‌ای از اجزای سازه‌ای زیر، که بلوک‌ها نامیده می‌شوند، واگذار می‌شود [پیوست 4].

طبق کتاب Varfolomeev A.A. "مبانی امنیت اطلاعات"، انتخاب درست چنین ساختار سیستم بازیابی اطلاعات مبتنی بر یک منطق بسیار ساده است - هر واحد از سیستم باید داده ها را دریافت کند، پردازش کند و به ترتیب خاصی به کاربر بدهد و منطق فرآیند را ارائه دهد.

نمی توان در مورد سیستم های بازیابی اطلاعات بدون ذکر چیزی به عنوان موتور جستجو صحبت کرد. همانطور که D.N. کولیسنیچنکو در کتاب "موتورهای جستجو و ارتقاء وب سایت در اینترنت"، موتور جستجو- یک سیستم با یک پایگاه داده تشکیل شده توسط یک ربات حاوی اطلاعات در مورد منابع اطلاعاتی. یکی از ویژگی های متمایز موتورهای جستجو این واقعیت است که پایگاه داده حاوی اطلاعات صفحات وب توسط یک برنامه روبات تولید می شود. پس از دریافت نتیجه، در صورتی که عنوان و توضیحات سند مطابق با شرایط شما باشد، می توانید بلافاصله با استفاده از لینک به منبع اصلی آن بروید. انجام این کار در یک پنجره جدید راحت تر است تا بتوانید نتایج جستجو را بیشتر تجزیه و تحلیل کنید. بسیاری از موتورهای جستجو به شما امکان جستجو در اسناد یافت شده را می دهند و می توان با معرفی عبارت های اضافی، پرس و جو را اصلاح کرد. اگر هوشمندی سیستم بالا باشد، امکان جستجوی اسناد مشابه نیز وجود دارد. با این حال، خودکار کردن تشخیص شباهت یک کار بی اهمیت نیست و اغلب این عملکرد همیشه به درستی کار نمی کند. برخی از موتورهای جستجو به شما اجازه می دهند نتایج را مرتب کنید. شایان توجه است که موتورهای جستجوی مختلف تعداد متفاوتی از منابع اطلاعاتی را در اینترنت توصیف می کنند. بنابراین، نمی توانید خود را به جستجو در تنها یکی از موتورهای جستجوی مشخص شده محدود کنید. ابزارهای جستجوی مختلفی وجود دارند که فهرست خود را تشکیل نمی دهند، اما می توانند از قابلیت های سایر موتورهای جستجو استفاده کنند. این همانطور که N.A. گایدماماکین در کتاب «سیستم‌های اطلاعات خودکار، پایگاه‌های اطلاعاتی و بانک‌های اطلاعاتی» موتورهای متاجستجو(سرویس های جستجو) - سیستم هایی که می توانند درخواست های کاربر را به طور همزمان به چندین سرور جستجو ارسال کنند، سپس نتایج را ترکیب کرده و در قالب یک سند همراه با لینک به کاربر ارائه دهند.

همچنین D.N. کولیسنیچنکو می نویسد که برای یافتن دقیق ترین و سریع ترین اطلاعات لازم در شبکه، از IPS استفاده کنید نمایه سازی.

فهرست جستجو- ساختار داده ای که حاوی اطلاعاتی درباره اسناد است و در موتورهای جستجو استفاده می شود.

نمایه سازی(یا نمایه سازی) که توسط یک موتور جستجو انجام می شود، فرآیند جمع آوری، مرتب سازی و ذخیره داده ها به منظور ارائه بازیابی سریع و دقیق اطلاعات است. ایجاد این شاخص شامل مفاهیم میان رشته ای از زبان شناسی، ریاضیات و علوم کامپیوتر است.

موتورهای جستجوی محبوب بر نمایه سازی متن کامل اسناد نوشته شده به زبان های طبیعی تمرکز می کنند. اسناد چند رسانه ای مانند ویدئو و صدا و گرافیک نیز می توانند در جستجو شرکت کنند.

A.Yu. کلینا در کتاب "مبانی امنیت اطلاعات" می نویسد که موتورهای فراجستجو از نمایه های خدمات جستجوی دیگر استفاده می کنند و فهرست محلی را ذخیره نمی کنند، در حالی که موتورهای جستجو بر اساس صفحات ذخیره شده در حافظه پنهان، هم فهرست و هم مجموعه های متنی را برای مدت طولانی ذخیره می کنند. برخلاف نمایه های متن کامل، خدمات متن جزئی عمق نمایه سازی را برای کاهش اندازه نمایه محدود می کنند.

معماری موتور جستجو در روش های نمایه سازی متفاوت است. ایندکس ها از انواع زیر هستند [پیوست 5]:

  • · شاخص مستقیمفهرست فوروارد فهرستی از کلمات را برای هر سند ذخیره می کند.
  • · شاخص معکوسفهرستی از وقوع هر عبارت جستجو را ذخیره می کند.

ایندکس تنها بخشی از موتور جستجو است که از دید کاربر پنهان است. قسمت دوم این دستگاه می باشد زبان بازیابی اطلاعات (IPL)، که در مورد آن Varfolomeev A.A. به تفصیل می نویسد. در کتاب مبانی امنیت اطلاعات. ISL زبانی است که به شما امکان می دهد درخواستی را به صورت ساده و بصری به سیستم فرموله کنید. حتی اگر از کاربر خواسته شود که پرس و جوها را به زبان طبیعی وارد کند، این بدان معنا نیست که سیستم تجزیه معنایی پرس و جو کاربر را انجام خواهد داد. نکته اصلی این است که معمولا عبارت به کلمات تقسیم می شود، کلمات ممنوعه و رایج از این لیست حذف می شوند، گاهی اوقات واژگان عادی می شوند و سپس همه کلمات یا با یک AND یا OR منطقی به هم متصل می شوند.

انواع نیز ممکن است، همانطور که توسط N.A. چورسین در کتاب «انفورماتیک محبوب». بنابراین، در اکثر سیستم ها، برخی از عبارات به عنوان کلمات کلیدی شناخته می شوند و به کلمات جداگانه تفکیک نمی شوند. روش دیگر محاسبه نزدیکی بین پرس و جو و سند است. در حال حاضر، حدود دوازده معیار مختلف مجاورت شناخته شده است. این درصدهای انطباق سند با درخواست است که به عنوان صادر می شود اطلاعات پس زمینهدر لیست اسناد یافت شده

به گفته K. Manning، AltaVista دارای پیشرفته ترین زبان پرس و جو از سیستم های بازیابی اطلاعات اینترنتی مدرن است. علاوه بر مجموعه معمول AND، OR، NOT، این سیستم به شما امکان استفاده از NEAR را نیز می دهد. آخرین عملگر به شما امکان می دهد یک جستجوی متنی را سازماندهی کنید. تمام اسناد موجود در سیستم به فیلدهایی تقسیم می شوند، بنابراین در درخواست می توانید مشخص کنید که کاربر می خواهد کلمه کلیدی (در یک پیوند، عنوان و غیره) را در کدام قسمت از سند مشاهده کند.

(برای اطلاعات بیشتر در مورد اطلاعات و زبان های بازیابی اینترنت، به پیوست مراجعه کنید)

از کتاب Yu.I. Kudinov "مبانی انفورماتیک مدرن"، می توانید دریابید که رایج ترین مدل ها برای ارائه اسناد در یک سیستم بازیابی اطلاعات، انواع مختلفی از موضوع ارائه یک سند به عنوان مجموعه ای از اصطلاحات است. همانطور که قبلا ذکر شد، این کل متن سند نیست، بلکه فقط مجموعه کوچکی از اصطلاحات است که محتوای آن را منعکس می کند. بر اساس این ایده از یک سند، لازم است زبان های مختلف بازیابی اطلاعات در نظر گرفته شود.

رایج ترین ILP زبان سنتی است که به شما امکان نوشتن را می دهد عبارات بولیاز مجموعه اصطلاح. در این مورد از عملگرهای بولی AND، OR، NOT استفاده می شود.

چنین طرحی بسیار ساده است و بنابراین بیشترین استفاده را در سیستم های بازیابی اطلاعات مدرن دارد. اما حتی 20 سال پیش، کاستی های آن کاملا شناخته شده بود.

جستجوی بولی مقیاس خوبی ندارد. اپراتور AND می تواند تعداد اسناد بازگردانده شده در هر پرس و جو را تا حد زیادی کاهش دهد. در این مورد، همه چیز به میزان معمولی بودن عبارات جستجو برای پایگاه داده بستگی دارد. برعکس، عملگر OR می تواند منجر به یک پرس و جوی گسترده و غیرمنطقی شود که در آن اطلاعات مفید در پشت نویز اطلاعات گم می شود. برای کاربرد موفقیت آمیز این ILP، باید دانش خوبی از واژگان سیستم و تمرکز موضوعی آن داشت. به عنوان یک قاعده، برای سیستمی با چنین IEL، پایگاه های واژگانی اسنادی خاصی با فرهنگ لغت های پیچیده ایجاد می شود که اصطلاحنامه نامیده می شود و حاوی اطلاعاتی در مورد رابطه اصطلاحات فرهنگ لغت با یکدیگر است.

K. Manning اشاره می کند که اصلاح جستجوی بولی یک جستجوی بولی وزنی است. ایده چنین جستجویی بسیار ساده است. این اصطلاح برای توصیف محتوای سند با کمی دقت در نظر گرفته می شود و این دقت به عنوان وزن اصطلاح بیان می شود. در این حالت، هر دو عبارت سند و عبارت پرس و جو می توانند وزن شوند. درخواست را می توان در ILP توضیح داده شده در بالا فرموله کرد، اما خروجی اسناد بسته به میزان شباهت بین درخواست و سند رتبه بندی می شود. در این مورد، اندازه‌گیری مجاورت به گونه‌ای ساخته می‌شود که جستجوی بولی معمولی مورد خاصی از جستجوی بولی وزنی باشد.

اما برخلاف وارفولومیف A.A. ، است. اشمانوف در کتاب خود با عنوان "تبلیغ وب سایت در موتورهای جستجو" می نویسد که اگرچه ISP ها در حال حاضر کامل نیستند، توجه ویژهبه الگوریتم توجه کنید رتبه بندی(تراز منظم) پیوندهای دریافتی، زیرا اهمیت کمتری ندارد. رایج ترین معیارهای مورد استفاده برای رتبه بندی در IRS وجود کلمات از استعلام در سند، تعداد آنها، نزدیکی به ابتدای سند، نزدیکی به یکدیگر است.

وجود کلمات از پرس و جو در عناوین و زیر عنوان اسناد (عناوین باید به طور خاص قالب بندی شوند)؛

تعداد پیوندها به این سنداز اسناد دیگر "احترام" اسناد ارجاع دهنده.

موتورهای جستجوی مختلف از الگوریتم های رتبه بندی متفاوتی استفاده می کنند، اما اصول اساسی برای تعیین ارتباط به شرح زیر است:

  • · تعداد کلمات پرس و جو در محتوای متن سند (یعنی در کد html).
  • · برچسب هایی که این کلمات در آنها قرار دارند.
  • · محل کلمات جستجو شده در سند.
  • · سهم کلماتی که مربوط به آنها در تعداد کل کلمات سند تعیین می شود.

این اصول برای همه موتورهای جستجو اعمال می شود.

پایگاه داده یک لیست مشابه رتبه بندی شده از اسناد HTML را خروجی می دهد و آن را به شخصی که درخواست می کند برمی گرداند. موتورهای جستجوی مختلف نیز انتخاب می کنند راه های مختلفلیست حاصل را نشان دهید - برخی فقط پیوندها را نشان می دهند. دیگران لینک های خروجی را با چند جمله اول موجود در سند یا عنوان سند همراه با پیوند ارائه می دهند. رتبه بندی جستجو بخشی جدایی ناپذیر از آن است بازیابی اطلاعات.

جنبه های این مفهوم در کتاب «مقدمه ای بر بازیابی اطلاعات» نوشته ک. منینگ به خوبی ارائه شده است. بازیابی اطلاعاتبه معنای استفاده از استراتژی ها، روش ها، مکانیسم ها و ابزارهای معین است. رفتار کاربری که فرآیند جستجو را مدیریت می کند نه تنها با نیاز اطلاعات، بلکه با تنوع ابزاری سیستم - فناوری ها و ابزارهای ارائه شده توسط سیستم - تعیین می شود.

استراتژی جستجو - یک طرح کلی (مفهوم، ترجیح، تنظیمات) از رفتار سیستم یا کاربر برای بیان و ارضای نیازهای اطلاعاتی کاربر، هم به دلیل ماهیت هدف و نوع جستجو و هم به دلیل تصمیمات "استراتژیک" سیستم - معماری پایگاه داده، روش ها و ابزارهای جستجو در یک IS خاص. انتخاب استراتژی در حالت کلی یک مسئله بهینه سازی است. در عمل، تا حد زیادی توسط هنر دستیابی به سازش بین نیازهای عملی و امکانات وسایل موجود تعیین می شود.

روش جستجو - مجموعه ای از مدل ها و الگوریتم ها برای پیاده سازی فردی مراحل تکنولوژیکی: ساخت تصویر جستجو از یک پرس و جو، انتخاب اسناد (مقایسه تصاویر جستجو از پرس و جوها و اسناد)، گسترش یک پرس و جو، بومی سازی و ارزیابی صدور.

جستجوی تصویر - متنی که به زبان ILP نوشته شده است که محتوای معنایی درخواست اطلاعات را بیان می کند و حاوی دستورالعمل های لازم برای اجرای مؤثرترین بازیابی اطلاعات است.

فرآیند بازیابی اطلاعات مجموعه ای از مراحل است که از طریق سیستم به یک نتیجه معین منتهی می شود و امکان ارزیابی کامل بودن آن را فراهم می کند. از آنجایی که کاربر معمولاً اطلاعات جامعی در مورد محتوای اطلاعاتی منبعی که در آن جستجو می کند ندارد، می تواند کفایت عبارت پرس و جو و همچنین کامل بودن نتیجه به دست آمده را تنها بر اساس برآوردهای خارجی یا بر اساس ارزیابی کند. نتایج میانی و تعمیم، مقایسه آنها، به عنوان مثال، با موارد قبلی.

فرآیند جستجو را می توان به عنوان اجزای اصلی زیر نشان داد:

  • 1) فرموله کردن درخواست به زبان طبیعی، انتخاب موتورهای جستجو و خدمات، رسمی کردن درخواست در ILP مربوطه.
  • 2) انجام جستجو در یک یا چند موتور جستجو؛
  • 3) بررسی نتایج به دست آمده (مراجع)؛
  • 4) پردازش اولیهنتایج به دست آمده: مشاهده محتوای پیوندها، استخراج و ذخیره داده های مربوطه.
  • 5) در صورت لزوم، اصلاح درخواست و انجام جستجوی مکرر (روشن کننده) با پردازش بعدی نتایج.

برای کاهش حجم مطالب انتخاب شده، نتایج جستجو بر اساس نوع منابع (سایت ها، پورتال ها)، موضوعات و سایر زمینه ها فیلتر می شوند.

با توجه به فناوری های جستجوی مورد استفاده، IP را می توان به 4 دسته تقسیم کرد:

  • 1. فهرست های موضوعی.
  • 2. کاتالوگ های تخصصی (دایرکتوری های آنلاین).
  • 3. موتورهای جستجو (جستجوی متن کامل).
  • 4. ابزار فراجستجو.

کاتالوگ های موضوعیپردازش اسناد و انتساب آنها به یکی از چندین دسته را فراهم می کند که لیست آنها از قبل تعیین شده است. در واقع، این نمایه سازی بر اساس طبقه بندی است. نمایه سازی می تواند به صورت خودکار یا دستی توسط کارشناسانی که در حال مرور وب سایت ها و اجزای محبوب هستند انجام شود. توضیح کوتاهخلاصه اسناد (کلمات کلیدی، چکیده، چکیده).

کاتالوگ های تخصصییا کتاب های مرجعتوسط صنایع و موضوعات فردی، اخبار، شهرها، آدرس‌های ایمیل و غیره ایجاد می‌شوند.

موتورهای جستجو(پیشرفته ترین امکانات جستجو در اینترنت) فناوری جستجوی متن کامل را پیاده سازی می کند. متون واقع در سرورهای نظرسنجی ایندکس می شوند. یک فهرست می تواند حاوی اطلاعاتی در مورد چندین میلیون سند باشد.

هنگام استفاده از وجوه متاجستجوپرس و جو به طور همزمان توسط چندین موتور جستجو انجام می شود. نتیجه جستجو در یک لیست مشترک که بر اساس ارتباط مرتب شده است ترکیب می شود. هر سیستم تنها بخشی از گره های شبکه را پردازش می کند که امکان گسترش پایگاه جستجو را فراهم می کند.

به اصطلاح "سازمان جستجو" و "اجرای جستجو" نیز بسیار مهم هستند، همانطور که D.N. کولیسنیچنکو در کتاب "موتورهای جستجو و ارتقاء وب سایت در اینترنت".

سازمان جستجو

روند جستجوی اطلاعات لازم به 9 مرحله اصلی تقسیم می شود:

  • · تعیین حوزه دانش;
  • · انتخاب نوع داده و منابع.
  • مجموعه ای از مواد لازم برای پر کردن مدل اطلاعاتی؛
  • · انتخابی از بیشترین اطلاعات مفید;
  • · انتخاب روش پردازش اطلاعات (طبقه بندی، خوشه بندی، تحلیل رگرسیون و غیره).
  • · انتخاب الگوریتم برای جستجوی قوانین.
  • جستجو برای الگوها، قوانین رسمی و روابط ساختاری در اطلاعات جمع آوری شده;
  • · تفسیر خلاقانه از نتایج به دست آمده.
  • · ادغام «دانش» استخراج شده.

برای انجام جستجو، رابط کار با پایگاه داده مربوطه در ابتدا بر روی رایانه کاربر بارگذاری می شود. این می تواند یک پایگاه داده محلی یا راه دور باشد. در ابتدا باید در مورد نوع جستجو (ساده، پیشرفته و غیره) تصمیم بگیرید. سپس با مجموعه ای از زمینه های ارائه شده برای جستجو. IPS ممکن است یک یا چند فیلد ورودی ارائه دهد. در مورد دوم، اینها معمولاً فیلدها هستند: نویسنده، عنوان (عنوان)، دوره زمانی، نوع سند، کلمات کلیدی، سرفصل ها و غیره.

پیاده سازی جستجو

به طور کلی پذیرفته شده است که جستجو را بر اساس قطعات اولیه کلمه سازماندهی کنید (جستجو با برش سمت راست)، به عنوان مثال، به جای کلمه "کتابخانه" می توانید قطعه "کتابخانه*" آن را وارد کنید. در این صورت اسنادی پیدا می شود که نه تنها شامل کلمه "کتابخانه"، بلکه حاوی "کتابخانه"، "کتابدار"، "علم کتابخانه ای" و غیره است. در هر مورد، کاربر باید تصور کند که دقیقاً چه چیزی را می خواهد پیدا کند. از آنجایی که در گزینه پیشنهادی، تعداد اسناد بسیار بیشتری نسبت به زمانی که کلمه داده شده به طور کامل (بدون برش) مشخص شده است، یافت می شود. در چنین حالتی می توان در آرایه اطلاعات دریافتی جستجوی اصلاحی انجام داد و در نتیجه داده های مرتبط تری را به دست آورد.

IRSها همچنین با زمان اجرای جستجو، رابط ارائه شده به کاربر و نوع نتایج نمایش داده شده مشخص می شوند. هنگام انتخاب یک IPS، به پارامترهایی مانند پوشش و عمق توجه می شود. زیر پوششبه حجم پایگاه داده موتور جستجو اشاره دارد که با سه شاخص اندازه گیری می شود: حجم کل اطلاعات نمایه شده، تعداد سرورهای منحصر به فرد و تعداد اسناد منحصر به فرد. زیر عمققابل درک است - آیا محدودیتی در تعداد صفحات وجود دارد یا در عمق تودرتو دایرکتوری ها در یک سرور.

همچنین برخی از جنبه های بازیابی اطلاعات در کتاب توسط V.A. گووزدوا "مبانی ساختمان خودکار سیستم های اطلاعاتی» . همانطور که در کتاب نوشته شده است، هر موتور جستجو الگوریتم های خاص خود را برای مرتب سازی نتایج جستجو دارد. هر چه سند مورد نظر به بالای لیست به دست آمده در نتیجه جستجو نزدیکتر باشد، ارتباط بیشتر و موتور جستجو بهتر کار می کند. همه آنها با کلمات کلیدی، عناوین موضوعی و حتی حروف جداگانه، به سرعت در وب، به عنوان مثال، تمام یا تقریباً تمام متونی را که این کلمات وجود دارند، پیدا کنید. در این حالت کاربر از آدرس سایت هایی که نتایج یافت شده به طور مداوم در آنها وجود دارد مطلع می شود. با این حال، هیچ یک از آنها برتری قابل توجهی نسبت به بقیه ندارند. برای انجام یک جستجوی قابل اعتماد برای پرس و جوهای پیچیده، کارشناسان توصیه می کنند از IPS های مختلف به صورت سری یا موازی (به طور همزمان) استفاده کنید.

از کتاب D.N. کادیف" فناوری اطلاعاتو ارتباطات الکترونیکی" می توانید با مفهومی مانند "موتور جستجوی متن کامل" آشنا شوید. تمام کلمات متن قابل مشاهده برای کاربر را نمایه می کند. وجود صرف شناسی باعث می شود تا کلمات مورد نظر را در تمام نزول یا صرف پیدا کنید. برخی از ماشین‌ها می‌توانند عبارات یا کلمات را در یک فاصله مشخص جستجو کنند، که اغلب برای به دست آوردن یک نتیجه معقول مهم است. علاوه بر این، در زبان HTMLبرچسب هایی وجود دارند که می توانند توسط موتور جستجو نیز پردازش شوند (عناوین، پیوندها، شرح تصاویر و غیره). در عین حال، باید بدانید که هرچه تعداد کلمات کلیدی موجود در این تگ ها کمتر باشد، بیشتر می توانند در متون صفحات سایت قرار بگیرند و بنابراین ارتباط آنها بیشتر است. فرکانس بهینه چنین کلماتی بیش از 5٪ نیست. کلمات کلیدی زیادی نباید وجود داشته باشد، آنها باید بیشتر از یک یا دو کلمه تشکیل شده باشند که رایج ترین اصطلاحات را تشکیل می دهند. هرچه کلمات کلیدی مرتبط تر باشند، سند را از نظر موتورهای جستجو رقابتی تر می کنند.

کاربر بسته به صحت درخواست فرموله شده توسط خود، کامل بودن و صحت پاسخ را دریافت می کند. در نتیجه جستجو معمولاً اطلاعاتی بسیار بیشتر از نیاز او در اختیار او قرار می گیرد که ممکن است برخی از آنها اصلاً به درخواست ایجاد شده مرتبط نباشد. به راحتی می توان فهمید که نه تنها به یک پرس و جو که به خوبی فرمول بندی شده است، بلکه به قابلیت های موتورهای جستجو نیز بستگی دارد که بسیار متفاوت هستند. در عین حال، این واقعیت که امکان رد شدن از اطلاعات اصلی و ضروری در داده های به دست آمده کاملاً واضح است. پرس و جوهای ساده در قالب اصطلاحات نسبتاً مشترک جداگانه منجر به استخراج هزاران (صدها هزار) سند می شود که کاربر به اکثریت قریب به اتفاق آنها نیازی ندارد ( نویز اطلاعات).

یک جنبه مهم همچنین توانایی IPS برای پشتیبانی از چندزبانگی است، یعنی توانایی پردازش درخواست ها به زبان های مختلف. همچنین، جستجو در پایگاه داده های متن کامل معمولاً با استفاده از تحلیلگرهای مورفولوژیکی (معمولاً روسی و انگلیسی) انجام می شود که به شما امکان می دهد به طور خودکار فرم های کلمه موجود را با یک قطعه کلمه، کلمه، عبارت پیدا کنید، حتی اگر اشتباهات املایی در پرس و جو وجود داشته باشد. کلمات

همچنین، نمی توان به چنین ویژگی IPS مانند با اشاره کرد ابزارهای جستجو و ساختاربندی ، گاهی اوقات نامیده می شود موتورهای جستجو . همانطور که I.S. آشمانوف در کتاب خود، ارتقای وب سایت در موتورهای جستجو، از موتورهای جستجو برای کمک به مردم برای یافتن اطلاعات مورد نیازشان استفاده می شود. ابزارهای جستجو مانند عوامل، عنکبوت ها، خزنده ها و روبات ها برای جمع آوری اطلاعات در مورد اسناد موجود در اینترنت استفاده می شوند. آی تی برنامه های ویژه، که صفحاتی را در وب جستجو می کنند، پیوندهای فرامتن را در آن صفحات استخراج می کنند و به طور خودکار اطلاعاتی را که پیدا می کنند برای ایجاد یک پایگاه داده فهرست می کنند. هر موتور جستجو مجموعه ای از قوانین خاص خود را دارد که نحوه یافتن و پردازش اسناد را تعیین می کند. برخی هر پیوند را در هر صفحه ای که پیدا می کنند دنبال می کنند و سپس به نوبه خود هر پیوند را در هر یک از صفحات جدید بررسی می کنند و غیره. برخی از افراد پیوندهایی را که منجر به فایل های گرافیکی و صوتی، فایل های انیمیشن می شوند نادیده می گیرند. به دیگران دستور داده می شود که ابتدا به محبوب ترین صفحات نگاه کنند. طبقه بندی مکانیسم های جستجو به بهترین وجه در کتاب Varfolomeev A.A. ارائه شده است. "مبانی امنیت اطلاعات" :

  • · عوامل- "هوشمندترین" ابزارهای جستجو. آنها می توانند بیشتر از جستجو انجام دهند: آنها حتی می توانند معاملات را از طرف شما انجام دهند. در حال حاضر، آن‌ها می‌توانند سایت‌های خاصی را جستجو کنند و فهرستی از سایت‌ها را که بر اساس ترافیکشان مرتب شده‌اند، برگردانند. نماینده ها می توانند محتوای اسناد را پردازش کنند، انواع دیگر منابع را پیدا کرده و فهرست بندی کنند، نه فقط صفحات. آنها همچنین می توانند برای استخراج اطلاعات از پایگاه های داده از قبل موجود برنامه ریزی شوند. هر اطلاعاتی را که عوامل نمایه می کنند، آن را به پایگاه داده موتور جستجو باز می گردانند.
  • جستجوی کلی برای اطلاعات در وب توسط برنامه هایی انجام می شود که به عنوان شناخته می شوند عنکبوت ها. عنکبوت ها محتوای سند یافت شده را گزارش می دهند، آن را فهرست می کنند و اطلاعات حاصل را استخراج می کنند. آنها همچنین به عناوین، برخی از پیوندها نگاه می کنند و اطلاعات فهرست شده را به پایگاه داده موتور جستجو ارسال می کنند.
  • · خزنده هابه سربرگ ها نگاه کنید و فقط لینک اول را برگردانید.
  • · ربات هامی‌توان آن را طوری برنامه‌ریزی کرد که پیوندهای مختلف با عمق‌های مختلف تودرتو را دنبال کند، فهرست‌سازی انجام دهد و حتی پیوندها را در یک سند بررسی کند. به دلیل ماهیت آنها، آنها می توانند در چرخه ها گیر کنند، بنابراین به منابع وب قابل توجهی برای دنبال کردن پیوندها نیاز دارند، با این حال، روش هایی طراحی شده است تا از جستجوی ربات ها در سایت هایی که صاحبان آنها نمی خواهند ایندکس شوند، جلوگیری کنند.

در خاتمه می توان گفت که IPS در شبکه با تمام تنوع بیرونی خود، طبقه بندی آنها که در کتاب توسط L.G. گاگارینا "سیستم های اطلاعات خودکار":

سیستم های بازیابی اطلاعات طبقه بندی

در طبقه بندی IPS از سازماندهی سلسله مراتبی (درخت مانند) اطلاعات استفاده می شود که به آن CLASSIFIER می گویند. بخش های طبقه بندی کننده RUBRIC نامیده می شوند. آنالوگ کتابخانه ای طبقه بندی IPS یک فهرست سیستماتیک است. طبقه بندی توسط تیمی از نویسندگان توسعه یافته و بهبود یافته است. سپس توسط تیم دیگری از متخصصان به نام SYSTEMATIZERS استفاده می شود. سیستم‌سازها با شناخت طبقه‌بندی‌کننده، اسناد را می‌خوانند و شاخص‌های طبقه‌بندی را به آنها اختصاص می‌دهند و نشان می‌دهند که این اسناد با کدام بخش از طبقه‌بندی‌کننده مطابقت دارند.

IPS موضوع (حلقه های وب)

از دیدگاه کاربر، موضوع IPS ساده ترین است. به دنبال نام موضوع مورد نظر مورد علاقه خود باشید (موضوع می تواند چیزی غیر مادی باشد، به عنوان مثال، موسیقی هندی)، و لیستی از منابع اینترنتی مرتبط با نام مرتبط است. این امر به ویژه در صورتی راحت خواهد بود که لیست کامل موارد کوچک باشد.

دیکشنری IPS

مسائل فرهنگی مرتبط با استفاده از IPS طبقه بندی شده منجر به ایجاد یک IPS از نوع فرهنگ لغت با نام انگلیسی تعمیم یافته شده است. موتورهای جستجو. ایده اصلی فرهنگ لغت IPS ایجاد فرهنگ لغاتی از کلمات موجود در اسناد اینترنتی است که در آن برای هر کلمه، فهرستی از اسنادی که کلمه داده شده از آنها گرفته شده است، ذخیره می شود.

بر اساس اطلاعات کتاب A.Yu. کلینا "مبانی امنیت اطلاعات"، می توانید دریابید که دو الگوریتم اصلی برای عملکرد فرهنگ لغت IPS وجود دارد: استفاده از کلمات کلیدی و استفاده از توصیفگر ( توصیفگر - یک واحد واژگانی (کلمه، عبارت) از یک زبان بازیابی اطلاعات که برای توصیف محتوای معنایی اصلی یک سند یا فرموله کردن یک پرس و جو در هنگام جستجوی یک سند (اطلاعات) در یک سیستم بازیابی اطلاعات خدمت می کند.). در حالت اول، برای ارزیابی محتوای سند، فقط از کلماتی استفاده می شود که در آن وجود دارد و در صورت درخواست، IS کلمات حاصل از پرس و جو را با کلمات سند مقایسه می کند و ارتباط آن را با تعداد، مکان تعیین می کند. ، وزن کلمات از پرس و جو در سند. به دلایل تاریخی، IPSها از این الگوریتم در تغییرات مختلف استفاده می کنند.

1 اصول کلی برای سازماندهی جستجوی اطلاعات در اینترنت

1.1 جستجوی اطلاعات در اینترنت: استراتژی و روش

جستجوی اطلاعات یکی از رایج ترین و در عین حال سخت ترین کارهایی است که هر کاربری در وب با آن روبروست. دلیل مشکلاتی که در بازیابی اطلاعات در اینترنت به وجود می آید توسط دو عامل اصلی مشخص می شود. اولا، تعداد منابع موجود در وب بسیار زیاد است. ثانیاً، میزان اطلاعات موجود در وب نه تنها از نظر حجم عظیم، بلکه بسیار پویا است. در نیم دقیقه ای که صرف خواندن خطوط اول این بخش می کنیم، حدود صد سند جدید یا تغییر یافته در دنیای مجازی ظاهر می شود، ده ها سند به آدرس های جدید منتقل می شوند و واحدها برای همیشه وجود ندارند.

ضرورت و اهمیت مسئله بازیابی اطلاعات منجر به شکل گیری یک صنعت کامل در خود اینترنت شده است که وظیفه آن دقیقا کمک به کاربر در جهت یابی در فضای مجازی است. این صنعت از خدمات یا خدمات جستجوی ویژه تشکیل شده است. به طور معمول، آنها را می توان به دایرکتوری ها (دایرکتوری ها) و موتورهای جستجو (موتورهای جستجو) تقسیم کرد.

این انواع از نظر ظاهری بسیار شبیه به هم هستند، زیرا هر دایرکتوری معمولا موتور جستجوی خود را دارد و هر موتور جستجو دایرکتوری مخصوص به خود را دارد. با این حال، اصول کار آنها بر اساس رویکردها و فناوری های کاملا متفاوت است. هر یک از این ابزارها دارای مزایای خاصی هستند و تفاوت اصلی بین آنها در مشارکت / عدم مشارکت یک فرد نهفته است. موتورهای جستجو نرم افزار "عنکبوت" را در وب اجرا می کنند که از صفحه ای به صفحه دیگر می رود و متن کامل هر صفحه را فهرست می کند. از سوی دیگر، دایرکتوری ها توسط ویرایشگرهای انسانی تشکیل می شوند که صفحات را می خوانند، صفحات نامناسب را حذف می کنند و گره ها را بر اساس موضوع دسته بندی می کنند. علاوه بر این، هر نوع از خدمات جستجو برای حل یک نوع مشکل استفاده می شود. انتخاب درست ابزار تا حد زیادی استراتژی فعالیت جستجو و در نهایت نتیجه جستجو را تعیین می کند.

با شروع جستجوی اطلاعات در اینترنت، همیشه باید چند نکته اساسی را به خاطر بسپارید. اول از همه، هیچ وسیله ناوبری - کاتالوگ یا موتورهای جستجو - کل آرایه اطلاعات فعلی اینترنت را پوشش نمی دهد. بر اساس برخی برآوردها، حتی رهبران شناخته شده جستجوی وب مانند گوگل، بیش از یک سوم از کل محتوای وب را منعکس نمی کنند. دلیل این امر افزایش مداوم حجم اطلاعات در اینترنت است که با وجود تمام تلاش های سرویس های ناوبری، حاوی تعداد زیادی از نقاط خالی است.

علاوه بر رشد سریع و تغییر مکان اسناد، اکثر موتورهای جستجو دارای محدودیت های داخلی برای نمایش مطالب از یک سایت و حجم قسمت نمایه شده صفحه هستند. برنامه های ربات اغلب فراتر از یک دایرکتوری خاص، به عمق سرور نمی روند، که همچنین تعداد مواد منعکس شده را کاهش می دهد.

در عین حال، بسیاری از سایت های بزرگ سیستم جستجوی خود را دارند که کل آرایه اطلاعات آنها را منعکس می کند. پس از شناسایی چنین سرورهایی با استفاده از دایرکتوری ها، می توانید با استفاده از یک موتور جستجوی محلی بررسی دقیق تری از آنها انجام دهید. بنابراین، دایرکتوری ها و موتورهای جستجو باید در کنار یکدیگر برای دستیابی به کامل ترین نتایج استفاده شوند.

همچنین تعدادی الزامات کلی برای فعالیت های جستجو وجود دارد که رعایت آنها باعث افزایش کارایی و صرفه جویی در زمان صرف شده برای جستجوی داده می شود.

1. برای جستجوی مواد در یک موضوع خاص بسیار محدود، باید با کاتالوگ ها شروع کنید.

2. برای به دست آوردن نتایج کامل تر برای یک پرس و جو پیچیده، جستجوی جداگانه در هر موتور جستجو توصیه می شود. موتورهای جستجو تنوع زیادی در انعکاس اسناد دارند و استفاده مداوم از آنها به میزان زیادی پوشش مطالب را گسترش می دهد.

3. هنگام جستجوی اسناد در مورد یک کشور خاص یا به یک زبان خاص، اولویت باید به ملی/منطقه ای داده شود ابزارهای جستجو.

4. باید با استفاده از تمامی امکانات مکانیزم تدوین درخواست، درخواست را تا حد امکان دقیق تشکیل داد. زمانی که برای تهیه دقیق نسخه جستجو صرف می شود، زمانی که نتایج جستجو تجزیه و تحلیل می شوند، نتیجه می دهد. با تشکیل پرس و جو دقیق، درصد نویز اطلاعات بسیار کمتر خواهد بود.

با استفاده سیستماتیک از ابزارهای جستجو، نظارت مداوم بر اخبار مربوط به سرویس جستجو ضروری است. در دنیای اطراف ما به طور کلی، و حتی بیشتر از آن در دنیای دیجیتال، هیچ چیز ابدی وجود ندارد. هر موتور جستجو دوره‌هایی از شروع، شکوفایی و افول را پشت سر می‌گذارد. از دور شدن از موتور جستجوی مورد علاقه اما قدیمی خود و تغییر به ابزارهای جستجوی جدیدتر و قدرتمندتر نترسید.

1.2 جستجو با استفاده از دایرکتوری ها

1.2.1 اصل عملکرد، مزایا و معایب دایرکتوری ها

دایرکتوری ها پیشگامان ناوبری وب هستند. کاتالوگ داده ای است که توسط موضوعات در قالب ساختارهای سلسله مراتبی ساختار یافته است. هنگامی که کاتالوگ بارگیری می شود، کلی ترین فهرست حوزه های فعالیت انسانی روی صفحه نمایش داده می شود: هنر، آموزش، کسب و کار، علم، بازی، ورزش و غیره. کاتالوگ ها ساختار سلسله مراتبی دارند، یعنی کاربر با ورود به هر بخش از کاتالوگ، اطلاعات بیشتر و دقیق تری را مشاهده می کند. اکثر دایرکتوری ها با افزودن صفحات وب سایت خود به لیست لینک های موجود توسط نویسندگان ایجاد می شوند.

دایرکتوری های جستجو به صورت دستی ایجاد می شوند، یعنی. اطلاعات موجود در آنها توسط افراد وارد می شود. ویراستاران واجد شرایط شخصاً بررسی می کنند فضای اطلاعاتی WWW آنچه را که فکر می‌کنند مورد علاقه عمومی است انتخاب کرده و فهرست‌بندی می‌کند. به لطف عامل "انسان"، اطلاعات موجود در دایرکتوری ها کاملاً واضح سازماندهی می شوند که در موارد خاص به شما امکان می دهد سریعتر از موتورهای جستجو به نتیجه دلخواه برسید. مشکل اصلی دایرکتوری ها را جستجو کنیدنسبت پوشش منابع WWW بسیار پایین است. فقط بهترین صفحات وارد دایرکتوری ها می شوند. بنابراین، یافتن اطلاعات به اندازه کافی خاص در کاتالوگ اغلب بسیار دشوار است.

علاوه بر بخش‌های اصلی، بسیاری از دایرکتوری‌ها دارای فهرست‌های اضافی هستند که در آنها سایت‌ها بر اساس مبنای متفاوتی طبقه‌بندی می‌شوند: منطقه، کشور؛ الفبا؛ محبوبیت

ویژگی کاتالوگ ها این است که هنگام جستجوی مجموعه های اطلاعات در مورد یک موضوع کلی خاص، به عنوان مثال، "جنبش اتحادیه های کارگری"، "دفاتر تحریریه روزنامه در اورال" و نه هنگام جستجو برای پاسخ به یک موضوع خاص، موثرتر هستند. سوال!

دایرکتوری ها می توانند:

· جهانی، که به شما امکان می دهد در موضوعات مختلف جستجو کنید. اطلاعات در بخش هایی دسته بندی می شوند. هر بخش دارای چندین زیربخش است. به عنوان مثال، www.ru، referal.ru، www.freeedom.ru.


ویندوز، هر برنامه DOS دفترچه راهنمای کاربر خود را داشت و بنابراین نیاز به مطالعه جداگانه هر برنامه داشت. 2 تکنیک های اساسی برای جستجوی اطلاعات در اینترنت 2.1 الزامات جستجوی اساسی حداقل هزینهزمان و حداکثر سرعت، بیشینه سرعتجستجو کردن. ...

اطلاعات با استفاده از بخش های موضوعی انتخاب شده (دایرکتوری های موضوعی) در موتورهای جستجو. این روش جستجوی اطلاعات در اینترنت در قالب یک فهرست کتابخانه ای انجام می شود. به عنوان مثال، اگر نیاز به یافتن اطلاعاتی در مورد استهلاک دارایی های ثابت دارید، باید به قسمت «حسابداری» مراجعه کنید. در آن، بخش "دارایی های ثابت" را انتخاب کنید. و در بخش "دارایی های ثابت" - ...

با استفاده از چک باکس های موجود در این صفحه. این سیستم قابلیت دنبال کردن لینک ها را نیز دارد. فصل 2. حسابداری تسویه حساب ها و بدهی های جاری با خریداران و مشتریان هنگام جستجوی اطلاعات در مورد موضوع "حسابداری تعهدات جاری و تسویه حساب با خریداران و مشتریان"، موتورهای جستجو مانند http://www.altavista.com، http:/ /www. http://...

منابع آموزشی www.spb. osi.ru/ic/آموزش از راه دور در اینترنت www.examen.ru آزمون ها و تست ها www.kbsu.ru/~book/ کتاب درسی علوم کامپیوتر مگا. km.ru دایره المعارف ها و لغت نامه ها جستجوی اطلاعات در اینترنت: مشکلات مشکلاتی که در سطح ظاهر نمی شوند اغلب پس از اتمام مرحله خاصی از کار جستجو، خود را فقط "در آینده" احساس می کنند، و ...


هزینه تولید یکی از شاخص های اقتصادی مهم فعالیت اقتصادی بنگاه ها است.

هزینه تولید یکی از شاخص های اقتصادی مهم فعالیت اقتصادی بنگاه ها است. این به صورت پولی محاسبه می شود و تمام هزینه های شرکت مرتبط با فرآیند تولید و فروش محصولات آن را در نظر می گیرد. یعنی قیمت تمام شده نشان می دهد که محصول تولید شده توسط شرکت چقدر هزینه دارد.

علاوه بر تعیین بهای تمام شده واحد محصول اصلی، محاسبه بهای تمام شده واحدهای کمکی، محصولات نیمه تمام تولید اصلی، محصولات کلیه بخش ها و کارگاه های شرکت ضروری است.

محاسبه بهای تمام شده یا هزینه یابی به شما امکان می دهد سود اقتصادی تولید را تعیین کنید.

با تجزیه و تحلیل کار بخش های شرکت، بر اساس هزینه یک واحد تولید، می توان سودآوری کار آنها را برای دوره مورد تجزیه و تحلیل قضاوت کرد.

اگر هزینه تولید (کار، خدمات) بخش های کمکی شرکت در مقایسه با هزینه های این بخش در سطح مناسبی باشد، فعالیت آنها موثر تلقی می شود.

با افزایش قیمت تمام شده، لازم است در قیمت های فروش تعیین شده تجدید نظر شود. در صورتی که قیمت فروش تغییر نکند، اما در عین حال هزینه های تولید بنگاه افزایش یابد، باید سازمان تولید را بهبود بخشید، فناوری ها را بهبود بخشید و سیاست موثر و اقتصادی تامین مواد اولیه، مواد و غیره لازم را دنبال کرد.

انواع محصولات نهایی مشمول فروش و همچنین خدمات و کارهایی که به سفارش مصرف کنندگان شخص ثالث انجام می شود، واحدهای بهای تمام شده هستند.

برای محصولات، هدف هزینه یابی یک قطعه (کیت، مونتاژ، قطعه، کپی) است.

برای محصولات، شی محاسبه می تواند واحدهای زیر باشد:

وزن - گرم، کیلوگرم، تن؛

حجمی - متر مکعب (سانتی متر، دسی متر)؛

مسطح - متر مربع (سانتی متر، دسی متر)؛

خطی - متر (سانتی متر، دسی متر).

اگر فرآیند فن آوری بسته بندی محصولات نهایی را فراهم کند، هدف محاسبه می تواند یک ظرف، بشکه، بطری، بسته و غیره باشد.

با در نظر گرفتن انواع محصولات، ویژگی های کارها و خدمات، پیچیدگی، نوع، ماهیت فرآیند فن آوری و سازماندهی تولید در شرکت های صنعتی، روش های مختلفهزینه یابی محصول

این روش ها عبارتند از:

هنجاری؛

· در جریان؛

· سفارش داده شده؛

· رو به جلو.

سازماندهی جستجوی اطلاعات در اینترنت. سیستم های بازیابی اطلاعات

جستجوی اطلاعات در اینترنت به دو روش اصلی انجام می شود - با کمک دایرکتوری ها (به آنها دایرکتوری نیز گفته می شود) و با کمک موتورهای جستجو.

دایرکتوری ها جستجوی متنی را برای مرور ساختار یافته فراهم می کنند، در حالی که موتورهای جستجو، همانطور که از نامشان پیداست، زمینه را ارائه نمی دهند، اما به شما امکان می دهند کلمات یا عبارات خاصی را پیدا کنید.

دایرکتوری ها مانند فهرست مطالب یک کتاب هستند و موتورهای جستجو مانند یک فهرست هستند.

اغلب موتورهای جستجو موتور جستجو و دایرکتوری ها را با هم ترکیب می کنند.

این به وضوح در مثال صفحه اول Yandex، جایی که در زیر مشاهده می شود رشته جستجومیزبان لیستی از دایرکتوری ها است که به کاربر اجازه می دهد تا پرس و جو را در حالی که به عمق هر یک از آنها می رود، اصلاح کند.

همه موتورهای جستجو بر اساس یک الگوریتم کار می کنند و بر اساس اصول یکسانی هستند. تفاوت بین آنها فقط در سطح اجرای فنی این اصول در کار ایجاد می شود.

نمونه های موتور جستجو:

ü AltaVista (http://www.altavista.com)

ü Yahoo (http://www.yahoo.com)

ü FTPSearch (http://ftpsearch.lycos.com)

ü "DISCo Finder" شرکت "DISco" (http://www.disco.ru)

ü Yandex (http://www.yandex.ru)

ü گوگل (http://www.google.ru)

ü Rambler (http://www.rambler.ru)

ü ایمیل (http://www.mail.ru)

ü MSN روسیه (http://ru.msn.com) و دیگران.

همه موتورهای جستجو بر اساس سه عملگر اصلی هستند. اینها عملگرهای منطقی "AND"، "OR" و "NOT" هستند. آنها به شرح زیر عمل می کنند.

1. منطقی "AND". اگر یک عملگر "AND" بین دو کلمه در پرس و جو وجود داشته باشد، در نتیجه جستجو فقط آن دسته از اسنادی که حاوی هر دو کلمه هستند پیدا می شوند. بنابراین، برای مثال، query dog ​​AND cat سندی حاوی جمله "سگ در حال تعقیب گربه بود" را پیدا می کند، اما اسنادی متشکل از متن "گربه در حال استراحت بود" یا "غذای سگ" را نخواهیم دید.

2. منطقی "OR". اگر بین کلمات یک عملگر OR وجود داشته باشد، نتایج جستجو اسنادی خواهند بود که حداقل یکی از این کلمات را در خود دارند.

اگر بندهای محدودکننده خاصی قائل نشویم، مطالبی که هر دوی این واژه ها در آنها وجود دارد نیز پیدا می شود.

3. منطقی "نه". اگر دو عبارت قبلی، کلماتی را که می‌خواهید در پرس و جو قرار دهید، توصیف می‌کردند، عملگر NOT کلمات را از پرس و جو مستثنی می‌کند. کاربرانی که برای اولین بار با عملگرهای پرس و جو مواجه می شوند، اغلب تعجب می کنند: آیا ساده تر نیست که یک کلمه غیر ضروری را در یک پرس و جو وارد نکنید؟ در واقع، برای درک اهمیت عملگر منطقی NOT، منطقی است که به یاد داشته باشیم که پرس و جو ما چیز جدیدی در اینترنت ایجاد نمی کند. ما فقط آنچه را که نیاز داریم از آرایه عظیم، اما هنوز محدود موجود پیدا می کنیم. در عین حال باید زباله های اطلاعاتی را قطع کرد. ما آن را با کمک عملگر "NOT" قطع کردیم. متأسفانه تصمیم با ما نیست که آیا این زباله ها را در نتایج جستجو خواهیم دید یا خیر. بنابراین، به عنوان مثال، پس از درخواست اطلاعات در مورد خط الراس پشت بام، زباله های اطلاعات همیشه در قالب اسنادی در مورد اسب قوزدار کوچک، اسکیت بازی، هاکی، اسب ها و غیره ظاهر می شوند. هیچ راهی برای انجام بدون "NOT" منطقی وجود ندارد.

2. شبکه جهانی. خدمات اطلاعات اینترنتی: پست الکترونیک، کنفرانس از راه دور، شبکه جهانی وب.

اینترنت یک شبکه کامپیوتری جهانی است که خدمات یا سرویس های مختلفی را میزبانی می کند.

شبکه کامپیوتریمی تواند دو عملکرد را انجام دهد:

وسیله ای برای ارتباط بین کاربرانی که از یکدیگر فاصله دارند (این تابع را ارتباط می نامیم).

وسیله ای برای دسترسی به مشترک باشد منابع اطلاعات(ما این تابع را اطلاعاتی می نامیم).

خدمات (خدمات یا خدمات) شبکه

رایج ترین خدمات کاربردی در اینترنت عبارتند از:

پست الکترونیک

ایمیل اولین سرویس اینترنت بود و هنوز هم پرکاربردترین سرویس اینترنت امروزی است. ایمیل برای تبادل پیام های پستی بین مشترکین اینترنت در نظر گرفته شده است. با استفاده از ایمیل می‌توانید پیام‌ها را ارسال و دریافت کنید، به نامه‌های دریافتی پاسخ دهید، نسخه‌ای از نامه را به طور همزمان برای چندین گیرنده ارسال کنید، نامه دریافتی را به آدرس دیگری ارسال کنید و غیره.

کنفرانس های تلفنی

نوع دیگری از خدمات شبکه اطلاعاتی به نام "کنفرانس از راه دور" شبیه اشتراک یک روزنامه الکترونیکی است که در آن اطلاعات در مورد یک موضوع خاص - اخبار، یادداشت ها، پاسخ به سوالات، پاسخ به انتشارات قبلی و غیره ظاهر می شود. نویسندگان این اطلاعات بسیار متنوع و فوق سریع، خود کاربران اینترنتی هستند که با منافع مشترک متحد شده اند. کنفرانس های تلفنی از نظر طراحی و نحوه کار بسیار شبیه به ایمیل است، تنها با این تفاوت که نامه شما توسط تعداد زیادی از افراد قابل خواندن است و به نوبه خود می توانید به آنچه افراد کاملاً غریبه برای شما می نویسند علاقه مند شوید.

وب جهانی (وب جهانی یا WWW)

WWW شبکه‌ای از اسناد است که توسط لینک‌ها به یکدیگر مرتبط شده‌اند.

بنابراین، معانی مختلفی به استفاده از اصطلاحات مختلف نسبت داده شده است: شبکه سیستمی از رایانه های متصل به هم است، یعنی سیستم فنیو وب (وب) سیستمی از اسناد به هم پیوسته است، یعنی یک سیستم اطلاعاتی.

البته "وب" اسناد بر اساس یک شبکه کامپیوتری وجود دارد.

هر سند جداگانه ای که آدرس خاص خود را دارد، صفحه وب نامیده می شود.

هر صفحه وب می تواند پیوندهای زیادی به صفحات دیگری داشته باشد که در همان رایانه یا رایانه های دیگر در وب ذخیره می شوند. روی انجیر 3 به صورت شماتیک پوشش شبکه ای از اسناد را در یک شبکه کامپیوتری نشان می دهد. خطوط یکپارچه سرورهای وب و پیوندهای بین آنها را نشان می دهد، خطوط نقطه چین - اسناد وب و پیوندهای آنها.

انجمن های چت مستقیم - IRC (Internet Relay Chat). ترجمه تحت اللفظی - "چت" در زمان واقعی (کنفرانس چت). ارتباط بین شرکت کنندگان بصورت کتبی بصورت آنلاین صورت می گیرد. مانند یک کنفرانس تلفنی، شرکت کنندگان در کنفرانس چت به گروه های موضوعی تقسیم می شوند.

تلفن اینترنتی

این ارتباط صوتی از طریق وب در حالت آنلاین است. این یک سرویس جدید و رو به رشد است. مزیت اصلی آن نسبت به تلفن این است قیمت پایین. کیفیت هنوز پایین تر است اتصال تلفنی(تاخیر زمانی، اعوجاج صدا) اما بدون شک به مرور زمان این نقص برطرف خواهد شد.

3. محلی شبکه های کامپیوتر: مفاهیم اساسی، هدف.

شبکه کامپیوتری مجموعه ای از کامپیوترها است که توسط کانال های انتقال داده به هم متصل شده اند.

شبکه مجموعه ای از رایانه ها و سایر دستگاه های متصل است. و مفهوم کامپیوترهای متصل و به اشتراک گذاری منابع شبکه نامیده می شود. رایانه های تحت شبکه می توانند به اشتراک بگذارند:

ü داده ها؛

ü چاپگرها؛

ü دستگاه های فکس؛

ü مودم ها؛

ü دستگاه های دیگر

این لیست با ظاهر شدن روش های جدید به طور مداوم به روز می شود. اشتراک گذاریمنابع

چندین توپولوژی شبکه اصلی وجود دارد، به عنوان مثال. موقعیت فیزیکی کامپیوترها، کابل ها و سایر اجزاء:

برای ساخت شبکه اترنت به تجهیزات زیر نیاز دارید:

1. کارت شبکه - یک کارت برای هر کامپیوتر.

2. سوئیچ - دستگاهی که همه کابل ها از آن وصل شده اند کارت های شبکهکامپیوترها

3. کابل.

برنامه های کاربردی اصلی شبکه های محلی

1. اتوماسیون فعالیت های مدیریت اداری، سازمان "دفاتر الکترونیک"، که در آن از ایمیل به جای گردش کار کاغذی استفاده می شود.

2. اتوماسیون تولید – اتوماسیون فرآیندهای تکنولوژیکی, پشتیبانی اطلاعاتمدیریت عملیاتی تولید، برنامه ریزی و مدیریت اقتصادی تولید؛

3. اتوماسیون تحقیق و توسعه علمی.

4. اتوماسیون آموزش، آموزش و بازآموزی پرسنل.

5. اتوماسیون فعالیت های سازمانی.