Практическая работа "Поисковые службы интернет. Поисковые серверы www"

П р а кт и ч е с к а я ра б о т а 1
ПОИСКОВЫЕ СЛУЖБЫ ИНТЕРНЕТ. ПОИСКОВЫЕ СЕРВЕРЫ
WWW.
Цель работы:
Освоение приёмов поиска информации:
через каталоги и применения средств
простого поиска;
с помощью поисковой машины,
формирование группы слов для
организации простого поиска;
с помощью поисковой машины,
изучение особенностей поиска
нормативного документа;
графической информации с помощью
поисковой машины, формирование
группы ключевых слов и интерфейса
поисковой системы для поиска
изображений;
скачивания файлов через WWW.
Ответить на вопросы
Какой вид поиска является самым быстрым и надежным?
Где пользователь может найти адреса Web-страниц?
Каково основное назначение поисковой системы?
Из каких частей состоит поисковая система?
Какие поисковые системы вы знаете?
Какова технология поиска по рубрикатору поисковой системы?
Основные теоретические положения
Поиск информации в Интернете осуществляется с помощью
специальных программ, обрабатывающих запросы - информационно-
поисковых систем (ИПС). Различаются поисковые каталоги и поисковые
указатели.
Поисковые каталоги устроены по тому же принципу тематических
каталогов библиотек. Они обычно представляют собой иерархические
гипертекстовые меню с пунктами и подпунктами, определяющими тематику
сайтов, адреса которых содержатся в данном каталоге, с постепенным, от
уровня к уровню, уточнением темы.
Автоматическую каталогизацию Web-ресурсов и удовлетворение
запросов клиентов выполняют поисковые указатели. Работу поискового
указателя можно условно разделить на три этапа:
сбор первичной базы данных;
индексация базы данных;
рафинирование результирующего списка.
В России наиболее крупными и популярными поисковыми указателями
являются:
«Яndex» (www.yandex.ru)
«Pамблер» (www.rambler.ru)
«Google» (www.google.ru)
Каждая поисковая система - это большая база ключевых слов,
связанных с Web-страницами, на которых они встретились. Для поиска
адреса сервера с интересующей вас информацией надо ввести в поле
поисковой системы ключевое слово, несколько слов или фразу. Тем самым
вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде
списка адресов Web-страниц, на которых встретились эти слова.
Как правило, поисковые системы состоят из трех частей: робота, индекса и
программы обработки запроса.
Робот (Spider, Robot или Bot) - это программа, которая посещает веб-
страницы и считывает (полностью или частично) их содержимое. Роботы
поисковых систем различаются индивидуальной схемой анализа
содержимого веб-страницы.
Индекс - это хранилище данных, в котором сосредоточены копии всех
посещенных роботами страниц. Индексы в каждой поисковой системе
различаются по объему и способу организации хранимой информации. Базы
данных ведущих поисковых машин хранят сведения о десятках миллионов
документов, а объемы их индекса составляют сотни гигабайт. Индексы
периодически обновляются и дополняются, поэтому результаты работы
одной поисковой машины с одним и тем же запросом могут различаться,
если поиск производился в разное время.
Рабочая область Yandex.ru разбита на несколько частей: