2 занятие

Материал из Saratov FIO Wiki
Перейти к: навигация, поиск

Тематический поиск. Поиск по каталогам. Поиск по указателям (индексам).

Поиск по адресу слишком «прямолинеен», чтобы использоваться часто. Самая лучшая справочная книга для поиска в Интернете – это он сам. И наиболее целенаправленный поиск – это не поиск по адресу, а поиск по темам.

Успешность поиска определяется двумя факторами:

  • насколько точно и корректно посетитель сформулировал запрос;
  • насколько адекватно поисковая система воспринимает поступивший запрос.

Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы информационно-поисковых систем (ИПС). Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность — это поисковые каталоги и поисковые указатели.

Основные различия в их работе заключается в том, каким образом посетитель формулирует запрос и в каком виде он получает ответ на него.

Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог. Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор — работа должна быть автоматизирована.

Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели. Работу поискового указателя можно условно разделить на три этапа:

  1. Сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы — черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;
  2. Индексация базы данных — первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы — собственно поисковые указатели;
  3. Рафинирование (очистка) результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска. Под фильтрацией понимается отсев ссылок, которые нецелесообразно выдавать пользователю (например, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка (по количеству ключевых слов, сопутствующих слов и др.).

Российские поисковые системы Rambler, Яndex, Aport.

Одним из наиболее популярных российских каталогов является Aport (http://www.aport.ru/)

Vish08.JPG

Пусть нам надо найти фото собаки породы йоркширский терьер. Тогда нам предстоит пройти такой путь поиска: Дом и семья →Животные и растения → Животные дома → Собаки →Породы собак →Терьеры. Далее надо просто поработать с теми сайтами, которые предложил поисковик. Могут быть и другие алгоритмы поиска в каталоге. Можно сразу в строке поиска набрать «Йоркширский терьер», нажать «апорт!» и получить огромный список адресов сайтов, посвященных этой собачке. Но это уже другой поиск. С развитием Интернета и лавинообразным увеличением объема его ресурсов каталоги уже не могут полностью удовлетворить запросы пользователей, поэтому в состав многих из них включаются другие механизмы поиска – указатели , или индексы.

Задание: Найти сайты, связанные с Лицеем г.Вольска.

Примечание: Воспользоваться разделом каталога Образование → Общеобразовательные учреждения → Лицеи.

Наиболее популярными российскими поисковыми указателями являются Rambler (www.rambler.ru)

Image017.jpg

и Яndex (www.yandex.ru)

Image019.jpg

На сегодняшний день практически все российские поисковые системы представляют собой комбинацию обоих видов поиска. На отличия ИПС остановимся позже, после того, как познакомимся с понятием «Язык запросов».

Зарубежная поисковая система Google.

Система Google , пожалуй, самая мощная на сегодняшний день. И хотя она имеет американское происхождение, но очень популярна в России, т. к. в Рунете существует «зеркало» этого ресурса по адресу www.google.ru. Индекс этой системы насчитывает более 8 млрд. адресов и постоянно пополняется!