§2.10 Поиск информации в Интернете.
Поиск информации в Интернете.
Заполнение баз данных поисковой системы осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web-серверы Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса документов. Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются старые, меняются их URL-адреса и т. д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не существующего или перемещенного документа. В целях обеспечения боль: него соответствия между со держанием базы данных поисковой системы и реальным со стоянием Интернета большинство поисковых систем разрешают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчики сайта вносит URL сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт. Поисковые системы общего назначения Интерфейс по исковых систем общего назначения содержит поле поиска и список разделов каталога. Заполнение баз данных поисковых систем. Заполнение баз данных поисковой системы осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web-серверы Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса документов. Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются старые, меняются их URL-адреса и т. д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не существующего или перемещенного документа. В целях обеспечения большего соответствия между со держанием базы данных поисковой системы и реальным со стоянием Интернета большинство поисковых систем разрешают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчики сайта вносит URL сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт. Поиск по ключевым словам. При поиске по ключевым словам в поле поиска вводится одно или несколько ключевых слов, которые, по мнению пользователя, являются главными дня искомого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и т. д. Через некоторое время после отправки запроса поисковая система вернет аннотированный (с короткими комментариями содержания документа) список URL-адресов доку ментов, в которых были найдены указанные вал-и ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на него ссылку. Если ключевые слова были выбраны неудачно, то список URL-адрес документов может быть слишком большим (содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы. Поиск в иерархической системе каталогов. Ката логи составляются редакторами, просматривающими каждый новый сайт до его включения в иерархическую систему каталогов. Каталоги обычно организованы в соответствии с предметной классификацией. Поиск информации в каталоге сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на URL-адреса наиболее посещаемых и важных Web-сайтов, каждая ссылка обычно аннотирована. Современные поисковые системы. Одной из наиболее полных и мощных поисковых систем является Google (www.googIe.ru), в базе данных которой хранятся 8 миллиардов Web-страниц, и каждый месяц программы роботы заносят в нее 5 миллионов новых страниц. В Рунете (российской части Интернета) обширные базы данных, содержащие более 200 миллионов документов, имеют поисковые системы yndex (www.yandex.ru) и Rambler (www .rambler.ru). Наиболее полный многоуровневый иерархический тематический каталог русскоязычных Интернет-ресурсов имеет поисковая система Апорт (www.aport.ru). Сайты в базе данных ранжируются по количеству их по сещений в день, неделю или месяц Посещаемость сайтов определяется с помощью специальных счетчиков, которые могут быть установлены на сайте. Счетчики фиксирует каждое посещение сайта и передаю' информацию о количестве посещений на сервер поисковой системы. Современные поисковые системы часто являются информационными порталами, которые предоставляют пользователям не только возможности поиска документов в Интернете, но и доступ к другим информационным ресурсам (новостям, информации о погоде, валютном курсе, интерактивным географическим картам и т. д.). Специализированные поисковые системы. Специализированные поисковые системы позволяют искать информацию в других информационных «слоях» Интернета. Существуют специализированные поисковые системы, предназначенные для поиска файлов на серверах фай новых архивов, а также системы поиска адресов электронной почты. Файловая поисковая система (v;ww filesearcn.ruj является специализированной поисковой системой, в базах данных которой хранятся сведения о 6 миллионах файлов, размещенных на 2 тысячах серверов файловых архивов Рунета. Системы поиска людей позволяют искать адрес электрон ной почты по имени человека или, наоборот, имя человека, хозяина определенного адреса электронной почты. В окно по иска необходимо ввести имя и фамилии, после чего система осуществит поиск адреса электронной почты в базы данных, содержащей информацию об абонентах, зарегистрированных в системе.
Работу выполнил:
Ученик 10-А класса
Булдаков Артём