четверг, 3 января 2008 г.

Поиск информации: Поиск информации в Интернете

my_poisk1В Интернете имеются огромные массивы информации на любую тематику. За время существования Всемирной сети в ней накопились самые разнообразные сведения — от расписания и маршрутов движения транспортных средств до дипломных проектов и рецептов экзотических блюд. Однако опытные пользователи знают, что отыскать нужные данные в столь огромном хранилище не так просто. Бессистемный поиск информации в сети можно сравнить с поиском книги в огромной библиотеке без алфавитного каталога, опытного персонала и картотеки.

В Интернете для этой цели служит поисковая машина, которую условно можно назвать веб-сервисом. С ее помощью выполняется поиск страниц в большой базе данных по заданному слову, словосочетанию или другому критерию. Когда вы подключаетесь к веб-порталу (например, Google, Яндекс, Rambler), то имеете возможность задать критерий поиска, после чего щелкаете на кнопке с надписью типа Поиск, Найти или Search и просматриваете полученные результаты. Креме этого, на порталах существуют тематические каталоги.

Получив результаты поиска, не торопитесь переходить по ссылкам на найденные страницы: просмотрите не,только заголовки этих страниц, но и дополнительную информацию, представленную поисковой машиной. В частности, вам могут быть предложены результаты просмотра сопутствующих баз данных (новостей, изображений,каталогов файлов и т. п.) — возможно, они тоже окажутся полезными. Внимательно просмотрите содержимое отдельных найденных записей. Как правило, поисковая машина приводит одну или две записи с каждого сайта, а для просмотра остальных выводит ссылку с надписью, вроде more results from... (еще результаты с сайта...). Не зная назначения этих ссылок, можно пропустить важную информацию.


Использование нескольких поисковых машин


Нужно учесть, что базы данных поисковых машин не идентичны: из-за различий механизмов сбора и индексирования информации (а также в силу других причин) каждая из них содержит записи, отсутствующие в базах данных других поисковых машин. Поэтому если вам нужна как можно более полная информация по интересующему вас вопросу, имеет смысл выполнить один и тот же запрос на нескольких крупнейших машинах — и каждый раз вы будете получать 20-30 % новых записей. Ниже приведены подробные описания нескольких поисковых машин, имеющих самые мощные базы данных и пользующихся наибольшей популярностью. Речь пойдет о возможностях, представленных на страницах этих машин.


Google


За время своего существования поисковая машина Google сумела завоевать симпатии большинства пользователей Интернета. Главным критерием оценки сайтов, которым руководствуется Google, являетсяих популярность. Этот фактор, а также простота интерфейса, постоянное увеличение размера базы данных и наполнение ее наиболее востребованным содержимым способствуют росту популярности самой Google. Уникальность этой машины заключается в том, что она дает возможность перейти либо к выбранной вами странице результатов поиска, либо к ее копии, хранящейся в базе данных Google, благодаря чему можно просматривать даже те страницы, сайты которых в данный момент недоступны. Кроме того, Google является лучшим средством поиска информации в группах новостей (она позволяет находить новости Usenet за последние 20 лет), а также файлов изображений, документов в формате PDF и других форматах, отличных от HTML. В базе данных поисковой машины хранятся записи более чем о восьми иллиардах страниц


Яндекс


Поисковая машина Яндекс (www.yandex.ru) на сегодня имеет самую большую базу данных среди русскоязычных поисковых машин (объемом более 12 500 Гбайт) и является лучшей в российском сегменте Интернета. Ее история ведет отсчет с 1990 года с начала проведения компанией «Аркадия» разработок поискового программ) юго обеспечения. Спустя три года, когда «Аркадия» стала подразделением компании CompTek, технологии поиска были существенно усовершенствованы. В частности,появилась возможность выполнять поиск с учетом орфологии русского языка, и уже в октябре 1996 года были представлены первые продукты серии Яндекс — Hndex.Dict (морфологическое расширение запроса) и Япгкх.Б^е (поиск по своему сайту). А осенью 1997 года был открыт и сайт Яndex.


Сегодня Яндекс — это еще и крупнейший российский портал, предлагающий пользователям не только поиск по Интернету, но и другие услуги Поскольку, как мы уже говорили, Яндекс является порталом, то перечень предоставляемых им услуг довольно обширен — это поиск по блогам и форумам, поиск картинок и возможность просмотра географических карт, а также бесплатная почта и размещение сайтов пользователей, доступ к энциклопедиям и словарям и т. д. Чтобы просмотреть список услуг, нужно с домашней страницы перейти по ссылке Все службы, расположенной под полем для ввода условий поиска.


Rambler


Самой посещаемой поисковой системой российского Интернета является Rambler (www.rambler.ru). Здесь вы можете ввести запрос с помощью ключевых слов, просмотреть тематические каталоги и рейтинговые таблицы, получить последние обзоры финансовых или политических новостей и т. д. Причем Rambler на сегодняшний день является не только наиболее популярным, но и самым мощным поисковым механизмом в Рунете (среди российских сайтов). Его поисковая база содержит миллионы документов более чем с 15 000 сайтов, имеет развитый язык запросов и гибкую форму представления результатов. Домашняя страница поисковой системы Rambler содержит ссылки на самые последние новости.


Благодаря усилиям большой группы программистов и лингвистов заметно улучшиласьточность, полнота и актуальность поиска. Теперь во время обработки запроса Rambler анализирует не только отдельные документы, но и целые сайты. Однако несмотря на усложнившиеся методы поиска, скорость обработки запросов не уменьшилась. Язык запросов системы достаточно прост и понятен даже для начинающихпользователей. Интересной особенностью системы Rambler является отслеживание рейтинга Тор 100, в котором собраны ссылки на самые посещаемые сайты. В рейтинге участвуют около 90 000 сайтов, объединенных более чем в 50 категорий.


kompus.ru

Комментариев нет: