Классический метапоиск
У данного класса интернет-поисковиков есть ряд отличительных признаков. Это отсутствие собственных баз данных (они пересылают запросы на несколько других поисковиков), одновременное получение результатов сразу от нескольких поисковых машин. Классические метапоисковики во многом пытаются повторять обычные машины. Так, например, результаты поиска выводятся единым списком, отсортированным по релевантности. При оценке и размещении ссылок в списке, кроме всего прочего, как правило, учитывается количество нашедших эту ссылку поисковиков и позиция конкретной веб- страницы в этих результатах. Преимущества онлайнового метапоиска очевидны. Во-первых, это широта охвата — одним запросом вы можете охватить сразу несколько поисковиков со своими уникальными базами данных. В результате экономится время, которое было бы потрачено на перебор поисковиков, как следствие повышается эффективность вашей работы. Кроме того, метапоисковики позволяют сравнить результаты, полученные от разных поисковиков, а также, например, быстро оценить позицию какого-нибудь сайта в результатах различных поисковых ресурсов. Наконец, эти инструменты абсолютно доступны и бесплатны.
Для полноты картины назовем и основные недостатки метапоисковых систем. Поскольку результатов по популярным запросам и на одном поисковике может быть ну очень много, количество ссылок, полученных с нескольких машин, может достигать совсем уж неприличных цифр. Сражаться с такими объемами можно различными способами. Одним из самых популярных является ограничение количества ссылок, полученных с одного поисковика. Зачастую метапоисковики принимают только 10-20 первых результатов с каждой машины. Это серьезно бьет по глубине поиска. Есть у метапоисковиков проблемы с синтаксисом сложных запросов — он зачастую либо вообще отсутствует, либо ограничивается самыми незамысловатыми командами. В особо запущенных случаях нельзя даже произвести поиск по точной фразе. Такое положение вещей сложилось в основном "благодаря" различиям в языках запросов, задействованных системой поисковиков. Забивать себе голову проблемами перевода вашего заковыристого запроса на язык, понятный десяткам различных машин, станет далеко не каждый разработчик. Ряд метапоисковиков грешит злоупотреблением ссылками из платных рекламных баз. Хорошо если они будут четко выделены в списке результатов. Данное обстоятельство также не способствует повышению качества поиска. Кроме того, современные крупные поисковики могут похвастаться массой дополнительных сервисов, в то время как метапоиковики на этом фоне смотрятся довольно аскетично. Наконец, еще один специфический, но важный для нас с вами недостаток — по большей части это зарубежные ресурсы, поэтому далеко не все метапоисковики способны корректно отрабатывать запросы на кириллице.
В настоящее время метапоисковиков пруд пруди. Во многом это связано с желанием разработчиков немного упростить себе задачу — множество таких метамашин просто рассылают запрос по нескольким поисковым ресурсам и выдают вам один или несколько списков результатов, не утруждая себя дополнительной их обработкой. Если принять во внимание эти особенности, легко сформулировать требования к добротному метапоисковику. В первую очередь, у него должна быть хорошая подборка поисковиков. При этом важно даже не столько общее количество поисковиков в списке, сколько хороший охват существующих в данный момент индексных баз — их все-таки меньше, чем поисковиков. Смысла в одновременном обращении к нескольким поисковикам, которые пользуются одной и той же индексной базой, не так уж много, поскольку результаты все равно будут совпадать. Хорошая метапоисковая машина также должна располагать мощными инструментами дополнительной обработки собранных из разных источников данных. По меньшей мере, она должна уметь отсеивать дублирующиеся ссылки, а также корректно сортировать результаты общего метапоиска. Весьма желательно также видеть статистику: где именно была найдена конкретная ссылка, какой поисковик принес самый интересный улов. Наконец, важны дополнительные инструменты поиска, скорость и стабильность работы. Вооружившись такой умозрительной линейкой, давайте пройдемся по характеристикам парочки наиболее интересных и полезных метапоисковиков классического типа.
Dogpile
www.dogpile.com
Соответственно, в Dogpile представлены четыре крупные индексные базы, что дает очень хороший охват ресурсов. Кроме того, Dogpile умеет искать не только веб-документы, но и новости, картинки, аудио- и видеофайлы, а также деловую информацию и White Pages. Как и на других метапоисковиках, самый, наверное, интересный раздел Dogpile — это расширенный поиск. На этой странице присутствуют инструменты работы с логическими операторами (подраздел Quick Web Search), поиск документов на определенном языке, отбор по дате включения страницы в индексную базу. Можно отобрать ссылки на ресурсы определенного домена (Domain Filter). Отдельного упоминания заслуживает подраздел Search Filter, по сути, являющийся так называемым "семейным фильтром". Он предусматривает три варианта фильтрации, скажем так, сомнительного контента: отсутствие фильтрации, отбрасывание наиболее нескромных страниц и, наконец, максимальная фильтрация, после которой, по идее, должны остаться только безупречно благопристойные ссылки. Что интересно, настройки этого фильтра повторены на странице Preferences, только уже под другими именами. Суть фильтра от этого совершенно не меняется — все работает абсолютно одинаково. Отличие в другом: если настройки, выставленные на странице Advanced Search, работают только для одного поиска, то опции Preferences запоминаются и действуют постоянно.
Таким образом, Dogpile хорош в первую очередь достойным охватом поисковиков, возможностью поиска файлов различных форматов и неплохими опциями расширенного поиска. Если вы ищете преимущественно по зарубежным ресурсам и заинтересованы в быстром отлове уникальных для каждого поисковика ссылок, это хороший вариант.
Metabear/Metabot
www.metabear.com/www.metabot.ru
В результате Metabear/Metabot является добротным проектом, хотя звезд с неба не хватает. Интересен главным образом поиском по русским ресурсам и файлам разных типов.
Подведем итог
Метапоисковик — это средство поиска с максимально широким охватом индексных баз. Воспользовавшись таким ресурсом, можно быстро получить общую картину интересующей вас темы, которую потом при желании можно уточнить, отправившись на оказавшиеся наиболее полезными поисковики. Главная проблема метапоиска — сортировка результатов. Даже при поиске по одной базе данных алгоритмы сортировки представляют собой едва ли не главный ресурс любого поисковика. Когда таких баз несколько, задача усложняется, и решить ее без потери глубины поиска весьма и весьма непросто. Однако сегодня уже есть несколько вариантов решения этой проблемы, наиболее популярным из которых является кластеризация результатов. Именно такие поисковики нового поколения станут темой нашего следующего обзора.
Алексей Кутовенко
Опубликовано: "Компьютерная газета"
Комментариев нет:
Отправить комментарий