понедельник, 12 ноября 2012 г.

Современный метапоиск в Интернете

Не секрет, что даже самые крупные поисковые системы не способны полностью охватить интернет-ресурсы: для наполнения индексных баз используются различные роботы и алгоритмы, а значит, их содержание на разных поисковиках может различаться.
Следовательно, если вы хотите добиться максимального охвата источников, следует задействовать несколько индексных баз.

Такую за­да­чу при­зва­ны ре­шать герои на­ше­го об­зо­ра — ме­та­по­ис­ко­вые си­сте­мы. Эти сер­ви­сы на­прав­ля­ют за­прос поль­зо­ва­те­ля на несколь­ко по­ис­ко­вых машин, а затем при­ни­ма­ют по­лу­чен­ные ре­зуль­та­ты, об­ра­ба­ты­ва­ют их и вы­да­ют еди­ным спис­ком.

Ме­та­по­ис­ко­вые ин­тер­нет-си­сте­мы про­шли в своем раз­ви­тии до­ста­точ­но дол­гий путь, и сей­час их луч­шие пред­ста­ви­те­ли ис­поль­зу­ют самые со­вре­мен­ные тех­но­ло­гии об­ра­бот­ки ин­фор­ма­ции, на­при­мер кла­сте­ри­за­цию. Суть та­ко­го под­хо­да за­клю­ча­ет­ся в том, что по­лу­чен­ное в ходе по­ис­ка по опре­де­лен­но­му клю­че­во­му слову под­мно­же­ство стра­ниц до­пол­ни­тель­но ана­ли­зи­ру­ет­ся, в ре­зуль­та­те чего вы­яв­ля­ют­ся новые клю­че­вые слова, встре­ча­ю­щи­е­ся на веб-стра­ни­цах вме­сте с тер­ми­на­ми за­про­са. С боль­шой ве­ро­ят­но­стью они от­но­сят­ся к от­дель­ным ас­пек­там ин­те­ре­су­ю­щей поль­зо­ва­те­ля темы. Далее най­ден­ные веб-стра­ни­цы раз­де­ля­ют­ся на от­дель­ные кла­сте­ры в со­от­вет­ствии с на­ли­чи­ем этих до­пол­ни­тель­ных клю­че­вых тер­ми­нов. Такая тех­но­ло­гия имеет ряд пре­иму­ществ. Поль­зо­ва­тель по­лу­ча­ет под­сказ­ки, поз­во­ля­ю­щие уточ­нить за­прос, что осо­бен­но важно при по­ис­ке по незна­ко­мой пред­мет­ной об­ла­сти. При­ме­не­ние кла­сте­ров также по­мо­га­ет под­нять в ре­зуль­та­тах по­ис­ка уз­ко­те­ма­ти­че­ские сайты, ко­то­рые при обыч­ном по­ис­ке могли ока­зать­ся да­ле­ко за пре­де­ла­ми пер­вой де­сят­ки ре­зуль­та­тов и, сле­до­ва­тель­но, вне поля зре­ния по­дав­ля­ю­ще­го боль­шин­ства поль­зо­ва­те­лей.

Далее мы рас­смот­рим луч­шие в на­сто­я­щее время ин­тер­нет-ме­та­по­ис­ко­ви­ки, ба­зи­ру­ю­щи­е­ся на кла­стер­ных тех­но­ло­ги­ях.

Clusty

Сер­вис Clusty — один из круп­ней­ших со­вре­мен­ных ме­та­по­ис­ко­ви­ков, «пол­но­цен­ная» вер­сия экс­пе­ри­мен­таль­ной ма­ши­ны Vivisimo, раз­ра­ба­ты­ва­ю­щей­ся с 2004 г. Clusty ра­бо­та­ет с по­ис­ко­ви­ка­ми Ask, Gigablast, Live (те­перь — Bing), до­пол­няя ре­зуль­та­ты дан­ны­ми, по­лу­чен­ны­ми в «Ви­ки­пе­дии», Yahoo! News и Open Directory. Эту си­сте­му вряд ли стоит ре­ко­мен­до­вать для по­ис­ка по умол­ча­нию, од­на­ко она ста­нет от­лич­ным до­пол­не­ни­ем к по­ис­ку по ино­стран­ным ре­сур­сам в Google или Yahoo!, по­сколь­ку поз­во­ля­ет в еди­ном ин­тер­фей­се охва­тить ин­декс­ные базы, обыч­но вы­па­да­ю­щие из круга зре­ния поль­зо­ва­те­ля, при­вык­ше­го об­ра­щать­ся толь­ко к самым круп­ным и из­вест­ным по­ис­ко­ви­кам.

Ин­тер­фейс стра­ни­цы вы­да­чи дан­но­го сер­ви­са четко раз­де­лен на две об­ла­сти: спи­сок ре­зуль­та­тов и бо­ко­вую па­нель кла­сте­ров, на ко­то­рой отоб­ра­жа­ют­ся ре­зуль­та­ты кла­сте­ри­за­ции в виде пе­реч­ня. Его от­дель­ные эле­мен­ты можно рас­крыть, чтобы про­смот­реть вло­жен­ные кла­сте­ры. Clusty по умол­ча­нию ис­поль­зу­ет двух­уров­не­вую кла­сте­ри­за­цию. Уточ­нить поиск по­мо­жет поле Find in clusters. Бо­ко­вая па­нель со­дер­жит еще несколь­ко за­кла­док: Sources, на ко­то­рой ре­зуль­та­ты раз­би­ты на груп­пы по от­дель­ным по­ис­ко­ви­кам, и Sites, где ссыл­ки сгруп­пи­ро­ва­ны по до­ме­нам.

В спис­ке ре­зуль­та­тов рядом с каж­дой ссыл­кой при­сут­ству­ют три кноп­ки. С их по­мо­щью можно от­крыть ссыл­ку в новом окне, найти все ее вхож­де­ния в раз­лич­ных кла­сте­рах, а также вос­поль­зо­вать­ся ре­жи­мом пред­ва­ри­тель­но­го про­смот­ра. В этом слу­чае на стра­ни­це вы­да­чи со­зда­ет­ся неболь­шой фрейм, куда и под­гру­жа­ет­ся най­ден­ная веб-стра­ни­ца.

Рас­ши­рен­ные на­строй­ки по­ис­ка поз­во­ля­ют ука­зать язык ис­ко­мых стра­ниц, типы фай­лов (под­дер­жи­ва­ют­ся фор­ма­ты Microsoft Office и PDF), а также ко­ли­че­ство ссы­лок в кла­сте­рах — 200 или 500.

По­ми­мо по­ис­ка по веб-сай­там, Clusty пред­ла­га­ет ра­бо­ту с ба­за­ми изоб­ра­же­ний, но­во­стей и бло­гов. Каж­дый из пе­ре­чис­лен­ных ре­жи­мов имеет свою спе­ци­фи­ку. Так, при по­ис­ке кар­ти­нок за­дей­ство­ван толь­ко один ис­точ­ник — Picsearch, од­на­ко до­стой­но ра­бо­та­ет кла­сте­ри­за­ция ре­зуль­та­тов. Из­ме­ня­ют­ся и вклад­ки на бо­ко­вой па­не­ли, пред­ла­га­ю­щие сгруп­пи­ро­вать най­ден­ный кон­тент по раз­ме­ру ри­сун­ка, типу файла и до­ме­ну. При по­ис­ке но­во­стей пред­ла­га­ет­ся соб­ствен­ная груп­пи­ров­ка: «го­ря­чие» но­во­сти, наука, биз­нес и дру­гие по­доб­ные ка­те­го­рии. Весь­ма ин­те­ре­сен раз­дел Wikipedia. Это, по сути, кла­стер­ный ин­тер­фейс к круп­ней­шей се­те­вой эн­цик­ло­пе­дии, по­лез­ный в том слу­чае, когда ин­те­ре­су­ет до­ста­точ­но ши­ро­кая пред­мет­ная об­ласть. Поиск по бло­гам ве­дет­ся до­воль­но мед­лен­но, при­чем об­ра­ба­ты­ва­ют­ся сер­ви­сы Feedster, Technorati, Blogger и BlogPulce.

В на­строй­ках Clusty при­сут­ству­ет ин­те­рес­ная воз­мож­ность со­здать соб­ствен­ный режим по­ис­ка, вклю­чив в него необ­хо­ди­мые по­ис­ко­ви­ки из спис­ка под­дер­жи­ва­е­мых си­сте­мой. Это, на­при­мер, поз­во­лит вести од­но­вре­мен­ный поиск и по сай­там, и по но­во­стям, и по бло­гам.

На­ря­ду с обыч­ным веб-ин­тер­фей­сом си­сте­ма об­ла­да­ет и сер­ви­сом, оп­ти­ми­зи­ро­ван­ным для про­смот­ра на мо­биль­ных устрой­ствах (m.​clusty.​com). Он вы­пол­нен до­ста­точ­но удач­но: кла­сте­ры вы­во­дят­ся в виде го­ри­зон­таль­ной ли­ней­ки над ос­нов­ным спис­ком. Кроме того, сразу пред­ла­га­ет­ся пе­ре­чень уточ­нен­ных за­про­сов, что удоб­но, если вы поль­зу­е­тесь обыч­ным те­ле­фо­ном и не же­ла­е­те лиш­ний раз на­би­рать на кла­ви­а­ту­ре. В от­ли­чие от обыч­но­го по­ис­ка, мо­биль­ная вер­сия вы­во­дит на одной стра­ни­це ре­зуль­та­ты по­ис­ка и по веб-сай­там, и по базе изоб­ра­же­ний. От­дель­но вы­де­ле­ны ста­тьи, най­ден­ные в «Ви­ки­пе­дии».

И еще Clusty пред­ла­га­ет по­ис­ко­вый пла­гин для Firefox и Internet Explorer, а также па­не­ли ин­стру­мен­тов для бра­у­зе­ров Firefox, Safari и Opera.

PolyMeta


Cи­сте­ма PolyMeta — но­вин­ка в об­ла­сти ме­та­по­ис­ка. Дан­ный сер­вис ра­бо­та­ет с во­се­мью круп­ны­ми по­ис­ко­ви­ка­ми: Google, Yahoo!, Bing, Ask, Exalead, AllTheWeb, GigaBlast и Cuil, что обес­пе­чи­ва­ет хо­ро­ший охват при по­ис­ке. При же­ла­нии до­пу­сти­мо вруч­ную на­стро­ить спи­сок по­ис­ко­ви­ков, на ко­то­рые будет от­прав­лен за­прос. Для этого слу­жит ссыл­ка Select Sources, рас­по­ло­жен­ная рядом с полем ввода за­про­са. Кла­стер­ный ал­го­ритм PolyMeta об­ра­ба­ты­ва­ет толь­ко пер­вые две сотни ре­зуль­та­тов, по­лу­чен­ные от на­зван­ных по­ис­ко­вых си­стем, т. е. удаст­ся уви­деть лишь пер­вые 25 ссы­лок с каж­до­го из них. Сле­до­ва­тель­но, PolyMeta не слиш­ком под­хо­дит для ра­бо­ты с так на­зы­ва­е­мым «длин­ным хво­стом» ре­зуль­та­тов.

C по­мо­щью дан­ной си­сте­мы можно ис­кать по веб-стра­ни­цам, базам изоб­ра­же­ний и но­во­стей, а также по бло­гам. Ори­ги­наль­ный раз­дел этого ме­та­по­ис­ко­ви­ка — поиск по мик­роб­ло­гам Twitter.

Ин­тер­фейс стра­ни­цы вы­да­чи раз­де­лен на три ко­лон­ки. На левой па­не­ли со­дер­жат­ся ре­зуль­та­ты кла­сте­ри­за­ции. Дан­ная си­сте­ма под­дер­жи­ва­ет несколь­ко уров­ней вло­же­ний в кла­сте­рах, бла­го­да­ря чему можно до­ста­точ­но быст­ро уточ­нять за­прос про­сто щелч­ка­ми мыши. От­дель­ная за­клад­ка па­не­ли по­мо­жет от­сор­ти­ро­вать ре­зуль­та­ты по ис­точ­ни­кам по­ис­ка. Пра­вая ко­лон­ка ин­тер­фей­са PolyMeta вы­во­дит ре­зуль­та­ты по­ис­ка изоб­ра­же­ний, осу­ществ­ля­ю­ще­го­ся го­раз­до мед­лен­нее, чем поиск веб-сай­тов. При по­ис­ке видео си­сте­ма ра­бо­та­ет с YouTube, Google Video, Yahoo! Video и MySpace.

В спис­ке ссы­лок, вы­во­дя­щем­ся в цен­траль­ной ко­лон­ке, как и в Clusty, до­ступ­на опция пред­ва­ри­тель­но­го про­смот­ра най­ден­ной веб-стра­ни­цы во фрей­ме. Кроме того, уни­каль­ные ре­зуль­та­ты, об­на­ру­жен­ные толь­ко одним из за­дей­ство­ван­ных по­ис­ко­ви­ков, под­све­чи­ва­ют­ся цвет­ным фоном. Над пе­реч­нем всех най­ден­ных ссы­лок вы­во­дит­ся ин­фор­ма­ция о ко­ли­че­стве тех, ко­то­рые по­лу­че­ны с каж­до­го за­дей­ство­ван­но­го по­ис­ко­ви­ка. В си­сте­ме PolyMeta также до­сту­пен ви­зу­аль­ный режим отоб­ра­же­ния кла­сте­ров.

Си­сте­ма PolyMeta, обес­пе­чи­ва­ю­щая охват всех круп­ней­ших ин­декс­ных баз, может быть ре­ко­мен­до­ва­на для об­зор­но­го по­ис­ка по ино­стран­ным ре­сур­сам. За­ме­тим, что бла­го­да­ря об­ра­ще­нию к базам ев­ро­пей­ско­го по­ис­ко­ви­ка Exalead, ре­зуль­та­ты по за­про­сам на язы­ках, от­лич­ных от ан­глий­ско­го, здесь ино­гда по­лу­ча­ют­ся лучше, чем на дру­гих ме­та­по­ис­ко­ви­ках. К ми­ну­сам PolyMeta от­но­сят­ся за­мет­ная «за­дум­чи­вость» при об­ра­бот­ке ре­зуль­та­тов, не все­гда удач­ная сор­ти­ров­ка ссы­лок, а также ра­бо­та толь­ко с пер­вы­ми по­зи­ци­я­ми в вы­да­че от­дель­ных по­ис­ко­ви­ков.

KartOO

Раз­ра­бот­чи­ки фран­цуз­ско­го про­ек­та KartOO бро­си­ли все силы на со­зда­ние дей­стви­тель­но ори­ги­наль­но­го ви­зу­аль­но­го ин­тер­фей­са. По­стро­ен­ный на ос­но­ве тех­но­ло­гии Flash, он внешне за­мет­но от­ли­ча­ет­ся от боль­шин­ства при­выч­ных нам ин­тер­нет-по­ис­ко­ви­ков.

Ин­тер­фейс KartOO до­сту­пен на трех язы­ках: ан­глий­ском, фран­цуз­ском и немец­ком. После от­прав­ки за­про­са можно вы­би­рать из трех ре­жи­мов про­смот­ра ре­зуль­та­тов. Пе­ре­клю­че­ние между ними осу­ществ­ля­ет­ся с по­мо­щью кно­пок на Па­не­ли ин­стру­мен­тов, рас­по­ло­жен­ной над ос­нов­ным ра­бо­чим про­стран­ством. Пер­вые два ре­жи­ма — обыч­ный го­ри­зон­таль­ный спи­сок най­ден­ных ссы­лок, а также вывод ссы­лок вер­ти­каль­ны­ми ко­лон­ка­ми. В дан­ном слу­чае на одном экране по­ме­ща­ет­ся всего три ссыл­ки, но они со­про­вож­да­ют­ся, во-пер­вых, гра­фи­че­ской ми­ни­а­тю­рой веб-стра­ни­цы и, во-вто­рых, рас­ши­рен­ной ан­но­та­ци­ей. Од­на­ко наи­бо­лее ин­те­ре­сен тре­тий режим, по­сколь­ку ана­ло­гов ему нет у кон­ку­рен­тов. Он вклю­чен на KartOO по умол­ча­нию, и ре­зуль­та­ты де­мон­стри­ру­ют­ся в виде свое­об­раз­ной ви­зу­аль­ной карты. Каж­дая най­ден­ная ссыл­ка пред­став­ля­ет­ся гра­фи­че­ской ми­ни­а­тю­рой сайта, раз­мер ко­то­рой за­ви­сит от ее по­зи­ции в вы­да­че за­дей­ство­ван­ных по­ис­ко­ви­ков. При на­ве­де­нии кур­со­ра на ми­ни­а­тю­ру по­яв­ля­ет­ся неболь­шое всплы­ва­ю­щее окно с крат­кой тек­сто­вой вы­держ­кой, ха­рак­те­ри­зу­ю­щей най­ден­ную веб-стра­ни­цу.

Чтобы до­пол­ни­тель­но об­ра­бо­тать ре­зуль­та­ты, KartOO, как и дру­гие участ­ни­ки дан­но­го об­зо­ра, ис­поль­зу­ет тех­но­ло­гию кла­сте­ри­за­ции. Ее ре­зуль­та­ты также вы­во­дят­ся на карте, но толь­ко по­лу­ча­ет­ся не при­выч­ная па­нель с пе­реч­нем кла­сте­ров, а «тро­пин­ки» между от­дель­ны­ми ми­ни­а­тю­ра­ми на карте. Цвет­ные связи в этом слу­чае поз­во­ля­ют со­еди­нить веб-стра­ни­цы из раз­ных кла­сте­ров, что по­лез­но для об­ра­бот­ки сай­тов ши­ро­кой те­ма­ти­ки. Если несколь­ко сай­тов при­над­ле­жат к од­но­му кла­сте­ру, то они будут свя­за­ны между собой на карте, а рядом с такой сетью вы­во­дит­ся на­зва­ние кон­крет­но­го кла­сте­ра. Щелк­нув по нему, можно уточ­нить за­прос и пе­рей­ти к про­смот­ру ре­зуль­та­тов. По­жа­луй, наи­бо­лее бли­зок к KartOO по своей идее ин­тер­фейс рос­сий­ско­го по­ис­ко­ви­ка Quintura, од­на­ко там ос­но­вой по­слу­жи­ло про­стое об­ла­ко тегов, без де­мон­стра­ции свя­зей между от­дель­ны­ми сай­та­ми.

Есть у KartOO и бо­ко­вая па­нель. По умол­ча­нию там вы­во­дят­ся ре­зуль­та­ты по­ис­ка по но­во­стям и кар­тин­кам. Ее со­дер­жа­ние можно из­ме­нить в на­строй­ках по­ис­ка. Среди дру­гих на­стро­ек, до­ступ­ных в этом по­ис­ко­ви­ке, — дет­ский фильтр, внеш­ний вид карты и пе­ре­клю­ча­тель ко­ли­че­ства ре­зуль­та­тов на одной стра­ни­це.

Nigma

C удо­воль­стви­ем сле­ду­ет от­ме­тить, что в об­ла­сти ме­та­по­ис­ка рос­сий­ские раз­ра­бот­чи­ки не от­ста­ют от своих за­ру­беж­ных кол­лег. Со всей от­вет­ствен­но­стью утвер­ждаю, что по­ис­ко­вая си­сте­ма Nigma, вы­пол­нен­ная на ми­ро­вом уровне, яв­ля­ет­ся самым со­вер­шен­ным в на­сто­я­щее время кла­стер­ным ме­та­по­ис­ко­ви­ком для рус­ско­языч­ных веб-ре­сур­сов.

Сер­вис Nigma был раз­ра­бо­тан в 2005 г. при под­держ­ке спе­ци­а­ли­стов МГУ им. М.В. Ло­мо­но­со­ва и в со­труд­ни­че­стве со Стэнд­форд­ским уни­вер­си­те­том. Он ра­бо­та­ет со всеми круп­ней­ши­ми ин­декс­ны­ми ба­за­ми, со­дер­жа­щи­ми до­ку­мен­ты на рус­ском языке. Это Google, «Ян­декс», «Рам­блер», Bing, Altavista, Yahoo!, Aport, а также соб­ствен­ная ин­декс­ная база Nigma.

Дей­стви­тель­но силь­ная сто­ро­на Nigma — это учет спе­ци­фи­ки рус­ско­го языка при об­ра­бот­ке за­про­сов и фор­ми­ро­ва­нии кла­сте­ров. По по­нят­ным при­чи­нам по­доб­ной точ­но­стью не может по­хва­стать­ся ни один из за­ру­беж­ных ре­сур­сов. В Nigma также хо­ро­шо вы­пол­не­но ав­то­до­пол­не­ние при вводе по­ис­ко­во­го за­про­са. В от­ли­чие от боль­шин­ства ин­тер­нет-по­ис­ко­ви­ков, здесь не толь­ко пред­ла­га­ют­ся ва­ри­ан­ты на­пи­са­ния того или иного слова, но и вы­во­дят­ся пря­мые ссыл­ки на спра­воч­ные ре­сур­сы.

Nigma — лучший метапоисковик для русских документов

Nigma — лучший метапоисковик для русских документов

До­стой­но вы­пол­нен­ный ал­го­ритм кла­сте­ри­за­ции Nigma в ходе по­ис­ка учи­ты­ва­ет раз­лич­ные мор­фо­ло­ги­че­ские формы слов из за­про­са, умеет на­хо­дить и об­ра­ба­ты­вать си­но­ни­мы, а также вы­яв­лять более общие по­ня­тия. Кроме того, си­сте­ма успеш­но об­ра­ба­ты­ва­ет за­про­сы с ор­фо­гра­фи­че­ски­ми ошиб­ка­ми — их может быть до че­ты­рех в одном слове, а пред­ла­га­е­мые ва­ри­ан­ты на­пи­са­ния ран­жи­ру­ют­ся по бли­зо­сти к его зву­ча­нию. Nigma также без про­блем справ­ля­ет­ся с за­про­са­ми, по ошиб­ке на­бран­ны­ми в непра­виль­ной рас­клад­ке. Си­сте­ма об­ла­да­ет соб­ствен­ным сло­ва­рем омо­ни­мов, что очень по­мо­га­ет при по­ис­ке по темам, от­но­ся­щим­ся к ин­фор­ма­ци­он­ным тех­но­ло­ги­ям, по­сколь­ку ва­ри­ан­тов на­пи­са­ния за­им­ство­ван­ных из ан­глий­ско­го языка тер­ми­нов может быть нема­ло.

Ин­тер­фейс Nigma по­стро­ен на вы­во­де сфор­ми­ро­ван­ных кла­сте­ров в виде спис­ка на бо­ко­вой па­не­ли. Вклю­че­ние и ис­клю­че­ние от­дель­ных кла­сте­ров осу­ществ­ля­ют­ся про­стым щелч­ком по со­от­вет­ству­ю­щим чек­бок­сам.

На­ря­ду с по­ис­ком по веб-стра­ни­цам в Nigma ре­а­ли­зо­ва­ны еще три вида по­ис­ка: «Кар­тин­ки», «Биб­лио­те­ки» и «Му­зы­ка». Поиск изоб­ра­же­ний также ра­бо­та­ет в ме­та­ре­жи­ме, об­ра­ща­ясь к трем внеш­ним по­ис­ко­ви­кам: «Ян­декс», Google и «Рам­блер». Здесь, прав­да, кла­сте­ри­за­ция не ра­бо­та­ет, филь­тро­вать изоб­ра­же­ния можно по более при­выч­ным при­зна­кам — раз­ме­ру и типу файла.

Поиск книг, ра­бо­та­ю­щий с круп­ней­ши­ми се­те­вы­ми биб­лио­те­ка­ми, ори­ен­ти­ро­ван на на­хож­де­ние пол­ных тек­стов про­из­ве­де­ний. Здесь осу­ществ­ля­ет­ся кла­сте­ри­за­ция, од­на­ко ее ре­зуль­та­ты да­ле­ко не такие впе­чат­ля­ю­щие, как при про­стом веб-по­ис­ке. Весь­ма до­стой­но вы­гля­дит в ра­бо­те поиск му­зы­ки. Как и в слу­чае с кни­га­ми, си­сте­ма ори­ен­ти­ру­ет­ся на ре­сур­сы, поз­во­ля­ю­щие пря­мое ко­пи­ро­ва­ние фай­лов. Несмот­ря на то что сер­вис в дан­ном ре­жи­ме ра­бо­та­ет толь­ко с ба­за­ми «Ян­декс» и Nigma, ре­зуль­та­ты по­ис­ка весь­ма до­стой­ные, на­хо­дят­ся даже до­воль­но ред­кие вещи. Если файл поз­во­ли­тель­но вос­про­из­ве­сти без за­кач­ки, то рядом с най­ден­ны­ми ре­зуль­та­та­ми вы­во­дит­ся ми­ни-пле­ер.

По­сколь­ку речь зашла о ме­та­по­ис­ке с ви­зу­а­ли­за­ци­ей ре­зуль­та­тов, то нель­зя не вспом­нить про­ект SearchCrystal, ко­то­рый, бла­го­да­ря ори­ги­наль­но­му ин­тер­фей­су со спи­ра­ле­вид­ной кар­той, отоб­ра­жал до несколь­ких сотен ссы­лок на одной стра­ни­це, умел пред­став­лять кла­сте­ры в раз­лич­ных ре­жи­мах — от об­ла­ка тегов до иерар­хи­че­ско­го спис­ка, а также пред­ла­гал впе­чат­ля­ю­щий набор ин­стру­мен­тов для ра­бо­ты с за­про­сом. К со­жа­ле­нию, сей­час про­ект не дей­ству­ет. Будем на­де­ять­ся, что раз­ра­бот­ки SearchCrystal не про­па­дут и мы еще уви­дим их в Сети.

Ин­те­рес­но, что, если си­сте­ме уда­ет­ся ав­то­ма­ти­че­ски рас­по­знать от­дель­ные эле­мен­ты веб-стра­ни­цы, она вы­во­дит по­дроб­ные све­де­ния о ней на стра­ни­це вы­да­чи. На­при­мер, для ав­тор­ских ста­тей это могут быть за­го­ло­вок и автор, для про­грамм — на­зва­ние, раз­мер, раз­ра­бот­чик, из­да­тель и даже спи­сок по­хо­жих про­грамм. Это в опре­де­лен­ной сте­пе­ни род­нит Nigma с при­ло­же­ни­я­ми так на­зы­ва­е­мо­го по­ко­ле­ния Semantic Web, или, как его еще ино­гда на­зы­ва­ют, Web 3.0.

Рейтинг сервисов:

Clusty

Оцен­ка: 4 / 5
Тех­но­ло­ги­че­ские особенности: кла­сте­ри­за­ция
Язык интерфейса: ан­глий­ский
Сайт: www.​clusty.​com

PolyMeta

Оцен­ка: 4 / 5
Тех­но­ло­ги­че­ские особенности: кла­сте­ри­за­ция
Язык интерфейса: ан­глий­ский
Сайт: www.​polymeta.​com

KartOO

Оцен­ка: 4 / 5
Тех­но­ло­ги­че­ские особенности: кла­сте­ри­за­ция, ви­зу­аль­ное отоб­ра­же­ние результатов
Язык интерфейса: ан­глий­ский, фран­цуз­ский, немецкий
Сайт: www.​kartoo.​com

Nigma

Оцен­ка: 5 / 5
Тех­но­ло­ги­че­ские особенности: кла­сте­ри­за­ция, учет осо­бен­но­стей рус­ско­го языка
Язык интерфейса: рус­ский
Сайт: www.​nigma.​ru

Алексей Кутовенко
Опубликовано: "Мир ПК"

Комментариев нет:

Отправить комментарий

Поехали, робот!

  Алексей КУТОВЕНКО Распространения роботизированного транспорта можно ожидать уже в самое ближайшее время. Впрочем, как и любая новая тех...