Предлагаем долгосрочное, прибыльное и перспективное сотрудничество с AMWAY Corporation, с 43-летним опытом работы на мировом рынке, которая в ближайшее время уже приходит на рынок стран СНГ и Балтии.
Четкая и прозрачная система ведения бизнеса, поддержка первоклассной бизнес-школы, технология создания источника пассивного дохода и мн. другое
Кроме традиционного пути построения,предлагаем уникальные технологии работы в этом бизнесе с помощью интернет.
Более подробную информацию можно получить на http://start.ecomora.com 
(или по тел. в Киеве (044) 572-56-32, Дмитрий)


Internet-ищейки. Сравнительный тест 12 информационно-поисковых систем

Олег Пилипенко

Сегодня Internet можно назвать необъятной - количество Web-документов в ней исчисляется миллиардами, из-за чего найти нужную информацию подчас очень нелегко.

Одна из самых больших сложностей в Internet - нахождение интересующей в данный момент информации. Этот процесс порой может отнимать немыслимо много времени.

Несколько десятилетий назад, когда Internet еще не была такой большой, пользователи узнавали о существовании и местонахождении файлов главным образом из общения между собой. Те, кто больше общался с другими пользователями и посещал больше конференций, также больше знал о том, где находятся те или иные ресурсы. Этот принцип сетевых гуру работал прекрасно, пока Сеть была небольшой и работали в ней, в основном, программисты и ученые.

Однако теперь, когда Internet предоставляет информацию широким массам пользователей, найти в ней какой-то ресурс без специальных средств - все равно что иголку в стоге сена. Но это под силу поисковым системам. Принцип работы таких систем весьма прост, но ушли годы, чтобы его разработать в том виде, в каком он существует сегодня.

Internet-порталы, начинавшиеся как каталоги ресурсов, собранных вручную, постепенно переросли в автоматизированные независимые системы (см. с. 74). Каждая из них владеет собственной технологией сбора информации и алгоритмом ее переработки. Помимо того, что информационно-поисковые системы (ИПС) отличаются объемом проиндексированной базы ресурсов, у них также разная скорость доступа и выборки данных. Некоторые поддерживают сложные логические запросы, другие же допускают лишь простой поиск (см. с. 78). В зависимости от вышеуказанных факторов и от задачи, которая стоит перед пользователем, предпочтительно использовать ту или иную поисковую систему. Неправильный выбор может привести или к нулевому результату, или же к слишком большим затратам времени на поиск нужных ресурсов.

Сбор информации

Можно ли найти нужный ресурс, не прибегая к услугам поисковых средств? Допустим, мы хотим найти электронную версию новой книги о графических редакторах. Один из способов - зайти на один из библиотечных порталов, предварительно узнав URL от знакомых, и далее, перемещаясь с ссылки на ссылку, отыскать нужную книгу. Чтобы ссылка всегда была под рукой, для нее можно создать закладку в папке Избранные.

Теперь представим, что операцию поиска нужных ресурсов приходится производить очень часто. Через некоторое время у нас накопится большое количество структурированных ссылок на различные Internet-сайты.

Именно так зарождался один из первых поиcковых Web-порталов - Yahoo!. Изначально его содержимое состояло из личной библиотеки ссылок двух аспирантов, выпускников университета. Через некоторое время www.yahoo.com вырос до огромных размеров, все записи в нем строго каталогизированы по определенным рубрикам. Специальный штат сотрудников в Yahoo! собирает Web-адреса, анализирует содержимое и рассортировывает по категориям.

У данного способа есть свои достоинства и недостатки. Благодаря тому, что Internet-ресурсы анализируются непосредственно редакторами, их комментарии объективно отображают содержание сайта. Однако эти описания имеют ограниченный объем, кроме того, каталоги не всегда сохраняют свою актуальность.

Существует также более производительный способ сбора данных: при помощи поисковых роботов. Эти программы, называемые также Crawler, Robot или Spider, последовательно перебирают Web-сайты и сортируют их по ключевым словам и содержимому. Благодаря их использованию, поддерживается актуальность каталогов и автоматизируется ручной труд (например, поисковые машины AltaVista и Google за час считывают несколько тысяч Web-сайтов).

Далее используются различные сложные алгоритмы для оперативного и наиболее полного представления пользователю искомых данных. Web-страницы в Internet меняются довольно быстро, поэтому роботы должны периодически просматривать уже занесенные в базу данные.

Основные недостатки поисковых машин проявляются при анализе текста. Очевидно, что роботы в некоторых случаях не могут правильно оценить содержание сайта, поэтому каталоги, составленные вручную, гораздо точнее.

Кого поставить в первую десятку?

Одна из проблем, возникающая уже после обработки запроса - в каком порядке расположить результаты поиска. Как правило, поисковые машины сортируют сайты по тому, насколько часто там встречаются искомые слова. Но есть и другой способ оценить приоритетность каждого ресурса: страница считается важной, если на нее ссылаются множество других, по возможности тоже важных страниц. Так осуществляется сортировка страниц в Google.

В HotBot и Infoseek используется другой принцип. Специальная программа следит за работой поисковой машины и отмечает, какие Web-страницы с какими ключевыми словами выбираются наиболее часто. При последующих запросах эти страницы попадают на более высокие позиции в списке результатов.

Иногда приоритетность того или иного сайта при соответствии его искомому слову может устанавливаться вручную администраторами поисковой системы. Так может произойти, если появляется ресурс, который содержит критически важную для многих пользователей информацию, например новый Web-сайт общегородского телефонного справочника или Web-ресурс крупной корпорации. Однако в некоторых поисковых порталах это не практикуется.

Поскольку многие ИПС содержат информацию о сотнях тысяч или даже миллионах Web-страниц, при поиске очень важной является возможность отфильтровать полученную информацию, иначе - сузить область поиска. Если мы хотим найти определенную информацию по мониторам с ЖК-дисплеями и зададим для поиска ключевое слово "монитор", поисковая система может нам выдать тысячи и даже миллионы ссылок. Просмотреть их все и найти искомую информацию слишком сложно. Как правило, пользователь просматривает только первые несколько десятков ссылок, и если не находит там нужную информацию, то задает новое ключевое слово для поиска. Однако следующая попытка может оказаться такой же бесполезной. Статистика показывает, что в 90 % случаев серферы не используют возможности расширенного поиска, стремясь ограничиться простыми запросами.

К счастью, фактически все поисковые системы позволяют более точно указать тему поиска. Например, если задать контекстный поиск по фрагменту текста "мониторы с ЖК-дисплеем", то число результатов запроса резко уменьшится.

Иногда требуется производить поиск сразу по нескольким параметрам. У большинства поисковых систем для расширенного поиска присутствует отдельный интерфейс, где используется специальный механизм для построения сложных логических запросов. В остальных и расширенный, и простой поиск могут задаваться в одной и той же строке.

Для построения логических запросов большинство поисковых систем разрешает использовать булевы операторы AND, OR, NOT. Некоторые из них могут использоваться в неявном виде: например, пробел между словами как правило тождествен оператору AND.

Также довольно часто применяются операторы контекстной близости. Например, в системе Lycos к ним относятся NEAR, FAR, BEFORE и ADJ. При помощи этих операторов можно задать близость или удаленность терминов запроса в тексте документа. Каждая из систем имеет свои собственные правила употребления вышеописанных операторов, поэтому перед заданием запроса рекомендуется изучить документацию к данной системе.

Особого рассмотрения заслуживает возможность поиска по полям: этот механизм позволяет искать заданное слово только в указанных полях, например в URL, в заглавии или в тексте страницы. Некоторые поисковые системы позволяют производить отбор по дате, по типу файлов (МР3-, PDF-формат) и даже по ссылкам в HTML-документах.

Многие поисковые машины после вывода результатов поиска предлагают просмотреть похожие страницы (More Like This). Каждая система при этом оценивает схожесть страниц по своему собственному принципу, поэтому трудно предсказать заранее, найдет ли пользователь в подобных страницах то, что ему нужно. Как правило, поисковая машина пытается оценить главную тему найденной страницы, и уже исходя из этого, подбирает похожие сайты.

Персональные сыщики в Сети

Количество Internet-ресурсов растет с каждым днем. Всякая попытка найти нужную информацию в этом море данных была бы практически безнадежной, если бы не поисковые системы. ЧИП тестирует наиболее популярные украинские и зарубежные системы, исследует особенности их использования и функциональные возможности.

Yahoo!

Всего лишь 3-4 года назад термин "поисковая система" у украинских пользователей, как правило, ассоциировался с порталом Yahoo.com. Еще бы - ведь эта ИПС, запущенная в 1994 году, была одной из первых в мире. Сегодня Yahoo! имеет 24 Web-филиала в разных странах мира.

Yahoo! предоставляет мощные возможности для поиска, причем искушенные серферы могут прибегнуть к расширенному поисковому модулю, в котором можно вводить сложный логический запрос с использованием булевых операторов AND, NOT (вместо них используются символы "+" и "-").

Возможен поиск заданных слов в определенных полях: для ограничения поиска только в поле заголовка документа нужно поставить перед ключевым словом буквосочетание "t:" (например, t:Harrison), для поиска в пределах URL ввести "u:" (u:ukr*). Вы можете комбинировать в запросах различные операторы, однако их надо использовать в правильной последовательности: сначала операторы "+" или "-", затем "u:" "t:", далее кавычки "" и наконец "*". Вот пример правильного синтаксиса: +t:beer* -Russian.

Впрочем, новички при выполнении сложного запроса могут воспользоваться готовой формой "Advanced search". Кстати, только здесь можно задать фильтр результатов по дате и их количество на одной странице.

Без преувеличения можно сказать, что данная поисковая система обладает наиболее развитой структурой каталогов и различных сервисов. Сотни тысяч различных Internet-ресурсов сортируются вручную по 14 основным рубрикам, каждая из которых имеет несколько подрубрик с более узкой тематикой. Все, что можно ожидать от Internet, рассортировано в нескольких рубриках портала.

Достоинством Yahoo! является удобный доступ к разным Web-сервисам. В этой области Yahoo! опережает многие другие порталы этого теста.

Yahoo! позволяет сделать покупки через Internet, найти информацию о различных фирмах и магазинах. Портал предоставляет услугу бесплатного Web-хостинга, а также бесплатный почтовый ящик, собственный online-фотоальбом. Здесь же можно загрузить Internet-пейджер Yahoo! Messenger 5.0.

На портале представлено большое количество персональных сервисов. К ним относится онлайновая адресная книга, портфель документов, а также персональный деловой календарь с напоминателем. Напоминание может автоматически высылаться в виде SMS-сообщений на мобильный телефон, на адрес электронной почты или через Yahoo! Messenger.

Функция MyYahoo! дает возможность сформировать внешний вид и содержимое портала по предпочтению пользователя. Он может определить цвет страницы, размещение и тематику рубрик.

AltaVista

Не менее популярная и обширная поисковая система AltaVista.com содержит около 550 млн индексированных страниц. Специальные роботы сканируют содержимое Internet и сортируют по темам. У этого ресурса есть 21 филиал в различных странах на разных языках.

AltaVista отличается мощными возможностями поиска. Например, можно отобрать только видеоролики, только звуковые файлы (MP3, Windows media, real, wav) или же изображения (все графические форматы). Поиск картинок очень удобен: при выводе результатов показываются пиктограммы найденных картинок.

Если при написании ключевого слова пользователь допустил грамматическую ошибку, портал подбирает похожее слово и выдает по нему ссылки.

Начинающие пользователи могут обратиться к помощнику Search Assistant. В специальной форме можно в удобном виде задать критерии поиска, например, временной диапазон, розыск в полях на странице (текст страницы, заголовок и ссылки), географические ограничения. Фактически, эта форма аналогична Advanced search, однако критерии поиска задаются в более легком для начинающих виде.

Искушенные искатели могут прибегнуть к расширенному поиску (Advanced search), где можно вводить сложный логический запрос с использованием четырех булевых операторов: AND, OR, NOT, NEAR.

Для создания составного запроса можно применять скобки, при этом слова в скобках имеют приоритет над операндами за скобками, т. е. действует то же правило, что в алгебре. Рассмотрим выражение (motor AND wheels) NEAR limousine AND NOT (old* OR used). Сначала поисковая машина проверяет, чтобы в Web-странице присутствовали слова motor и wheels и не было слов old, older или used. Затем отбираются страницы, в которых motor и wheels находятся в пределах 10 слов от термина limousine.

Однако AltaVista - не только поисковая машина, это также портал, предоставляющий множество услуг. Среди них - online-переводчик с английского и на английский с 9 других языков, в том числе и русского! Введя текст объемом до 150 слов, через считанные секунды можно получить его перевод.

Служба "Желтые страницы" позволяет найти нужную организацию, а "Белые страницы" - отыскать частное лицо. К сожалению, портал AltaVista.com работает только по информационной базе жителей и предприятий США.

Ссылка Maps разрешает просмотреть картографические изображения почти для всех стран Европы, в том числе и Украины.

В случае возникновения проблем на AltaVista есть достаточно информативная и понятная страница помощи, единственный недостаток этого портала - отсутствие русско- или украиноязычного филиала.

Lycos

В октябре 2000 года крупнейший Internet-провайдер Terra Networks, S.A. и компания Lycos, Inc. объявили о своем объединении в Terra Lycos. Вновь образованное предприятие продвигает множество Internet-порталов, среди которых такие общепризнанные лидеры поиска, как Lycos.com и Hotbot.com.

Возможности сложных запросов в Lycos не самые широкие, но вполне достаточные - используются операторы AND (или знак "+"), OR, NOT (вместо него ставится знак минус "-"). Есть возможность ограничить поиcк определенной рубрикой, например искать информацию про George Harrison только в разделе Music.

Функция поиска по ссылкам разрешает узнать, сколько Web-страниц ссылается на указанный вами Web-сайт. К сожалению, нельзя указать тип искомых файлов (например, отобрать исключительно видеоролики). Также не поддерживаются символы маскирования.

Портал Lycos в разделе Tools предоставляет бесплатную электронную почту с Web-доступом, FTP-сервер с бесплатной загрузкой разного ПО. Кроме того, Lycos предлагает свой Internet-пейджер - Lycos Instant Messenger, сделанный на платформе AOL Instant Messenger и полностью с ним совместимый.

В Lycos встроена одна интересная функция под названием Parental Controls (под контролем родителей). Она позволяет ограничить доступ к Internet-ресурсам, посвященным порнографии, оружию, пропагандирующим расизм и насилие. Секрет работы этой функции в том, что при поиске пропускаются ключевые слова, которые имеют отношение к вышеописанным темам. При помощи Parental Controls можно также отключить доступ к чату и почте Lycos. Для активизации и деактивизации данной функции нужно указать опции фильтрации и ввести пароль.

Есть в Lycos своеобразный хит-парад, показывающий 100 наиболее популярных ключевых слов, по которым проводился поиск в текущем году. Lycos имеет около 40 филиалов во всем мире, в том числе русскоязычный www.lycos.ru.

HotBot

Принадлежащий компании Terra Lycos сайт Hotbot.com (имеющий также адрес hotbot.lycos.com) давно пользуется большой популярностью у Web-серферов и в свое время завоевал немало наград за наилучший охват Internet-ресурсов.

Возможности поиска в HotBot намного шире, чем у Lycos. Например, можно искать в определенном поле или по ссылкам на указанный URL, ограничить поиск по дате, региону и даже отфильтровать по доменному имени (com, edu, net). HotBot позволяет отобрать документы, содержащие графические изображения, аудио- или видеофайлы, Java-скрипты, ActiveX-компоненты, можно даже задать при поиске свой тип файлов, указав расширение (например .png). При выводе результатов HotBot, как и Lycos, указывает похожие ключевые слова, которые помогут шире раскрыть тему поиска.

Общая ссылка help выводит страницу поиска для Lycos.com.

Excite

Довольно популярный Internet-портал Excite пробуждает интерес не только своим названием, но и содержимым. Подобно Yahoo!, найденные Web-ресурсы рассортировываются редакторами вручную по 12 основным информационным рубрикам.

Данная поисковая система допускает применение булевых операторов в запросах - разрешается употреблять операторы AND (или знак "+"), OR, NOT (знак "-").

В Excite присутствует очень полезная функция для сужения диапазона поиска под названием Zoom in - после ввода ключевого слова выводится список найденных подрубрик на заданную тему, из которых пользователь может выбрать наиболее ему подходящую. Если результаты поиска не удовлетворили, Excite предоставляет возможность метапоиска по другим поисковым системам, таким как Ah-ha, AltaVista, Direct Hit, Find What, About и другие.

На Excite можно завести персональную адресную книгу и бесплатный почтовый ящик, совершить покупки через Internet, воспользоваться справочной информацией в "желтых" и "белых" страницах.

Google

Сравнительно недавно появившийся портал Google использует в работе уникальную комбинацию аппаратного и программного обеспечения. Сеть недорогих компьютеров, рассредоточенных по всему миру, и высокоэффективный алгоритм поиска вместе обеспечивает высочайшую скорость поиска - список результатов выдается через доли секунды после введения запроса.

Данный портал применяет свою собственную фирменную систему иерархии страниц PageRank, которая присваивает приоритет документам в зависимости от количества ссылающихся на них других страниц.

Google обладает огромными возможностями в области поиска. При этом общее количество проиндексированных страниц превышает два миллиарда!

Поисковая машина поддерживает логические операторы AND, OR, NOT. Часто употребляемые слова "How", "Where", "When", отдельные буквы и цифры при поиске опускаются в целях ускорения процесса розыска и улучшения результатов. Поисковая машина не чувствительна к регистру букв, поэтому ключевые слова можно вводить как прописными, так и заглавными буквами. Портал не поддерживает символы маскирования.

Google поддерживает поиск внутри указанного Web-сайта. Например, чтобы найти все об ОС Linux на сайте ITware, нужно в строке поиска ввести: freeware site:itware.com.ua. Отбор документов можно проводить на более чем шестидесяти языках. Пользователи, дружащие только с одним иностранным языком - английским, могут выполнить автоматический машинный перевод с итальянского, французского, испанского, немецкого и португальского.

Метапоиск - глобальное прочесывание

Ни одна из информационно-поисковых систем не может похвастаться 100-процентным охватом ресурсов Internet. Это связано с тем, что количество документов в Сети изменяется очень быстро, поэтому ИПС ориентируются, как правило, лишь на полное освещение некоторой части ресурсов. Однако технологии поиска тоже не стоят на месте - специальные метапоисковые машины могут производить поиск не только в пределах своей информационной базы, но и посылают запросы в другие ИПС.

Найденные результаты они представляют пользователю. Метапоисковые запросы выполняются дольше, зато автоматизируют процедуру поиска. Возможности метапоиска предоставляют порталы Excite, Яndex, TopPing и другие. Хорошие метамашины перед выводом результатов удаляют дублирующиеся ссылки, после чего сортируют результаты и указывают, откуда они были получены.

В основном, метапоисковые машины имеет смысл использовать для поиска специализированных понятий, при отборе которых не будут выводиться многие тысячи ссылок.

При индексировании страниц машина кэширует их образ, поэтому при анализе найденных результатов можно просмотреть страницу в том виде, какой она была на момент индексирования.

Как и другие порталы, Google имеет также свой каталог по адресу directory.google.com, в котором Web-документы рассортированы по рубрикам.

Rambler

Разработка Rambler началась еще в 1991 году, 5 дет спустя был запущен в эксплуатацию поисковый механизм rambler.ru.

Rambler - один из немногих в российской Internet портал, объединивший поисковую систему, рейтинг-классификатор, а также ряд бесплатных сервисов и информационных проектов, таких как бесплатная почта, чат, словари. Поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах стран СНГ и России. Rambler ежесуточно обрабатывает около полумиллиона запросов, сканирует 48 тысяч Web-серверов, используя несколько одновременно работающих программ-роботов.

Язык запросов в Rambler не уступает западным порталам. Можно использовать операторы AND (&), OR (|), NOT (!), причем пробел тождествен оператору AND. Rambler пока не поддерживает операторы маскирования (*,?), однако эти символы зарезервированы для использования в будущем. При поиске можно ограничивать расстояние между искомыми словами, например, запрос (2, футбольная команда) выведет только документы, в которых эти слова находятся по соседству.

Как и многие другие поисковые системы, Rambler опускает при поиске стоп-слова: предлоги, частицы, артикли. Если же эти элементы входят в состав фразы, то ее нужно заключить в кавычки. Выведенные результаты можно отсортировать по соответствию (релевантности) или по дате обновления.

Яndex

Официально поисковая машина Yandex.ru была анонсирована в сентябре 1997 года. Основными отличительными чертами Яndex (одна из интерпретаций - "Языковой index") на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые особенности поискового ядра Яndex. Например, система учитывала морфологию русского языка, могла искать с учетом расстояния (в том числе в пределах абзаца). Тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывал не только количество слов запроса, найденных в тексте, но и положение в документе, и расстояние между словами. Чуть позже появился поиск в категориях каталога и впервые в Рунете было введено понятие "индекс цитирования" - количество ресурсов, ссылающихся на данный.

Сегодня Яndex без преувеличения можно назвать крупнейшей поисковой системой в русской части Internet: количество проиндексированных документов приближается к 56 млн.

При поиске в Яndex можно задавать вопросы на обычном языке. Например, если задать вопрос "Где купить автомобиль?", Яndex выдаст ссылки с прайс-листами на модели ведущих фирм-производителей автомобилей. Поиск учитывает все формы слова по правилам русского языка, в том числе падежи и спряжения. Для поиска по точной словоформе нужно перед ней поставить восклицательный знак "!". Из булевых операторов используются логические AND, OR и NOT.

Интересно выполнено задание критериев при поиске с расстоянием: одинарный оператор & ищет указанные словосочетания в пределах предложения, двойной && - в пределах документа. Можно точно указать расстояние между искомыми словами в виде "слово1 /число слово2". Например, "мобильные /2 телефоны" означает, что второе слово должно находиться не далее чем через слово от первого. Возможно употребление сложных выражений с использованием скобок.

Яndex предоставляет четыре специфических направления поиска, среди них поиск в online-энциклопедиях (доступно свыше 10 энциклопедий и словарей) и отбор изображений. Хотя последний, к сожалению, лишь выдает список сайтов, содержащих заданную картинку, но не показывает само изображение.

Одним из дополнительных преимуществ Яndex является наличие бесплатного хостинга и почтового ящика с Web-доступом.

Апорт

Портал Апорт существует в двух варинтах: полная версия по адресу www.aport.ru, сокращенная версия по адресу aport.ru. Как и вышеописанные русские сайты, Апорт разрабатывался для поиска в русскоязычной части Internet.

При поиске Апорт поддерживает логические операторы AND, OR, NOT. Для задания порядка действия логических операторов используются круглые скобки. Поиск осуществляется по всем грамматическим формам ключевых слов, причем можно употреблять оператор маскирования "*". Определенная последовательность слов заключается в кавычки, хотя стоп-слова (частицы, предлоги и другие) опускаются и здесь тоже.

Поддерживается ограничение расстояния между искомыми словами. Например, запрос сл5(футбол видео трансляция) приведет к нахождению документов, где между словами "футбол", "видео" и "трансляция" стоит не более двух других слов (то есть общее число слов во фрагменте не более 5).

Для большего удобства серферы могут использовать кнопку поиска "Апорт", которая инсталлируется в Internet-браузер простым перетаскиванием с рабочей площади страницы в панель браузера Links (Ссылки). После этого можно выделить на любой Web-странице слово или фразу, затем, нажав на кнопку Апорт на панели браузера, получить результаты поиска по выделенному тексту.

МЕТА

Наиболее популярный украинский поисковый портал МЕТА предоставляет множество стандартных сервисов, среди которых каталог, содержащий свыше 12 тысяч сайтов, бесплатный почтовый ящик (на сервере ukrnet), чат, новостная рассылка.

МЕТА позволяет искать по всей украинской Internet, а также по реестру украинских сайтов. Полнотекстовый поиск идет с учетом русской и украинской морфологии. Это значит, что по запросу "рушник вишиваний" будут найдены также документы, содержащие слова "вишиваному рушниковi_".

В качестве логических операторов AND, OR, NOT применяются соответственно символы "+", "|" и "-". Фиксированное словосочетание заключается в кавычки, а нефиксированное, (то есть, близкое к указанному) - в фигурные скобки.

Можно ограничить расстояние между словами: например, по запросу [5, мобильный телефон] будут найдены только те документы, в которых слова мобильный и телефон расположены в фрагменте текста, не превышающем 5 слов. Предусмотрены также операторы, позволяющие ограничить поиск полем заголовка документа и названием его разделов.

Web-дизайнеры могут воспользоваться порталом МЕТА для поиска как по своему сайту, так и по всей украинской Internet.

UAport

Разработанный компанией ElVisti ресурс Uaport (построенный на ядре InfoReS-XL - Information Retrieval System Extended Language) представляет собой информационно-поисковую систему, ориентированную на обработку полнотекстовых и реферативных документов.

Общий тематический каталог содержит свыше 20 направлений, региональный - все области Украины (всего 26 пунктов). Ресурсы, относящиеся к наиболее популярным темам, сгруппированы в отдельных разделах. Таковых в UAport пять: сеть fido Usenet, новости, масс-медиа, технологии, бизнес. Объем разделов весьма значителен, например, подрубрика СУБД раздела технологии содержит ссылки на более чем полторы тысячи документов.

Сильной стороной UAport является поиск новостей - специальный робот несколько раз в день сканирует новостные сайты, что позволяет получать свежайшие новости из разных источников. С мая 2001 года поиск осуществляется не только на украинском и русском, но также английском, французском и других языках.

Поиск в WAP

С развитием мобильного доступа в Internet количество WAP-ресурсов стало стремительно увеличиваться. Для нахождения информации в "мобильном" секторе Internet возникла потребность в поисковых системах. WAPJAG сегодня является самым большим в мире каталогом по WAP-ресурсам и также наиболее популярной поисковой машиной. Каталог имеет 17 основных рубрик и может удовлетворить потребность практически в любой информации - например, можно узнать даже последние новости в мире моды или прочитать свой гороскоп.

Кроме того, WAPJAG предоставляет редактор, позволяющий создать и бесплатно разместить WAP-страничку, а также WAP-эмулятор для отладки созданных страниц. Пока доступна лишь английская версия этого портала, однако разработчики в скором времени обещают русифицированный вариант.

В украинском секторе WAP-internet можно отметить портал wap.uaport.net, разработанный компанией ElVisti. Один из самых насыщенных информацией украинских WAP-ресурсов уже сегодня доступен на русском и английском языках.

Несколько лет назад многие ИПС позволяли пользователю вручную зарегистрировать свой сайт в базе данных системы. В настоящее время большинство западных порталов от этого отказалось, однако в UAport (впрочем, как и в META и TopPing) такая возможность присутствует. При регистрации своего ресурса в реестре UAport можно указать ключевые слова, описание и заголовок ресурса, язык и рубрику, к которой относится сайт.

При поиске в качестве операндов могут использоваться любые слова языка или их правые усечения, длина которых превышает 2 буквы. По умолчанию каждое слово воспринимается как усечение, т. е. слева и справа от операнда могут присутствовать любые символы. Система не чувствительна к регистрам букв. Запрос может быть многоуровневым. Приоритет уровня определяется входящими в него операторами, либо при помощи круглых скобок.

TopPing

Сделанный одесскими разработчиками TopPing предлагает рейтинг украинских сайтов, который содержит около 8 тысяч наименований с ежедневной и ежемесячной статистикой посещений. Интересующийся новостями серфер может посетить мощный новостной сайт media.topping.com.ua.

Преимуществом ТоpPing является наличие новой метапоисковой машины МетаPing, которая позволяет производить поиск по нескольким ИПС одновременно. Можно просканировать украинские, российские и западные хранилища Web-ресурсов, всего 17 наименований. Поиск метамашиной выполняется намного дольше, зато успех более вероятен.

Многим родителям наверняка понравится присутствие семейного фильтра. При его включении система не выводит в результатах поиска сайты, которые она считает содержащими информацию "Только для взрослых". Включение и выключение фильтра можно защитить паролем. Для кор-ректной работы системы в Internet-браузере должно быть разрешено использование cookies.

Поиск с применением логических операторов или по фиксированной фразе ТоpPing не выполняет. К сожалению, помощь доступна только в виде ответов на часто задаваемые вопросы.


Так ЧИП тестировал информационно-поисковые системы

Для проверки возможностей поисковой системы в нахождении информации использовались определенные ключевые слова, позволяющие сделать вывод об объеме и актуальности найденных результатов.

В качестве информационного поиска, не требующего актуальности информации, использовались два имени собственных, написание первого осуществлялось латиницей, второго - кириллицей. Были выбраны следующие фамилии - George Harrison, легендарный участник Beatles, умерший в ноябре прошлого года, и Назарий Яремчук, известный украинский певец, умерший в 1991 году. Актуальность информации проверялась на примере сообщений об антитеррористической войне США в Афганистане.

Следующей была задача найти в Internet по ключевому слову "Автомузыка" ("Car Audio" в английском варианте) информацию о том, где можно купить аудиоаппаратуру для автомобиля, насколько велик выбор и сколько это будет стоить.

На оценку результатов влияло удобство поиска. Например, возможно ли применение булевых операторов или поиск фразы, заключенной в кавычки. Поддерживаются ли сложные многоуровневые информационные запросы с использованием нескольких логических операторов и фильтром по дате? Минимальным стандартным набором являются операторы AND, OR, NOT. Многие системы допускают также употребление оператора ограничения расстояния между словами, а также символы маскирования.

Дополнительные баллы участники теста могли заработать благодаря специальным функциям. Можно ли вести поиск по адресам электронной почты, находить графические изображения, аудио- или видеофайлы или же файлы с заданным пользователем расширением. Можно ли ограничить поиск указанной категорией из рубрикатора или внутри определенного домена?

На общую оценку оказывало влияние удобство интерфейса ИПС, а также информативность справочной системы. Суммарная оценка высчитывалась на основании четырех критериев, каждый из которых учитывался с равным весом в 25 %.

ЧИП рекомендует (выбор редакции)

В качестве универсальной поисковой системы можно рекомендовать Google. Эта ИПС обладает огромной информационной базой, очень легка в использовании, отличается очень малым периодом времени, затраченного на нахождение документов и загрузку сайта. Кроме того, Google обладает мощными функциями расширенного поиска, например, можно создавать сложные многоуровневые запросы с использованием булевых операторов, также есть возможность искать ресурсы на более чем 60-ти языках. Еще одним преимуществом является наличие русско- и украиноязычного интерфейса, хотя справочная система пока доступна только на английском.

Фактически дышит лидеру в затылок ИПС AltaVista. Обладающая наибольшей функциональностью в расширенном поиске, она оказалась слабее по объему индексированных Web-страниц, а также по скорости нахождения информации. Тем не менее, в AltaVista есть свои преимущества, например, мультиязычный online-переводчик, а также очень удобный поиск изображений с возможностью их предпросмотра.

В Рунете наилучшим оказался портал Яndex. Наибольшая среди ИПС информационная база и широкие поисковые возможности позволяют рекомендовать его для поиска в русскоязычной части Internet. Кроме того, Яndex отличается прекрасной информативной документацией и хорошим набором бесплатных сервисов, среди которых Web-хостинг и электронная почта с Web-доступом.

Среди украинских ресурсов неплохие возможности предоставляют порталы МЕТА и UAport. Первый отличается хорошим покрытием украинской доли Internet, также поддерживает многие функции расширенного поиска. При индексации документов МЕТА кэширует их образы в своей информационной базе, что ускоряет просмотр найденных результатов.

Немного отставший от META портал UAport отличается весьма объемным каталогом, в котором тысячи документов рассортированы по рубрикам. Отдельным достоинством UAport является актуальная подача новостной информации, благодаря тому, что специальные роботы сканируют по несколько раз в день наиболее популярные украинские, российские и зарубежные агентства новостей.

Источник: http://www.chip.com.ua/articles/

 


Copyright © "Internet Zone", http://www.izcity.com/, info@izcity.com