Internet Zone >>

Бесплатные программы, полезные ресурсы, свежие номера журнала.   Нажимай!

Пойди туда, не знаю куда, принести то, знаю что

 Алексей Петюшкин - www.alpet.spb.ru

Поиск в Интернет

Как известно, искать можно по-разному. Интернет не исключение, поэтому и в его пределах существует несколько вариантов поиска необходимой информации. Первый осуществляется путем ввода ключевого слова, отдельной фразы или даже (в ряде случаев) вопроса в каком-либо поисковом двигателе или на сервере, имеющем возможности поисковой системы. Таких серверов сейчас развелось огромное множество, лично я знаю около десяти наших и более тридцати зарубежных поисковых служб. Все они, так или иначе, ставят перед собой одну главную цель: найти то, что хочет пользователь. Но поиск при помощи таких серверов иногда имеет целый ряд недостатков, что для некоторых в конечном итоге является причиной перехода на второй способ. Он заключается в нахождении желаемых данных посредством специального программного обеспечения - поисковых программ-клиентов. Вот о них мы сегодня и поговорим.

Постараюсь описать некоторые приложения для поиска в Сети и сравнить их с поисковыми машинами в Интернет. Хочу напомнить, что выставленные мною оценки носят субъективный характер, и любой пользователь в полном праве со мной не согласиться. После каждой оценки я указываю только основные недостатки описанного приложения (плюсы сразу видны в работе).

QueryN MetaSearch 2.2

Утилита QueryN MetaSearch компании FreeFlow Software (www.queryn.com) - довольно простая программа, позволяющая вести поиск не только по имеющимся в базе серверам, но и добавлять по желанию новые. Исходных серверов девять: AltaVista, Yahoo, AOL NetFind, Magellan и др. Нажав на "View/Options:" в верхнем меню, можно увидеть перечень загруженных в базу поисковых двигателей. Там же настраиваются параметры для каждого сервера: наименование URLа, начальная и последующие страницы, определение разделителей ("и", "или", "и/или"). Здесь можно также удалить или наоборот, добавить нужные субдомены исходных серверов. Естественно, при загрузке слишком большого количества различных доменов второго и последующих уровней понижается скорость поиска необходимой информации в Сети.

Определяются и такие опции, как количество соединений с сервером, количество дополнительных попыток установки связи при неудачной пересылки данных, временной интервал проверки IP-адресов и внутренней структуры (вместе с содержимым) сайтов, возможность сохранения копий, автоматического игнорирования дубликатов Web-страниц, найденных по гиперссылкам, проверки расположения узлов и обновления Web-ярлыков.

Работает утилита очень медленно даже при поиске простых, общеизвестных слов. Например, около трех минут она потратила на слово "Toyota", а на словосочетание "European music" - все пять и, к тому же, ни одного сайта, соответствующего моему запросу, так и не обнаружила после нескольких попыток. Фрейм, отображающий по замыслу разработчиков найденные узлы, был девственно чист. Окончательно разочаровавшись (я ведь уже готов был выложить за нее $20, требуемых постоянно выскакивающим регистрационным окном, лишь бы окна этого не видеть:-), я решил распрощаться с такой "быстродействующей" утилитой и поискать что-нибудь пооперативнее.

++ Очень медленный поиск. Из-за явной недоработки технической базы программа не способна удовлетворить простейшие запросы пользователя.

Subject Search Spider 2.0

Приложение Subject Search Spider версии 2.0 фирмы с интересным названием Kryloff Technologies, Inc. (www.kryltech.com) представляет собой более структуризованный и мощный инструмент информационного поиска. Во-первых, отмечу симпатичный интерфейс: при запуске появляется неизбежное зло в виде напоминания о необходимости зарегистрироваться и, пока вы раздумываете над выбором (что-то типа "Я согласен с условиями", "Я согласен и просто жажду зарегистрироваться", "Я категорически не согласен с вашими кабальными условиями и вообще программа у вас дурацкая"), слева вдруг выползает паучок и начинает карабкаться вверх по регистрационному окну. Думаете, у меня в компьютере завелись насекомые? А вот и нет: это просто у Spider талисман такой (либо специальное средство для воздействия на женскую половину пользователей с целью быстрейшего получения заполненных регистрационных форм).

Не удивляйтесь, если увидите рекламные баннеры в нижней части рабочего экрана: все хотят подзаработать. И еще, уже после прохождения регистрационной пытки появится окошко с индикаторной полосой и надпись "Waiting for connection", а потом "Looking for database upgrade". Не советую этой услугой пользоваться. Лично я после пяти минут этого проклятого апгрейда попытался закончить его всеми гуманными способами: Escape жал, Alt+F4, даже Ctrl+Alt+Del, а он хоть бы хны! Обновляет себе потихонечку базы. Пришлось вдавить заветную кнопочку Reset на системном блоке.

Однако добравшись до основного меню я выяснил, что это в общем очень даже неплохая утилита с точки зрения эфективности и точности поиска. Например, поиск по слову "Toyota" занял минуту, после чего высветился перечень из 40 узлов, а по словосочетанию "European music" - примерно полторы минуты (около 100 документов).

Искать с помощью этой программы чрезвычайно легко. Сам поиск может осуществляться двумя путями. Первый предполагает ввод в строку поиска нужное слово или словосочетание, определение границ поиска (весь Интернет, только UseNet и т.д.), пользовательского языка по умолчанию (примечательно, что приложение имеет поддержку более 30 различных языков и соответствующих кодировок, включая русские), тип доменов, которые проверяет поисковик и другое. Далее нажимается Enter или выбирается пункт меню Tools/Search Site Entries, предварительно нужно выделить текущий запрос. Это делается потому, что одновременно может быть определено и обработано несколько запросов, и если вы не хотите перегружать и Сеть, и утилиту-клиент, то ограничьтесь одним словом или словосочетанием.

Удобный момент - создание списка найденных узлов в виде отдельно загружающийся Web-страницы, а не параллельно с отчетом об осмотренных сайтах. Перечень строго классифицирован по степени соответствия вашему запросу: данные разбиты по блокам - соответствие 100%, 99%, 98% и так далее. Помимо этого дано краткое описание ресурса и его проиндексированный URL, больше всего подходящий под ваш запрос.

Второй вариант поиска подразумевает применение специального мастера. В принципе, он делает то же самое, но уже по более точным параметрам, установленным пользователем: выбор языковой кодировки, поиск по всему WWW, в UseNet или по одной из тематических областей (путешествия, отдых, образование, развлечения и пр., всего их более 20), ограничение доменных суффиксов (если, например, вы точно знаете, что на французских серверах нет информации о китайской кухне, то можете смело отбросить домены .fr), определение типа отчета (стандартный или краткий), выбор максимального количества исследуемых узлов и времени передачи данных на каждый документ. После этого мастер произведет поиск и создаст для вас отчет, работая с которым вы уже можете достаточно легко найти то, что искали. Да, чуть не забыл: Spider использует около 64 (!) самых разнообразных поисковых двигателей и тематических серверов, а также способен создавать библиотеку отчетов по обработанным запросам: это позволяет в любое время вернуться в то место в списке, на котором вчера вы заснули, просматривая ссылки, и спокойно продолжать начатую работу.

+++++ Очень затянутый процесс обновления базы данных. Наличие баннеров.

Copernic 2000

Следующая утилита - Copernic 2000 (версия 4.0), разработанная компанией Copernic Technologies, Inc. (www.copernic.com). Прежде всего в ней поражает перечень тем, по которым можно осуществлять поиск - 31: компьютеры, новости, ПО, финансы, игры, здоровье и многое другое. Правда, не все они доступны в этой версии (всего четыре), а полный перечень работает в Copernic PRO, которая уже является shareware. Говорить о свойствах и возможностях настройки параметров поиска не стану, так как они аналогичны, по большому счету, остальным поисковикам. Пару слов о быстродействии и результативности поиска. По тому же слову "Toyota" программа нашла 95 документов за 25 секунд! Далее создается стандартный отчет в виде HTML-страницы с показателями релевантности пользовательскому запросу, описанием и URL-ами. Что касается Copernic PRO, то там в вашем распоряжении более 200 различных поисковых двигателей и серверов (интересно, что по разделу "Cars" программа находит всего 50 документов, что на 45 больше, чем по всей "паутине"). В остальном приложение ни в чем не отличается от своего бесплатного собрата. Показ рекламных баннеров при поиске можно отключить в настройках.

+++++ Нет поддержки русских кодировок.

GIF Runner 1.0

Утилита GIF Runner компании JWSG (www.jwsg.com) интересна тем, что ищет в Сети анимированные GIF-файлы. Интерфейс и управление не представляют никакой сложности: рабочий экран поделен на три маленьких и одно большое окно. Вы вводите в строке "Search for" предполагаемое название графического изображения и нажимаете кнопку "Start". После этого утилита начинает поиск: при этом в маленьких фреймах отображаются просматриваемые узлы, узлы с анимированными GIF-файлами и найденные изображения, подходящие вашему запросу. В большом окне появляется анимация, которую можно скачать на жесткий диск или любые другие носители.

+++ Отсутствуют настройка запросов и задание границ поиска. Неясно, по какому критерию и на каких серверах ведется поиск. Трудновато вывести анимацию на большой экран для копирования одновременно с продолжающимся поиском.

Top-10 Tracker 2.0

Следущая утилита - Top-10 Tracker (http://affiliate.top-10.com). К сожалению, в тестах она показала очень низкую производительность в поиске на 10 популярных американских серверах (AltaVista, Lycos и т.д.): за полторы минуты было найдено всего 29 документов, соответствующих запросу "Toyota". Отчет составляется тоже автоматически, но в весьма неприглядном виде: указаны названия поисковых двигателей и перечень ссылок. Ни описания, ни степени соответствия. К тому же в отчете по слову "Toyota" девять серверов не дали никаких результатов (?), а вот один, WebCrawler (молодцы, ребята!) выдал эти несчастные 29 линков.

++ Отсутствует настройка запросов и задание границ поиска. Неясно, по какому критерию и на каких серверах ведется поиск. Низкая производительность. Недоработана система взаимодействия с поддерживаемыми сереверами и обработки запросов пользователя. Наличие баннеров.

BeeLine 1.0

Весьма красочный и запоминающийся интерфейс выделяет приложение BeeLine (версия 1.0) фирмы TransCom Software, Inc. (www.transcomsoft.com). Помимо того, что разработчики этой утилиты дружат с неплохим дизайнером, они еще постарались создать для своего детища эффективный инструментарий и гибкую систему настроек параметров поиска и функций программы.

Сначала про настройки. В верхнем меню нужно найти "Settings", и увидите окно установки параметров. Очень удобное решение - всплывающие подсказки при поднесении курсора к любой из секций настройки. Здесь определяются следующие опции: вид отчета (URL, краткое описание, наименование сервера, отыскавшего ссылку), игнорирование документов с нарушенными связями и дубликатов, временной интервал просмотра каждого узла (до 300 секунд), установка языка (английский, испанский, французский, немецкий и итальянский). BeeLine может искать в WWW (26 поисковых двигателей), на серверах новостей (12), на серверах дискуссий (всего 2), E-mail-серверах (4) и вести поиск программного обеспечения (4).

Что касается самого поиска (можно вводить отдельное слово или целую фразу), то результаты теста такие: на слово "Toyota" было потрачено всего 15 секунд, найдено 26 подходящих узлов. Сразу же создается отчет, в котором при наведении курсора на каждую из найденных ссылок появляется перечень ключевых слов конкретного документа. К сожалению, я тестировал незарегистрированную версию программы, которая позволяет использовать только 3 сервера (для зарегистрированных пользователей - 26), но и она дала просто превосходные результаты: скорость поиска и степень соответствия запросу очень высокие.

+++++ Нет поддержки русских кодировок. Наличие баннеров.

Shetty Search 3.0

И, наконец, последняя поисковая утилита - Shetty Search, созданная неким Satish K. Shetty (http://members.aol.com/satishetty). При достаточно аскетичном интерфейсе, негибкой системе упавления и настройки параметров поиска она показала неплохую производительность: потратив около полутора минут на слово "Toyota", выдала больше тысячи ссылок, правда, большая их часть оказалась дубликатами, "зеркальными" копиями узлов и документами с нарушенными связями. Кроме того, ужасно долго создается отчет (традиционно в виде Web-страницы): на него накладывается куча рекламы, таблиц, интерактивных компонентов и прочего барахла, тормозящего загрузку. Прождав 10 минут (при передаче 31 200 бит/с), я понял, что мне не светит лицезреть полный отчет по моему запросу - он загрузился только на 26%.

+++ Нет поддержки русских кодировок. Наличие баннеров, таблиц, скриптов и пр. Долго создается отчет. Не игнорируются дубликаты, "зеркальные" копии и документы с нарушенными связями.

Итоги

Я лично выбрал себе утилиту по вкусу, а вы? Кстати, все эти, а также многие другие поисковые программы-клиенты можно скачать на сервере TuCows в разделе "Searchbots".

Источник: http://www.magicpc.spb.ru/lib/

 


Copyright © 2000г. "Internet Zone" & Nik Romanov, info@izcity.com
Копирование и использование данных материалов разрешается только в случае указания на журнал "Internet Zone", как на источник получения информации. При этом во всех ссылках обязательно явное указание адреса вэб-сайта http://www.izcity.com/. При наличии у копируемого материала авторов и источника информации - их также нужно указывать, наряду со ссылкой на нас.