Алексей Петюшкин - www.alpet.spb.ru
Поиск в Интернет
Как известно, искать можно по-разному.
Интернет не исключение, поэтому и в его
пределах существует несколько
вариантов поиска необходимой
информации. Первый осуществляется путем
ввода ключевого слова, отдельной фразы
или даже (в ряде случаев) вопроса в каком-либо
поисковом двигателе или на сервере,
имеющем возможности поисковой системы.
Таких серверов сейчас развелось
огромное множество, лично я знаю около
десяти наших и более тридцати
зарубежных поисковых служб. Все они, так
или иначе, ставят перед собой одну
главную цель: найти то, что хочет
пользователь. Но поиск при помощи таких
серверов иногда имеет целый ряд
недостатков, что для некоторых в
конечном итоге является причиной
перехода на второй способ. Он
заключается в нахождении желаемых
данных посредством специального
программного обеспечения - поисковых
программ-клиентов. Вот о них мы сегодня и
поговорим.
Постараюсь описать некоторые
приложения для поиска в Сети и сравнить
их с поисковыми машинами в Интернет.
Хочу напомнить, что выставленные мною
оценки носят субъективный характер, и
любой пользователь в полном праве со
мной не согласиться. После каждой оценки
я указываю только основные недостатки
описанного приложения (плюсы сразу
видны в работе).
QueryN MetaSearch 2.2
Утилита QueryN MetaSearch компании FreeFlow Software (www.queryn.com)
- довольно простая программа,
позволяющая вести поиск не только по
имеющимся в базе серверам, но и
добавлять по желанию новые. Исходных
серверов девять: AltaVista, Yahoo, AOL NetFind, Magellan и
др. Нажав на "View/Options:" в верхнем меню,
можно увидеть перечень загруженных в
базу поисковых двигателей. Там же
настраиваются параметры для каждого
сервера: наименование URLа, начальная и
последующие страницы, определение
разделителей ("и", "или", "и/или").
Здесь можно также удалить или наоборот,
добавить нужные субдомены исходных
серверов. Естественно, при загрузке
слишком большого количества различных
доменов второго и последующих уровней
понижается скорость поиска необходимой
информации в Сети.
Определяются и такие опции, как
количество соединений с сервером,
количество дополнительных попыток
установки связи при неудачной пересылки
данных, временной интервал проверки IP-адресов
и внутренней структуры (вместе с
содержимым) сайтов, возможность
сохранения копий, автоматического
игнорирования дубликатов Web-страниц,
найденных по гиперссылкам, проверки
расположения узлов и обновления Web-ярлыков.
Работает утилита очень медленно даже
при поиске простых, общеизвестных слов.
Например, около трех минут она потратила
на слово "Toyota", а на словосочетание
"European music" - все пять и, к тому же, ни
одного сайта, соответствующего моему
запросу, так и не обнаружила после
нескольких попыток. Фрейм, отображающий
по замыслу разработчиков найденные узлы,
был девственно чист. Окончательно
разочаровавшись (я ведь уже готов был
выложить за нее $20, требуемых постоянно
выскакивающим регистрационным окном,
лишь бы окна этого не видеть:-), я решил
распрощаться с такой "быстродействующей"
утилитой и поискать что-нибудь
пооперативнее.
++ Очень
медленный поиск. Из-за явной недоработки
технической базы программа не способна
удовлетворить простейшие запросы
пользователя.
Subject Search Spider 2.0
Приложение Subject Search Spider версии 2.0 фирмы с
интересным названием Kryloff Technologies, Inc. (www.kryltech.com)
представляет собой более
структуризованный и мощный инструмент
информационного поиска. Во-первых,
отмечу симпатичный интерфейс: при
запуске появляется неизбежное зло в
виде напоминания о необходимости
зарегистрироваться и, пока вы
раздумываете над выбором (что-то типа
"Я согласен с условиями", "Я
согласен и просто жажду
зарегистрироваться", "Я
категорически не согласен с вашими
кабальными условиями и вообще программа
у вас дурацкая"), слева вдруг
выползает паучок и начинает карабкаться
вверх по регистрационному окну. Думаете,
у меня в компьютере завелись насекомые?
А вот и нет: это просто у Spider талисман
такой (либо специальное средство для
воздействия на женскую половину
пользователей с целью быстрейшего
получения заполненных регистрационных
форм).
Не удивляйтесь, если увидите рекламные
баннеры в нижней части рабочего экрана:
все хотят подзаработать. И еще, уже после
прохождения регистрационной пытки
появится окошко с индикаторной полосой
и надпись "Waiting for connection", а потом "Looking
for database upgrade". Не советую этой услугой
пользоваться. Лично я после пяти минут
этого проклятого апгрейда попытался
закончить его всеми гуманными способами:
Escape жал, Alt+F4, даже Ctrl+Alt+Del, а он хоть бы хны!
Обновляет себе потихонечку базы.
Пришлось вдавить заветную кнопочку Reset
на системном блоке.
Однако добравшись до основного меню я
выяснил, что это в общем очень даже
неплохая утилита с точки зрения
эфективности и точности поиска.
Например, поиск по слову "Toyota" занял
минуту, после чего высветился перечень
из 40 узлов, а по словосочетанию "European
music" - примерно полторы минуты (около 100
документов).
Искать с помощью этой программы
чрезвычайно легко. Сам поиск может
осуществляться двумя путями. Первый
предполагает ввод в строку поиска
нужное слово или словосочетание,
определение границ поиска (весь
Интернет, только UseNet и т.д.),
пользовательского языка по умолчанию (примечательно,
что приложение имеет поддержку более 30
различных языков и соответствующих
кодировок, включая русские), тип доменов,
которые проверяет поисковик и другое.
Далее нажимается Enter или выбирается
пункт меню Tools/Search Site Entries,
предварительно нужно выделить текущий
запрос. Это делается потому, что
одновременно может быть определено и
обработано несколько запросов, и если вы
не хотите перегружать и Сеть, и утилиту-клиент,
то ограничьтесь одним словом или
словосочетанием.
Удобный момент - создание списка
найденных узлов в виде отдельно
загружающийся Web-страницы, а не
параллельно с отчетом об осмотренных
сайтах. Перечень строго классифицирован
по степени соответствия вашему запросу:
данные разбиты по блокам - соответствие
100%, 99%, 98% и так далее. Помимо этого дано
краткое описание ресурса и его
проиндексированный URL, больше всего
подходящий под ваш запрос.
Второй вариант поиска подразумевает
применение специального мастера. В
принципе, он делает то же самое, но уже по
более точным параметрам, установленным
пользователем: выбор языковой кодировки,
поиск по всему WWW, в UseNet или по одной из
тематических областей (путешествия,
отдых, образование, развлечения и пр.,
всего их более 20), ограничение доменных
суффиксов (если, например, вы точно
знаете, что на французских серверах нет
информации о китайской кухне, то можете
смело отбросить домены .fr), определение
типа отчета (стандартный или краткий),
выбор максимального количества
исследуемых узлов и времени передачи
данных на каждый документ. После этого
мастер произведет поиск и создаст для
вас отчет, работая с которым вы уже
можете достаточно легко найти то, что
искали. Да, чуть не забыл: Spider использует
около 64 (!) самых разнообразных поисковых
двигателей и тематических серверов, а
также способен создавать библиотеку
отчетов по обработанным запросам: это
позволяет в любое время вернуться в то
место в списке, на котором вчера вы
заснули, просматривая ссылки, и спокойно
продолжать начатую работу.
+++++ Очень
затянутый процесс обновления базы
данных. Наличие баннеров.
Copernic 2000
Следующая утилита - Copernic 2000 (версия 4.0),
разработанная компанией Copernic Technologies, Inc.
(www.copernic.com). Прежде всего в ней поражает
перечень тем, по которым можно
осуществлять поиск - 31: компьютеры,
новости, ПО, финансы, игры, здоровье и
многое другое. Правда, не все они
доступны в этой версии (всего четыре), а
полный перечень работает в Copernic PRO,
которая уже является shareware. Говорить о
свойствах и возможностях настройки
параметров поиска не стану, так как они
аналогичны, по большому счету, остальным
поисковикам. Пару слов о быстродействии
и результативности поиска. По тому же
слову "Toyota" программа нашла 95
документов за 25 секунд! Далее создается
стандартный отчет в виде HTML-страницы с
показателями релевантности
пользовательскому запросу, описанием и
URL-ами. Что касается Copernic PRO, то там в
вашем распоряжении более 200 различных
поисковых двигателей и серверов (интересно,
что по разделу "Cars" программа
находит всего 50 документов, что на 45
больше, чем по всей "паутине"). В
остальном приложение ни в чем не
отличается от своего бесплатного
собрата. Показ рекламных баннеров при
поиске можно отключить в настройках.
+++++ Нет
поддержки русских кодировок.
GIF Runner 1.0
Утилита GIF Runner компании JWSG (www.jwsg.com)
интересна тем, что ищет в Сети
анимированные GIF-файлы. Интерфейс и
управление не представляют никакой
сложности: рабочий экран поделен на три
маленьких и одно большое окно. Вы
вводите в строке "Search for"
предполагаемое название графического
изображения и нажимаете кнопку "Start".
После этого утилита начинает поиск: при
этом в маленьких фреймах отображаются
просматриваемые узлы, узлы с
анимированными GIF-файлами и найденные
изображения, подходящие вашему запросу.
В большом окне появляется анимация,
которую можно скачать на жесткий диск
или любые другие носители.
+++ Отсутствуют
настройка запросов и задание границ
поиска. Неясно, по какому критерию и на
каких серверах ведется поиск.
Трудновато вывести анимацию на большой
экран для копирования одновременно с
продолжающимся поиском.
Top-10 Tracker 2.0
Следущая утилита - Top-10 Tracker (http://affiliate.top-10.com).
К сожалению, в тестах она показала очень
низкую производительность в поиске на 10
популярных американских серверах (AltaVista,
Lycos и т.д.): за полторы минуты было найдено
всего 29 документов, соответствующих
запросу "Toyota". Отчет составляется
тоже автоматически, но в весьма
неприглядном виде: указаны названия
поисковых двигателей и перечень ссылок.
Ни описания, ни степени соответствия. К
тому же в отчете по слову "Toyota"
девять серверов не дали никаких
результатов (?), а вот один, WebCrawler (молодцы,
ребята!) выдал эти несчастные 29 линков.
++ Отсутствует
настройка запросов и задание границ
поиска. Неясно, по какому критерию и на
каких серверах ведется поиск. Низкая
производительность. Недоработана
система взаимодействия с
поддерживаемыми сереверами и обработки
запросов пользователя. Наличие баннеров.
BeeLine 1.0
Весьма красочный и запоминающийся
интерфейс выделяет приложение BeeLine (версия
1.0) фирмы TransCom Software, Inc. (www.transcomsoft.com).
Помимо того, что разработчики этой
утилиты дружат с неплохим дизайнером,
они еще постарались создать для своего
детища эффективный инструментарий и
гибкую систему настроек параметров
поиска и функций программы.
Сначала про настройки. В верхнем меню
нужно найти "Settings", и увидите окно
установки параметров. Очень удобное
решение - всплывающие подсказки при
поднесении курсора к любой из секций
настройки. Здесь определяются следующие
опции: вид отчета (URL, краткое описание,
наименование сервера, отыскавшего
ссылку), игнорирование документов с
нарушенными связями и дубликатов,
временной интервал просмотра каждого
узла (до 300 секунд), установка языка (английский,
испанский, французский, немецкий и
итальянский). BeeLine может искать в WWW (26
поисковых двигателей), на серверах
новостей (12), на серверах дискуссий (всего
2), E-mail-серверах (4) и вести поиск
программного обеспечения (4).
Что касается самого поиска (можно
вводить отдельное слово или целую фразу),
то результаты теста такие: на слово "Toyota"
было потрачено всего 15 секунд, найдено 26
подходящих узлов. Сразу же создается
отчет, в котором при наведении курсора
на каждую из найденных ссылок
появляется перечень ключевых слов
конкретного документа. К сожалению, я
тестировал незарегистрированную версию
программы, которая позволяет
использовать только 3 сервера (для
зарегистрированных пользователей - 26),
но и она дала просто превосходные
результаты: скорость поиска и степень
соответствия запросу очень высокие.
+++++ Нет
поддержки русских кодировок. Наличие
баннеров.
Shetty Search 3.0
И, наконец, последняя поисковая утилита -
Shetty Search, созданная неким Satish K. Shetty (http://members.aol.com/satishetty).
При достаточно аскетичном интерфейсе,
негибкой системе упавления и настройки
параметров поиска она показала неплохую
производительность: потратив около
полутора минут на слово "Toyota",
выдала больше тысячи ссылок, правда,
большая их часть оказалась дубликатами,
"зеркальными" копиями узлов и
документами с нарушенными связями.
Кроме того, ужасно долго создается отчет
(традиционно в виде Web-страницы): на него
накладывается куча рекламы, таблиц,
интерактивных компонентов и прочего
барахла, тормозящего загрузку. Прождав 10
минут (при передаче 31 200 бит/с), я понял,
что мне не светит лицезреть полный отчет
по моему запросу - он загрузился только
на 26%.
+++ Нет
поддержки русских кодировок. Наличие
баннеров, таблиц, скриптов и пр. Долго
создается отчет. Не игнорируются
дубликаты, "зеркальные" копии и
документы с нарушенными связями.
Итоги
Я лично выбрал себе утилиту по вкусу, а
вы? Кстати, все эти, а также многие другие
поисковые программы-клиенты можно
скачать на сервере TuCows в разделе "Searchbots".
Источник: http://www.magicpc.spb.ru/lib/
|