Открылась Компьютерная Ярмарка Expo-com.ru на Тульской 
6000 кв.м, 20 000 покупателей в день.
Удачное расположение (м. "Тульская"), большой ассортимент, автостоянка, лифты, кафе, туалеты, телефонная связь, интернет. 
Арендаторам: 1 месяц бесплатно
Режим работы и проезд см. здесь >>
реклама у нас
***

Раз, два, три, четыре, пять, я иду искать

Автор: Олег Борисов

Фирма iSleuthHound Technologies выпускает на рынок несколько вариантов своего инструмента для решения проблем поиска в локальных документах разнообразных форматов. Продукт под названием "Ищейка" покрывает как профессиональный рынок, однако может послужить и нуждам домашних пользователей. В настоящее время предлагаются:

  • персональный комплект "Ищейки";
  • профессиональный вариант;
  • серверный вариант.

Давайте рассмотрим сначала "Ищейку" для персонального использования. Инсталлятор занимает 1.9 мегабайта, в установленном комплекте на диске потребует мегабайт, все остальное место будут занимать создаваемые индексные файлы. Например, для папки, наполненной документами на 5 мегабайт, получается индекс около одного мегабайта.

"Ищейка" для группировки разыскиваемой информации создает "зоны поиска", куда вы включаете необходимые каталоги. Используя различные зоны, вы можете производить разделение обрабатываемой информации по тематике. Например, если у вас в части каталогов лежит библиотека с художественной литературой, то их разумно объединить в зоне поиска "Библиотека", а техническую информацию расположить в зоне поиска "Документация". Если вы не можете однозначно идентифицировать, где разместить тот или иной документ, никто не мешает проиндексировать его для нескольких зон поиска, потому что они позволяют задавать пересечение по каталогам. Для персонального варианта "Ищейки" действует ограничение - не более двух дон поиска.

Каждая зона поиска доступна в любой момент времени для редактирования списка отслеживаемых каталогов. Вы можете добавлять, удалять список просматриваемых каталогов (они представлены в виде дерева с наглядным и интуитивно понятным интерфейсом), указывать нужные вам типы обрабатываемых документов, производить обновление поискового индекса в случае изменения в просматриваемых данных.

В персональном варианте "Ищейка" обрабатывает следующие типы документов (максимум 500 для одной зоны поиска):

  • документы и шаблоны MS Word (DOC, DOT);
  • текстовые документы (TXT, поддерживает форматы ASCII, ANSI, Unicode);
  • HTML-документы (поддерживает кодировки KOI8, WIN1251).

После того как мы проиндексировали указанные каталоги, можно производить поиск. В настоящее время "Ищейка" поддерживает следующие варианты поиска с поддержкой морфологического анализа:

  • по указанному слову, с учетом падежный окончаний (для слова "поиск" будут найдены все документы, где "поиск", "поиска", "поиску", "поисковый" и т.д.);
  • по усеченным словам, в заданном слове добавляется в конце знак "звездочка" (задано "систем*", будут найдены "система", "системный", "систематический" и т.д.);
  • несколько слов, разделенных пробелом (будут найдены все документы, в которых в обязательном порядке присутствуют все указанные слова во всех словоформах и падежных окончаниях). Пробел в данном случае интерпретируется как логическая функция "И" (AND);
  • сложные запросы, с явным использованием логических операторов и разделяющих скобок. Возможно использование логических операторов AND, OR, NOT;
  • кроме того, возможно использовать поиск по имени файла или дате его создания. Для даты возможно задание диапазона поиска (для варианта "Date:2003.04.*" будут найдены все файлы, созданные в апреле 2003 года).

Для удобства пользования "Ищейка" хранит до двадцати последних запросов, и вы можете выбирать их из выпадающего списка. Здесь сразу хочется отметить большую скорость поиска - программа работает без явного замедления и на больших объемах данных.

После того как "Ищейка" отработает запрос, пользователю выдается окно результатов, в котором можно просматривать найденные документы как в виде списка файлов (с краткими "выдержками" найденного текста), так и переключаться на полноформатное воспроизведение материала для последующего чтения или редактирования.

При показе списка для каждого из документов дается кратка характеристика: 

  • имя документа;
  • его тип (текст, html-файл, документ MS Word);
  • дата создания;
  • расположение на диске;
  • текст, где обнаружен заданный поисковый фрагмент. 

Любой из найденных документов можно просмотреть либо в самой "Ищейке" (нажав на соответствующую кнопку и сменив режим представления информации), либо запустить обработчик данного типа файлов в MS Windows (например, MS Word для файлов *.doc). При полноформатном просмотре документа в "Ищейке" для html-файлов и текстовых файлов действует подсветка найденных фрагментов. Для MS Word документов подсветка в режиме просмотра не работает, хотя слова выделяются в режиме индексного просмотра. Для полноформатного просмотра документа во время работы был найден только один минус: для больших документов (более полумегабайта) происходит задержка в момент возврата в индексный список. Для небольших файлов такой задержки не заметно.

Когда вы работаете со списком найденных файлов, для каждого из них выводится текстовый фрагмент, который можно прокручивать в непосредственно в окне поиска (количество выводимых строк задается в настройке программы). Кроме того, для каждого из найденных документов есть возможность перехода между всеми обнаруженными вхождениями поисковой строки без открытия для этого всего документа.

Режим индексного просмотра позволяет сортировать найденные документы по имени документа, дате создания, месту расположения на жестком диске. Возможны как восходящая, так и нисходящая сортировки (от А до Я и наоборот).

К сожалению, "Ищейка" не позволяет вести поиск в уже найденном наборе (как это реализовано в сложных поисковых системах), поэтому для этого приходится просто писать более сложный запрос. Но заложенный в ней язык запросов с лихвой компенсирует данное ограничение.

Практически любые возможности программы можно настроить под конкретного пользователя - для этого служит окно задания параметров, объединяющее в себе следующие подразделы:

  • Общие. Указываются параметры запуска программы в момент старта MS Windows, внешний вид предоставляемой информации, длина списка выполненных запросов.
  • Индекс. Месторасположение базы индексных файлов.
  • Браузер результатов. Настройки списка отображаемых найденных документов, их количество, ссылки на странице, внешний вид отображаемой информации.
  • Модули. Содержит перечень используемых модулей, можно подключать дополнительные модули.

Для автоматического обновления индексов по зонам поиска можно задать частоту просмотра:

  • каждый день;
  • каждую неделю;
  • каждый месяц;
  • вообще не обновлять индекс.

Удобно то, что частоту просмотра можно задавать разную для каждой из зон просмотра.

Хочется отметить добротно сделанный файл помощи, в котором отражены все возможные аспекты работы "Ищейки" и даны рекомендации по последовательному освоению продукта. Вместе с тем, интерфейс программы хорошо продуман, и опытные пользователи смогут ее использовать по минимуму прибегая к подсказкам.

Для профессиональной версии "Ищейки" добавлены следующие возможности:

  • неограниченное количество зон поиска;
  • неограниченное количество документов в зонах поиска;
  • все форматы документов MS Word (6.0, 95, 97, 2000, *.DOT), RTF-документы;
  • модули обработки ASP, SHTML, PHP-документов, MS Excel, MS PowerPoint;
  • разработка дополнительных модулей по просьбе заказчика.

Фактически, профессиональная версия просто снимает все ограничения, присущие бесплатному персональному варианту, и является платным рабочим инструментом для тех, кто постоянно пользуется возможностями этой системы. Для редкого использования вполне хватает и урезанной версии.

Организации, желающие расширить возможности работы их пользователей, могут использовать вариант "Ищейки" для установки на сервере. В настоящий момент времени поддерживаются серверы от Microsoft (Windows NT, Windows 2000). В системе задаются зоны поиска и обрабатываются все указанные выше типы документов. Пользователи получают доступ к поисковому сервису, используя обычный интернет-браузер. Администратор сервера может задать внешний вид страницы поиска и настроить ее, согласно корпоративному стилю.

В завершение хочется отметить высокое качество поставляемой программы, по достоинству отмеченной многочисленными наградами. Будет неудивительно, если после ознакомления с возможностями "Ищейки", вы решите раз и навсегда для себя проблему с поиском в документах.

Программы в каталоге Softkey.ru:

Ссылки по теме:

Источник: http://www.softkey.info/
 

***

***

Copyright © "Internet Zone"info@izcity.com. Условия использования материалов