| ||
Internet-пылесосыЮрий Эйсмонт Вы устали от бесконечной скачки по Web-страницам, от спешки в поиске интересующей вас информации, от бессмысленной траты времени и денег при навигации по Internet? Тогда для вас - оффлайновые браузеры Неограниченный доступ в Internet - роскошь, доступная в нашей стране, увы, отнюдь не многим. И ситуация, когда ограниченный финансовыми возможностями и временем работы в Сети в спешке скачешь с одной Web-страницы на другую, лишь бегло просматривая их содержимое, рискуя упустить что-то важное и интересное, достаточно типична. Впрочем, как и то, что в конце концов так и не находишь того, что искал. Возможно, избыток недовольства пользователей по этому поводу и привел к появлению в виртуальных просторах Всемирной cети ряда специализированных программ, предназначенных для "ограбления" Internet и навигации по ней в оффлайновом (автономном) режиме. Такие программы получили название оффлайн-браузеров. Практичная теорияИдея, лежащая в основе работы оффлайн-браузеров, достаточно проста. Пользователь указывает адрес интересующего его Web-сайта, а программа в ответ загружает на его компьютер все файлы, которые необходимы для автономного (т. е. отключившись от Internet) просмотра этого сайта. Преимущества такого способа работы налицо - в автономном режиме платить за Internet, равно как и занимать телефонную линию (для модемного соединения) не нужно, информация с жесткого диска загружается очень быстро, а локальная копия сайта полностью "обозреваема" - сохраняется структура и взаимосвязь HTML-документов. Алгоритм, конечно же, не претендует на уникальность, однако работает достаточно эффективно. Бесспорно, возможность локального сохранения страниц присутствует в любом современном Web-браузере, однако информация в Internet практически никогда не нагромождается в каком-то одном гипертекстовом документе, а иерархически распределяется по их множеству. Поэтому, к примеру, создание локальных копий электронных книг или учебников, разбитых на огромное число отдельных глав, при помощи привычного браузера может показаться настоящей мукой. Кроме того, несмотря на присутствие в наиболее популярных браузерах Internet Explorer, Netscape Navigator и Opera средств для автономного просмотра Web-документов из локального кэша, доступ к ним и управление ими достаточно затруднены. Не говоря уже о том, что информация в кэше хранится в совершенно неупорядоченном виде и о транспортировке локальной копии сайта или его части на другой компьютер не может быть и речи. Сегодня оффлайн-браузеры попросту творят чудеса. Помимо загрузки сайтов целиком или частично для последующего просмотра, они умеют создавать точные копии (зеркала) сайтов с полным сохранением внутренней структуры, производить поиск файлов на сайтах согласно заданным критериям, отслеживать связи HTML-документов, строить наглядные карты сайтов и многое-многое другое. Кроме того, эти программы не зря имеют в своем названии часть "браузер" - достаточно важной возможностью, присутствующей в большинстве подобных программ, является наличие собственного "обозревателя" для просмотра уже загруженного "кусочка" Internet. Семь раз проверь...Загружать из Internet на свой компьютер абсолютно все файлы, хранящиеся на Web-сайте, бессмысленно - простому пользователю сложно представить, сколько ненужной информации (и каких огромных объемов!) там порой скапливается. Поэтому одна из основных функций оффлайновых браузеров - отбор только тех данных, которые действительно нужны для автономного просмотра Internet-контента.
Главный фильтр, который неизменно должны поддерживать программы для выкачивания сайтов, - глубина вложенности поиска. Значимость этого параметра сложно переоценить, ведь Всемирная паутина не зря получила свое название - ссылки с одних Web-страниц ведут на другие, с тех на третьи и т. д., и совершить путешествие по этим беспорядочным связям до конца практически невозможно. При планировании новой загрузки практически все современные оффлайн-браузеры позволяют произвести установку глубины поиска. А некоторые даже различают глубину просмотра ссылок в пределах основного сервера и на других серверах. При установке этого параметра не стоит чрезмерно усердствовать - зависимость между глубиной просмотра ссылок и размером загружаемых страниц экспоненциальная, и, установив для глубины слишком большое значение, вы рискуете тем, что закачка будет длиться целую вечность. Второе, не менее важное ограничение, устанавливается на тип загружаемых файлов. Джентльменский набор - это графика и текстовые документы (включая листы стилей, Java-апплеты и т. д.). Если скорость связи оставляет желать лучшего, а информации много, можно остановиться на выкачивании только текста. Компромиссом также может стать загрузка текста и графических файлов, размер которых не превышает заданный. Загрузка на жесткий диск аудио- и видеоданных из Web - дело вкуса и обстоятельств. Стоит лишь заметить, что файлы этих типов обычно составляют немалую долю общего объема сайта. Иногда также требуется выкачивать целые архивы ZIP и EXE-файлов - и это умеют оффлайн-браузеры. Другие ограничения - на количество и размер загружаемых файлов, на область поиска путем указания конкретных папок на сервере, с которого производится загрузка, время последней модификации данных и т. д. - многочисленны и достаточно специфичны от одной программы к другой. Настроив их соответствующим образом, вы обеспечите эффективную загрузку на свой компьютер только необходимой вам информации. Интересно и то, что некоторые программы позволяют не только отбирать для выкачивания, а и дополнительно отсеивать файлы, отвечающие определенным критериям - место расположения, тип, содержащиеся ключевые слова. Работа по хронометруКакая же загрузка из Internet, а тем более загрузка целых сайтов, обойдется без хорошо продуманного планирования. Поэтому совершенно неудивительно присутствие в наиболее популярных оффлайн-браузерах развитых планировщиков. Настройки расписания работы с проектами способны удовлетворить самые изысканные вкусы. Так, вы можете спланировать ночную закачку сайта, оставить компьютер включенным и преспокойно лечь спать - программа сама в состоянии установить соединение с провайдером услуг Internet, выполнить всю необходимую работу по загрузке, а по ее окончании оборвать соединение. Некоторые программы даже позволяют осуществлять автоматическое выключение компьютера после выполнения сетевых заданий. Возможности установки удаленного соединения отдельных оффлайн-браузеров не ограничиваются простым вызовом системного "дозвонщика" Windows. Они умеют производить автоматический дозвон к провайдеру, перебирая при этом различные номера телефонов. При случайном обрыве связи программы в состоянии восстановить соединение и продолжить загрузку сайта с места обрыва - одним словом, средства дозвона к провайдеру у оффлайн-браузеров бывают не хуже, чем у специализированных программ-"звонилок". О сетевом этикетеДля того чтобы совершить запрос файла по Сети, клиентские приложения (включая браузеры) по возможности должны сообщить удаленному серверу свой уникальный идентификатор (agent identity). Проанализировав этот идентификатор, сервер определяет, какие данные лучше выдавать в ответ. Конечно же, правилом хорошего "сетевого" тона является передача своего истинного идентификатора, однако в ряде случаев сервер может вообще решить не выдавать ничего в ответ. Поэтому иногда есть смысл скрывать свою истинную сущность и выдавать себя, к примеру, за Internet Explorer или Netscape Navigator - им серверы отказывают нечасто. И это оффлайн-браузерам по плечу. Мэтры телепортацииПрограмм для полной загрузки сайтов на сегодняшний день существует огромное количество. Наиболее популярные из них вы найдете на августовском выпуске CHIP-CD. Большинство - условно-бесплатны или вовсе бесплатны. Служа одной цели, все они отличаются друг от друга функциональными возможностями, оснащением, интерфейсом и удобством работы. Каждая программа хороша по-своему, однако среди них есть безусловный лидер.
Право называться одним из лучших оффлайн-браузеров заслуженно принадлежит ветерану этого рынка - программе Teleport Pro американской компании Tennyson Maxwell. Помимо присутствия в ней практически всех возможностей, описанных выше, программу выделяет наличие удобного мастера создания проектов загрузки. Она понимает различные варианты HTML, DHTML, каскадных листов стилей, работает с Java-апплетами, проверяет обновления файлов и т. д. Новые функции версии 1.29 позволяют программному роботу одновременно рассылать запросы различным серверам, защищать слабомощные серверы от перегрузок и следовать правилам на доступ к удаленным файлам. Остальные программы изо всех сил стараются не отставать от лидера. В большинстве из них, как и в Teleport Pro, присутствует функция многопотоковости - одновременной обработки целого набора файлов, практически все они удачно научились "ходить" через межсетевые экраны и работать с "запароленными" сайтами. Отдельные программы (например, WWW Jet Triton, WebReaper, Downloader) позволяют выбирать предпочтительный вариант кодировки загружаемых страниц. WebReaper, WebCopier, ДИСКо Качалка, eCatch и некоторые другие умеют строить удобные карты сайтов и отображать привязку картинок и сценариев к определенным страницам. Поддерживающий "шкуры" NetMan "подхватывает" открытые в браузере страницы и производит их загрузку (учитывая ссылки) в фоновом режиме. WWW Jet Triton умеет предварительно искать файлы в кэше популярных браузеров, а WebReaper - сохранять там локальные копии сайтов. Программа 1ClickWebSlideShow вообще уникальна - отсеивая рекламные баннеры, она загрузит все изображения с указанного сайта и сделает из них слайд-шоу. Конечно же, не стоит полагать, что оффлайн-браузеры всегда в состоянии удачно транспортировать часть Всемирной сети на жесткий диск. Несмотря на поддержку последних веяний Internet-моды - стандартов XML/XSL, Flash-сайтов и других сложных вариаций контента, существует ряд специфичных задач, которые этим программам "не по зубам" по своей природе. К примеру, нет возможности сделать локальную копию онлайновой телефонной базы, запросы в которую обрабатываются мощнейшей СУБД, - можно лишь повторить часть клиентского интерфейса, а для получения результатов необходимо будет соединение с Internet. Печалиться по этому поводу не стоит. Будем надеяться, что в скором времени широкий круг украинских пользователей не будет ограничен временем и скоростью работы в Сети. А пока что больше ничего не остается, как в целях экономии времени и денег прибегать к услугам оффлайновых браузеров. Источник: http://www.chip.com.ua/articles/
| ||
Copyright © "Internet Zone", http://www.izcity.com/, info@izcity.com |