IZONE- http://www.izcity.com/- бесплатный софт, вэб-сервисы, ресурсы для раскрутки, свежие номера журнала "Internet Zone".

Связь. Вопросы и ответы-40

FeodoR

У меня установлен файрволл Norton Internet Security, и при просмотре практически любого сайта он выдает предупреждение о сохранении каких-то cookies. Что это? Это опасно?

В большинстве случаев - нет. Cookies - это технология взаимодействия между сервером и клиентом, способная персонифицировать информацию, передаваемую на ваш компьютер. Например, при использовании cookies при входе на любимый почтовый сервер вполне реально показать окошко с надписью "Здравствуй, Вася". И технология эта крайне успешно применяется. Основана она на генерации некоторого маленького текстового файла, в котором закодированы предпочтения пользователя, его входное имя на какие-либо сервера, результат голосования на каком-либо сайте и т. д. В файле cookie информация может быть любой (и, чаще всего, наполовину кодированной), например:
pixelpopslot
5
schneemann.8m.com/
1600
1482425216
29456104
778171712
29455903
*
"Печенье" обычно используется в две стадии. Допустим, вы зашли на известный веб-портал Yahoo!, чтобы чего-либо найти. В процессе выбора категорий веб-сервер генерирует файл cookie со списком выбранных категорий, именем пользователя (если вы зарегистрировались) и так далее - и пересылает его на ваш компьютер.

Причем, как правило, это происходит БЕЗ ВАШЕГО ВЕДОМА. Когда вы в следующий раз посетите Yahoo!, то браузер автоматически перешлет нужное cookie на сайт Yahoo! для того, чтобы немного персонифицировать информацию для вас: отобразить ваше имя, предложить наиболее интересные сайты из выбранных ранее категорий и т. д. И опять этот процесс будет сделан без вашего ведома.

То есть ваши перемещения в интернете вполне можно отследить с помощью cookies. Неприятно? Программы-файрволлы обычно дают несколько вариантов работы с cookies. Можно, например, запретить все. Однако это не выход, так как вас перестанут узнавать многие сайты - например, www.mail.ru.

На этом портале также организована работа с cookies, и их отключение приведет к невозможности прочесть свою почту. Однако не стоит и разрешать все приходящие на ваш компьютер cookies. Особенно если вы бродите по полулегальной части интернета.

Некоторое время назад был скандал, связанный с тем, что злоумышленник, пользуясь встроенным в процессор Intel Pentium III серийным номером и технологией cookies, может перехватить большую часть информации, содержащуюся на компьютере пользователя. В настоящее время ведется консилиум по поводу тотального запрещения cookies. Хотя вероятность взлома через cookies крайне мала, стоит все-таки отслеживать их появление. Спокойнее спать потом будете.

При посещении некоторых сайтов у меня нечитабелен текст, хотя в подменю кодировка отмечен пункт "автовыбор". Что делать?

Прежде всего, снять флажок "автовыбор". В коде веб-страницы должно быть указано, в какой кодировке она сделана, - в этом случае текст будет читабелен. В противном случае вам придется выбрать кодировку вручную. Вообще же, для Рунета данная проблема имеет животрепещущий характер. Связано это с множеством кириллических кодировок и невнимательностью веб-мастеров.

Когда компьютеры начинали вхождение в жизнь пользователей, существовало не так уж и много стандартов на кодировки символов. В Советском Союзе это была КОИ-8 (код обмена информацией восьмиразрядный), в США придумали ASCII (American Standard Code for Information Interchange) - семиразрядную и, соответственно, поддерживающую всего 128 символов (27).

Впоследствии ASCII была расширена до 8-разрядной кодировки, где со 129-го символа (имеющего номер 128 - поскольку нумерация символов идет с 0) шли специфические буквы европейских языков и символы псевдографики. Про русский язык, естественно, никто и не вспоминал. С развитием компьютерных технологий появилась необходимость не только в латинских и специфичных для европейских языков символов, но и букв других языков.

Вот тут-то и начались проблемы. Было решено размещать национальные символы во второй половине таблицы, то есть после 128-го символа. Кодировок появилось достаточно много. В том числе и с поддержкой русского языка - сначала CP-866 (она же codepage 866, 866-я кодовая страница, русская MS-DOS), а с выходом Windows 95 - CP-1251 (кодовая страница 1251, windows-1251).

Таким образом, существует не менее трех официальных кодировок русского языка. (А еще есть основная кодировка ГОСТ, макинтошевская раскладка... Upgrade писал об этом подробно в #6 - прим. ред.) Поскольку кодировок оказалось много, их надо как-то различать. В документах HTML для этого существует специальный тег, который говорит браузеру, какая кодировка используется на странице.

Если этот тег не указан, то браузер определяет кодировку сам. Однако многие веб-серверы имеют ограничения на кодировку документов.

И невнимательность при написании веб-страниц приводит к нечитабельности текста. Если на сервере стоит жесткое ограничение на кодировку, например, Windows-1251, а документ написан в КОИ, то при запросе данной страницы придется вручную (на глаз) определять кодовую страницу, так как автоопределение, скорее всего, даст сбой. Кроме того, многие прокси-серверы имеют функцию перекодирования символов "на лету" или транскодирование (Accept-Charset).

Последствия автоматического перекодирования довольно печальны: может статься так, что страница или письмо по электронной почте (да-да, и почты это тоже касается) будет просто испорчена вследствие многократного перекодирования. И иногда насовсем. Например, некоторые серверы сети CompuServe перекодируют русский текст в последовательность вопросительных знаков, что, увы, не поддается расшифровке.

Однако, если все не настолько плохо, на помощь нам придут специализированные программы-перекодировщики. Существует их достаточно большое количество, программы различаются возможностями, ценами, понимаемыми кодировками и интерфейсом. Лично я пользуюсь бесплатной программой TCode, написанной Алексеем Бойко (alexboiko.chat.ru). Программа работает под всеми Windows, начиная с 95-х и имеет довольно обширные возможности.

Может раскодировать текст из DOS, Windows, KOI-8, ISO-8859-5, Base64, Quoted-Printable, RTF, HTML, UTF-8. Интерфейс программы обделен графическими наворотами и при этом крайне удобный. Достаточно скопировать кусок текста в буфер обмена и запустить программу. С большой степенью вероятности текст будет распознан.

Еще одна программа перекодировки испорченного текста под названием Trancode (www.dialognauka.ru /dsav_toolkit/trancode.htm) написана программистами из компании "Диалог-Наука" Виталием Ладыгиным и Дмитрием Лозинским. Программа бесплатна, но несмотря на бесплатность обеспечивает хорошее качество распознавания и перекодирования испорченного текста.

Есть в ней функция слежения за буфером обмена и срабатывание по горячим клавишам. Есть возможность транслитерации русского текста, то есть написание русских слов латинскими символами (те, кому приходится отправлять немереную кучу SMS с серверов без автоматической транслитерации, по достоинству оценят это свойство). Есть также возможность автоматизировать действия по перекодировке текста во многих типах окон. Однако владельцев Windows XP я хочу огорчить - Trancode под эту ОС ставиться отказывается. 

Тем, кому лень забивать себе место на жестком диске, могу предложить несколько онлайновых перекодировщиков. Это, например, перекодировщик на сайте технической поддержки провайдера МТУ-Интел (support.mtu.ru/cgi/decode.cgi). Поддерживает кодировки КОИ, Windows-1251, ISO-8859-5, DOS.
Сайт decoder.design.ru также предлагает перекодирование текста из одной кодировки в другую. Список кодировок достаточен, чтобы удовлетворить даже самых требовательных пользователей Сети.

Также данный перекодировщик поддерживает большое количество уровней вложенности, то есть когда текст был неоднократно перекодирован и стандартными средствами в чувство его привести нельзя, а не читать жалко - вам сюда.

А тех, кого не утраивает мой список, прошу зайти на сайт soft.mail.ru/Programs/Text/Decoders, где собрано большое количество программ-перекодировщиков и транслитераторов. Большинство из этих программ распространяется бесплатно. Еще можно посетить сайт hotlinks.ru/guide/44.html, где содержится приличное количество ссылок не только на перекодировщики текста, но и на переводчики. Людям, плохо владеющим иностранными языками, это, несомненно, поможет.

Однако в мире кодовых страниц грядут изменения. На данный момент активно продвигается кодировка Unicode, призванная решить проблемы с чтением текстов. В Unicode каждый символ кодируется двумя байтами, а это означает 65 536 поддерживаемых символов, что снимает проблемы с ограниченностью кодовой страницы.

Некоторые операционные системы, например Windows NT / 2000 / XP, имеют встроенную поддержку Unicode, что позволяет называть файлы любыми именами - хоть иероглифами. Проблем не будет. Но самое интересное, что консорциум ISO (International Standards Organization) разрабатывает 4-байтовую кодировку, которая станет хранилищем чуть ли не всех известных человеку символов, ведь туда можно поместить 4 294 967 295 символов!!! Интересно, как в этой куче символов искать нужный, если что...

В качестве вывода могу сказать, что, если отображаемая страница или письмо от друга нечитаемо, а подбор кодировок ничего не дает, ищите программу-перекодировщик и все станет хорошо!

Источник: http://www.computery.ru/upgrade/

 


Copyright © "Internet Zone", http://www.izcity.com/, info@izcity.com