|
|||
|
|||
Самый простой способ преобразовать .PDF в .TXT или .DOC формат |
|||
А зачем это?Сей опус адресован тем, у кого
есть желание, но нет возможности (вернее
они о ней не знают) конвертировать файлы
.PDF в другие форматы. Помимо наличия
присутствия желания, должно наблюдаться
наличие присутствия установленного Adobe
Acrobat Reader и доступа к Internet :-). Итак, приступим.Самый простой способ преобразовать текст .PDF документа в форматы .TXT или .DOC - это меню Edit Adobe Acrobat Reader. Если нужно скопировать только фрагмент, то просто нажимаем соответствующую кнопку (на рисунке она нажата), выделяем и копируем (как обычно в других приложениях Windows).
Если документ большой, то можно воспользоваться утилитой Pdf To Txt (402Кб), взять ее можно здесь . Работает она в режиме эмуляции DOS. Чтобы работать было удобнее, в переменной Path файла Autoexec.bat нужно прописать пути до папки с программой и папки с документом, который нужно преобразовать. Если у Вас установлен Adobe Acrobat Reader 4.05, то отсюда Вы можете скачать патч (1223Кб), который позволит Вам конвертировать документ из формата .PDF в TXT или HTML 2.0. Надо сказать, что качество преобразования в обоих случаях невысокое. Изображения игнорируются, про навигацию можно забыть, а если на странице были таблицы или текст был разбит на колонки, читать это будет трудно. А он не хочет конвертироваться!Одно из преимуществ формата .PDF по сравнению, например, с форматом .DOC - это существенно меньший объем при большом количестве изображений, а при известных проблемах с русскими шрифтами, бывает проще сначала перевести текст в изображение, а уже изображение отконвертировать в .PDF. Отличить текстовый .PDF файл от графического можно, например, с помощью функции Zoom: при увеличении масштаба графического файла становится заметной зернистость изображения, кроме того, не работает функция Select All меню Edit. Преобразовать такой файл ни одним из вышеприведенных способов, естественно, будет невозможно. Еще одна неприятность, которая может встретиться на нашем пути, это если при конвертации документа, вместо оригинального текста "Схемотехника современных PC" мы получим что-то вроде "Ko_fhl_ogbdZ kh\j_f_gguo PC". Тут я ничего определенного сказать не могу, могу лишь предположить, что причинна этого - программа, в которой создавался документ (до преобразования его в .PDF). Для справки: документы, созданные Adobe PageMaker конвертируются корректно. Безвыходных положений не бывает!(Барон Мюнхгаузен) А как же картинки, спросите Вы. Отвечу: и эта проблема решаема. Сделать это можно стандартными средствами Windows следующим образом:
Этим же способом можно
преобразовать и текст, который не
удалось преобразовать описанными выше
способами. Для этого необходимо
добавить еще одну операцию -
распознавание текста с помощью Fine Reader'а
или чего-то вроде. А, между прочим, краткость...(Кто-то очень умный) Да я, собственно, все. Подготовлено
по материалам рассылки "FAQ"
- почтовый форум.
|
|||
|
|||
Copyright © "Internet Zone", info@izcity.com | |||
Копирование и использование данных материалов разрешается только в случае указания на журнал "Internet Zone", как на источник получения информации. При этом во всех ссылках обязательно явное указание адреса вэб-сайта http://www.izcity.com/. При наличии у копируемого материала авторов и источника информации - их также нужно указывать, наряду со ссылкой на нас. |