Надоел медленный Интернет?  Попробуй Ускоритель!
Marketscore - сервис, практически вдвое увеличивающий в Интернете скорость работы вашего браузера. В среднем, скорость загрузки вэбстраниц с графикой и текстом ускоряется на 75%. 
Особенно заметен выигрыш, если у вас медленный модем или вы выходите в Интернет на маленьких скоростях (до 56 Кб/сек).
Подробнее...

реклама у нас

***

Персональное бюро переводов

Олег Пилипенко

Электронных лингвистов часто называют недорогой альтернативой профессиональным переводчикам. Применение таких программ позволяет ускорить перевод объемных текстов и компенсировать пробелы в знании иностранных языков.

Программное обеспечение для переводов текстов с одного языка на другой развивается уже несколько десятилетий, при этом совершенствуется как качество перевода, так и количество поддерживаемых языков.

Первые попытки разработать подобные программы осуществлялись еще в начале 50-х годов. Пройдя за несколько десятилетий этапы энтузиазма и разочарований, в конце 80-х разработчикам удалось достигнуть довольно впечатляющих результатов в переводе текстов.

В начале 90-х появились первые отечественные продукты, способные выполнять прямой и обратный перевод с русского на английский, а также с русского на украинский языки. А с популяризацией Internet получили распространение
программы для перевода содержимого Web-cайтов, а также компьютерные толмачи с Web-доступом.

Технологии машинного перевода

В настоящее время используются две технологии перевода при помощи компьютеров (так называемого машинного перевода). Первая, часто называемая Transfer, строится как комплекс трех процессов. На первой стадии исходный текст анализируется с разбиением на группы существительных, прилагательных, глаголов и наречий, а также определением основы и окончания каждого из слов. Далее производится преобразование этой структуры в аналогичную структуру выходного языка, после чего следует синтез конечного предложения по полученной структуре.

Другая, реже используемая технология Interlingua (то есть промежуточный язык), предполагает создание некоего языка, описывающего все структуры входного и выходного языков. Поэтому процесс перевода здесь проходит всего в два этапа: анализ входного предложения в терминах промежуточного языка и затем генерация соответствующего предложения на выходном языке. Наибольшую сложность представляет разработка самого промежуточного языка с описанием в соответствующих терминах естественного языка. В связи с этим технология Interlingua применяется менее часто, чем Transfer.

Для перевода объемных текстов с большим количеством повторов применяется также иная технология, использующая концепцию Translation Memory. Работа подобной системы основана на использовании баз соответствий смысловых единиц. Таким образом, перед началом работы с такой системой нужно создать эту базу соответствий или воспользоваться готовой. При этом нельзя создать универсальную базу для всех видов текстов, как правило, для каждой задачи создается своя собственная база соответствий. В результате, предложения или их части, отсутствующие в базе, не будут обрабатываться вообще, но зато те, что есть, будут переводиться всегда правильно. Именно по этой причине применение технологии баз соответствий оправдано лишь для объемных текстов с многочисленными повторами, например, технической документации, справочников и т.п.

Однако для флективных языков (которые используют в морфологии флексию - словоизменение, при котором словоформы получаются путем изменения основы слова), допускающих произвольный порядок слов в предложении (таких как русский и украинский), эта система оказывается малоэффективной. Поэтому намного выгодней применять базы соответствий для англо-русского перевода, а не наоборот.

Вообще, разработка системы, использующей принцип баз соответствий, не представляет большого труда для профессионального программиста, ибо основная ее ценность состоит именно в правильно созданных базах, а не в оболочке. Но все же немалой популярностью пользуются и готовые системы, например Translator's Workbench (TRADOS).

Следует заметить, что многие современные системы перевода текстов (например Promt XT) построены на базе синтеза нескольких технологий. Так, при переводе по методу Translation Memory в этой программе устанавливается максимальная величина совпадений, после чего все сегменты со значением менее этой величины рассматриваются как неизвестные и отправляются на машинный перевод.

Быть ли роботам-переводчикам?

В фильме <Star Wars> робот C-3PO знал свыше миллиона языков и мог выполнять синхронный перевод с любого из них. Успехи современных систем машинного перевода гораздо скромнее, однако определенные обнадеживающие результаты можно отметить уже сейчас. Работу системы синхронного компьютерного перевода можно представить в виде трех этапов: распознавание речи и транcформация ее в текст, перевод с одного языка на другой и чтение вслух готового текста.

Последний этап особых сложностей не представляет - технологии синтеза голоса разработаны уже давно и используются во многих приложениях. Хотя и здесь разработчикам предстоит немало поработать, дабы устранить монотонность голоса и придать ему хоть какую-то выразительность.

Наибольшие проблемы связаны именно с первой фазой синхронного перевода. Более или менее качественные системы распознавания речи пока существуют только для английского языка, да и то, стопроцентный качественный результат они обеспечивают лишь при так называемой дискретной надиктовке с паузами между словами. Однако эти разработки быстро совершенствуются, и можно прогнозировать уже в ближайшее время появление систем, которые смогут качественно распознавать непрерывную беглую речь людей с хорошей дикцией.

Этап второй - перевод с одного языка на другой - наиболее проблематичен в области обеспечения качества перевода на должном уровне. Современные электронные толмачи на мощном компьютере способны перевести сотни слов за считанные секунды, а вот качественный результат гарантирован не всегда.

Практически все специалисты сходятся на мысли, что относительно совершенную компьютерную систему синхронного перевода не удастся создать посредством простого комбинирования программ распознавания речи, компьютерного перевода и синтеза голоса. Только если разрабатывать такую систему на основе искусственного интеллекта (нейронных сетей), то есть заставить ее думать и анализировать переводимый текст подобно человеку-переводчику, можно действительно сотворить робота, в будущем способного заменить живого переводчика. Однако, это весьма отдаленная перспектива, которая вряд ли грозит нам в ближайшие годы.

Плюсы и минусы

Как любой продукт, электронные толмачи имеют свои достоинства и недостатки. Их соотношение зависит от сложности исходного текста, а также цели, которая преследуется в конечном счете. Впрочем, рассмотрим все факторы по порядку.

Основным достоинством компьютерного переводчика можно считать высокую скорость перевода. С ростом вычислительных мощностей перевод многостраничного текста может осуществляться всего за несколько секунд. Это позволяет быстро понять смысл текста, кроме того, если система правильно настроена на тематику текста, впоследствии потребуется минимальная редакторская правка. Но предварительно, как правило, требуется тщательная настройка словарей, а <гладкий> осмысленный результат возможен только в случае простого построения предложений в исходном тексте.

Другим важнейшим преимуществом программ-переводчиков является надежный доступ к услуге. Компьютерный толмач всегда под рукой, в то время как использование услуг бюро переводов или просто человека-переводчика требует затрат времени и денег.

Еще одним позитивным фактором в применении систем машинного перевода является конфиденциальность. Электронные переводчики часто используются в личной переписке, для перевода различной закрытой (например, деловой) корреспонденции. Однако информация подобного рода требует высокой точности перевода, что программные средства не всегда могут обеспечить, а точнее возможность этого зависит от сложности структуры исходного текста.

Кроме того, можно отметить универсальность компьютерных толмачей. Ведь у каждого человека-переводчика есть своя специализация, будь то техническая, экономическая, юридическая и иная. Как правило, опытный переводчик не возьмется за сложный текст чужой специфики. А вот в системах машинного перевода все проще - после подключения словаря по соответствующей тематике любой текст будет интерпретирован с учетом его специфики. Во многих продуктах такие словари можно даже пополнять самостоятельно. С другой стороны, процесс тематического конфигурирования программного переводчика весьма трудоемкий и сложный, поэтому оправдывает себя лишь при больших объемах переводимой информации.

Путь к взаимопониманию

Качество интерпретации современных компьютерных толмачей все еще далеко от идеала. Более или менее неплохо существующие программы переводят с английского лишь при условии, что текст написан с использованием стандартных словосочетаний и в нем нет грамматических ошибок. Поэтому, если при переписке вы пользуетесь системой компьютерного перевода, следует попросить вашего адресата писать короткими предложениями и проверять орфографию.

Средства межкультурного общения

Возможности, которые открывает машинный перевод для интенсивного межкультурного общения, завораживают. Однако природа человеческого взаимодействия посредством языка является слишком сложной для того, чтобы ожидать в этой области быстрых успехов.

Рассматривая англо-русские и русско-английские переводы художественных и технических текстов, выполненные данными программами, легко заметить, что ни одна из них пока не умеет анализировать, порождать и интерпретировать высказывание. В основном программы работают на распознавание слов, поэтому результаты перевода позволяют лишь приблизительно определить предмет высказывания. Успех последующего <достраивания> исходного текста связан с разной степенью предсказуемости его элементов и поэтому в значительной мере зависит от его типа и структуры. Программы не всегда соблюдают грамматическую согласованность на уровне словосочетания. А лексико-синтаксическое согласование слов на уровне предложения оказалось сложным практически для всех представленных программ.

Машинный перевод художественного текста - пока что дело будущего. Но уже сегодня хочется отметить качество перевода продукта Promt XT, которому удалось c допустимой долей погрешности справиться с техническим текстом.

В русском или украинском языках такого подхода недостаточно для обеспечения должного качества перевода, ибо славянские языки допускают произвольный порядок слов в предложении. А чтобы достичь приемлемых результатов, нужно применять способ построения предложения такой, как в английском языке. В нем используется следующий порядок слов: подлежащее + сказуемое + обстоятельства. Помимо этого, есть множество других тонкостей, которые также будут влиять на качество перевода. Например, такие слова, как <также> или <тоже> необходимо ставить впереди остальных слов предложения, а вместо слова <есть> в значении <иметь> (которое в русском языке часто опускается) рекомендуется всегда использовать глагол <иметь>.

Рассмотрим два примера. Неадаптированный оригинал: Я также благодарен вам за ваше приглашение. У вас широкие возможности для творчества. Рекомендую вам использовать их в полную силу. А вот его машинный перевод: I am also thanked you for your invitation. Beside you broad possibilities for creative activity. Recommend you to use them in get fat power.

Теперь адаптируем оригинал под требования компьютерного перевода: Также я благодарю вас за ваше приглашение. Вы имеете большие возможности для творчества. Я рекомендую вам использовать их максимально. В результате получаем перевод: Also I thank you for your invitation. You have a greater possibilities for creative activity. I recommend you to use them greatly. И хотя этот перевод также не идеален,
тем не менее у вашего адресата уже не возникнет вопросов при прочтении вашего письма.

Перед началом перевода также рекомендуется определить в тексте зарезервированные слова, которые не должны переводиться (если программа это позволяет). При необходимости их можно транслитерировать или же оставить в оригинальном написании.

Ниже по тексту статьи представлено описание протестированных систем компьютерного перевода, а также таблица с результатами теста. Далее предложен обзор переводчиков с Web-доступом, а также программы для перевода содержимого сайтов.

Promt XT Office Giant

Потомок некогда популярного электронного переводчика Stylus, продукт Promt XT Office в настоящее время является однозначным лидером по числу направлений перевода и функциональности. Так, Promt XT поддерживает прямой и обратный перевод с английского, французского, немецкого на русский, а также выполняет односторонний перевод с испанского и итальянского на русский. В состав набора приложений Promt XT Family, помимо профессиональной среды для переводов Promt, входят следующие модули: электронный словарь, содержащий всю словарную базу специализированных словарей продукта, модуль Promt Е для перевода Web-страниц в MS Internet Explorer, а также некоторые служебные утилиты, например Promt Backup для резервного хранения настроек и пользовательских словарей системы, программа TDSetup для инсталляции дополнительных словарей и шаблонов тематик, модуль Promt for TRADOS, отвечающий за интеграцию системы класса Translation Memory Trados, и программы машинного перевода Promt XT.

Продукт поставляется в нескольких вариантах комплектации: от <легковесного> Express, содержащего только программу Promt X, до Promt XT Professional, который комплектуется максимальным числом различных модулей. В стандартный комплект поставки входят 17 специализированных словарей, также можно подключать свои собственные.

Promt XT обладает многими полезными функциями, такими как озвучивание текста при наличии установленных на компьютере средств синтеза речи, совместимых со стандартом Text-To-Speech, и синхронный перевод, когда текст обрабатывается программой сразу после ввода очередного фрагмента предложения.

В процессе перевода программа отбирает незнакомые слова и показывает их в отдельном окне. Далее их можно перевести самостоятельно и занести в пользовательский словарь. При необходимости, некоторые слова можно пометить как зарезервированные (например торговые марки компаний и т. д.).

Для передачи стилистических особенностей документа, с которыми системы машинного перевода справляются неважно, используется модуль ассоциированной памяти (АП), который работает на базе концепции Translation Memory. Некорректно интерпретированную фразу пользователь переводит самостоятельно, после чего заносит в базу исправленный вариант. В настройках АП указывается степень совпадения слов (допустим 80 %). Теперь, если в будущих документах встретится аналогичная фраза, она будет переведена на основании данных из базы АП.

При тестировании Promt XT Office показал наиболее высокие результаты среди участников теста. Как и следовало ожидать, технические тексты переводились более качественно, чем документы общей тематики. По скорости перевода Promt XT не был самым быстрым, но этот фактор с лихвой компенсировался более высоким качеством перевода.

Чтобы оценить прогресс текущей версии по сравнению с Promt 2000, предыдущим выпуском программы, протестированной нами ранее (см. ЧИП 1/2001, с. 54), мы попробовали перевести при помощи Promt XT Office те же исходные тексты, которые использовались в прошлом тесте. Улучшение очевидно - увеличился словарный запас, текст переводился более гладко, с согласованием падежей. Помимо этого, программа теперь более надежно распознает сокращения, аббревиатуры. В то же время, с переводом некоторых оборотов предыдущая версия продукта справилась не хуже, а иногда - даже лучше.

Pragma 1.0

Программа машинного перевода Pragma 1.0 пришла на смену более ранней и весьма популярной системе L-Master 98. Pragma 1.0 работает по новой, отличной от L-Master 98 технологии, и осуществляет перевод на трех языках - русском, украинском, английском, причем в любой комбинации. Продукт имеет два вида словарей: системный и пользовательский. Последний имеет более высокий приоритет, поэтому слова первоначально просматриваются в нем, затем в системном. Специализированные словари в программе выбираются автоматически по ключевым словам из текста, вручную их указать нельзя.

Продукт состоит из двух основных модулей: Pragma Navigator и Pragma Monitor. Первый представляет собой довольно стандартную среду перевода, с горизонтально разделенным на две части окном. В одной половинке окна помещается текст-источник, в другой - результат перевода. В левой части окна находится меню основных опций системы. Модуль Pragma Monitor резидентно загружен в памяти системы и отвечает за мгновенный перевод текста в буфере обмена.

При инсталляции Pragma 1.0 устанавливает свои модули в наиболее популярных офисных приложениях: MS Word, Notepad, Wordpad. Это позволяет осуществлять перевод прямо в окне этих приложений. Однако на момент тестирования программа отличалась некоторыми недоработками в этой области и не всегда корректно интегрировалась в офисные приложения.

Функциональные возможности продукта достаточно скудны: Pragma 1.0 не имеет в комплекте поставки даже электронного словаря в виде отдельного приложения, присутствует только орфографический модуль. Зато в области экспорта/импорта программа оказалась на высоте, позволяя открывать и сохранять файлы в более чем 10 форматах. Скорость перевода по сравнению с L-Master 98 увеличилась в несколько раз. Качество перевода также несколько улучшилось как для англо-русско-английского направления перевода, так и для украинско-русско-украинского.

Почему ЧИП рекомендует Pragma 1.0, Плай 4.02 и Promt XT Office Giant

В категории украинско-русского и русско-украинского направлений перевода продукты Pragma 1.0 и Плай 4.02 показали практически одинаковые результаты. Функционально ProLing Office 4.02, в состав которого входит переводчик Плай 4.02, более удобен для пользователей, работающих только с русским и украинским языками. В то же время Pragma 1.0 - один из немногих продуктов, способный осуществлять качественный перевод с английского на украинский и обратно, что представляет особый интерес для организаций, работающих с этими направлениями перевода.

Сократ Персональный 4.1

Свою историю системы машинного перевода Сократ ведут с 1995 года, когда была выпущена первая версия этого электронного переводчика для Windows. Через некоторое время компанией Арсеналъ была выпущена

32-разрядная версия продукта Сократ 97. Недавно выпущенная система автоматического перевода Сократ Персональный 4.1 осуществляет перевод всего в двух направлениях - с русского на английский и обратно. В состав продукта, помимо переводчика, входит также электронный словарь, использующий общие словарные базы.

По количеству различных функций данная программа весьма бедна - из дополнительных средств в ее состав входит лишь электронный словарь. В настройках программы нельзя указать специализированный словарь во время перевода, а также определить зарезервированные слова. Хотя, по информации разработчика, Сократ Персональный 4.1 автоматически учитывает тематику и стилистические особенности текста. С другой стороны, интерфейс продукта чрезвычайно прост и позволяет приступить к работе через считанные минуты после установки программы.

Сократ Персональный 4.1 оказался несомненным лидером в скорости перевода. Текст объемом в несколько тысяч знаков обрабатывался всего за несколько секунд. А вот словарный запас программы не особо велик: как результат, этот продукт оказался позади всех по количеству непереведенных слов.

Чтобы узнать, насколько текущая версия переводчика отличается от более ранней Сократ 98 Профессиональный, мы обработали посредством Сократ Персональный 4.1 исходные тексты, использовавшиеся в прошлом тесте. В категории англо-русского перевода определенные улучшения были весьма очевидны. Но вот русско-английский перевод ничем не порадовал - обе версии программы совершили практически идентичные ошибки.

Плай 4.02

Об украинско-русско-украинском переводчике Плай 4.02, входящем в состав пакета ProLing Office 4.02, ЧИП уже писал (12/2001, с. 64). Помимо собственно электронного толмача в комплект входит популярная система проверки орфографии Рута 4.02, а также электронный украинско-русско-украинский словарь Улис 1.1. Система компьютерного перевода (как и модуль проверки орфографии) интегрируется во время инсталляции посредством plug-in-модуля в офисные приложения MS Office и работает в их окне.

В состав продукта Плай 4.02 входят 2 общих и 4 специализированных словаря общим объемом около 300 тысяч слов. Скорость перевода достаточно высока - 1 тысяча знаков в среднем обрабатывается за 2-3 секунды. Качество перевода как русско-украинского, так и украинско-русского было на высоте - за небольшими исключениями, касающимися непереведенных слов, текст был вполне читабелен и почти не требовал редакторской правки по согласованию падежей и т. п.

В прошлом тесте ЧИП испытывал Плай 4.0. Чтобы узнать, насколько предыдущая версия отличается от текущей, мы попробовали перевести те же русские и украинские исходные тексты, которые использовались в прошлом сравнительном обзоре. Результат был довольно неожиданным - переведенные обеими версиями программ документы, а также совершенные ими ошибки, совпали на 100 %, за исключением одного слова в тексте общей тематики.

L-Master 98

Все еще поставляемая программа L-Master 98 отличается от своей первой редакции лишь поддержкой приложений MS Office 2000 и MS Office XP. Сама технология и качество интерпретации текстов не изменились, о чем свидетельствуют и результаты перевода документов, использовавшиеся ЧИПом в качестве исходных в прошлом тесте.

Продукт не имеет собственной оболочки, при инсталляции L-Master 98 интегрируется в среду MS Word и перевод документа выполняется внутри текстового процессора. Производительность продукта оказалась довольна невелика - документ объемом в 1 тысячу знаков обрабатывался за 10-15 секунд. Однако качество перевода, особенно с русского на украинский и обратно, даже на сегодняшний день достаточно высокое, более современные продукты лишь незначительно улучшили его показатели.

В состав продукта также входит модуль проверки орфографии (spellchecker). При работе в MS Word программа L-Master 98 предоставляет функцию перевода одного слова, что частично компенсирует отсутствие отдельного электронного словаря.

Источник: http://chip.ua/articles/

 


Copyright © "Internet Zone"info@izcity.com 
Копирование и использование данных материалов разрешается только в случае указания на журнал "Internet Zone", как на источник получения информации. При этом во всех ссылках обязательно явное указание адреса вэб-сайта http://www.izcity.com/.
При наличии у копируемого материала авторов и источника информации - их также нужно указывать, наряду со ссылкой на нас. Подробнее условия использования материалов смотрите здесь.