|
*** |
Персональное бюро переводовОлег Пилипенко Электронных лингвистов часто называют недорогой альтернативой профессиональным переводчикам. Применение таких программ позволяет ускорить перевод объемных текстов и компенсировать пробелы в знании иностранных языков. Программное обеспечение для переводов текстов с одного языка на другой развивается уже несколько десятилетий, при этом совершенствуется как качество перевода, так и количество поддерживаемых языков. Первые попытки разработать подобные программы осуществлялись еще в начале 50-х годов. Пройдя за несколько десятилетий этапы энтузиазма и разочарований, в конце 80-х разработчикам удалось достигнуть довольно впечатляющих результатов в переводе текстов.
В начале 90-х появились первые отечественные продукты, способные выполнять прямой и обратный перевод с русского на английский, а также с русского на украинский языки. А с популяризацией Internet получили распространение
Технологии машинного переводаВ настоящее время используются две технологии перевода при помощи компьютеров (так называемого машинного перевода). Первая, часто называемая Transfer, строится как комплекс трех процессов. На первой стадии исходный текст анализируется с разбиением на группы существительных, прилагательных, глаголов и наречий, а также определением основы и окончания каждого из слов. Далее производится преобразование этой структуры в аналогичную структуру выходного языка, после чего следует синтез конечного предложения по полученной структуре. Другая, реже используемая технология Interlingua (то есть промежуточный язык), предполагает создание некоего языка, описывающего все структуры входного и выходного языков. Поэтому процесс перевода здесь проходит всего в два этапа: анализ входного предложения в терминах промежуточного языка и затем генерация соответствующего предложения на выходном языке. Наибольшую сложность представляет разработка самого промежуточного языка с описанием в соответствующих терминах естественного языка. В связи с этим технология Interlingua применяется менее часто, чем Transfer. Для перевода объемных текстов с большим количеством повторов применяется также иная технология, использующая концепцию Translation Memory. Работа подобной системы основана на использовании баз соответствий смысловых единиц. Таким образом, перед началом работы с такой системой нужно создать эту базу соответствий или воспользоваться готовой. При этом нельзя создать универсальную базу для всех видов текстов, как правило, для каждой задачи создается своя собственная база соответствий. В результате, предложения или их части, отсутствующие в базе, не будут обрабатываться вообще, но зато те, что есть, будут переводиться всегда правильно. Именно по этой причине применение технологии баз соответствий оправдано лишь для объемных текстов с многочисленными повторами, например, технической документации, справочников и т.п. Однако для флективных языков (которые используют в морфологии флексию - словоизменение, при котором словоформы получаются путем изменения основы слова), допускающих произвольный порядок слов в предложении (таких как русский и украинский), эта система оказывается малоэффективной. Поэтому намного выгодней применять базы соответствий для англо-русского перевода, а не наоборот. Вообще, разработка системы, использующей принцип баз соответствий, не представляет большого труда для профессионального программиста, ибо основная ее ценность состоит именно в правильно созданных базах, а не в оболочке. Но все же немалой популярностью пользуются и готовые системы, например Translator's Workbench (TRADOS). Следует заметить, что многие современные системы перевода текстов (например Promt XT) построены на базе синтеза нескольких технологий. Так, при переводе по методу Translation Memory в этой программе устанавливается максимальная величина совпадений, после чего все сегменты со значением менее этой величины рассматриваются как неизвестные и отправляются на машинный перевод.
Плюсы и минусыКак любой продукт, электронные толмачи имеют свои достоинства и недостатки. Их соотношение зависит от сложности исходного текста, а также цели, которая преследуется в конечном счете. Впрочем, рассмотрим все факторы по порядку. Основным достоинством компьютерного переводчика можно считать высокую скорость перевода. С ростом вычислительных мощностей перевод многостраничного текста может осуществляться всего за несколько секунд. Это позволяет быстро понять смысл текста, кроме того, если система правильно настроена на тематику текста, впоследствии потребуется минимальная редакторская правка. Но предварительно, как правило, требуется тщательная настройка словарей, а <гладкий> осмысленный результат возможен только в случае простого построения предложений в исходном тексте. Другим важнейшим преимуществом программ-переводчиков является надежный доступ к услуге. Компьютерный толмач всегда под рукой, в то время как использование услуг бюро переводов или просто человека-переводчика требует затрат времени и денег. Еще одним позитивным фактором в применении систем машинного перевода является конфиденциальность. Электронные переводчики часто используются в личной переписке, для перевода различной закрытой (например, деловой) корреспонденции. Однако информация подобного рода требует высокой точности перевода, что программные средства не всегда могут обеспечить, а точнее возможность этого зависит от сложности структуры исходного текста. Кроме того, можно отметить универсальность компьютерных толмачей. Ведь у каждого человека-переводчика есть своя специализация, будь то техническая, экономическая, юридическая и иная. Как правило, опытный переводчик не возьмется за сложный текст чужой специфики. А вот в системах машинного перевода все проще - после подключения словаря по соответствующей тематике любой текст будет интерпретирован с учетом его специфики. Во многих продуктах такие словари можно даже пополнять самостоятельно. С другой стороны, процесс тематического конфигурирования программного переводчика весьма трудоемкий и сложный, поэтому оправдывает себя лишь при больших объемах переводимой информации. Путь к взаимопониманиюКачество интерпретации современных компьютерных толмачей все еще далеко от идеала. Более или менее неплохо существующие программы переводят с английского лишь при условии, что текст написан с использованием стандартных словосочетаний и в нем нет грамматических ошибок. Поэтому, если при переписке вы пользуетесь системой компьютерного перевода, следует попросить вашего адресата писать короткими предложениями и проверять орфографию.
В русском или украинском языках такого подхода недостаточно для обеспечения должного качества перевода, ибо славянские языки допускают произвольный порядок слов в предложении. А чтобы достичь приемлемых результатов, нужно применять способ построения предложения такой, как в английском языке. В нем используется следующий порядок слов: подлежащее + сказуемое + обстоятельства. Помимо этого, есть множество других тонкостей, которые также будут влиять на качество перевода. Например, такие слова, как <также> или <тоже> необходимо ставить впереди остальных слов предложения, а вместо слова <есть> в значении <иметь> (которое в русском языке часто опускается) рекомендуется всегда использовать глагол <иметь>. Рассмотрим два примера. Неадаптированный оригинал: Я также благодарен вам за ваше приглашение. У вас широкие возможности для творчества. Рекомендую вам использовать их в полную силу. А вот его машинный перевод: I am also thanked you for your invitation. Beside you broad possibilities for creative activity. Recommend you to use them in get fat power.
Теперь адаптируем оригинал под требования компьютерного перевода: Также я благодарю вас за ваше приглашение. Вы имеете большие возможности для творчества. Я рекомендую вам использовать их максимально. В результате получаем перевод: Also I thank you for your invitation. You have a greater possibilities for creative activity. I recommend you to use them greatly. И хотя этот перевод также не идеален,
Перед началом перевода также рекомендуется определить в тексте зарезервированные слова, которые не должны переводиться (если программа это позволяет). При необходимости их можно транслитерировать или же оставить в оригинальном написании. Ниже по тексту статьи представлено описание протестированных систем компьютерного перевода, а также таблица с результатами теста. Далее предложен обзор переводчиков с Web-доступом, а также программы для перевода содержимого сайтов. Promt XT Office GiantПотомок некогда популярного электронного переводчика Stylus, продукт Promt XT Office в настоящее время является однозначным лидером по числу направлений перевода и функциональности. Так, Promt XT поддерживает прямой и обратный перевод с английского, французского, немецкого на русский, а также выполняет односторонний перевод с испанского и итальянского на русский. В состав набора приложений Promt XT Family, помимо профессиональной среды для переводов Promt, входят следующие модули: электронный словарь, содержащий всю словарную базу специализированных словарей продукта, модуль Promt Е для перевода Web-страниц в MS Internet Explorer, а также некоторые служебные утилиты, например Promt Backup для резервного хранения настроек и пользовательских словарей системы, программа TDSetup для инсталляции дополнительных словарей и шаблонов тематик, модуль Promt for TRADOS, отвечающий за интеграцию системы класса Translation Memory Trados, и программы машинного перевода Promt XT. Продукт поставляется в нескольких вариантах комплектации: от <легковесного> Express, содержащего только программу Promt X, до Promt XT Professional, который комплектуется максимальным числом различных модулей. В стандартный комплект поставки входят 17 специализированных словарей, также можно подключать свои собственные. Promt XT обладает многими полезными функциями, такими как озвучивание текста при наличии установленных на компьютере средств синтеза речи, совместимых со стандартом Text-To-Speech, и синхронный перевод, когда текст обрабатывается программой сразу после ввода очередного фрагмента предложения. В процессе перевода программа отбирает незнакомые слова и показывает их в отдельном окне. Далее их можно перевести самостоятельно и занести в пользовательский словарь. При необходимости, некоторые слова можно пометить как зарезервированные (например торговые марки компаний и т. д.). Для передачи стилистических особенностей документа, с которыми системы машинного перевода справляются неважно, используется модуль ассоциированной памяти (АП), который работает на базе концепции Translation Memory. Некорректно интерпретированную фразу пользователь переводит самостоятельно, после чего заносит в базу исправленный вариант. В настройках АП указывается степень совпадения слов (допустим 80 %). Теперь, если в будущих документах встретится аналогичная фраза, она будет переведена на основании данных из базы АП. При тестировании Promt XT Office показал наиболее высокие результаты среди участников теста. Как и следовало ожидать, технические тексты переводились более качественно, чем документы общей тематики. По скорости перевода Promt XT не был самым быстрым, но этот фактор с лихвой компенсировался более высоким качеством перевода. Чтобы оценить прогресс текущей версии по сравнению с Promt 2000, предыдущим выпуском программы, протестированной нами ранее (см. ЧИП 1/2001, с. 54), мы попробовали перевести при помощи Promt XT Office те же исходные тексты, которые использовались в прошлом тесте. Улучшение очевидно - увеличился словарный запас, текст переводился более гладко, с согласованием падежей. Помимо этого, программа теперь более надежно распознает сокращения, аббревиатуры. В то же время, с переводом некоторых оборотов предыдущая версия продукта справилась не хуже, а иногда - даже лучше. Pragma 1.0Программа машинного перевода Pragma 1.0 пришла на смену более ранней и весьма популярной системе L-Master 98. Pragma 1.0 работает по новой, отличной от L-Master 98 технологии, и осуществляет перевод на трех языках - русском, украинском, английском, причем в любой комбинации. Продукт имеет два вида словарей: системный и пользовательский. Последний имеет более высокий приоритет, поэтому слова первоначально просматриваются в нем, затем в системном. Специализированные словари в программе выбираются автоматически по ключевым словам из текста, вручную их указать нельзя. Продукт состоит из двух основных модулей: Pragma Navigator и Pragma Monitor. Первый представляет собой довольно стандартную среду перевода, с горизонтально разделенным на две части окном. В одной половинке окна помещается текст-источник, в другой - результат перевода. В левой части окна находится меню основных опций системы. Модуль Pragma Monitor резидентно загружен в памяти системы и отвечает за мгновенный перевод текста в буфере обмена. При инсталляции Pragma 1.0 устанавливает свои модули в наиболее популярных офисных приложениях: MS Word, Notepad, Wordpad. Это позволяет осуществлять перевод прямо в окне этих приложений. Однако на момент тестирования программа отличалась некоторыми недоработками в этой области и не всегда корректно интегрировалась в офисные приложения. Функциональные возможности продукта достаточно скудны: Pragma 1.0 не имеет в комплекте поставки даже электронного словаря в виде отдельного приложения, присутствует только орфографический модуль. Зато в области экспорта/импорта программа оказалась на высоте, позволяя открывать и сохранять файлы в более чем 10 форматах. Скорость перевода по сравнению с L-Master 98 увеличилась в несколько раз. Качество перевода также несколько улучшилось как для англо-русско-английского направления перевода, так и для украинско-русско-украинского.
Почему ЧИП рекомендует Pragma 1.0, Плай 4.02 и Promt XT Office GiantВ категории украинско-русского и русско-украинского направлений перевода продукты Pragma 1.0 и Плай 4.02 показали практически одинаковые результаты. Функционально ProLing Office 4.02, в состав которого входит переводчик Плай 4.02, более удобен для пользователей, работающих только с русским и украинским языками. В то же время Pragma 1.0 - один из немногих продуктов, способный осуществлять качественный перевод с английского на украинский и обратно, что представляет особый интерес для организаций, работающих с этими направлениями перевода. Сократ Персональный 4.1Свою историю системы машинного перевода Сократ ведут с 1995 года, когда была выпущена первая версия этого электронного переводчика для Windows. Через некоторое время компанией Арсеналъ была выпущена 32-разрядная версия продукта Сократ 97. Недавно выпущенная система автоматического перевода Сократ Персональный 4.1 осуществляет перевод всего в двух направлениях - с русского на английский и обратно. В состав продукта, помимо переводчика, входит также электронный словарь, использующий общие словарные базы. По количеству различных функций данная программа весьма бедна - из дополнительных средств в ее состав входит лишь электронный словарь. В настройках программы нельзя указать специализированный словарь во время перевода, а также определить зарезервированные слова. Хотя, по информации разработчика, Сократ Персональный 4.1 автоматически учитывает тематику и стилистические особенности текста. С другой стороны, интерфейс продукта чрезвычайно прост и позволяет приступить к работе через считанные минуты после установки программы. Сократ Персональный 4.1 оказался несомненным лидером в скорости перевода. Текст объемом в несколько тысяч знаков обрабатывался всего за несколько секунд. А вот словарный запас программы не особо велик: как результат, этот продукт оказался позади всех по количеству непереведенных слов. Чтобы узнать, насколько текущая версия переводчика отличается от более ранней Сократ 98 Профессиональный, мы обработали посредством Сократ Персональный 4.1 исходные тексты, использовавшиеся в прошлом тесте. В категории англо-русского перевода определенные улучшения были весьма очевидны. Но вот русско-английский перевод ничем не порадовал - обе версии программы совершили практически идентичные ошибки. Плай 4.02Об украинско-русско-украинском переводчике Плай 4.02, входящем в состав пакета ProLing Office 4.02, ЧИП уже писал (12/2001, с. 64). Помимо собственно электронного толмача в комплект входит популярная система проверки орфографии Рута 4.02, а также электронный украинско-русско-украинский словарь Улис 1.1. Система компьютерного перевода (как и модуль проверки орфографии) интегрируется во время инсталляции посредством plug-in-модуля в офисные приложения MS Office и работает в их окне. В состав продукта Плай 4.02 входят 2 общих и 4 специализированных словаря общим объемом около 300 тысяч слов. Скорость перевода достаточно высока - 1 тысяча знаков в среднем обрабатывается за 2-3 секунды. Качество перевода как русско-украинского, так и украинско-русского было на высоте - за небольшими исключениями, касающимися непереведенных слов, текст был вполне читабелен и почти не требовал редакторской правки по согласованию падежей и т. п. В прошлом тесте ЧИП испытывал Плай 4.0. Чтобы узнать, насколько предыдущая версия отличается от текущей, мы попробовали перевести те же русские и украинские исходные тексты, которые использовались в прошлом сравнительном обзоре. Результат был довольно неожиданным - переведенные обеими версиями программ документы, а также совершенные ими ошибки, совпали на 100 %, за исключением одного слова в тексте общей тематики. L-Master 98Все еще поставляемая программа L-Master 98 отличается от своей первой редакции лишь поддержкой приложений MS Office 2000 и MS Office XP. Сама технология и качество интерпретации текстов не изменились, о чем свидетельствуют и результаты перевода документов, использовавшиеся ЧИПом в качестве исходных в прошлом тесте. Продукт не имеет собственной оболочки, при инсталляции L-Master 98 интегрируется в среду MS Word и перевод документа выполняется внутри текстового процессора. Производительность продукта оказалась довольна невелика - документ объемом в 1 тысячу знаков обрабатывался за 10-15 секунд. Однако качество перевода, особенно с русского на украинский и обратно, даже на сегодняшний день достаточно высокое, более современные продукты лишь незначительно улучшили его показатели. В состав продукта также входит модуль проверки орфографии (spellchecker). При работе в MS Word программа L-Master 98 предоставляет функцию перевода одного слова, что частично компенсирует отсутствие отдельного электронного словаря. Источник: http://chip.ua/articles/
| ||||
| ||||
Copyright © "Internet Zone", info@izcity.com |