Технологии
Автоматизация процесса перевода
Объем информации, переводимой на
разные языки, увеличивается с
каждым годом. В то же время
производители стараются
максимально сократить сроки выхода
продуктов на рынок. Все это
приводит к тому, что спрос на услуги
переводчиков растет, а вместе с ним
растут и требования. Перевод стал
высокотехнологическим процессом и
без помощи компьютеров в наше время
просто немыслим. Но вы ошиблись,
если подумали сейчас о
программах-автопереводчиках.
Полезные в частных случаях, когда
нужно быстро понять текст на
незнакомом языке, эти программы
совсем не гарантируют связности и
осмысленности переведенного
текста и даже его соответствия
оригиналу. Поэтому
профессиональные переводчики в
своей работе используют менее
известные в России средства
автоматизации:
- системы «памяти переводов»
(translation memory);
- средства работы с
терминологическими базами данных
(termbases);
- средства синхронизации (alignment),
анализа и подсчета количества
слов;
- средства локализации
пользовательского интерфейса.
«Память переводов»
Технология
Translation Memory (TM) позволяет
помещать элементы текста (фразы,
предложения, сочетания символов,
цифры и т.д.) в базу данных. Они
содержатся в базе в виде языковых
пар (фраза на исходном языке +
фраза на языке перевода). Такие
элементы, называемые сегментами,
обычно разграничиваются точкой или
символом конца абзаца в исходном
тексте.
Если в исходном тексте
встречается сегмент, полностью или
частично совпадающий с сохраненным
в базе данных, переводческая
программа предлагает пользователю
соответствующий сегмент на языке
перевода. При наличии нескольких
совпадений программа предлагает
несколько вариантов для
подстановки.
Это позволяет сэкономить время,
избавляя от необходимости
повторного перевода одинаковых или
похожих элементов, и обеспечивает
идентичность перевода одинаковых
фрагментов по всему документу. В
большинстве программ, использующих
технологию TM, имеется также функция
Concordance Search — поиск по
базе данных переводов. При вводе
слова или фрагмента текста
программа ищет все сегменты базы
данных, в которых этот текст
встречается, и выводит их на
экран.
Терминологические базы данных
Терминологические базы —
это базы данных, содержащие
ключевые термины, которые должны
одинаково переводиться в пределах
всего документа (проекта).
Наряду с термином и его переводом
в терминологической базе может
содержаться объяснение термина,
сведения об области его применения
и т. д.
Средства анализа и
синхронизации
Анализ проводится для оценки
затрат на выполнение перевода.
Средства анализа файлов
применяются для подсчета общего
количества слов, количества
сегментов, в разной степени
совпадающих с сегментами в базе, и
повторяющихся сегментов в
переводимом документе.
Синхронизация (часто не вполне
корректно называемая
выравниванием) применяется для
создания баз данных Translation Memory с
использованием ранее переведенных
файлов.