Byte/RE ИТ-издание

Средства автоматизации перевода и их окупаемость

Михаил Каничев,
коммерческий директор компании ПРОМТ

Глобализация бизнеса ставит перед компаниями среди прочих такие важные задачи, как предоставление сотрудникам доступа к информационному мировому пространству "без языковых барьеров" и снижение затрат (как временных, так и денежных) на локализацию собственной продукции при освоении новых рынков. Заметим, что задача устранения языковых барьеров актуальна не только для бизнес-структур, но и для некоммерческих организаций, которые вовлекаются в международное сотрудничество.

Онлайновый доступ к многоязычной информации

Проблема доступа к мировым информационным ресурсам стала особенно актуальной в последние годы – сотрудники преуспевающих компаний сегодня обязаны просматривать, прочитывать и анализировать огромный поток информации, и основным источником этой информации для них, разумеется, служит многоязычный Интернет.

Традиционно основным языком сети считается английский – и его так или иначе знают очень многие. Но, по последним данным, число пользователей Интернета, не говорящих по-английски, уже превышает число англоговорящих, и их доля продолжает расти. А следовательно, важная информация появляется и на других языках.

Так, по данным Global Reach, 59,8% пользователей выходят в Сеть из регионов, где не говорят по-английски. В абсолютных значениях численность неанглоязычной аудитории составляет 338,5 млн пользователей в сравнении с 228 млн англоговорящих.

Пользователи из европейских стран, где не говорят на английском, составляют 33,9% всей аудитории Интернета. В частности, для десятков миллионов пользователей родной язык – испанский, немецкий или французский. Жители азиатских стран составляют 25,8% совокупной аудитории Интернета, или 146,2 млн человек в абсолютном выражении. Самая многочисленная категория здесь говорит по-китайски (55,5 млн пользователей), японский язык – родной для 52,1 млн пользователей, корейский – для 25,2 млн.

Приблизительно в такой же пропорции в Интернете представлены и разноязычные документы, многие из которых могут оказаться необходимыми для принятия правильных решений. Как работать с ними?

Можно смело утверждать, что в нынешней ситуации решение этой задачи в принципе невозможно без применения технологий автоматизированного перевода. Только такие технологии в состоянии обеспечить онлайновый доступ к многоязычной информации на выбранном пользователем языке.

Оценивать сравнительную эффективность приобретения различных программных систем для онлайнового перевода больших информационных массивов или окупаемость соответствующих инвестиций представляется затруднительным – из-за отсутствия альтернативных решений. Однако если у сотрудников компании или организации есть постоянная необходимость в просмотре и анализе многоязычной информации, остается только выбрать производителя и конкретное решение и далее уже вырабатывать стратегию развития бизнеса, будучи хорошо осведомленными в мировом масштабе.

Один из ведущих поставщиков средств автоматизированного перевода в России –
компания ПРОМТ (http://www.promt.ru). Для
решения задач онлайнового перевода она предлагает два пакета – PROMT Intranet
Server и PROMT Development Kit.

PROMT Intranet Server – это законченный продукт, после установки которого на сервер корпоративной сети любой сотрудник компании получает возможность онлайнового автоматизированного перевода интересующей его информации. Intranet Server не требует дополнительных затрат на поддержку рабочих мест – пользователю достаточно иметь на компьютере браузер Microsoft Internet Explorer. Стоит подчеркнуть, что Intranet Server в первую очередь предназначен для быстрого перевода документов с целью просмотра и ознакомления с их содержанием. Средства настройки данного продукта довольно ограниченны – пользователь может только настроить перевод на определенную тематику, выбрав те или иные специализированные словари.

Другой продукт, PROMT Development Kit, представляет собой инструментарий разработчика программ (SDK), который можно встроить в существующую в компании систему документооборота. PROMT Development Kit, как правило, также используют для быстрого перевода документов, хотя на основе данного продукта можно построить и полноценную профессиональную систему перевода. Естественно, PROMT Development Kit предоставляет широкий спектр возможностей для настройки.

Средства автоматизации перевода

Помимо онлайнового перевода перед компаниями-производителями и экспортерами стоит еще одна задача – так называемый промышленный перевод. Цель этого процесса – получение не онлайнового перевода документа, предназначенного для быстрого просмотра, а законченного документа, готового к опубликованию: это могут быть инструкции, сопутствующие материалы, сопроводительная документация и т. п.

Очевидно, что в этом случае переведенный документ должен быть "зеркалом" исходного, в частности, сохранять все особенности его стиля и форматирования, а также базироваться на внутрикорпоративных терминологических стандартах. Перевод должен быть по возможности качественным – насколько это возможно в обычные весьма сжатые сроки (как правило, перевод не рассматривается как полноценный и равноправный этап разработки и соответственно откладывается до последнего момента).

В таких условиях взоры заказчиков и "поставщиков услуг по переводу" все чаще и чаще обращаются к средствам, оптимизирующим процесс перевода, т. е. средствам автоматизации. Какие факторы рассматриваются и принимаются во внимание при покупке и применении средств автоматизации перевода? Обычно это:

  1. Снижение себестоимости перевода (по сравнению с дорогой ручной работой).
  2. Уменьшение временных затрат (связано с п. 1).
  3. Повышение качества переведенного материала (соблюдение терминологии, сохранение
    стиля, что особенно актуально при коллективной работе и при современных огромных
    объемах переводов).

Средства автоматизации перевода делятся на такие категории, как системы Translation Memory (TM, или накопители переводов), системы автоматизированного перевода, вспомогательные инструменты (в частности, системы автоматического извлечения терминологии, системы проверки качества и т. п.) и средства, обеспечивающие интеграцию всех этих продуктов в единый процесс перевода.

Системы Translation Memory предоставляют пользователю возможность сохранять
результаты его работы в специализированной базе TM и использовать эти результаты
при последующих переводах. "Не стоит переводить дважды одно и то же" – распространенный
девиз разработчиков и пользователей систем TM.

Благодаря простоте и удобству системы TM нашли широкое применение в современных технологиях перевода. Практически все крупные международные компании используют системы TM для локализации своей продукции. Эти системы де-факто стали основным инструментом профессиональных переводчиков. Тем не менее следует учитывать, что наиболее эффективны они при переводах материалов, отличающихся высокой степенью повторяемости.

Системы автоматизированного, или машинного перевода (МП), осуществляющие
связный перевод с одного естественного языка на другой, позволяют быстро получить
готовый текст (качество которого очень сильно зависит, во-первых, от качества
исходного текста и, во-вторых, от настроек системы). Затем этот текст при соблюдении
определенных условий можно быстро отредактировать, доведя до уровня "ручного"
перевода. Применение МП в целях "промышленного перевода" позволяет обеспечивать
единство терминологии и стиля – особенно при коллективной работе – и сократить
временные затраты на ручной набор текста и форматирование документов.

Системы МП еще не нашли такого единодушного признания у частных переводчиков, как TM. Тем не менее они все чаще используются при "промышленном" переводе в крупных компаниях и организациях. В частности, если в 1993 г. с использованием систем МП в Европейском Союзе было переведено порядка 100 тыс. страниц, то в 1998 г. – уже более 200 тыс. страниц.

Системы автоматического извлечения терминологии также пока не нашли широкого применения, хотя терминологическая работа – это важнейший элемент переводческого процесса.

Вышеперечисленные средства автоматизации можно связать в единую технологическую цепочку, что делает их использование более эффективным. На рис. 1 показано решение для автоматизации всего переводческого процесса, предлагаемое компанией ПРОМТ.

Fig.1 Рис. 1. Средства автоматизации в единой технологической цепочке.


Система PROMT Terminology Manager (PROMT TerM, средство работы с терминологией) помогает выявить в переводимом тексте новую терминологию. Для этого система на базе статистических методов анализа исходных документов строит список "терминологических кандидатов" и затем позволяет сравнить их с терминами, найденными в словарях систем МП (PROMT) и TM (TRADOS). Возможность гибко управлять фильтрами, на основе которых формируется данный список, позволяет добиться наилучших результатов.

Пользователь может просмотреть контекстное окружение, в котором находится данный "терминологический кандидат", обсудить новую терминологию со специалистами, получить перевод новых терминов (например, с помощью системы МП) и занести утвержденный термин в словарь систем МП и TM. Тем самым обеспечивается терминологическая настройка и поддержка дальнейшего переводческого процесса.

Затем исходный документ направляется на перевод в систему TM, которая сравнивает его с сегментами выбранной базы данных и выделяет те фрагменты, которые в базе не найдены и требуют перевода. Эти фрагменты отправляются в систему МП для машинного перевода, обрабатываются там с помощью словаря, предварительно настроенного средствами PROMT TerM. Готовые фрагменты с пометкой о том, что они переведены PROMT, возвращаются в базу. Вся эта работа полностью автоматизирована с помощью средства PROMTforTRADOS (P4T). Переводчику остается только отредактировать автоматически переведенные фрагменты и сохранить их в ТМ. Результатом этого процесса будет переведенный документ, пополненные база данных ТМ и словари МП/TМ, настроенные на данную тематику. Все это позволит существенно сократить затраты при переводе следующего подобного документа.

В качестве системы МП в данной технологической цепи ПРОМТ предлагает использовать систему PROMT XT Professional с развитыми возможностями настройки. В ее состав входят инструменты PROMT TerM и PROMTforTRADOS.

Эффективность автоматизации

Эмпирическая оценка показывает, что использование систем МП после их настройки в соответствии с тематикой документов обеспечивает сокращение затрат времени на перевод приблизительно на 20-50%. При использовании систем ТМ в переводческих процессах улучшение составляет 20-60%. Средства автоматизации терминологической работы могут обеспечить рост эффективности на 30-50%.

Другой способ расчета эффективности может быть основан на том, чтобы разделить процесс перевода на ряд последовательных этапов (рис. 2) и оценивать эффект от применения средства автоматизации на каждом из них. При этом следует учитывать большое количество факторов, определяющих этот эффект, включая требования к переводу, особенности документооборота и многое другое. В ряде случаев применение средств автоматизации практически не приводит к росту эффективности, например, если требуется переводить совершенно разнотипные документы, где объем совпадений близок к нулю, – в таких условиях системы ТМ окажутся малопригодными.

Fig.2 Рис. 2. Технологическая цепочка при переводе документа.


Определим факторы, которые в наибольшей степени влияют на эффективность применения средств автоматизации.

Структура документооборота и вид исходных документов. Это один из важнейших
факторов. Если в компании реализован электронный документооборот и документы
на перевод направляются в электронном виде, то только за счет сокращения объема
ручной работы скорость всего процесса перевода увеличивается на 10-20%.

Стиль документации, включая степень унификации и повторяемости. Высокая
степень унификации и повторяемости делает эффективным применение как TM-инструментария,
так и систем МП. Известно, например, что техническая документация к ПО или телекоммуникационному
оборудованию характеризуется общим уровнем повторяемости до 70%. Это означает,
что при наличии базы ТМ и грамотном ее ведении в среднем потребуется переводить
не более 30% новых документов. Унифицированные документы, хорошо поддающиеся
обработке в настроенной системе МП, гарантируют ускорение процесса перевода
на 60-70%.

Объем требуемых переводов. Чем больше требуемый объем переводов, тем
эффективнее применение средств автоматизации (и тем быстрее окупаются затраты
на настройку и поддержку). При объеме меньше 300 страниц в месяц приобретение
и поддержка средств автоматизации представляются нецелесообразными.

Необходимость организации коллективной работы при переводе документов.
В нынешней экономической ситуации объемы переводов и жесткие сроки диктуют необходимость
коллективной работы. Процесс подготовки документов при этом обязательно должен
включать этап тщательного редактирования с целью соблюдения единых стандартов
и стилей. Применение средств автоматизации позволяет решить эти проблемы и тем
самым сократить временные затраты на 10-20%.

Наличие жестких требований к единству терминологии, к сохранению форматных
признаков.
Применение средств автоматизации позволяет гарантировать соблюдение
жестких требований к единству терминологии и сохранению форматирования. Зачастую
таким образом удается сократить временные затраты на 40-70%.

В совокупности уровень сокращения затрат за счет вышеприведенных факторов можно оценить как 40-70%.

Коэффициент окупаемости инвестиций

Если в предыдущем разделе мы говорили об эффективности использования средств автоматизации, то в настоящем разделе мы попытаемся вычислить коэффициент окупаемости соответствующих инвестиций (Return on Investment, ROI).

Расчет ROI должен стать важным этапом в процессе принятия решения о покупке средств автоматизации перевода. Правильный выбор здесь следует делать не на основании субъективного мнения (нравится или не нравится качество перевода), а на базе объективного выявления плюсов и минусов (расходов, соотнесенных с ожидаемой прибылью) автоматизации процесса.

Определим объем расходов на приобретение, содержание и поддержку средств автоматизации,
а затем подсчитаем, сколько времени и средств следует потратить на то, чтобы
технология стала прибыльной. Расчеты проведем на примере совместного использования
продуктов компаний PROMT и TRADOS (http://www.trados.com).

За основу для расчетов возьмем отдел переводов некоторой компании, обеспечивающий перевод около 3000 страниц (или 600 тыс. слов) в месяц. Будем ориентироваться на разброс себестоимости одной страницы перевода в пределах от 6 до 9 долл. Себестоимость перевода страницы определяется заработной платой переводчика, затратами на менеджмент, аренду рабочего места, амортизацией основных средств, налогами и прочими издержками. Данные по России показывают, что у большинства компаний издержки на перевод укладываются в эти рамки.

При объеме переводов около 3000 страниц в месяц и средней дневной норме выработки
на одного человека около 10 страниц компания вынуждена держать в штате 15 переводчиков.
Расходы при этом определяются следующими составляющими.

  1. Первоначальные расходы на лицензирование ПО.
  2. Опциональные инвестиции. Имеются в виду средства на запуск проекта (установка
    ПО, интеграция продуктов между собой), обучение сотрудников работе с ПО, тренинг,
    настройку средств автоматизации (терминологическая работа, создание базы данных
    в TM, работа со словарями систем МП), а также на расширенную поддержку и консультации
    по работе с ПО.
  3. Регулярные инвестиции – расходы на запуск проекта (установка ПО, интеграция
    продуктов между собой, интеграция в процесс и техническая поддержка процесса
    перевода), а также настройка словарей системы МП.

Размер инвестиций по пункту 1 может составлять 22-26 тыс. долл., в зависимости от того, какой коэффициент эффективности будет реализован. Чем выше коэффициент эффективности использования средств автоматизации, тем меньше лицензий на ПО нужно приобретать, так как для обеспечения необходимого объема работ потребуется меньше переводчиков. Указанный размер инвестиций предполагает, что будет приобретена определенная комбинация продуктов на требуемое количество рабочих мест. Комплект должен включать TRADOS WinAlign, TRADOS, PROMT XT Professional (включающий PROMT TerM и PROMT4TRADOS).

Компания может отказаться от опциональных инвестиций (пункт 2), которые составляют порядка 6500 долл. и носят разовый характер, но наша практика показывает, что они весьма желательны для достижения наилучших результатов автоматизации переводческого процесса.

Регулярные инвестиции определяются издержками на регулярное обновление базы TM и пополнение словарей системы PROMT, а также обеспечение технической поддержки вышеперечисленного ПО. Мы оценили эту составляющую как 2500 долл. в месяц. Мы рассматриваем ее как перспективную инвестицию, поскольку в процессе этой работы создаются нематериальные активы, которые способствуют устойчивости бизнеса.

Кто из руководителей отдела перевода не сталкивался с проблемами кадрового состава и сохранения накопленного опыта? Между тем средства автоматизации помогут решить эти проблемы. База данных систем Translation Memory и словари к системам машинного перевода становятся тем якорем, который обеспечивает преемственность и устойчивость всех переводческих процессов. Не зря, по-видимому, все крупнейшие мировые переводческие агентства как прямые активы оценивают свои наработанные и бережно хранимые базы данных TM и словари.

На основе вышеприведенных цифр построен график, демонстрирующий возврат инвестиций для двух вариантов коэффициента эффективности – 1,4 и 1,7 (рис. 3).

Fig.3
Рис. 3. Брутто-результат эксплуатации инвестиций.


Как следует из рис. 3, при К =1,4 возврат инвестиций произойдет через
13 месяцев, а при К =1,7 – через 8 месяцев. Если же себестоимость перевода
страницы принять равной 9 долл., то эти значения составят соответственно 8 и
5 месяцев.

Какие же основные выводы можно сделать на основании расчетов ROI? Во-первых, несмотря на значительный объем вложений, они окупаются достаточно быстро – менее чем за год. Во-вторых, время окупаемости сильно зависит от того, какие факторы, определяющие эффективность применения средств автоматизации, наличествуют в компании.

В-третьих, чем больше затраты на трудовые ресурсы (переводчиков), тем быстрее окупаются инвестиции. Заметим, что именно поэтому в западных странах, где данные затраты велики, средства автоматизации перевода получили более широкое распространение, чем в России. В частности, по данным Allied Business Intelligence, рост рынка средств автоматизации перевода достигает 35%, в то время как рынок услуг по переводу растет со скоростью 7%.

В-четвертых, немаловажным следствием применения систем автоматизации следует считать создание нематериальных активов, обеспечивающих преемственность и устойчивость всех переводческих процессов.

Вам также могут понравиться