Трудности перевода: моя твоя непонимать

Трудности перевода: моя твоя непонимать

Возможно, наступит время, в то время, когда в мозг человека будут вживлять особые «чипы», благодаря которым мы сами сможем вольно сказать на любом языке и осознавать обращение зарубежного собеседника. Но имеется еще одна неприятность: скорость! Лишь сверхчеловек, храбрец научно-фантастического романа, сможет совладать с переводом нескольких десятков страниц за одну 60 секунд.

В простой жизни нужно израсходовать много часов либо кроме того дней, дабы освоиться с иноязычным текстом, и это при условии, что мы обладаем нужным зарубежным языком. Исходя из этого в этом случае совокупности машинного перевода являются крайне полезный инструмент, что окажет помощь скоро преодолеть языковой барьер и к тому же сэкономить большое время.

Разговор по понятиям

Понятие — сущ., ср. [логически расчлененная неспециализированная идея о предмете]; idea, notion; concept (ion); comprehension.

Что же такое машинный перевод (МП)? В случае если ответить коротко, это связный перевод текста с одного языка на другой, делаемый компьютерной программой. Причем в отличие от словаря, программа не делает подстрочный перевод каждого слова в отдельности, а делает как раз связный перевод с учетом грамматических, синтаксических и других изюминок языка.

Существуют разные разработки разработки совокупностей МП, о которых обращение отправится ниже, но сущность машинного перевода состоит как раз в исполнении программой связного перевода текста на базе анализа изюминок входного и выходного языков.

Как же программе удается на выходе представить связный текст с учетом грамматики языка? На сегодня легендарны два главных подхода к разработке совокупностей машинного перевода: МП на базе правил (методов) (rule-based machine translation) и статистический МП (statistical-based machine translation).

Тождественный перевод

Тождественный — (либо адэкватный), прил. [лат., филос. — в полной мере соответствующий оригиналу]; appropriate, good (опытный, хороший); adequate (достаточный).

Разработка, которая именуется rule-based machine translation (другими словами основанная на обработке лингвистических методов), на сегодня используется самый обширно. Ее применяет большая часть разработчиков: SYSTRAN (Франция), Linguatec (Германия) и русский компания ПРОМТ.

При работе по данной технологии совокупность МП сперва разбирает исходный текст: проводит морфологический анализ слов в предложении, после этого синтаксический анализ и на последнем этапе делает синтез предложений в переведенном тексте. Так, совокупность проводит громадную работу, формируя связный перевод предложения на базе информации о каждом слове и согласуя между собой все члены предложения. Таковой метод работы частично сродни работе человека-переводчика: он кроме этого разбирает текст, ищет варианты перевода в собственной «словарной базе», использует правила, другими словами сперва разбирает текст, а позже синтезирует вариант перевода.

Перевод по статистике

Перевод — сущ., супруг. [действие по передаче содержания текста на одном языке средствами другого языка, и его результат]; translation; version; interpretation.

Вторая разработка перевода — статистический машинный перевод — стала широко распространена совсем сравнительно не так давно благодаря разработкам компании Гугл. Поисковый портал Гугл представил пользователям сетевой сервис с BETA-предположениями некоторых языковых направлений, созданных на базе статистической разработке.

В ходе работы совокупность разбирает огромные словарные базы парных фрагментов (фраз из двух-трех слов) — его перевод и оригинал фрагмента. Программа вычисляет самая вероятную последовательность слов выходного языка, которую она вычисляет соответствующей переводу исходного текста. В отличие от классических совокупностей перевода статистическая программа не учитывает в собственной работе грамматические правила, что, непременно, отражается на качестве перевода.

Нередки случаи, в то время, когда вместо связного перевода статистический переводчик выдает совсем несогласованные предложения, лишенные всякого смысла.

Существует вывод, что статистический машинный перевод более перспективен и на выходе предлагает более качественный перевод, чем классическая разработка. Но пока практика обосновывает обратное. Одна из низкокачественных причин перевода статистической совокупности — недостаточный количество словарных баз.

хорошие примеры перевода (отрывки новостей информагентства Рейтерс) с английского языка на русский представлены в таблице 1. Переводы были выполнены посредством совокупности PROMT (машинный перевод на базе правил) и онлайн-портала Гугл (статистический машинный перевод). Из приведенных примеров видно, что сейчас сервис Google не всегда справляется с переводом названий и имён, появляются сложности с согласованием участников предложения, и оказавшийся вариант перевода больше напоминает подстрочник. В полной мере возможно, что в будущем разработчикам удастся повысить уровень качества переводов, делаемых этим способом МП, но имеется опасение, что таковой совокупности не достаточно применения лингвистических методов, анализа изюминок входного и выходного языков (принцип, на базе которого действуют классические совокупности).

Машинный перевод, основанный на правилах, кроме этого имеет погрешности и сейчас не имеет возможности предложить совершенного качества перевода. Но в целом перевод, основанный на применении правил, выглядит более гладко, и суть текста понятен сходу. Налицо преимущество классической разработке МП, по крайней мере такова обстановка на сегодня.

Два в одном

1. два, один -числ. 2. два в одном [напр. кондиционер и шампунь в одном флаконе]; two-in-one; two-in-one preparation (парф.).

Сравнительно не так давно разработчики совокупностей МП начали обсуждать идею объединения обеих разработок машинного перевода — классического и статистического способов МП — с целью нейтрализовать недочёты того и другого. Имеется вывод, что это разрешит усилить классическую разработку перевода и добиться хорошего синергетического результата.

Человек против автомобили: кто кого?

Человек — сущ., супруг. (Homo sapiens) [в зоологическом отношении образовывает отдельное семейство отряда приматов]; person, man, human being, individual; body; bones; fellow.

Современные программы-переводчики обучились более-менее связно переводить громадные количества информации с самых различных языков. Но многие из нас смогут поспорить, что уровень качества перевода электронного толмача совсем не соответствует результату труда человека-переводчика. Не следует делать поспешные выводы: сегодняшние совокупности МП — это вправду умные программы, каковые пускай и не заменят труд переводчика на 100%, но смогут существенно уменьшить его.

Сегодняшние совокупности МП укомплектованы громадным числом нужных инструментов для увеличения качества перевода текстов из разных областей знаний. В частности, возможно зарезервировать (сохранить) заглавия организаций либо имена, и тогда программа покинет их непереведенными, что разрешит избежать нелепостей при переводе (см. пример в таблице 2).

Помимо этого, возможно подключать к совокупности словари, которые содержат специальную лексику. Такие словари в большинстве случаев предлагают сами разработчики программ. Имеется еще одна нужная возможность: пользователь может самостоятельно создавать личные словари и заносить в них как раз те варианты перевода, каковые ему нужны.

Подключение пользовательского словаря кроме этого разрешит корректно перевести нужную информацию. В современных совокупностях перевода возможно задавать правила перевода (настраивать перевод модальных глаголов и местоимений в зависимости от различных условий, задавать тип текста и др.), предлагать на выбор пара вариантов перевода одного слова (варианты представлены в скобках) и сохранять заданные настройки в виде шаблонов, дабы не задавать их любой раз заново.

Освоение нужных возможностей программы оказывает помощь на выходе взять хорошее уровень качества перевода и значительно сократить время на его редактирование. Принципиально важно учитывать да и то, что посредством совокупности перевода мы можем всего за пара секунд получить доступ к нужной информацим (взять черновой вариант перевода), другими словами сэкономить время и скоро обработать громадный количество текста, что сейчас актуально очень.

Статья размещена в издании «Популярная механика» (№63, январь 2008).

Трудности перевода. The Punisher


Темы которые будут Вам интересны: