пятница, 25 апреля 2014 г.

Машинный перевод

Уже давно мы забыли о листании пятитомных словарей и закладывании пальцев на нужные страницы, ведь современные технологии и электронные словари позволяют нам ускорить процесс перевода в несколько раз.

Следующим шагом эволюции должен быть автоматизированный перевод, не требующий высокоинтеллектуального участия человека. Эдаким «мозгозаменителем» служит машинный переводчик, но говорить о новой ступени еще рановато, т. к. слепо ему доверять слишком опасно.

Одной из самых популярных юмористических тем в социальных сетях являются «перлы» машинного переводчика, например «вход в гостиницу – input in hotel», «Институт белка РАН – Squirrel institute» и т. п. Ещё больше примеров можно найти здесь и здесь.

Целесообразно разобраться в причинах такого «халатного отношения машины к предоставленной ей работе». А причины кроются в принципе работы машинного перевода.

Системы машинного перевода делятся на три категории: системы на основе грамматических правил, статистические системы и гибридные системы, сочетающие преимущества тех и других. Первые анализируют текст и строят его перевод на базе встроенных словарей и набора правил для данной языковой пары. Во вторых применяется принцип статистического анализа: в программу загружаются большие объёмы текстов на исходном языке и их переводы, выполненные человеком. Затем, программа ищет в этой базе аналогичные слова, фразы и предложения, анализирует статистику межъязыковых соответствий и использует ее при выборе вариантов перевода. Этот процесс называется  самообучением. Систему может обучать и человек, корректируя выдаваемые переводы. Именно так работает широко известный сервис «Переводчик Google». Благодаря этой способности, качество повышается с каждым переведённым текстом.

Дело в том, что базы машинных переводчиков не всегда достаточны для адекватного перевода, они скорее рассчитаны на простые, незамысловатые тексты. Это, пожалуй, главный недостаток при работе с такой системой. Ведь перевод текстов, в которых содержатся идиомы, фразеологизмы, длинные и  сложные предложения чаще всего оказывается неправильным или даже глупым.

Основное преимущество автоматизированного перевода – это скорость, экономия времени при работе с большим объемом информации.

Эффективна такая система в случае с комбинациями языков, которые относятся к одной языковой семье, как например, русский/украинский, испанский/французский, испанский/итальянский. Не смотря на то, что избежать неточностей сложно, такой способ может оказаться очень выгодным и экономным для получения основного содержания или создания первичного наброска перевода.

Преимуществом пользуются программы с системой «Translation memory», т. к. их база обогащается благодаря собственноручно переведенным текстам, или текстам, в качестве которых переводчик уверен.

Системы машинного перевода во многом облегчили и ускорили работу переводчика, но на вопрос о полной автоматизации процесса сложно дать ответ. В ближайшем будущем компьютер вряд ли полностью заменит человека, ведь искусственный интеллект еще не был изобретен.

-------------------------------------------------------------
Желаю вам удачного перевода при помощи машинного переводчика. Уверен, что эта статья принесет вам пользу и не забудьте упомянуть ее в Твиттере или других социальных сетях. Подпишитесь на обновления блога по ссылке, самое интересное еще впереди.