Показаны сообщения с ярлыком база переводов. Показать все сообщения
Показаны сообщения с ярлыком база переводов. Показать все сообщения

понедельник, 18 января 2016 г.

Практическое применение переводческой памяти

Существуют несколько форматов файлов переводческой памяти. Наиболее распространенным и стандартным является формат TMX (Translation Memory Exchange Format). Именно в этом универсальном формате я буду предлагать читателям блога файлы баз памяти переводов.

Помимо TMX формата, существуют следующие виды файлов переводческой памяти:
  1. XLIFF (XML Localisation Interchange File Format)
  2. TBX (Termbase Exchange format) и др.
В файлах TMX информация представлена в сегментированном виде, где каждый сегмент состоит из пары предложений (фраз): оригинал и перевод. TMX файлы могут быть не только двуязычными (напр., англ.-русс.), но и многоязычными. Однако информация в редакторе TMX файлов отображается только для выбранной в данный момент языковой пары.

Если вам необходимо ознакомиться и редактировать TMX базы, воспользуйтесь бесплатными программами: редактор Olifant и редактор Heartsome TMX Editor 8. Обе программы предоставляют возможность создавать TMX файлы, вносить изменения в текст сегментов, удалять ненужные теги, повторы, непереведённые сегменты, изменять тип языковой пары (например, вы хотите изменить en-US-ru-RU на En-Ru), удалять лишние пробелы до и после сегментов, делить TMX файлы на несколько частей, соединять несколько TMX файлов в один, экспортировать TMX в файлы MS Word, MS Excel, txt, tbx и т.д. Более подробно формат TMX описывается в Wikipedia.
Чтобы извлечь пользу из файлов TMX, из следует импортировать в новую или уже готовую базу памяти переводов в САТ-программе. 

Импорт TMX файла в SDL Trados Studio 2015
  1. Вкладка Главная > Открыть > Открыть базу переводов из главного меню, или нажмите кнопку "Создать", чтобы создать новую базу переводов.
  2. База переводов появилась в списке слева в разделе "Базы переводов".
  3. Выберите нужную базу переводов из списка и нажмите кнопу "Импорт" на вкладке Главная.
  4. Нажмите кнопку "Добавить файлы", чтобы добавить файлы TMX и нажмите Далее.
  5. Нажмите Далее.
  6. Выберите необходимые опции и нажмите Готово.
Видеоинструкция


Импорт TMX файла в программе MemoQ 2015
  1. Выберите Resource Console > Translation Memories > Create new или выберите уже готовую базу переводов.
  2. Укажите название для новой базы переводов и языковую пару.
  3. Выделите созданную базу переводов и нажмите Import from TMX/CSV.
  4. Выберите на своем компьютере файл TMX и нажмите OK
После импорта необходимого TMX файла в базу переводов САТ-программы вы сможете получать результаты при работе над переводом. При обнаружении полных или частичных совпадений переводимого текста с данными в базе переводов, САТ-программа будет автоматически подставлять перевод, чем значительно ускорит вашу работу.

Удачной вам работы с файлами переводческой памяти. Уверен, что переводческая память принесет вам пользу и не забудьте упомянуть этот блог в Твиттере, Фейсбуке или в других социальных сетях. Подпишитесь на обновления блога по ссылке, самое интересное будет очень скоро.

ТМ и глоссарии из Интернета

Продолжаю искать и публиковать глоссарии и базы памяти переводов из открытых источников в Интернете.


Тематика Языковая пара Размер Формат

«Повестка дня на XXI век»
(источник: dejavubase.narod.ru)
EN-RU 4,4 Мб
(5841 сегмент)
tmx
Загрузить
Уход за престарелыми людьми
(источник: www.ttmem.com)
EN-GB-RU-RU 449Кб
(996 сегментов)
tmx
Загрузить
Терминология компании "Майкрософт"
(источник: www.ttmem.com)
EN-GB-RU-RU 9 Мб
(20 901 сегмент)
tmx
Загрузить
Тароупаковочная промышленность
(источник: www.ttmem.com)
EN-GB-RU 420 Кб
(2253 сегмента)
tmx
Загрузить
Глоссарий Европейского Банка
реконструкции и развития
(источник: dejavubase.narod.ru)
EN-RU 2,1 Мб
(18 117 строк)
Excel
Загрузить
Глоссарий "Банковские операции"
(источник: dejavubase.narod.ru)
EN-RU 110 Кб
(754 строки)
Excel
Загрузить
Глоссарий "Профессиональная гигиена"
(источник: dejavubase.narod.ru)
EN-RU 601 Кб
(6224 строки)
Excel
Загрузить
Глоссарий "Природный газ"
(источник: dejavubase.narod.ru)
EN-RU 115 Кб
(914 строк)
Excel
Загрузить

В следующих сообщениях я расскажу как с пользой применять файлы переводческой памяти и глоссарии в САТ-программах.

А что удалось найти вам? Пишите в комментариях свои способы поиска и создания глоссариев и файлов переводческой памяти, указывайте ссылки на полезные сайты и задавайте вопросы.

Удачного вам поиска полезных глоссариев и ТМ. Уверен, что этот блог принесет вам пользу и не забудьте упомянуть его в Твиттере, Фейсбуке или в других социальных сетях. Подпишитесь на обновления блога по ссылке, самое интересное будет очень скоро.

суббота, 16 января 2016 г.

Создание TM из параллельных текстов

Я занимаюсь поиском параллельных текстов и созданием памятей переводов (англ. translation memory) и глоссариев. Такие накопители переводов используются во всех САТ-программах. Тексты для создания баз переводов нахожу в открытых источниках в Интернете.

Периодически буду делиться своими находками с уважаемым переводческим сообществом.

Указывайте в комментариях ваши источники параллельных текстов.


Тематика Языковая пара Размер Формат

Adjuvant Paclitaxel Plus Carboplatin
(источник: JOURNAL OF CLINICAL ONCOLOGY)
EN-RU 86,6 Kb
(199 сегментов)
tmx
Загрузить
DIRECTIVE 2001/83/EC OF THE EUROPEAN PARLIAMENT
AND OF THE COUNCIL
(medicinal products for human use)
EN-RU 1,5 Mb
(2839 сегментов)
tmx
Загрузить
Термины по автомобильной промышленности
(источник: www.ttmem.com)
EN-GB-RU 970 Kb
(4861 сегмент)
tmx
Загрузить
Термины по IT
(источник: www.ttmem.com)
EN-GB-RU-RU 2 Mb
(4376 сегментов)
tmx
Загрузить
Термины по технике
(источник: www.ttmem.com)
EN-GB-RU-RU 879 Kb
(1906 сегментов)
tmx
Загрузить