Пам'ять перекладів
Матеріал з Вікіпедії — вільної енциклопедії.
Пам'ять перекладів (ПП; англ. translation memory, TM; іноді називається «Накопичувач перекладів») — база даних, що містить набір раніше перекладених текстів. Один запис в такій базі даних відповідає «одиниці перекладу» (англ. translation unit), за яку зазвичай береться одне речення (рідше — частина складносурядного речення, або абзац). Якщо чергова пропозиція початкового тексту в точності співпадає з реченням, що зберігається в базі (точна відповідність, англ. exact match), воно може бути автоматично підставлене у переклад. Нове речення може також трохи відрізнятися від того, що зберігається у базі (неточна відповідність, англ. fuzzy match). Таке речення може бути також підставлене у переклад, але перекладач буде повинен внести необхідні зміни.
Крім прискорення процесу перекладу фрагментів та періодичних змін, внесених до вже перекладених текстів (наприклад, нових версій програмних продуктів або змін у законодавстві), системи ПП також забезпечують одноманітність перекладу термінології в однакових фрагментах, що особливо важливо при технічному перекладі. З іншого боку, якщо перекладач регулярно підставляє в свій переклад точні відповідності, витягнуті з баз перекладів, без контролю їх використання у новому контексті, якість перекладеного тексту може погіршитися.
У кожній конкретній системі ПП дані зберігаються в своєму власному форматі (текстовий формат у Wordfast, база даних Access у Déjà Vu), але існує міжнародний стандарт TMX (англ. Translation Memory eXchange format), заснований на XML, який можуть створювати практично усі системи ПП. Завдяки цьому результати роботи перекладачів можна обмінювати між додатками; тобто перекладач, що працює з OmegaT, може використовувати ПП, створену у Trados і навпаки.
Більшість систем ПП як мінімум підтримують створення і використання словників користувача, створення нових баз даних на основі паралельних текстів (англ. alignment), а також напівавтоматичне витягнення термінології з оригінальних та паралельних текстів.
[ред.] Популярні програмні системи ПП
Відповідно до недавніх оглядів використання систем ПП до найбільш популярних систем відносяться:[1]
- Déjà Vu
- OmegaT (безкоштовна система, поширювана за ліцензією GNU)
- SDLX [2]
- Trados (найбільш популярна програма, що довгий час була стандартом ПП)
- Star Transit
- Wordfast (реалізована як набір макросів для MS Word)
- Transolution
- Open Language Tools
В кінці 2008 року з'явилася перша вітчизняна система ПП AnyMem, розроблена київською компанією Advanced International Translations
[ред.] Стандарти та формати пам'яті перекладів[3]
- TMX (Translation Memory Exchange Format - Обмін пам'яттю перекладів). Цей стандарт дозволяє взаємний обмін між різними постачальниками пам'яті перекладів. TMX є загальноприйнятим форматом у середовищі перекладачів та вважається кращим при імпорті та експорті пам'ятей перекладів. Остання версія цього стандарту (1.4b) дозволяє відновлювати оригінальні документи та документи перекладу з файлу TMX.
- TBX (Termbase Exchange format - Обмін базами термінів). Це формат прийнятий LISA (Асоціація індустрії локалізації), котрий зараз переглядається та перевидається згідно ISO 30042. Він дозволяє проводити обмін термінологічними даними, у тому числі детальною лексичною інформацією. Основна база TBX визначається стандартами ISO: ISO 12620, ISO 12200 та ISO 16642. ISO 12620 забезпечує реєстр чітко визначених "категорій даних" зі стандартизованими іменами, що функціонують як типи елементів даних або зумовлені значення. ISO 12200 (відомий також як MARTIF) забезпечує основу для стержневої структури TBX. ISO 16642 (відомий також як Terminological Markup Framework - Структура термінологічної розмітки) включає структурну метамодель для термінологічної мови розмітки (Terminology Markup Languages) у цілому.
- SRX створений для посилення формату TMX та задля більшої ефективності обміну пам'яттю перекладів поміж програмами. Можливість вказувати правила сегментації, що використовувались у попередньому перекладі, підвищує ефективність формату.
- GMX GILT означає Globalization, Internationalization, Localization, and Translation (Глобалізація, Інтернаціоналізація, Локалізація, Переклад). Стандарт GILT Metrics складається з трьох частин: GMX-V для показників об'єму, GMX-C для показників складності, а також GMX-Q для показників якості. Запропонований стандарт GILT Metrics має завдання квантифікувати об'єм робіт та вимогі якості для виконання будь якого завдання GILT.
- OLIF — відкритий стандарт, сумісний із XML, що використовується для обміну термінологічними та лексичними даними. Хоч спочатку він був запропонований як засіб для обміну лексичними даними між приватними словниками машинного перекладу, поступово цей формат перетворився на більш загальний стандарт для термінологічного обміну.
- XLIFF (XML Localisation Interchange File Format — XML формат для взаємообміну при локалізації), створений як єдиний формат файлів для взаємообміну, що може розпізнаватися будь яким провайдером локалізації. XLIFF — це найкращий у сучасній індустрії перекладів засіб для обміну інформацією у форматі XML.
- TransWS (Translation Web Services Веб послуги для перекладу), визначає необхідні виклики для користування веб-сервісами при відправленні та отриманні файлів та повідомлень, маючих відношення до проектів локалізації. Замислювався як детальна система автоматизації більшої частину процесу локалізації за допомогою сервісів Інтернету.
- xml:tm — цей підхід до пам'яті перекладів базується на концепції текстової пам'яті, що суміщає авторську пам'ять та пам'ять перекладів. Формат xml:tm був переданий Lisa OSCAR компанією XML-INTL.
- ↑ Див. стор. 26 у Imperial College London Translation Memories Survey 2006 (документ PDF)
- ↑ В результаті придбання в червні 2005 року компанії Trados британською компанією SDL International у 2006 з'явився єдиний продукт TRADOS SDLX 2006
- ↑ Стандарти LISA

