Identifikační kód | RIV/00216224:14330/15:00081035 |
Název v anglickém jazyce | Increasing Coverage of Translation Memories with Linguistically Motivated Segment Combination Methods |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2015 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Marek Medveď (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 8900167) Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353) Aleš Horák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3161870) |
Popis výsledku v anglickém jazyce | Translation memories (TMs) used in computer-aided translation (CAT) systems are the highest-quality source of parallel texts since they consist of segment translation pairs approved by professional human translators. The obvious problem is their size andcoverage of new document segments when compared with other parallel data. In this paper, we describe several methods for expanding translation memories using linguistically motivated segment combining approaches concentrated on preserving the high translational quality. The evaluation of the methods was done on a medium-size real-world translation memory and documents provided by a Czech translation company as well as on a large publicly available DGT translation memory published by European Commission. The asset of the TM expansion methods were evaluated by the pre-translation analysis of widely used MemoQ CAT system and the METEOR metric was used for measuring the quality of fully expanded new translation segments. |
Klíčová slova oddělená středníkem | transaltion memories; DGT; MemoQ; Moses; segment; CAT |
Stránka www, na které se nachází výsledek | http://rgcl.wlv.ac.uk/events/NLP4TM/3_Paper.pdf |