Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1516 neu 400000
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Increasing Coverage of Translation Memories with Linguistically Motivated Segment Combination Methods (2015)výskyt výsledku

Identifikační kódRIV/00216224:14330/15:00081035
Název v anglickém jazyceIncreasing Coverage of Translation Memories with Linguistically Motivated Segment Combination Methods
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2015
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku2
Počet tvůrců celkem3
Počet domácích tvůrců3
Výčet všech uvedených jednotlivých tvůrcůMarek Medveď (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 8900167)
Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353)
Aleš Horák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3161870)
Popis výsledku v anglickém jazyceTranslation memories (TMs) used in computer-aided translation (CAT) systems are the highest-quality source of parallel texts since they consist of segment translation pairs approved by professional human translators. The obvious problem is their size andcoverage of new document segments when compared with other parallel data. In this paper, we describe several methods for expanding translation memories using linguistically motivated segment combining approaches concentrated on preserving the high translational quality. The evaluation of the methods was done on a medium-size real-world translation memory and documents provided by a Czech translation company as well as on a large publicly available DGT translation memory published by European Commission. The asset of the TM expansion methods were evaluated by the pre-translation analysis of widely used MemoQ CAT system and the METEOR metric was used for measuring the quality of fully expanded new translation segments.
Klíčová slova oddělená středníkemtransaltion memories; DGT; MemoQ; Moses; segment; CAT
Stránka www, na které se nachází výsledekhttp://rgcl.wlv.ac.uk/events/NLP4TM/3_Paper.pdf

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of The Workshop on Natural Language Processing for Translation Memories (NLP4TM)
ISBN9789544520328
ISSN-
Počet stran výsledku5
Strana od-do31-35
Název nakladateleINCOMA Ltd. Shoumen
Místo vydáníBulgaria
Místo konání akceHissar, Bulgaria
Datum konání akce2015
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2016
SpecifikaceRIV/00216224:14330/15:00081035!RIV16-MSM-14330___
Datum poslední aktualizace výsledku24.05.2016
Kontrolní číslo191636075

Informace o dalších výskytech výsledku dodaného stejným předkladatelem

Dodáno GA ČR v roce 2016RIV/00216224:14330/15:00081035 v dodávce dat RIV16-GA0-14330___/01:1

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu 7F7F14047 - Harvesting big text data for under-resourced languages (2014 - 2017)
Projekt podporovaný GA ČR v programu GAGA15-13277S - Hyperintensionální logika pro analýzu přirozeného jazyka (2015 - 2017)
Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT