Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Univerzita Karlova / Matematicko-fyzikální fakulta1415 D 482.9840.7145.7142.132
Masarykova univerzita / Fakulta informatiky1415 D 482.9840.2862.2860.853
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.
V případě více výskytů téhož výsledku (tedy výskytů majících stejnou hodnotu ve sloupci VYSNID v datech H16) zde ke každému z nich doplňuji i informace o všech s ním sjednocených výskytech. Na rozdíl od dřívějších verzí hodnocení (do H14 včetně), kde skupina a (upravené) body výsledku byly vždy stejné pro všechny nevyřazené výskyty daného výsledku a (upravené) body VO stejné pro všechny nevyřazené výskyty daného výsledku od téhož předkladatele, takže nebylo třeba je uvádět opakovaně, zde uvádím vše, protože někdy se hodnoty v datech různí i tam, kde by podle Metodiky (s. 8) měly být shodné.

HindEnCorp - Hindi-English and Hindi-only Corpus for Machine Translation (2014)výskyt výsledku

Identifikační kódRIV/00216208:11320/14:10289364
Název v anglickém jazyceHindEnCorp - Hindi-English and Hindi-only Corpus for Machine Translation
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2014
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku2
Počet tvůrců celkem7
Počet domácích tvůrců5
Výčet všech uvedených jednotlivých tvůrcůOndřej Bojar (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 2630176)
Vojtěch Diatka (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 4851358)
Pavel Rychlý (státní příslušnost: CZ - Česká republika)
Pavel Straňák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8229570)
Vít Suchomel (státní příslušnost: CZ - Česká republika)
Aleš Tamchyna (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3528839)
Daniel Zeman (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9363661)
Popis výsledku v anglickém jazyceWe present HindEnCorp, a parallel corpus of Hindi and English, and HindMonoCorp, a monolingual corpus of Hindi in their release version 0.5. Both corpora were collected from web sources and preprocessed primarily for the training of statistical machine translation systems. HindEnCorp consists of 274k parallel sentences (3.9 million Hindi and 3.8 million English tokens). HindMonoCorp amounts to 787 million tokens in 44 million sentences. Both the corpora are freely available for non-commercial research and their preliminary release has been used by numerous participants of the WMT 2014 shared translation task.
Klíčová slova oddělená středníkemtranslation; machine; corpus; only; hindi; english; hindi; hindencorp
Stránka www, na které se nachází výsledekhttp://www.lrec-conf.org/proceedings/lrec2014/pdf/835_Paper.pdf

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014)
ISBN978-2-9517408-8-4
ISSN-
Počet stran výsledku6
Strana od-do3550-3555
Název nakladateleEuropean Language Resources Association
Místo vydáníReykjavík, Iceland
Místo konání akceReykjavík, Iceland
Datum konání akce26.05.2014
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelUniverzita Karlova v Praze / Matematicko-fyzikální fakulta
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2015
SpecifikaceRIV/00216208:11320/14:10289364!RIV15-MSM-11320___
Datum poslední aktualizace výsledku29.05.2015
Kontrolní číslo152059378

Informace o dalších výskytech výsledku dodaného ostatními předkladateli

Dodáno MŠMT v roce 2015RIV/00216224:14330/14:00076251 v dodávce dat RIV15-MSM-14330___/01:1 předkladatelem Masarykova univerzita / Fakulta informatiky

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)