Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Univerzita Karlova / Matematicko-fyzikální fakulta1415 D 482.9840.7145.7142.132
Masarykova univerzita / Fakulta informatiky1415 D 482.9840.2862.2860.853
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.
V případě více výskytů téhož výsledku (tedy výskytů majících stejnou hodnotu ve sloupci VYSNID v datech H16) zde ke každému z nich doplňuji i informace o všech s ním sjednocených výskytech. Na rozdíl od dřívějších verzí hodnocení (do H14 včetně), kde skupina a (upravené) body výsledku byly vždy stejné pro všechny nevyřazené výskyty daného výsledku a (upravené) body VO stejné pro všechny nevyřazené výskyty daného výsledku od téhož předkladatele, takže nebylo třeba je uvádět opakovaně, zde uvádím vše, protože někdy se hodnoty v datech různí i tam, kde by podle Metodiky (s. 8) měly být shodné.

HindEnCorp ? Hindi-English and Hindi-only Corpus for Machine Translation (2014)výskyt výsledku

Identifikační kódRIV/00216224:14330/14:00076251
Název v anglickém jazyceHindEnCorp ? Hindi-English and Hindi-only Corpus for Machine Translation
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2014
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku2
Počet tvůrců celkem7
Počet domácích tvůrců2
Výčet všech uvedených jednotlivých tvůrcůOndřej Bojar (státní příslušnost: CZ - Česká republika)
Vojtěch Diatka (státní příslušnost: CZ - Česká republika)
Pavel Rychlý (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6616844)
Pavel Straňák (státní příslušnost: CZ - Česká republika)
Vít Suchomel (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8884439)
Aleš Tamchyna (státní příslušnost: CZ - Česká republika)
Daniel Zeman (státní příslušnost: CZ - Česká republika)
Popis výsledku v anglickém jazyceWe present HindEnCorp, a parallel corpus of Hindi and English, and HindMonoCorp, a monolingual corpus of Hindi in their release version 0.5. Both corpora were collected from web sources and preprocessed primarily for the training of statistical machine translation systems. HindEnCorp consists of 274k parallel sentences (3.9 million Hindi and 3.8 million English tokens). HindMonoCorp amounts to 787 million tokens in 44 million sentences. Both the corpora are freely available for non-commercial research and their preliminary release has been used by numerous participants of the WMT 2014 shared translation task.
Klíčová slova oddělená středníkemMachine Translation; SpeechToSpeech Translation; Metadata
Stránka www, na které se nachází výsledekhttp://www.lrec-conf.org/proceedings/lrec2014/summaries/835.html

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)
ISBN9782951740884
ISSN-
Počet stran výsledku6
Strana od-do3550-3555
Název nakladateleEuropean Language Resources Association (ELRA)
Místo vydáníReykjavik, Iceland
Místo konání akceReykjavik, Iceland
Datum konání akce26.05.2014
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2015
SpecifikaceRIV/00216224:14330/14:00076251!RIV15-MSM-14330___
Datum poslední aktualizace výsledku29.05.2015
Kontrolní číslo152393965

Informace o dalších výskytech výsledku dodaného ostatními předkladateli

Dodáno MŠMT v roce 2015RIV/00216208:11320/14:10289364 v dodávce dat RIV15-MSM-11320___/01:1 předkladatelem Univerzita Karlova v Praze / Matematicko-fyzikální fakulta

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)