Informace o projektu
Elektronický paralelní česko-německý korpus
Kód projektu | ROZV/58/2003 CEP CORDIS MU WEB INET MU |
---|---|
Doba řešení | 01.01.2003–31.12.2003 |
Stav | ukončený |
Investor | Ministerstvo školství, mládeže a tělovýchovy ČR |
Program | Transformační a rozvojové programy |
Členové realizačního týmu za FI |
Anotace
Č. projektu z r. 2001: I/43/2001
Č. projektu z r. 2002: 31/2002
Cílem projektu v roce 2003 je rozšířit korpus na min. 3 miliony slov v české části; zpřesnt zarovnání celého korpusu na co nejmenší jednotku (ideálně na větu); zpřesnit tagování české části automatickou desambiguací, případně vyvinout dokonalejší anotační software; vyvažovat proporce korpusu zařazováním většího množství odborných a publicistických textů; vyvážit poměr českých a německých originálních textů na 1:1; informovat odbornou veřejnost o vzniku korpusu; zajistit další zdroje paralelních textů; zaškolit další studenty pro práci s texty.
Č. projektu z r. 2002: 31/2002
Cílem projektu v roce 2003 je rozšířit korpus na min. 3 miliony slov v české části; zpřesnt zarovnání celého korpusu na co nejmenší jednotku (ideálně na větu); zpřesnit tagování české části automatickou desambiguací, případně vyvinout dokonalejší anotační software; vyvažovat proporce korpusu zařazováním většího množství odborných a publicistických textů; vyvážit poměr českých a německých originálních textů na 1:1; informovat odbornou veřejnost o vzniku korpusu; zajistit další zdroje paralelních textů; zaškolit další studenty pro práci s texty.