Informace o projektu
LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie
Kód projektu | CZ.02.1.01/0.0/0.0/16_013/0001781 CEP CORDIS MU WEB INET MU |
---|---|
Doba řešení | 01.01.2017–31.12.2020 |
Stav | ukončený |
Investor | Ministerstvo školství, mládeže a tělovýchovy ČR |
Program | OP Výzkum, vývoj a vzdělávání (OP VVV) |
Řešitel za FI | |
Členové realizačního týmu za FI |
Anotace
Projekt navazuje na běžící projekt LINDAT-Clarin, který koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure). Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají žady oborů – v humanitních vědách to jsou jazykověda obecná a jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přechodem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost) a elektrotechniky (zpracování akustického signálu).