Informace o projektu

Počítačový korpus českých psaných textů (Počítačový fond češtiny)

Kód projektu	GA405/93/0218 CEP CORDIS MU WEB INET MU
Doba řešení	01.01.1993–31.01.1995
Stav	ukončený
Investor	Grantová agentura ČR
Program	Standardní projekty
Řešitel za FI	prof. PhDr. Karel Pala, CSc.

Anotace

Cílem projektu je vytvořit reprezentativní korpus českých psaných textů v rozsahu 20 miliónů slovních tvarů a na jeho základě pak v druhé fázi připravit velký Slovník českého jazyka. Výsledky projektu budou k dispozici v následujících podobách: a) souhrnná výzkumná zpráva obsahující informace o korpusu a jeho vytváření, b) vlastní korpus uložený ve standardním formátu na počítačových médiích, c) soubor nástrojů - algoritmů a programů pro práci na korpusu, d) v konečné fázi (nikoli v rámci tohoto grantu) Slovník českého jazyka. Na projektu se budou podílet přední odborníci v současné i historické bohemistice, lexikografii a počítačové lingvistice, kteří pocházejí z univerzitních pracovišť na filozofické fakultě Karlovy a Masarykovy univerzity, dále z pracoviště na Matematicko-fyzikální fakultě UK a také z Ústavu pro jazyk český AV ČR.

Zpět na seznam investorů