Informace o projektu

Inteligentní software pro sémantické hledání dokumentů

Kód projektu	TD03000295 CEP CORDIS MU WEB INET MU
Doba řešení	01.01.2016–31.12.2017
Stav	ukončený
Investor	Technologická agentura ČR
Program	OMEGA
Řešitel za FI	doc. RNDr. Petr Sojka, Ph.D.
Členové realizačního týmu za FI	James Edward Thomas, M.A. RNDr. Michal Růžička, Ph.D. RNDr. Martin Líška RNDr. Vít Starý Novotný, Ph.D.

Anotace

Naše společensko-vědní kultura je definována slovy, které v dnešní
informační společnosti konstituují _dokumenty_.
Cílem projektu je vytvoření databázového systému (software),
který umožní hledání _významově_ příbuzných dokumentů.
Systém Scaletext se skládá ze tří částí:

* sémantická analýza: strojově analyzuje libovolný nestrukturovaný
dokument v přirozeném jazyce (čeština, angličtina)

* indexace: nalezená témata a strukturu každého dokumentu vnitřně uloží
ve vhodné reprezentaci _významů_ slov tak, aby systém umožnil posléze
hledat podobné dokumenty k dotazu (=dokumentu), index vizualizovat

* vyhledávání: pro vstupní dokument nalezne ty dokumenty, které odpovídají
(latentnímu) významu dotazu, a to i když nesdílí stejná slova

Zpět na seznam investorů