Pracuje na vyhledávači nové generace. Získal cenu Brno Ph.D. talent a 300 tisíc
Doktorand Vít Novotný se na Fakultě informatiky MU věnuje v rámci výzkumné skupiny MIR vývoji internetového vyhledávače nové generace. Řeší problémy, na které Google nemá odpověď. Jeho projekt má usnadnit vyhledávání vědeckým pracovníkům po celém světě.
Tradiční vyhledávače jako je Google nebo Seznam ignorují matematiku v textu
Inženýři-technici, přírodovědci, zejména fyzici, vědečtí pracovníci a pracovníci ve výzkumu, posluchači a učitelé vysokých škol jsou při své práci závislí na článcích plných matematiky. „Tradiční vyhledávače fungují uspokojivě pro běžné dokumenty, ale matematiku v textu ignorují. Umožňují vyhledávání podle klíčových slov, nikoli podle vzorců. Když se na informaci zeptám textově a klíčová slova v článku chybí, je problém článek vůbec najít,“ vysvětluje Vít.
Pro tyto účely již v 21. století vznikly speciální vyhledávače. Fakulta Informatiky se např. podílela na Evropském projektu EuDML, do kterého dodala matematický vyhledávač MIaS. Ten však nepoužívá nejnovější metody strojového učení a umělé inteligence.
Metody strojového učení a umělé inteligence mohou obohatit matematické vyhledávače i textové vyhledávání
Dnešní matematické vyhledávače jsou schopné vyhledávat kromě textu i matematické vzorce. Text i matematiku však vnímají jako samostatné druhy informací. Pomocí nejnovějších metod strojového učení a umělé inteligence lze sestrojit hybridní vyhledávače, které umožní vyhledávat matematické vzorce pomocí textových dotazů a textové dokumenty pomocí matematických vzorců.
Myšlenkové vláčky jsme testovali na pohádce o Červené karkulce
„Dokumenty také reprezentujeme pomocí křivek. Křivka sleduje jak se odstavec po odstavci mění myšlenka textu (myšlenkové vláčky), ne jen na základě výskytu slov samotných. Zkoumali jsme podobnost tří verzí pohádky o Červené karkulce – původní verzí ze 17. století, verzí bratří Grimmů z 19. století a filmem Karcoolka z roku 2015. Zatímco první dvě verze jsou si až na závěr podobné, film zachovává pouze hlavní kulisy a postavy. Z hlediska výskytu slov se všechny tři verze shodovaly, ale myšlenkové vláčky filmu se od zbylých dvou verzí výrazně lišily,“ vysvětluje Vít.
Tento způsob vyhledávání umožňuje detekovat plagiáty a může obohatit klasické textové vyhledávání o možnost vyhledávání významově podobných dokumentů.
Ocenění Brno Ph.D. talent otevírá nové možnosti
Vítězství v soutěži Ph.D. talent Vítovi přineslo 300 000 Kč, které mu budou vypláceny po dobu 3 let. Kromě finanční podpory pro doktorský projekt mu Jihomoravské centrum pro mezinárodní mobilitu zprostředkovává odborné semináře a networking v rámci odborné komunity. Vytváří mu tak podmínky srovnatelné s předními západními institucemi a pomáhá talenty v Brně udržet.
A co dělá Vít, když zrovna nebádá? Skládá elektronickou hudbu, zpívá ve sboru a spoluorganizuje brněnský Animefest.