Identifikační kód | RIV/00216224:14330/12:00062288 |
Název v anglickém jazyce | Authorship Verification based on Syntax Features |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | A - Společenské vědy |
Obor | AI - Jazykověda |
Rok uplatnění | 2012 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Jan Rygl (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6045111) Kristýna Zemková (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9482687) Vojtěch Kovář (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6217850) |
Popis výsledku v anglickém jazyce | Authorship verification is wildly discussed topic at these days. In the authorship verification problem, we are given examples of the writing of an author and are asked to determine if given texts were or were not written by this author. In this paper wepresent an algorithm using syntactic analysis system SET for verifying authorship of the documents. We propose three variants of two-class machine learning approach to authorship verification. Syntactic features are used as attributes in suggested algorithms and their performance is compared to established word-lenth distribution features. Results indicate that syntactic features provide enough information to improve accuracy of authorship verification algorithms. |
Klíčová slova oddělená středníkem | authorship verification; syntactic analysis; SET; machine learning |
Stránka www, na které se nachází výsledek | - |