Prague Dependency Treebank Annotation Errors: A Preliminary Analysis
Název česky | Pražský závislostní stromový korpus: předběžná analýza |
---|---|
Autoři | |
Rok publikování | 2009 |
Druh | Článek ve sborníku |
Konference | RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing |
Fakulta / Pracoviště MU | |
Citace | |
www | http://nlp.fi.muni.cz/raslan/2009/ |
Obor | Informatika |
Klíčová slova | error in text; annotation; Prague Dependency Treebank; PDT |
Popis | Tento článek prezentuje základní analýzu chyb a nekonsistencí v syntaktické anotaci Pražského závislostního stromové korpusu (Prague Dependency Treebank, PDT), největšího českého ručně anotovaného korpusu tohoto druhu. Tento korpus je využíván pro vývoj a vyhodnocení mnoha syntaktických analyzátorů pro češtinu a problémy v anotaci mají zásadní dopad na vyhodnocení kvality a přesnosti těchto analyzátorů. V článku identifikujeme základní anotační problémy a v některých případech nastiňujeme jejich možná řešení. |
Související projekty: |