Classification of Errors in Text
Název česky | Klasifikace chyb v textu |
---|---|
Autoři | |
Rok publikování | 2009 |
Druh | Článek ve sborníku |
Konference | RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing |
Fakulta / Pracoviště MU | |
Citace | |
www | http://nlp.fi.muni.cz/raslan/2009/ |
Obor | Jazykověda |
Klíčová slova | errors in text; classification of errors |
Popis | Tento článek prezentuje dvě klasifikace chyb v českých textech. Základním zdrojem je korpus Chyby, který byl vytvořen v letech 1999-2000 ([1]). Tento korpus obsahuje různé druhy chyb jako např. pravopisné, typografické, gramatické, sémantické, lexikální a stylistické. Tyto chyby byly ručně opraveny a vyznačeny podle anotačního schématu pro klasifikaci chyb, která byla pro tento účel vyvinuta. Za účelem anotace byl vyvinut nástroj zvaný WinCorr. V článku je popsáno první anotační schéma i jeho revize navržená za účelem získání přesnějšího popisu chyb, které se v textech vyskytují. Předmětem diskuse jsou zároveň základní principy, na nichž obě anotace staví. |
Související projekty: |