Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
Autoři | |
---|---|
Rok publikování | 2008 |
Druh | Článek ve sborníku |
Konference | Čeština v mluveném korpusu |
Fakulta / Pracoviště MU | |
Citace | |
Obor | Jazykověda |
Klíčová slova | corpus; spoken corpora; tagging |
Popis | Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů. |
Související projekty: |