Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky

Varování

Publikace nespadá pod Fakultu sportovních studií, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.

Autoři	HLAVÁČKOVÁ Dana OSOLSOBĚ Klára
Rok publikování	2008
Druh	Článek ve sborníku
Konference	Čeština v mluveném korpusu
Fakulta / Pracoviště MU	Fakulta informatiky
Citace
Obor	Jazykověda
Klíčová slova	corpus; spoken corpora; tagging
Popis	Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů.
Související projekty:	Jazyková poradna na internetu