Víceslovné výrazy a klasifikace českých textů
Autoři | |
---|---|
Rok publikování | 2004 |
Druh | Článek ve sborníku |
Konference | Znalosti 2004, sborník posterů |
Fakulta / Pracoviště MU | |
Citace | |
Obor | Informatika |
Klíčová slova | text classification; machine learning; multword expressions |
Popis | Presentujeme první výsledky experimentů týkající se použití víceslovných výrazů pro klasifikaci českých textů. Podáváme přehled nejdelších, nejčastěji použitých a nejužitečnějších víceslovných skupin. Všímáme si též vlivu lematizace na přesnost klasifikace textů. |
Související projekty: |