Building Big Czech Corpus : Collecting and Converting Czech Corpora
Název česky | Budování velkého českého korpusu : shromáždění a konverze českých korpusů |
---|---|
Autoři | |
Rok publikování | 2008 |
Druh | Článek ve sborníku |
Konference | RASLAN 2008 |
Fakulta / Pracoviště MU | |
Citace | HANČAR, Pavel. Building Big Czech Corpus : Collecting and Converting Czech Corpora. In RASLAN 2008. Masaryk University, Brno: Masaryk University, Brno, 2008, s. 94-97, 100 s. ISBN 978-80-210-4741-9. |
www | https://nlp.fi.muni.cz/raslan/2008/papers/11.pdf |
Obor | Jazykověda |
Klíčová slova | corpus; desamb; vertjoin; |
Popis | Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení. |
Související projekty: |