Informace o projektu
Centrum komputační lingvistiky
- Kód projektu
- LC536
- Období řešení
- 1/2005 - 12/2011
- Investor / Programový rámec / typ projektu
-
Ministerstvo školství, mládeže a tělovýchovy ČR
- Centra základního výzkumu
- Fakulta / Pracoviště MU
- Fakulta informatiky
- Spolupracující organizace
-
Ústav pro jazyk český AV ČR, v. v. i.
- Odpovědná osoba doc. RNDr. Karel Oliva, Dr.
- Odpovědná osoba prof. RNDr. Jan Hajič, Dr.
- Odpovědná osoba prof. RNDr. Jan Hajič, Dr.
- Odpovědná osoba doc. Ing. Luděk Muller, Ph.D.
Předmětem činnosti Centra bude společný teoretický výzkum v oboru počítačové lingvistiky, a to zejména v oblasti kombinace zpracování psaného a mluveného jazyka, která bude podle našeho názoru této oblasti již v brzké době dominovat díky pokroku v obou těchto dosud oddělených oblastech.
Výsledky
Výsledky budou publikovány ve formě výzkumných zpráv, článků v časopisech a sbornících mezinárodních konferencí, software ve výzkumné podobě a s výzkumnou, otevřenou licencí a elektronických jazykových dat, která budou k dispozici široké veřejnosti
Publikace
Počet publikací: 196
2010
-
DESAM – morfologicky označkovaný korpus českých textů
Rok: 2010
-
Document Engineering for a Digital Library: PDF recompression using JBIG2 and other optimization of PDF documents
Proceedings of DocEng 2010 conference, rok: 2010
-
Document Engineering for a Digital Library: PDF recompression using JBIG2 and other optimization of PDF documents
Proceedings of MEMICS 2010 conference, rok: 2010
-
Editing of VerbaLex
Proceedings of Recent Advances in Slavonic Natural Language Processing 2010, rok: 2010
-
Effective Creation of Self-Referencing Citation Records
Proceedings of Fourth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2010, rok: 2010
-
E-learning punctuation test based on the error corpus
Rok: 2010
-
Fast and Faster: A Comparison of Two Streamed Matrix Decomposition Algorithms
NIPS 2010 workshop on Low-rank Methods for Large-scale Machine Learning, rok: 2010
-
Fast syntactic searching in very large corpora for many languages
PACLIC 24 Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation, rok: 2010
-
FinLib -- fast indexing library
Rok: 2010
-
Frequency of Low-Frequency Words in Text Corpora
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2010, rok: 2010