Punctuation Detection with Full Syntactic Parsing
Název česky | Detekce interpunkce pomocí hloubkové syntaktické analýzy |
---|---|
Autoři | |
Rok publikování | 2010 |
Druh | Článek v odborném periodiku |
Časopis / Zdroj | Research in Computing Science, Special issue: Natural Language Processing and its Applications |
Fakulta / Pracoviště MU | |
Citace | |
www | http://www.cicling.org/2010/Vol46.pdf |
Obor | Informatika |
Klíčová slova | punctuation; grammar checking; parsing; syntactic analysis |
Popis | Správné užívání interpunkčních znamének podléhá v mnoha jazycích, včetně češtiny, složitým pravidlům. Ačkoliv tato pravidla vycházejí z morfologie, syntaxe i sémantiky, současné aplikace pro detekci a korekci interpunkce se omezují na jednoduché pravidlové systémy. V tomto článku představujeme způsob založený na využití syntaktického analyzátoru (parseru) pro češtinu jménem synt. Tento parser používá při analýze strukturu typu chart, ze které lze dále získat různé druhy výstupů. Implementovaná technika detekce interpunkce využívá výstupu ve formě jednoznačných syntaktických struktur (jmenných a slovesných frází, jednoduchých, mj. vztažných, či obecně vložených vět). Tato funkcionalita umožňuje získání syntaktických struktur relevantních pro vkládání interpunkce. Závěrem jsou demonstrovány experimenty prokazující, že tato technika je použitelná pro pokrytí většiny syntaktických fenoménů souvisejících s detekcí interpunkce. |
Související projekty: |