Document Engineering for Digital Libraries (invited talk 5.11.2010,Portsmouth University Computing Seminar,UK)
Název česky | Dokumentové inženýrství pro digitální knihovny (zvaná přednáška 5.11.2010,Portsmouth University Computing Seminar,Portsmouth,UK) |
---|---|
Autoři | |
Rok publikování | 2010 |
Druh | Vyžádané přednášky |
Fakulta / Pracoviště MU | |
Citace | |
Popis | Přednáška bude uvozena vizí světové digitální matematické knihovny. Popíši architekturu zpracování matematických dokumentů v Digitální matematické knihovně DML-CZ. Speciální pozornost bude věnována vyvinutym inovativním nástrojům a transformací dokumentů, které byly vyvinuty v rámci digitální matematické knihovny DML-CZ: nástroj pro PDF rekompresi, který využívá enkodér jbig2enc. Dohromady s dalšími programy, především pdfsizeopt.py, který vyvinul Péter Szabó, jsme byli schopni snížít velikost PDF a nároky na jejich přenos o 62 %: použitím obou nástrojů jsme snížíli velikost PDF dokumentů na 38 % z původní velikosti. Mezi produkty tohoto projektu patří i dávkové podepisování PDF documentů, metriky vyhledávání podobností u dokumentů, které používají čtyři různé metody, process validace [meta]dat a OCR nástroje pro matematiku. Tento způsob tvorby dokumentů spolu s Google Scholar optimalizací indexace, vedlo k úspěšné obsluze digitalizovaných a born-digital vědeckých matematických dokumentů pro veřejnost v DML-CZ a bude dále nasazeno také v projektu evropské digitální matematické knihovny EuDML. |
Související projekty: |