Informace o projektu
LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy
(LINDAT/CLARIAH-CZ)
- Kód projektu
- LM2018101 (kod CEP: LM2018101)
- Období řešení
- 1/2019 - 12/2022
- Investor / Programový rámec / typ projektu
-
Ministerstvo školství, mládeže a tělovýchovy ČR
- Velké infrastruktury pro výzkum, vývoj a inovace
- Fakulta / Pracoviště MU
- Filozofická fakulta
- Další fakulta/pracoviště MU
-
Fakulta informatiky
- doc. Mgr. Pavel Rychlý, Ph.D.
- Mgr. Krištof Anetta
- Mgr. Jan Bušta
- Mgr. Michal Hala
- RNDr. Ondřej Herman
- Bc. Alchemy Hríbik
- RNDr. Miloš Jakubíček, Ph.D.
- RNDr. Vojtěch Kovář, Ph.D.
- RNDr. Marek Medveď, Ph.D.
- RNDr. Zuzana Nevěřilová, Ph.D.
- Mgr. Jitka Nováčková
- prof. PhDr. Karel Pala, CSc.
- RNDr. Adam Rambousek, Ph.D.
- Mgr. Radoslav Sabol
- RNDr. Vít Suchomel, Ph.D.
- RNDr. Pavel Šmerk, Ph.D.
- Bc. Tomáš Vondrák
- WWW stránky projektu
- https://digitalia.phil.muni.cz/
- Klíčová slova
- digitální humanitní vědy
- Spolupracující organizace
-
Filosofický ústav AV ČR, v. v. i.
Historický ústav AV ČR, v. v. i.
Knihovna AV ČR, v. v. i.
Ústav pro jazyk český AV ČR, v. v. i.
Moravská zemská knihovna Brno
Národní galerie v Praze
Národní knihovna České republiky
Univerzita Karlova
- Odpovědná osoba prof. RNDr. Jan Hajič, Dr.
Národní filmový archív
LINDAT/CLARIAH-CZ je Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy. Umožňuje archivaci, zpracování, správu a zpřístupnění dat, zdrojů a nástrojů z oblasti umění, humanitních a společenských věd. Cílem projektu je posílit a rozšířit výzkum obohacený o digitální zdroje a nástroje a podpořit výuku digitálních humanitních věd napříč tradičními humanitními obory filozofické fakulty.
Cílem projektu je posílit a propagovat přístupy k výzkumu používající digitální zdroje a výpočetní kapacity umožňující řešit tradiční problémy humanitních oborů novými metodami a z nového úhlu pohledu. CLARIAH je panevropská síť propojující lidi s informacemi, znalostmi, obsahem, metodami, nástroji a technologiemi poskytovanými členskými státy. Projekt usiluje o zviditelnění digitálních a infrastrukturních produktů a systémů, stejně jako vědeckých článků, které vznikly s jejich využitím, na globální úrovni. Tomu napomůže vytvoření lokálního uzlu infrastruktury CLARIAH a zprostředkování metadat a odkazů na jedinečné digitální zdroje tvořené vědci na FF MU.
Cíle udržitelného rozvoje
Masarykova univerzita se hlásí k cílům udržitelného rozvoje OSN, jejichž záměrem je do roku 2030 zlepšit podmínky a kvalitu života na naší planetě.
Publikace
Počet publikací: 54
2021
-
Website Properties in Relation to the Quality of Text Extracted for Web Corpora
Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), rok: 2021
-
When Tesseract Brings Friends: Layout Analysis, Language Identification, and Super-Resolution in the Optical Character Recognition of Medieval Texts
Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), rok: 2021
-
When Word Pairs Matter - Analysis of the English-Slovak Evaluation Dataset
Proceedings of the Fifteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2021, rok: 2021
-
Who is Selling to Whom – Feature Evaluation for Multi-block Classification in Invoice Information Extraction
SPECOM 2021: 23rd International Conference on Speech and Computer, rok: 2021
2020
-
Current Challenges in Web Corpus Building
Proceedings of the 12th Web as Corpus Workshop, rok: 2020
-
Data Mining from Free-Text Health Records : State of the Art, New Polish Corpus
Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020, rok: 2020
-
Digging for unspecified information requirements : a case study of Digital Library of Arne Novák users
Rok: 2020, druh: Další prezentace na konferencích
-
Digitální data perspektivou humanitního vědce
Rok: 2020, druh: Uspořádání konference
-
Multilingual Recognition of Temporal Expressions
Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020, rok: 2020
-
Removing Spam from Web Corpora Through Supervised Learning and Semi-manual Classification of Web Sites
Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020, rok: 2020