Both sides previous revisionPrevious revisionNext revision | Previous revisionLast revisionBoth sides next revision |
en:cnk:citace [2017/10/04 17:23] – michalskrabal | en:cnk:citace [2023/10/11 20:12] – [Lemmatization and tagging] jankrivan |
---|
| |
Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, pp. 160–164. Reykjavík: ELRA. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf | Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, pp. 160–164. Reykjavík: ELRA. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf |
| |
Tomáš Jelínek (2008): Nové značkování v Českém národním korpusu. In: //Naše řeč//, 91, 1, pp. 13–20. | |
| |
Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. In: //Naše řeč//, 97, 4, pp. 194–207. | Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. In: //Naše řeč//, 97, 4, pp. 194–207. |
| |
Drahomíra Spoustová, Jan Hajič, Jan Votrubec, Pavel Krbec, Pavel Květoň (2007): The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: //Proceedings of the Workshop on Balto-Slavonic Natural Language Processing//. ACL 2007, Praha. pp. 67–74. | Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp. 137-150. |
| |
| Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, Jana Šindlerová (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, pp. 48–59. |
| |
| For the lemmatization and tagging of the spoken ORAL corpus, you can also cite: |
| |
| Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. In: //Korpus -- gramatika -- axiologie//, 15, pp. 47–67. |
| |
==== Citing specialized applications ==== | ==== Citing specialized applications ==== |
| |
| **Word at a Glance (WaG)** |
| |
| Tomáš Machálek (2019): Word at a Glance -- application for word profile aggregation. FF UK, Praha. Available from <http://korpus.cz/slovo-v-kostce/>. |
| |
| Tomáš Machálek (2019): Word at a Glance – a Customizable Word Profile Aggregator. In: //[[https://office.clarin.eu/v/CE-2019-1512_CLARIN2019_ConferenceProceedings.pdf |
| |Proceedings of the CLARIN Annual Conference 2019]]//, s. 85–88. |
| |
| **[[en:manualy:kontext:index|KonText]]** |
| |
| Tomáš Machálek (2014): KonText -- application for working with language corpora. FF UK, Praha. Available from <http://kontext.korpus.cz>. |
| |
**[[en:manualy:syd|SyD]]** | **[[en:manualy:syd|SyD]]** |
| |
Cvrček, V. – Vondřička, P.: SyD - Korpusový průzkum variant. FF UK. Praha 2011. Available on WWW: <http://syd.korpus.cz>. | Václav Cvrček – Pavel Vondřička (2011): SyD -- corpus study of variants. FF UK, Praha. Available from <http://syd.korpus.cz>. |
| |
Cvrček, V. – Vondřička, P.: Výzkum variability v korpusech češtiny. In: F. Čermák (ed.): Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů. NLN. Praha, pp. 184–195. | Václav Cvrček – Pavel Vondřička (2011): Výzkum variability v korpusech češtiny. In: František Čermák (ed.): //Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů.// NLN, Praha, s. 184–195. |
| |
**[[en:manualy:morfio|Morfio]]** | **[[en:manualy:morfio|Morfio]]** |
| |
Cvrček, V. – Vondřička, P.: Morfio. FF UK. Praha 2013. Available on WWW: <http://morfio.korpus.cz>. | Václav Cvrček – Pavel Vondřička (2013): Morfio -- application for analyzing morphological relations. FF UK, Praha. Available from <http://morfio.korpus.cz>. |
| |
Cvrček, V. – Vondřička. P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. In: //Gramatika a korpus 2012//. Gaudeamus. Hradec Králové. | Václav Cvrček – Pavel Vondřička (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Gaudeamus, Hradec Králové. |
| |
**[[en:manualy:kwords|KWords]]** | **[[en:manualy:kwords|KWords]]** |
| |
Cvrček, V. – Vondřička, P.: KWords. FF UK. Praha 2013. Available on WWW: <http://kwords.korpus.cz>. | Václav Cvrček – Pavel Vondřička (2013): KWords -- application for the extraction of keywords. FF UK, Praha. Available from <http://kwords.korpus.cz>. |
| |
**[[en:manualy:treq|Treq]]** | **[[en:manualy:treq|Treq]]** |
| |
Vavřín, M. – Rosen, A.: Treq. FF UK. Praha 2015. Available on WWW: <http://treq.korpus.cz>. | Martin Vavřín – Alexandr Rosen (2015): Treq -- database of translation equivalents. FF UK, Praha. Available from <http://treq.korpus.cz>. |
| |
| Michal Škrabal – Martin Vavřín (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s. 245–260. |
| |
Škrabal, M. – Vavřín, M. (2017): The Translation Equivalents Database (Treq) as a Lexicographer’s Aid. In: I. Kosem et al. (eds): //Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference//. Lexical Computing CZ s. r. o. Leiden, pp. 124–137. | Michal Škrabal – Martin Vavřín (2017): The Translation Equivalents Database (Treq) as a Lexicographer’s Aid. In: I. Kosem et al. (eds): //Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference//. Lexical Computing CZ, s. r. o., Leiden, s. 124–137. |
| |