AplikaceAplikace
Nastavení

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
en:cnk:citace [2021/01/14 18:13] – [Lemmatization and tagging] Michal Křenen:cnk:citace [2023/10/13 17:15] (current) – [Lemmatization and tagging] Jan Křivan
Line 27: Line 27:
 ==== Lemmatization and tagging ==== ==== Lemmatization and tagging ====
  
-If you use [[en:pojmy:lemma|lemmatization]] or [[en:pojmy:tag|morphological tags]] (attributes //lemma// or //tag// in the SYN series corpora), please also cite the following publications:+  * If you use [[en:pojmy:lemma|lemmatization]][[en:pojmy:tag|morphological]] or [[en:cnk:syn2020#verb_tagging_verbtag|verb]] tags (attributes //lemma////tag// or //verbtag// in the SYN series corpora), please also cite one of the following publications:
  
-Jan Hajič: //Disambiguation of Rich Inflection (Computational Morphology of Czech)//Vol1Karolinum Charles University PressPraha 2004.+Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, Jana Šindlerová (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.)//Text, Speech, and Dialogue.// TSD 2021Lecture Notes in Computer Science, vol12848. Cham: Springerpp. 48–59.
  
-Jan HajičEduard Bejček, Jaroslava Hlaváčová, Marie Mikulová, Milan Straka, Jan ŠtěpánekBarbora ŠtěpánkováPrague Dependency Treebank - Consolidated 1.0InProceedings of the 12th International Conference on Language Resources and Evaluation (LREC 2020), European Language Resources Association, Marseille, France, ISBN 979-10-95546-34-4, pp. 5208-5218, 2020.+KřivanJ. – ŠindlerováJ. (2022)[[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, pp. 122–145.
  
-Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, pp. 160–164. Reykjavík: ELRA. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf+  * You can also cite any of the following articles that relate to the annotation used:
  
-Tomáš Jelínek (2008): Nové značkování v Českém národním korpusu. In: //Naše řeč//, 91, 1, pp. 1320.+Jan Hajič: //Disambiguation of Rich Inflection (Computational Morphology of Czech)//. Vol. 1. Karolinum Charles University Press, Praha 2004. 
 + 
 +Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, pp. 160164. Reykjavík: ELRA. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf
  
 Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. In: //Naše řeč//, 97, 4, pp. 194–207. Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. In: //Naše řeč//, 97, 4, pp. 194–207.
Line 41: Line 43:
 Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp. 137-150. Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp. 137-150.
  
-For the lemmatization and tagging of the spoken ORAL corpus, you can also cite:+  * For the lemmatization and tagging of the spoken ORAL corpus, you can also cite:
  
 Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. In: //Korpus -- gramatika -- axiologie//, 15, pp. 47–67. Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. In: //Korpus -- gramatika -- axiologie//, 15, pp. 47–67.