AplikaceAplikace
Nastavení

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
en:cnk:citace [2017/09/26 17:04] – [Citing non-reference corpora] Michal Křenen:cnk:citace [2023/10/13 17:15] (current) – [Lemmatization and tagging] Jan Křivan
Line 27: Line 27:
 ==== Lemmatization and tagging ==== ==== Lemmatization and tagging ====
  
-If you use [[en:pojmy:lemma|lemmatization]] or [[en:pojmy:tag|morphological tags]] (attributes //lemma// or //tag// in the SYN series corpora), please also cite the following publications:+  * If you use [[en:pojmy:lemma|lemmatization]][[en:pojmy:tag|morphological]] or [[en:cnk:syn2020#verb_tagging_verbtag|verb]] tags (attributes //lemma////tag// or //verbtag// in the SYN series corpora), please also cite one of the following publications:
  
 +Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, Jana Šindlerová (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, pp. 48–59.
 +
 +Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, pp. 122–145.
 +
 +  * You can also cite any of the following articles that relate to the annotation used:
  
 Jan Hajič: //Disambiguation of Rich Inflection (Computational Morphology of Czech)//. Vol. 1. Karolinum Charles University Press, Praha 2004. Jan Hajič: //Disambiguation of Rich Inflection (Computational Morphology of Czech)//. Vol. 1. Karolinum Charles University Press, Praha 2004.
  
-Tomáš Jelínek (2008): Nové značkování v Českém národním korpusu. In: //Naše řeč//, 91, 1, pp. 1320.+Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, pp. 160164. Reykjavík: ELRA. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf
  
-Drahomíra Spoustová, Jan Hajič, Jan Votrubec, Pavel Krbec, Pavel KvětoňThe Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: //Proceedings of the Workshop on Balto-Slavonic Natural Language Processing//. ACL 2007Praha. pp. 6774.+Vladimír Petkevič (2014)Problémy automatické morfologické disambiguace češtiny. In: //Naše řeč//, 97, 4, pp. 194207.
  
-Vladimír Petkevič (2006): Reliable Morphological Disambiguation of Czech: Rule-Based Approach is Necessary. In: //Insight into the Slovak and Czech Corpus Linguistics (Šimková Med.)//. VedaBratislava, pp. 2644+Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual EmbeddingsPOS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp137-150. 
 + 
 +  * For the lemmatization and tagging of the spoken ORAL corpus, you can also cite: 
 + 
 +Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. In: //Korpus -- gramatika -- axiologie//, 15, pp. 4767.
  
 ==== Citing specialized applications ==== ==== Citing specialized applications ====
  
-**[[en:manualy:syd|SyD]] program**+**Word at a Glance (WaG)** 
 + 
 +Tomáš Machálek (2019): Word at a Glance -- application for word profile aggregation. FF UK, Praha. Available from <http://korpus.cz/slovo-v-kostce/>
 + 
 +Tomáš Machálek (2019): Word at a Glance – a Customizable Word Profile Aggregator. In: //[[https://office.clarin.eu/v/CE-2019-1512_CLARIN2019_ConferenceProceedings.pdf 
 +|Proceedings of the CLARIN Annual Conference 2019]]//, s. 85–88. 
 + 
 +**[[en:manualy:kontext:index|KonText]]** 
 + 
 +Tomáš Machálek (2014): KonText -- application for working with language corpora. FF UK, Praha. Available from <http://kontext.korpus.cz>
 + 
 +**[[en:manualy:syd|SyD]]** 
 + 
 +Václav Cvrček – Pavel Vondřička (2011): SyD -- corpus study of variants. FF UK, Praha. Available from <http://syd.korpus.cz>
 + 
 +Václav Cvrček – Pavel Vondřička (2011): Výzkum variability v korpusech češtiny. In: František Čermák (ed.): //Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů.// NLN, Praha, s. 184–195. 
 + 
 +**[[en:manualy:morfio|Morfio]]** 
 + 
 +Václav Cvrček – Pavel Vondřička (2013): Morfio -- application for analyzing morphological relations. FF UK, Praha. Available from <http://morfio.korpus.cz>
 + 
 +Václav Cvrček – Pavel Vondřička (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Gaudeamus, Hradec Králové.
  
-Cvrček, V. – Vondřička, P.SyD - Korpusový průzkum variant. FF UK. Praha 2011. Available on WWW<http://syd.korpus.cz>.+**[[en:manualy:kwords|KWords]]**
  
-Cvrček, V. – Vondřička, P.: Výzkum variability v korpusech češtiny. In: F. Čermák (ed).: Korpusová lingvistika Praha 20112Výzkum a výstavba korpusůNLN. Praha, s. 184–195.+Václav Cvrček – Pavel Vondřička (2013): KWords -- application for the extraction of keywordsFF UK, Praha. Available from <http://kwords.korpus.cz>.
  
-**[[en:manualy:morfio|Morfio]] program**+**[[en:manualy:treq|Treq]]**
  
-Cvrček, V. – Vondřička, P.Morfio. FF UKPraha 2013. Available on WWW: <http://morfio.korpus.cz>.+Martin Vavřín – Alexandr Rosen (2015)Treq -- database of translation equivalents. FF UKPraha. Available from <http://treq.korpus.cz>.
  
-Cvrček, V. – Vondřička. P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusuIn: //Gramatika a korpus 2012//. Gaudeamus. Hradec Králové.+Michal Škrabal – Martin Vavřín (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s245–260.
  
-**[[en:manualy:kwords|KWords]] program**+Michal Škrabal – Martin Vavřín (2017)The Translation Equivalents Database (Treq) as a Lexicographer’s Aid. InI. Kosem et al. (eds): //Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference//. Lexical Computing CZ, s. r. o., Leiden, s. 124–137.
  
-Cvrček, V. – Vondřička, P.: KWords. FF UK. Praha 2013. Available on WWW: <http://kwords.korpus.cz>.