AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:citace [2021/01/13 10:39] Tomáš Jelínekcnk:citace [2023/10/13 17:12] (aktuální) – [Lemmatizace a tagování] Jan Křivan
Řádek 27: Řádek 27:
 ==== Lemmatizace a tagování ==== ==== Lemmatizace a tagování ====
  
-Používáte-li [[pojmy:lemma|lemmatizaci]] nebo [[pojmy:tag|morfologické značky]] (atributy //lemma// nebo //tag// v korpusech řady SYN), citujte také některou z následujících publikací:+  * Používáte-li [[pojmy:lemma|lemmatizaci]][[pojmy:tag|morfologické]] nebo [[pojmy:verbtag|slovesné]] značky (atributy //lemma////tag// nebo //verbtag// v korpusech řady SYN), citujte jednu z následujících publikací: 
  
-Jan Hajič (2004): //Disambiguation of Rich Inflection (Computational Morphology of Czech)//Vol1Karolinum Charles University PressPraha.+Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, Jana Šindlerová (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.)//Text, Speech, and Dialogue.// TSD 2021Lecture Notes in Computer Science, vol12848. Cham: Springerpp. 48–59.
  
-Jan HajičEduard Bejček, Jaroslava Hlaváčová, Marie Mikulová, Milan Straka, Jan ŠtěpánekBarbora ŠtěpánkováPrague Dependency Treebank - Consolidated 1.0InProceedings of the 12th International Conference on Language Resources and Evaluation (LREC 2020), European Language Resources Association, Marseille, France, ISBN 979-10-95546-34-4pp. 5208-52182020.+KřivanJ. – ŠindlerováJ. (2022)[[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//832/2022, s. 122–145.
  
-Milena HnátkováMichal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//. ELRA, Reykjavík, s. 160–164. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf+  * Můžete také uvést některý z následujících článkůkteré se použité anotace týkají:
  
-Tomáš Jelínek (2008): Nové značkování v Českém národním korpusu. //Naše ř// 91 (1), s. 1320.+Jan Hajič (2004): //Disambiguation of Rich Inflection (Computational Morphology of Czech)//. Vol. 1. Karolinum Charles University Press, Praha. 
 + 
 +Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//. ELRA, Reykjavík, s. 160164. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf
  
 Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. //Naše řeč// 97 (4), s. 194–207. Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. //Naše řeč// 97 (4), s. 194–207.
- 
-Drahomíra Spoustová, Jan Hajič, Jan Votrubec, Pavel Krbec, Pavel Květoň (2007): The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: //Proceedings of the Workshop on Balto-Slavonic Natural Language Processing//. ACL, Praha, s. 67–74. 
  
 Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp. 137-150. Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp. 137-150.
  
-V případě lemmatizace a značkování mluveného korpusu ORAL můžete citovat také následující publikaci:+  * V případě lemmatizace a značkování mluveného korpusu ORAL můžete citovat také následující publikaci:
  
 Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. //Korpus -- gramatika -- axiologie// 15, s. 47–67. Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. //Korpus -- gramatika -- axiologie// 15, s. 47–67.
Řádek 59: Řádek 59:
  
 Tomáš Machálek (2014): KonText -- aplikace pro práci s jazykovými korpusy. FF UK, Praha. Dostupný z WWW: <http://kontext.korpus.cz>. Tomáš Machálek (2014): KonText -- aplikace pro práci s jazykovými korpusy. FF UK, Praha. Dostupný z WWW: <http://kontext.korpus.cz>.
 +
 +Tomáš Machálek (2020): KonText: Advanced and Flexible Corpus Query Interface. In: //[[http://www.lrec-conf.org/proceedings/lrec2020/pdf/2020.lrec-1.865.pdf|Proceedings of LREC 2020]]//, s. 7005–7010.
  
 **[[manualy:syd|SyD]]** **[[manualy:syd|SyD]]**