AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:citace [2017/09/26 17:04] – [Lemmatizace a tagování] Michal Křencnk:citace [2023/10/13 17:12] (aktuální) – [Lemmatizace a tagování] Jan Křivan
Řádek 27: Řádek 27:
 ==== Lemmatizace a tagování ==== ==== Lemmatizace a tagování ====
  
-Používáte-li [[pojmy:lemma|lemmatizaci]] nebo [[pojmy:tag|morfologické značky]] (atributy //lemma// nebo //tag// v korpusech řady SYN), citujte také některou z následujících publikací:+  * Používáte-li [[pojmy:lemma|lemmatizaci]][[pojmy:tag|morfologické]] nebo [[pojmy:verbtag|slovesné]] značky (atributy //lemma////tag// nebo //verbtag// v korpusech řady SYN), citujte jednu z následujících publikací: 
  
-Jan Hajič: //Disambiguation of Rich Inflection (Computational Morphology of Czech)//Vol1Karolinum Charles University PressPraha 2004.+Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, Jana Šindlerová (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.)//Text, Speech, and Dialogue.// TSD 2021Lecture Notes in Computer Science, vol12848. Cham: Springerpp. 48–59.
  
-Milena Hnátková, Michal enPavel ProcházkaHana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, pp160–164Reykjavík: ELRAhttp://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf+ivanJ. – ŠindlerováJ. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, s. 122–145.
  
-Tomáš Jelínek (2008): Nové značkování v Českém národním korpusu. In//Naše řeč//, 91, 1, pp. 13–20.+  * Můžete také uvést některý z následujících článků, které se použité anotace týkají:
  
-Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. In: //Naše řeč//, 97, 4, pp. 194–207.+Jan Hajič (2004): //Disambiguation of Rich Inflection (Computational Morphology of Czech)//. Vol. 1. Karolinum Charles University PressPraha.
  
-Drahomíra SpoustováJan Hajič, Jan Votrubec, Pavel KrbecPavel Květoň (2007): The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: //Proceedings of the Workshop on Balto-Slavonic Natural Language Processing//. ACL 2007Prahapp. 6774.+Milena HnátkováMichal Křen, Pavel ProcházkaHana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//. ELRAReykjavík, s160164. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf
  
-==== Citování speciálních aplikací ====+Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. //Naše řeč// 97 (4), s. 194–207.
  
-**Program [[manualy:syd|SyD]]**+Milan Straka, Jana Straková, Jan Hajič (2019)Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, Parsing and NER. In: Proceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp. 137-150.
  
-Cvrček, V. – Vondřička, P.: SyD - Korpusový průzkum variant. FF UK. Praha 2011. Dostupný z WWW: <http://syd.korpus.cz>.+  * případě lemmatizace a značkování mluveného korpusu ORAL můžete citovat také následující publikaci:
  
-Cvrček, V. – VondřičkaP.: Výzkum variability v korpusech češtiny. In: F. Čermák (ed).Korpusová lingvistika Praha 2011. 2. Výzkum výstavba korpusů. NLNPraha, s. 184195.+Marie KopřivováZuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace morfologické značkování//Korpus -- gramatika -- axiologie// 15, s. 4767.
  
-**Program [[manualy:morfio|Morfio]]**+==== Citování aplikací ====
  
-Cvrček, V. – Vondřička, P.Morfio. FF UK. Praha 2013. Dostupný z WWW: <http://morfio.korpus.cz>.+**[[manualy:wag|Slovo v kostce (WaG)]]**
  
-Cvrček, V– VondřičkaP(2013)Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Gaudeamus. Hradec Králové.+Tomáš Machálek (2019): Slovo v kostce -- agregátor slovních profilůFF UKPrahaDostupný z WWW: <http://korpus.cz/slovo-v-kostce/>.
  
-**Program [[manualy:kwords|KWords]]**+Tomáš Machálek (2019): Word at a Glance – a Customizable Word Profile Aggregator. In: //[[https://office.clarin.eu/v/CE-2019-1512_CLARIN2019_ConferenceProceedings.pdf 
 +|Proceedings of the CLARIN Annual Conference 2019]]//, s. 85–88.
  
-Cvrček, V. – Vondřička, P.KWords. FF UK. Praha 2013. Dostupný z WWW<http://kwords.korpus.cz>.+**[[manualy:kontext:index|KonText]]**
  
-**Program [[manualy:treq|Treq]]**+Tomáš Machálek (2014)KonText -- aplikace pro práci s jazykovými korpusy. FF UK, Praha. Dostupný z WWW: <http://kontext.korpus.cz>.
  
-Vavřín, M. – Rosen, A.Treq. FF UKPraha 2015. Dostupný z WWW<http://treq.korpus.cz>.+Tomáš Machálek (2020)KonText: Advanced and Flexible Corpus Query InterfaceIn//[[http://www.lrec-conf.org/proceedings/lrec2020/pdf/2020.lrec-1.865.pdf|Proceedings of LREC 2020]]//, s. 7005–7010.
  
-ŠkrabalM. – Vavřín, M. (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), 245–260.+**[[manualy:syd|SyD]]** 
 + 
 +Václav Cvrček – Pavel Vondřička (2011): SyD -- korpusový průzkum variant. FF UKPraha. Dostupný z WWW: <http://syd.korpus.cz>. 
 + 
 +Václav Cvrček – Pavel Vondřička (2011): Výzkum variability v korpusech češtiny. In: František Čermák (ed.): //Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů.// NLN, Praha, s. 184–195. 
 + 
 +**[[manualy:morfio|Morfio]]** 
 + 
 +Václav Cvrček – Pavel Vondřička (2013): Morfio -- aplikace pro analýzu slovotvorných vztahů. FF UK, Praha. Dostupný z WWW: <http://morfio.korpus.cz>
 + 
 +Václav Cvrček – Pavel Vondřička (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Gaudeamus, Hradec Králové. 
 + 
 +**[[manualy:kwords|KWords]]** 
 + 
 +Václav Cvrček – Pavel Vondřička (2013): KWords -- aplikace pro extrakci klíčových slov. FF UK, Praha. Dostupný z WWW: <http://kwords.korpus.cz>
 + 
 +**[[manualy:treq|Treq]]** 
 + 
 +Martin Vavřín – Alexandr Rosen (2015): Treq -- databáze překladových ekvivalentů. FF UKPrahaDostupný z WWW: <http://treq.korpus.cz>
 + 
 +Michal Škrabal – Martin Vavřín (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s. 245–260
 + 
 +Michal Škrabal – Martin Vavřín (2017): The Translation Equivalents Database (Treq) as a Lexicographer’s Aid. In: I. Kosem et al. (eds): //Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference//. Lexical Computing CZ, s. r. o., Leiden, s. 124–137.