AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
cnk:citace [2013/12/28 20:29] lukasjanicikcnk:citace [2023/10/13 17:10] – [Lemmatizace a tagování] jankrivan
Řádek 1: Řádek 1:
 +~~NOTOC~~
 +
 ====== Jak citovat korpusy zpřístupňované ČNK ====== ====== Jak citovat korpusy zpřístupňované ČNK ======
-FIXME 
  
-[[Michal Křen aktualizuje]]+[{{ :cnk:jak_citovat_korpus.png?nolink&500|Zobrazení informace o korpusu včetně citačních údajů v rozhraní KonText}}] 
 + 
 +==== Způsoby citování korpusů ==== 
 + 
 + 
 + 
 +Existují v zásadě dva způsoby, jakým korpusy při vědecké práci citovat: 
 + 
 +  - uvedení korpusu jako pramene či zdroje dat; 
 +  - uvedení odkazu na konkrétní článek, který popisuje vznik korpusu a jeho složení. 
 + 
 +Volba mezi těmito dvěma možnostmi je na zvážení uživatele a záleží také na konkrétním účelu citace; samozřejmě je možné oba způsoby kombinovat. Konkrétní podobu citace najdete jednak v této wiki na stránce věnované konkrétnímu korpusu a jednak v rozhraní [[manualy:kontext:index|KonText]] po kliknutí na odkaz s názvem korpusu. 
 + 
 +Citace ad 1) je uvedena vždy, citace ad 2) pouze v KonTextu a jen pro většinu korpusů; chybí tedy v případě, kdy se žádný článek s popisem korpusu nepodařilo dohledat. Kromě konkrétního bibliografického údaje však můžete u některých korpusů v KonTextu najít přímo webový odkaz na adresu, z níž je možné článek stáhnout. 
  
-=== Citování referenčních korpusů ===+==== Citování nereferenčních korpusů ====
  
-V bibliografii uvádějte korpusový materiál následujícími způsoby:+Při citování [[pojmy:referencni|verzovaných korpusů]] je potřeba uvádět také číslo verze, které je v rozhraní KonText u každého verzovaného korpusu vždy k dispozici jako součást citační informace.
  
-**Korpus SYN2010:** +Při citaci **konkrétního díla** lze použít také [[seznamy:index|seznam zdrojů]] korpusu [[https://trnka.ff.cuni.cz/dokuwiki/doku.php/cnk:syn2000|SYN2000]][[https://trnka.ff.cuni.cz/dokuwiki/doku.php/cnk:syn2005|SYN2005]] nebo [[https://trnka.ff.cuni.cz/dokuwiki/doku.php/cnk:syn2010|SYN2010]].
-//Český národní korpus - SYN2010//. Ústav Českého národního korpusu FF UKPraha 2010Dostupný z WWW<http://www.korpus.cz>.+
  
-**Korpus SYN2009PUB:** +==== Lemmatizace a tagování ====
-//Český národní korpus - SYN2009PUB//. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>.+
  
-**Korpus SYN2006PUB:** +Používáte-li [[pojmy:lemma|lemmatizaci]], [[pojmy:tag|morfologické]] nebo [[pojmy:verbtag|slovesné]] značky (atributy //lemma//, //tag// nebo //verbtag// v korpusech řady SYN), citujte jednu z následujících publikací: 
-//Český národní korpus - SYN2006PUB//. Ústav Českého národního korpusu FF UKPraha 2006. Dostupný z WWW: <http://www.korpus.cz>.+
  
-**Korpus SYN2005:** +Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, Jana Šindlerová (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speechand Dialogue.// TSD 2021Lecture Notes in Computer Science, vol. 12848. Cham: Springer, pp48–59.
-//Český národní korpus - SYN2005//. Ústav Českého národního korpusu FF UKPraha 2005Dostupný z WWW: <http://www.korpus.cz>.+
  
-**Korpus SYN2000:** +Křivan, J– ŠindlerováJ(2022)[[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, s. 122–145.
-//Český národní korpus - SYN2000//Ústav Českého národního korpusu FF UKPraha 2000Dostupný z WWW<http://www.korpus.cz>.+
  
-**Korpus SYN2013PUB:** +Můžete také uvést některý z následujících článkůkteré se použité anotace týkají:
-Český národní korpus - SYN2013PUB. Ústav Českého národního korpusu FF UKPraha 2013. Dostupný z WWW: <http://www.korpus.cz+
  
-**Korpus ORAL2006:** FIXME (????) +Jan Hajič (2004)//Disambiguation of Rich Inflection (Computational Morphology of Czech)//Vol1Karolinum Charles University Press, Praha.
-Kopřivová, M–- Waclawičová, M.: ORAL2006: korpus neformální mluvené češtinyÚstav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: <http://www.korpus.cz>.+
  
-**Korpus ORAL2008:** +Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//. ELRAReykjavík, s. 160–164. http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf
-//Český národní korpus - ORAL2008//. Ústav Českého národního korpusu FF UKPraha 2008Dostupný z WWW: <http://www.korpus.cz>.+
  
-**Korpus ORAL2013:** FIXME (????) +Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. //Naše řeč// 97 (4), s194–207.
-Benešová, L. – Křen, M. – Waclawičová, M.: ORAL2013reprezentativní korpus neformální mluvené češtiny. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: http://www.korpus.cz+
  
-**Korpus PMK:** +Milan Straka, Jana Straková, Jan Hajič (2019)Czech Text Processing with Contextual Embeddings: POS TaggingLemmatization, Parsing and NERInProceedings of the 22nd International Conference on Text, Speech and Dialogue - TSD 2019, Lecture Notes in Computer Science, ISSN 0302-9743, 11697, pp137-150.
-//Český národní korpus - PMK//. Ústav Českého národního korpusu FF UKPraha 2001Dostupný z WWW<http://www.korpus.cz>.+
  
-=== Citování nereferenčních korpusů ===+V případě lemmatizace a značkování mluveného korpusu ORAL můžete citovat také následující publikaci:
  
-Analogicky odkazujte i na další korpusy s výjimkou korpusů **InterCorpSYNDIAKORP** a dalších [[pojmy:referencni|nereferenčních korpusů]]které na rozdíl ode všech výše uvedených nejsou neměnným referenčním zdrojema proto je potřeba udávat také čas přístupu podobně jako je tomu v případě citování webových stránek:+Marie KopřivováZuzana KomrskováDavid Lukeš, Petra Poukarová (2017)Korpus ORAL: sestavenílemmatizace a morfologické značkování. //Korpus -- gramatika -- axiologie// 15s. 47–67.
  
-**SYN:** +==== Citování aplikací ====
-Český národní korpus - SYN. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: +
-<http://www.korpus.cz>.+
  
-**InterCorp:** +**[[manualy:wag|Slovo v kostce (WaG)]]**
-Český národní korpus - InterCorp. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: +
-<http://www.korpus.cz>.+
  
-<WRAP round tip 40%>+Tomáš Machálek (2019): Slovo v kostce -- agregátor slovních profilů. FF UK, Praha. Dostupný z WWW: <http://korpus.cz/slovo-v-kostce/>.
  
-Při citaci **konkrétního díla** použijte [[seznamy:index|seznam zdrojů]] korpusu [[https://trnka.ff.cuni.cz/dokuwiki/doku.php/cnk:syn2000|SYN2000]], [[https://trnka.ff.cuni.cz/dokuwiki/doku.php/cnk:syn2005|SYN2005]] nebo [[https://trnka.ff.cuni.cz/dokuwiki/doku.php/cnk:syn2010|SYN2010]]. +Tomáš Machálek (2019)Word at a Glance – a Customizable Word Profile Aggregator. In: //[[https://office.clarin.eu/v/CE-2019-1512_CLARIN2019_ConferenceProceedings.pdf 
-</WRAP>+|Proceedings of the CLARIN Annual Conference 2019]]//, s85–88.
  
-      +**[[manualy:kontext:index|KonText]]**
-=== Citování lemmatizace a tagování ===+
  
-Používáte-li [[pojmy:lemma|lemmatizaci]] nebo [[pojmy:tag|morfologické značky]] (atributy //lemma// nebo //tag// v korpusech řady SYN), citujte také následující publikace:+Tomáš Machálek (2014): KonText -- aplikace pro práci s jazykovými korpusy. FF UK, Praha. Dostupný z WWW<http://kontext.korpus.cz>.
  
 +Tomáš Machálek (2020): KonText: Advanced and Flexible Corpus Query Interface. In: //[[http://www.lrec-conf.org/proceedings/lrec2020/pdf/2020.lrec-1.865.pdf|Proceedings of LREC 2020]]//, s. 7005–7010.
  
-Jan Hajič//Disambiguation of Rich Inflection (Computational Morphology of Czech)//. Vol. 1. Karolinum Charles University Press, Praha 2004.+**[[manualy:syd|SyD]]**
  
-Tomáš Jelínek (2008): Nové značkování v Českém národním korpusuIn: //Naše řeč//, 91, 1, pp13-20.+Václav Cvrček – Pavel Vondřička (2011): SyD -- korpusový průzkum variantFF UK, Praha. Dostupný z WWW: <http://syd.korpus.cz>.
  
-Drahomíra Spoustová, Jan Hajič, Jan Votrubec, Pavel Krbec, Pavel KvětoňThe Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: //Proceedings of the Workshop on Balto-Slavonic Natural Language Processing//. ACL 2007, Praha. pp. 67-74.+Václav Cvrček – Pavel Vondřička (2011)Výzkum variability v korpusech češtiny. In: František Čermák (ed.): //Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů.// NLN, Praha, s184–195.
  
-Vladimír Petkevič (2006)Reliable Morphological Disambiguation of Czech: Rule-Based Approach is Necessary. In: //Insight into the Slovak and Czech Corpus Linguistics (Šimková M. ed.)//. Veda, Bratislava, pp. 26-44. +**[[manualy:morfio|Morfio]]**
  
-=== Citování speciálních aplikací a korpusů ===+Václav Cvrček – Pavel Vondřička (2013): Morfio -- aplikace pro analýzu slovotvorných vztahů. FF UK, Praha. Dostupný z WWW: <http://morfio.korpus.cz>.
  
-== Program SyD == +Václav Cvrček – Pavel Vondřička (2013)Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//Gaudeamus, Hradec Králové.
-Cvrček, V. - Vodnřička, P.SyD - Korpusový průzkum variantFF UK. Praha 2011. Dostupný z WWW: <http://syd.korpus.cz>.+
  
-Cvrček, V. - Vondřička, P.Výzkum variability v korpusech češtiny. In: F. Čermák (ed).: Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů. NLN. Praha, (s. 184.195).+**[[manualy:kwords|KWords]]**
  
-== Korpus frWac ==+Václav Cvrček – Pavel Vondřička (2013): KWords -- aplikace pro extrakci klíčových slov. FF UK, Praha. Dostupný z WWW: <http://kwords.korpus.cz>.
  
-A. Ferraresi, S. Bernardini, G. Picci and M. Baroni (2010) “Web Corpora for Bilingual Lexicography: A Pilot Study of English/French Collocation Extraction and Translation”. In Xiao, R. (ed.) Using Corpora in Contrastive and Translation Studies. Newcastle: Cambridge Scholars Publishing. ([[http://wacky.sslmit.unibo.it/lib/exe/fetch.php?media=ferraresi_et_al_2010.pdf|PDF ke stažení]])+**[[manualy:treq|Treq]]**
  
-== Korpusy deWacitWac, ukWac ==+Martin Vavřín – Alexandr Rosen (2015): Treq -- databáze překladových ekvivalentů. FF UKPraha. Dostupný z WWW: <http://treq.korpus.cz>.
  
-M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209-226([[http://wacky.sslmit.unibo.it/lib/exe/fetch.php?media=papers:wacky_2008.pdf|PDF ke stažení]])+Michal Škrabal – Martin Vavřín (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s245–260.
  
 +Michal Škrabal – Martin Vavřín (2017): The Translation Equivalents Database (Treq) as a Lexicographer’s Aid. In: I. Kosem et al. (eds): //Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference//. Lexical Computing CZ, s. r. o., Leiden, s. 124–137.