AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Jak citovat korpusy zpřístupňované ČNK

Citování referenčních korpusů

V bibliografii uvádějte korpusový materiál následujícími způsoby:

Korpus SYN2010: Český národní korpus - SYN2010. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>.

Korpus SYN2009PUB: Český národní korpus - SYN2009PUB. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>.

Korpus SYN2006PUB: Český národní korpus - SYN2006PUB. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: <http://www.korpus.cz>.

Korpus SYN2005: Český národní korpus - SYN2005. Ústav Českého národního korpusu FF UK, Praha 2005. Dostupný z WWW: <http://www.korpus.cz>.

Korpus SYN2000: Český národní korpus - SYN2000. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: <http://www.korpus.cz>.

Korpus SYN2013PUB: Český národní korpus - SYN2013PUB. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: <http://www.korpus.cz

Korpus ORAL2006: FIXME (????) Kopřivová, M. –- Waclawičová, M.: ORAL2006: korpus neformální mluvené češtiny. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: <http://www.korpus.cz>.

Korpus ORAL2008: Český národní korpus - ORAL2008. Ústav Českého národního korpusu FF UK, Praha 2008. Dostupný z WWW: <http://www.korpus.cz>.

Korpus ORAL2013: FIXME (????) Benešová, L. – Křen, M. – Waclawičová, M.: ORAL2013: reprezentativní korpus neformální mluvené češtiny. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: http://www.korpus.cz

Korpus PMK: Český národní korpus - PMK. Ústav Českého národního korpusu FF UK, Praha 2001. Dostupný z WWW: <http://www.korpus.cz>.

Citování nereferenčních korpusů

Analogicky odkazujte i na další korpusy s výjimkou korpusů InterCorp, SYN, DIAKORP a dalších nereferenčních korpusů, které na rozdíl ode všech výše uvedených nejsou neměnným referenčním zdrojem, a proto je potřeba udávat také čas přístupu podobně jako je tomu v případě citování webových stránek:

SYN: Český národní korpus - SYN. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: <http://www.korpus.cz>.

InterCorp: Český národní korpus - InterCorp. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: <http://www.korpus.cz>.

Při citaci konkrétního díla použijte seznam zdrojů korpusu SYN2000, SYN2005 nebo SYN2010.

Citování lemmatizace a tagování

Používáte-li lemmatizaci nebo morfologické značky (atributy lemma nebo tag v korpusech řady SYN), citujte také následující publikace:

Jan Hajič: Disambiguation of Rich Inflection (Computational Morphology of Czech). Vol. 1. Karolinum Charles University Press, Praha 2004.

Tomáš Jelínek (2008): Nové značkování v Českém národním korpusu. In: Naše řeč, 91, 1, pp. 13-20.

Drahomíra Spoustová, Jan Hajič, Jan Votrubec, Pavel Krbec, Pavel Květoň: The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: Proceedings of the Workshop on Balto-Slavonic Natural Language Processing. ACL 2007, Praha. pp. 67-74.

Vladimír Petkevič (2006): Reliable Morphological Disambiguation of Czech: Rule-Based Approach is Necessary. In: Insight into the Slovak and Czech Corpus Linguistics (Šimková M. ed.). Veda, Bratislava, pp. 26-44.

Citování speciálních aplikací a korpusů

Program SyD

Cvrček, V. - Vodnřička, P.: SyD - Korpusový průzkum variant. FF UK. Praha 2011. Dostupný z WWW: <http://syd.korpus.cz>.

Cvrček, V. - Vondřička, P.: Výzkum variability v korpusech češtiny. In: F. Čermák (ed).: Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů. NLN. Praha, (s. 184.195).

Korpus frWac

A. Ferraresi, S. Bernardini, G. Picci and M. Baroni (2010) “Web Corpora for Bilingual Lexicography: A Pilot Study of English/French Collocation Extraction and Translation”. In Xiao, R. (ed.) Using Corpora in Contrastive and Translation Studies. Newcastle: Cambridge Scholars Publishing. (PDF ke stažení)

Korpusy deWac, itWac, ukWac

M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209-226. (PDF ke stažení)