Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize | ||
cnk:citace [2013/12/28 20:29] – lukasjanicik | cnk:citace [2023/10/13 17:10] – [Lemmatizace a tagování] jankrivan | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
+ | ~~NOTOC~~ | ||
+ | |||
====== Jak citovat korpusy zpřístupňované ČNK ====== | ====== Jak citovat korpusy zpřístupňované ČNK ====== | ||
- | FIXME | ||
- | [[Michal Křen aktualizuje]] | + | [{{ : |
+ | |||
+ | ==== Způsoby citování korpusů ==== | ||
+ | |||
+ | |||
+ | |||
+ | Existují v zásadě dva způsoby, jakým korpusy při vědecké práci citovat: | ||
+ | |||
+ | - uvedení korpusu jako pramene či zdroje dat; | ||
+ | - uvedení odkazu na konkrétní článek, který popisuje vznik korpusu a jeho složení. | ||
+ | |||
+ | Volba mezi těmito dvěma možnostmi je na zvážení uživatele a záleží také na konkrétním účelu citace; samozřejmě je možné oba způsoby kombinovat. Konkrétní podobu citace najdete jednak v této wiki na stránce věnované konkrétnímu korpusu a jednak v rozhraní [[manualy: | ||
+ | |||
+ | Citace ad 1) je uvedena vždy, citace ad 2) pouze v KonTextu a jen pro většinu korpusů; chybí tedy v případě, kdy se žádný článek s popisem korpusu nepodařilo dohledat. Kromě konkrétního bibliografického údaje však můžete u některých korpusů v KonTextu najít přímo webový odkaz na adresu, z níž je možné článek stáhnout. | ||
- | === Citování | + | ==== Citování |
- | V bibliografii | + | Při citování [[pojmy: |
- | **Korpus SYN2010:** | + | Při citaci |
- | //Český národní korpus - SYN2010//. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>. | + | |
- | **Korpus SYN2009PUB: | + | ==== Lemmatizace a tagování ==== |
- | //Český národní korpus - SYN2009PUB// | + | |
- | **Korpus SYN2006PUB:** | + | Používáte-li [[pojmy: |
- | //Český národní korpus - SYN2006PUB//. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: <http://www.korpus.cz> | + | |
- | **Korpus SYN2005:** | + | Tomáš Jelínek, Jan Křivan, Vladimír Petkevič, Hana Skoumalová, |
- | //Český národní korpus - SYN2005//. Ústav Českého národního korpusu FF UK, Praha 2005. Dostupný z WWW: <http://www.korpus.cz>. | + | |
- | **Korpus SYN2000: | + | Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/ |
- | //Český národní korpus - SYN2000//. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: <http://www.korpus.cz>. | + | |
- | **Korpus SYN2013PUB: | + | Můžete také uvést některý z následujících článků, které se použité anotace týkají: |
- | Český národní korpus - SYN2013PUB. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: <http:// | + | |
- | **Korpus ORAL2006:** FIXME (????) | + | Jan Hajič (2004): // |
- | Kopřivová, | + | |
- | **Korpus ORAL2008:** | + | Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC' |
- | //Český národní korpus - ORAL2008//. Ústav Českého národního korpusu FF UK, Praha 2008. Dostupný z WWW: <http://www.korpus.cz>. | + | |
- | **Korpus ORAL2013:** FIXME (????) | + | Vladimír Petkevič |
- | Benešová, L. – Křen, M. – Waclawičová, | + | |
- | **Korpus PMK:** | + | Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, |
- | //Český národní korpus - PMK//. Ústav Českého národního korpusu FF UK, Praha 2001. Dostupný z WWW: < | + | |
- | === Citování nereferenčních korpusů === | + | V případě lemmatizace a značkování mluveného korpusu ORAL můžete citovat také následující publikaci: |
- | Analogicky odkazujte i na další korpusy s výjimkou korpusů **InterCorp, SYN, DIAKORP** a dalších [[pojmy:referencni|nereferenčních korpusů]], které na rozdíl ode všech výše uvedených nejsou neměnným referenčním zdrojem, a proto je potřeba udávat také čas přístupu podobně jako je tomu v případě citování webových stránek: | + | Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. //Korpus -- gramatika -- axiologie// 15, s. 47–67. |
- | **SYN:** | + | ==== Citování aplikací ==== |
- | Český národní korpus - SYN. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: | + | |
- | < | + | |
- | **InterCorp:** | + | **[[manualy:wag|Slovo v kostce (WaG)]]** |
- | Český národní korpus - InterCorp. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: | + | |
- | < | + | |
- | <WRAP round tip 40%> | + | Tomáš Machálek (2019): Slovo v kostce -- agregátor slovních profilů. FF UK, Praha. Dostupný z WWW: <http:// |
- | Při citaci **konkrétního díla** použijte [[seznamy:index|seznam zdrojů]] korpusu [[https://trnka.ff.cuni.cz/ | + | Tomáš Machálek (2019): Word at a Glance – a Customizable Word Profile Aggregator. In: // |
- | </ | + | |Proceedings of the CLARIN Annual Conference 2019]]//, s. 85–88. |
- | + | **[[manualy: | |
- | === Citování lemmatizace a tagování === | + | |
- | Používáte-li [[pojmy:lemma|lemmatizaci]] nebo [[pojmy:tag|morfologické značky]] (atributy | + | Tomáš Machálek (2014): KonText |
+ | Tomáš Machálek (2020): KonText: Advanced and Flexible Corpus Query Interface. In: // | ||
- | Jan Hajič: // | + | **[[manualy:syd|SyD]]** |
- | Tomáš Jelínek | + | Václav Cvrček – Pavel Vondřička |
- | Drahomíra Spoustová, Jan Hajič, Jan Votrubec, | + | Václav Cvrček – Pavel Vondřička (2011): Výzkum variability v korpusech češtiny. In: František Čermák (ed.): //Korpusová lingvistika Praha 2011. 2. Výzkum a výstavba korpusů.// NLN, Praha, s. 184–195. |
- | Vladimír Petkevič (2006): Reliable Morphological Disambiguation of Czech: Rule-Based Approach is Necessary. In: //Insight into the Slovak and Czech Corpus Linguistics (Šimková M. ed.)//. Veda, Bratislava, pp. 26-44. | + | **[[manualy:morfio|Morfio]]** |
- | === Citování speciálních aplikací a korpusů === | + | Václav Cvrček – Pavel Vondřička (2013): Morfio -- aplikace pro analýzu slovotvorných vztahů. FF UK, Praha. Dostupný z WWW: < |
- | == Program SyD == | + | Václav |
- | Cvrček, V. - Vodnřička, P.: SyD - Korpusový průzkum variant. FF UK. Praha 2011. Dostupný z WWW: <http://syd.korpus.cz>. | + | |
- | Cvrček, V. - Vondřička, | + | **[[manualy:kwords|KWords]]** |
- | == Korpus frWac == | + | Václav Cvrček – Pavel Vondřička (2013): KWords -- aplikace pro extrakci klíčových slov. FF UK, Praha. Dostupný z WWW: < |
- | A. Ferraresi, S. Bernardini, G. Picci and M. Baroni (2010) “Web Corpora for Bilingual Lexicography: | + | **[[manualy:treq|Treq]]** |
- | == Korpusy deWac, itWac, ukWac == | + | Martin Vavřín – Alexandr Rosen (2015): Treq -- databáze překladových ekvivalentů. FF UK, Praha. Dostupný z WWW: < |
- | M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209-226. ([[http://wacky.sslmit.unibo.it/lib/exe/fetch.php? | + | Michal Škrabal – Martin Vavřín |
+ | Michal Škrabal – Martin Vavřín (2017): The Translation Equivalents Database (Treq) as a Lexicographer’s Aid. In: I. Kosem et al. (eds): // |