Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
cnk:citace [2014/03/11 18:11] – [Způsoby citování korpusů] Michal Křen | cnk:citace [2023/10/13 17:12] (aktuální) – [Lemmatizace a tagování] Jan Křivan | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
+ | ~~NOTOC~~ | ||
+ | |||
====== Jak citovat korpusy zpřístupňované ČNK ====== | ====== Jak citovat korpusy zpřístupňované ČNK ====== | ||
- | FIXME | ||
- | [[Michal Křen aktualizuje]] | + | [{{ : |
==== Způsoby citování korpusů ==== | ==== Způsoby citování korpusů ==== | ||
+ | |||
+ | |||
Existují v zásadě dva způsoby, jakým korpusy při vědecké práci citovat: | Existují v zásadě dva způsoby, jakým korpusy při vědecké práci citovat: | ||
Řádek 11: | Řádek 14: | ||
- uvedení odkazu na konkrétní článek, který popisuje vznik korpusu a jeho složení. | - uvedení odkazu na konkrétní článek, který popisuje vznik korpusu a jeho složení. | ||
- | Volba mezi těmito dvěma možnostmi je na zvážení uživatele a záleží také na konkrétním účelu citace; samozřejmě je možné | + | Volba mezi těmito dvěma možnostmi je na zvážení uživatele a záleží také na konkrétním účelu citace; samozřejmě je možné oba způsoby |
+ | Citace ad 1) je uvedena vždy, citace ad 2) pouze v KonTextu a jen pro většinu korpusů; chybí tedy v případě, kdy se žádný článek s popisem korpusu nepodařilo dohledat. Kromě konkrétního bibliografického údaje však můžete u některých korpusů v KonTextu najít přímo webový odkaz na adresu, z níž je možné článek stáhnout. | ||
- | ==== Citování nereferenčních korpusů ==== | ||
- | Analogicky odkazujte i na další korpusy s výjimkou korpusů **InterCorp, | + | ==== Citování |
- | + | ||
- | **SYN:** | + | |
- | Český národní korpus - SYN. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: | + | |
- | < | + | |
- | + | ||
- | **InterCorp: | + | |
- | Český národní korpus - InterCorp. Ústav Českého národního korpusu FF UK, Praha. Cit.24.09.2013 , dostupný z WWW: | + | |
- | < | + | |
- | + | ||
- | <WRAP round tip 40%> | + | |
- | Při citaci **konkrétního díla** použijte | + | Při citování |
- | </ | + | |
- | + | Při citaci **konkrétního díla** lze použít také [[seznamy: | |
- | ==== Citování lemmatizace a tagování ==== | + | |
- | Používáte-li [[pojmy: | + | ==== Lemmatizace a tagování ==== |
+ | * Používáte-li [[pojmy: | ||
- | Jan Hajič: //Disambiguation of Rich Inflection (Computational Morphology | + | Tomáš Jelínek, |
- | Tomáš Jelínek | + | Křivan, J. – Šindlerová, |
- | Drahomíra Spoustová, Jan Hajič, Jan Votrubec, Pavel Krbec, Pavel Květoň: The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: // | + | * Můžete také uvést některý z následujících |
- | Vladimír Petkevič (2006): Reliable Morphological | + | Jan Hajič (2004): //Disambiguation |
- | ==== Citování speciálních aplikací a korpusů ==== | + | Milena Hnátková, Michal Křen, Pavel Procházka, Hana Skoumalová (2014): The SYN-series corpora of written Czech. In: // |
- | == Program SyD == | + | Vladimír Petkevič (2014): Problémy automatické morfologické disambiguace češtiny. // |
- | Cvrček, V. - Vodnřička, P.: SyD - Korpusový průzkum variant. FF UK. Praha 2011. Dostupný z WWW: <http://syd.korpus.cz>. | + | |
- | Cvrček, V. - Vondřička, P.: Výzkum variability v korpusech | + | Milan Straka, Jana Straková, Jan Hajič (2019): Czech Text Processing with Contextual Embeddings: POS Tagging, Lemmatization, |
- | == Korpus frWac == | + | * V případě lemmatizace a značkování mluveného korpusu ORAL můžete citovat také následující publikaci: |
- | A. Ferraresi, S. Bernardini, G. Picci and M. Baroni | + | Marie Kopřivová, Zuzana Komrsková, David Lukeš, Petra Poukarová |
- | == Korpusy deWac, itWac, ukWac == | + | ==== Citování aplikací ==== |
- | M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209-226. ([[http:// | + | **[[manualy:wag|Slovo v kostce (WaG)]]** |
+ | Tomáš Machálek (2019): Slovo v kostce -- agregátor slovních profilů. FF UK, Praha. Dostupný z WWW: < | ||
- | ===== Výběr z literatury ===== | + | Tomáš Machálek (2019): Word at a Glance – a Customizable Word Profile Aggregator. In: // |
+ | |Proceedings of the CLARIN Annual Conference 2019]]//, s. 85–88. | ||
- | **SYN:** | + | **[[manualy:kontext:index|KonText]]** |
- | Křen, M. (2009): The SYN Concept: Towards One-Billion Corpus of Czech. In Mahlberg, M. – González-Díaz, | + | |
- | **CZeSL-plain: | + | Tomáš Machálek |
- | Šebesta, K. – Škodová, S. et al. (2012): *Čeština – cílový jazyk a korpusy*. Liberec: Technická univerzita v Liberci. ISBN 978-80-7372-848-9. | + | |
- | **KSK-dopisy: | + | Tomáš Machálek |
- | Hladká, Z. (2013): Korpusové zpracování soukromé korespondence v ÚČJ FF MU v Brně. In Hladká, Z. et al., *Soukromá korespondence jako lingvistický pramen*, 7-17. Brno: Masarykova univerzita. ISBN 978-80-210-6140-8. | + | |
- | **KSK-dopisy:** | + | **[[manualy:syd|SyD]]** |
- | Hladká, Z. (2006): Der zeitgenössische tschechische private Briefverkehr in einem elektronischen Korpus. In *Zeitschrift für Slawistik*, 51(3), 333–337. Berlin. ISSN 0044-3506 | + | |
- | **SKRIPT2012: | + | Václav Cvrček – Pavel Vondřička |
- | Šebesta, K. (2010): Korpusy češtiny a osvojování jazyka. In *Studie z aplikované lingvistiky*, 2, 11–33. Praha: Filozofická fakulta UK. ISSN 1804-3240. | + | |
- | **FSC2000: | + | Václav Cvrček |
- | Čermák, F. – Křen, M. (eds) (2004): *Frekvenční slovník | + | |
- | **TOTALITA:** | + | **[[manualy:morfio|Morfio]]** |
- | Čermák, F. – Cvrček, V. – Schmiedtová, | + | |
- | **ORAL2013: | + | Václav Cvrček – Pavel Vondřička (2013): Morfio -- aplikace pro analýzu slovotvorných vztahů. FF UK, Praha. Dostupný z WWW: <http://morfio.korpus.cz>. |
- | Válková, L. – Waclawičová, M. – Křen, M. (2012): Balanced data repository of spontaneous spoken Czech. In *Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC' | + | |
- | **ORAL2008: | + | Václav Cvrček – Pavel Vondřička (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Gaudeamus, Hradec Králové. |
- | Waclawičová, M. – Křen, M. – Válková, L. (2009): Balanced Corpus of Informal Spoken Czech: Compilation, | + | |
- | **ORAL2006:** | + | **[[manualy:kwords|KWords]]** |
- | Kopřivová, | + | |
- | **BMK:** | + | Václav Cvrček – Pavel Vondřička |
- | Hladká, Z. (2005): Zkušenosti s tvorbou korpusů | + | |
- | **SCHOLA2010:** | + | **[[manualy:treq|Treq]]** |
- | Šebesta, K. (2010): Korpusy češtiny a osvojování jazyka. In *Studie z aplikované lingvistiky*, | + | |
- | **HOTKO: | + | Martin Vavřín – Alexandr Rosen (2015): Treq -- databáze překladových ekvivalentů. FF UK, Praha. Dostupný z WWW: <http://treq.korpus.cz>. |
- | Wölkowa, S. (2013): Hornjoserbski tekstowy korpus w nowej formje. In: *Serbska šula*, 66(2), 44–47. http:// | + | |
- | **deWaC, itWaC, ukWaC:** | + | Michal Škrabal |
- | Baroni, M. – Bernardini, S. – Ferraresi, A. – Zanchetta, E. (2009): The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. In *Language Resources and Evaluation*, | + | |
- | **frWaC: | + | Michal Škrabal |
- | Ferraresi, A. – Bernardini, S. – Picci, G. – Baroni, M. (2010): Web Corpora for Bilingual Lexicography: | + |