AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn2013pub [2015/01/21 23:07] vaclavcvrcekcnk:syn2013pub [2022/08/29 18:07] (aktuální) – BatchEdit: pojmy>seznamy dokumenty cvrcek
Řádek 11: Řádek 11:
 ^ ::: ^ Počet [[pojmy:lemma|lemmat]] | 2 549 185 | ^ ::: ^ Počet [[pojmy:lemma|lemmat]] | 2 549 185 |
 ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:opus|opusů]] | 21 469 | ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:opus|opusů]] | 21 469 |
-^ ::: ^ Počet [[pojmy:atributy_strukturni|dokumentů]] | 4 172 882 |+^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|dokumentů]] | 4 172 882 |
 ^ ::: ^ Počet vět | 76 681 361 | ^ ::: ^ Počet vět | 76 681 361 |
 ^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO  |   ^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO  |  
Řádek 29: Řádek 29:
 Stejně jako ostatní publicistické korpusy řady [[SYN]] si ani SYN2013PUB v žádném ohledu nečiní nárok na reprezentativnost. Hlavním důvodem jeho vzniku byla kromě zveřejnění dalšího velkého balíku dat především potřeba doplnit a vyrovnat složení publicistiky v korpusu SYN tak, aby ve verzi 3, tj. po zařazení korpusu SYN2013PUB, obsahoval kompletní ročníky 2000–2009 významných publicistických titulů vydávaných v ČR. Na doplnění nabídky synchronních psaných korpusů o novější data se již pracuje.  Stejně jako ostatní publicistické korpusy řady [[SYN]] si ani SYN2013PUB v žádném ohledu nečiní nárok na reprezentativnost. Hlavním důvodem jeho vzniku byla kromě zveřejnění dalšího velkého balíku dat především potřeba doplnit a vyrovnat složení publicistiky v korpusu SYN tak, aby ve verzi 3, tj. po zařazení korpusu SYN2013PUB, obsahoval kompletní ročníky 2000–2009 významných publicistických titulů vydávaných v ČR. Na doplnění nabídky synchronních psaných korpusů o novější data se již pracuje. 
  
-**[[Grafy]]**+[{{:cnk:syn2013pub-roky.png?direct&325|Složení korpusu SYN2013PUB podle let}}] 
 +[{{:cnk:syn2013pub-tituly.png?direct&500|Složení korpusu SYN2013PUB podle titulů}}]
  
 ===== Struktura korpusu SYN2013PUB ===== ===== Struktura korpusu SYN2013PUB =====
  
 Mezi [[pojmy:atributy_strukturni|strukturní jednotky]] používané v tomto korpusu patří ''<opus>'', ''<doc>'' a ''<s>'', tedy text, dokument a věta - a pak každá jednotlivá [[pojmy:atributy_strukturni#pozice_jako_strukturni_jednotka|pozice]]. Mezi [[pojmy:atributy_strukturni|strukturní jednotky]] používané v tomto korpusu patří ''<opus>'', ''<doc>'' a ''<s>'', tedy text, dokument a věta - a pak každá jednotlivá [[pojmy:atributy_strukturni#pozice_jako_strukturni_jednotka|pozice]].
-Zobrazit si je můžete v položce menu [[manualy:kontext:moznosti_zobrazeni|Možnosti zobrazení]]+Zobrazit si je můžete v položce menu [[manualy:kontext:moznosti_zobrazeni|Zobrazení]]
  
-[{{:cnk:struktur_znacky.jpg?300|Strukturní jednotky korpusu SYN2013PUB.}}]+[{{:cnk:struktur_znacky.png?direct&400| Strukturní jednotky korpusu SYN2013PUB.}}]
  
 K těmto strukturním jednotkám náležejí [[pojmy:atributy_strukturni#strukturni_atributy_atributy_strukturnich_jednotek|následující atributy]], na obrázku patrné pod nadpisem Reference. K těmto strukturním jednotkám náležejí [[pojmy:atributy_strukturni#strukturni_atributy_atributy_strukturnich_jednotek|následující atributy]], na obrázku patrné pod nadpisem Reference.
  
 ====== Jak citovat SYN2013PUB ====== ====== Jak citovat SYN2013PUB ======
-<WRAP round tip 30%> +<WRAP round tip 70%> 
-//Český národní korpus - SYN2013PUB//. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: <http://www.korpus.cz>FIXME+Křen, M. – Hnátková, M. – Jelínek, T. – Petkevič, V. – Procházka, P. – Skoumalová, H.: //SYN2013PUB: korpus psané publicistiky//. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: http://www.korpus.cz 
 + 
 +Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): [[http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf|The SYN-series corpora of written Czech]]. In //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, 160–164. Reykjavík: ELRA. ISBN 978-2-9517408-8-4.
 </WRAP> </WRAP>
  
  
  --- //Michal Křen, Olga Richterová//  --- //Michal Křen, Olga Richterová//
- 
 ====== Související odkazy ====== ====== Související odkazy ======
 <WRAP round box 49%> <WRAP round box 49%>
 [[cnk:syn|SYN]] • [[cnk:syn2000|SYN2000]] • [[cnk:syn2005|SYN2005]] • [[cnk:syn2006pub|SYN2006PUB]] • [[cnk:syn2009pub|SYN2009PUB]] • [[cnk:syn2010|SYN2010]] [[cnk:syn|SYN]] • [[cnk:syn2000|SYN2000]] • [[cnk:syn2005|SYN2005]] • [[cnk:syn2006pub|SYN2006PUB]] • [[cnk:syn2009pub|SYN2009PUB]] • [[cnk:syn2010|SYN2010]]
 </WRAP> </WRAP>