AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:syn2006pub [2013/08/20 14:39] alzbetavitkovacnk:syn2006pub [2014/02/04 09:32] – [Složení korpusu SYN2006PUB] michalkren
Řádek 2: Řádek 2:
 ====== Korpus SYN2006PUB ====== ====== Korpus SYN2006PUB ======
  
-Korpus SYN2006PUB je [[pojmy:synchronni|synchronní]] korpus psané publicistiky o rozsahu 300 milionů textových slov ([[[[pojmy:token|tokenů]]). Obsahuje výhradně publicistiku od listopadu 1989 do konce roku 2004, tedy z období, jež pokrývají též korpusy [[SYN2000]] a [[SYN2005]]. Všechny tři korpusy jsou však co se zařazených textů týče **disjunktní**, tj. každý text může být zařazen pouze do jednoho z nich. Celkem tedy korpusy SYN2000, SYN2005 a SYN2006PUB obsahují 500 milionů textových slov, korpusy celé řady [[SYN]] pak obsahují 1,3 miliardy slov.+Korpus SYN2006PUB je [[pojmy:synchronni|synchronní]] korpus psané publicistiky o rozsahu 300 milionů textových slov ([[[[pojmy:token|tokenů]]). Obsahuje výhradně publicistiku od listopadu 1989 do konce roku 2004, tedy z období, jež pokrývají též korpusy [[SYN2000]] a [[SYN2005]]. Všechny korpusy řady SYN jsou však co se zařazených textů týče **disjunktní**, tj. každý text může být zařazen pouze do jednoho z nich.
  
 <WRAP right 35%> <WRAP right 35%>
Řádek 24: Řádek 24:
 ===== Složení korpusu SYN2006PUB ===== ===== Složení korpusu SYN2006PUB =====
  
-Je třeba zdůraznit, že korpus SYN2006PUB si v žádném ohledu nečiní nárok na reprezentativnost. Z grafů je zřejmé, že je nevyvážené jak složení korpusu podle roku vydání, tak podle titulů. Korpus SYN2006PUB tedy ocení především uživatelé, kteří potřebují pracovat s velkými objemy dat.+Je třeba zdůraznit, že korpus SYN2006PUB si v žádném ohledu nečiní nárok na reprezentativnost. Z grafů je zřejmé, že je nevyvážené jak složení korpusu podle roku vydání, tak podle titulů. Korpus SYN2006PUB tedy ocení především uživatelé, kteří potřebují pracovat s velkými objemy dat. 
  
  
Řádek 52: Řádek 52:
 ====== Související odkazy ====== ====== Související odkazy ======
 <WRAP round box 49%> <WRAP round box 49%>
-[[SYN2000]][[SYN2005]][[cnk:syn2010|SYN2010]][[SYN2009PUB]][[SYN]]+[[cnk:syn|SYN]] • [[cnk:syn2000|SYN2000]] • [[cnk:syn2005|SYN2005]] • [[cnk:syn2009pub|SYN2009PUB]] • [[cnk:syn2010|SYN2010]] • [[cnk:SYN2013PUB|SYN2013PUB]]
 </WRAP> </WRAP>