Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
cnk:syn:verze3 [2016/09/15 13:55]
Michal Křen [Jak citovat SYN verze 3]
cnk:syn:verze3 [2017/04/21 10:59] (aktuální)
Michal Škrabal [Složení korpusu SYN verze 3]
Řádek 26: Řádek 26:
 ^ <fs medium>​Referenční korpusy psaného jazyka (synchronní a obecné) v pořadí podle doby vzniku</​fs>​ ^^^^^^ ^ <fs medium>​Referenční korpusy psaného jazyka (synchronní a obecné) v pořadí podle doby vzniku</​fs>​ ^^^^^^
 ^ korpus ^ velikost (počet slov) ^ [[pojmy:​lemma|lemmatizace]] ^ [[pojmy:​tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^ ^ korpus ^ velikost (počet slov) ^ [[pojmy:​lemma|lemmatizace]] ^ [[pojmy:​tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^
-^ [[cnk:​syn2013PUB|SYN2013PUB]] | 935 mil. |  ​ANO  ​|  ​ANO  ​| ​ 2013  | korpus publicistických textů z let 2005-2009 | +^ [[cnk:​syn2013PUB|SYN2013PUB]] | 935 mil. |  ​✓  ​|  ​✓  ​| ​ 2013  | korpus publicistických textů z let 2005-2009 | 
-^ [[cnk:​syn2010|SYN2010]] | 100 mil. |  ​ANO  ​|  ​ANO  ​| ​ 2010  | reprezentativní korpus, převažují texty z let 2005–2009| +^ [[cnk:​syn2010|SYN2010]] | 100 mil. |  ​✓  ​|  ​✓  ​| ​ 2010  | reprezentativní korpus, převažují texty z let 2005–2009| 
-^ [[cnk:​syn2009PUB|SYN2009PUB]] | 700 mil. |  ​ANO  ​|  ​ANO  ​| ​ 2010  | korpus publicistických textů z let 1995–2007 | +^ [[cnk:​syn2009PUB|SYN2009PUB]] | 700 mil. |  ​✓  ​|  ​✓  ​| ​ 2010  | korpus publicistických textů z let 1995–2007 | 
-^ [[cnk:​syn2006PUB|SYN2006PUB]] | 300 mil. |  ​ANO  ​|  ​ANO  ​| ​ 2006  | korpus publicistických textů z let 1989–2004| +^ [[cnk:​syn2006PUB|SYN2006PUB]] | 300 mil. |  ​✓  ​|  ​✓  ​| ​ 2006  | korpus publicistických textů z let 1989–2004| 
-^ [[cnk:​syn2005|SYN2005]] | 100 mil. |  ​ANO  ​|  ​ANO  ​| ​ 2005  | reprezentativní korpus, převažují texty z let 2000–2004| +^ [[cnk:​syn2005|SYN2005]] | 100 mil. |  ​✓  ​|  ​✓  ​| ​ 2005  | reprezentativní korpus, převažují texty z let 2000–2004| 
-^ [[cnk:​syn2000|SYN2000]] | 100 mil. |  ​ANO  ​|  ​ANO  ​| ​ 2000  | reprezentativní korpus, převažují texty z let 1990–1999|+^ [[cnk:​syn2000|SYN2000]] | 100 mil. |  ​✓  ​|  ​✓  ​| ​ 2000  | reprezentativní korpus, převažují texty z let 1990–1999|
  
 Složení publicistické části korpusu SYN verze 3 pokrývá produkci hlavních celostátních deníků (Mladá fronta DNES, Lidové noviny, Právo, Hospodářské noviny, Blesk) a nespecializovaných časopisů (Reflex, Respekt, Týden) mezi lety 1998--2009. Tabulku s velikostí 15 titulů nejvíce zastoupených v publicistické části korpusu SYN verze 3 (s rozložením po jednotlivých letech; údaje jsou v milionech slov, tj. pozic bez započtení interpunkce) je možné stáhnout níže, náhled složení publicistické části je vidět na následujícím grafu. ​ Složení publicistické části korpusu SYN verze 3 pokrývá produkci hlavních celostátních deníků (Mladá fronta DNES, Lidové noviny, Právo, Hospodářské noviny, Blesk) a nespecializovaných časopisů (Reflex, Respekt, Týden) mezi lety 1998--2009. Tabulku s velikostí 15 titulů nejvíce zastoupených v publicistické části korpusu SYN verze 3 (s rozložením po jednotlivých letech; údaje jsou v milionech slov, tj. pozic bez započtení interpunkce) je možné stáhnout níže, náhled složení publicistické části je vidět na následujícím grafu. ​