AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:syn2000 [2015/04/14 18:05] – [Složení korpusu SYN2000] Václav Cvrčekcnk:syn2000 [2015/10/22 20:49] – + zmínka o FSC2000 Václav Horký
Řádek 22: Řádek 22:
  
 Korpus SYN2000 je [[pojmy:lemma|lemmatizovaný]] a morfologicky [[pojmy:tag|označkovaný]]. Upozorňujeme však, že vzhledem k tomu, že SYN2000 je také korpusem [[pojmy:referencni|referenčním]], jsou jeho lemmatizace a značkování na úrovni roku 2000, tedy nutně zastaralé a nespolehlivé. Kromě toho je pro identifikaci textu, ve kterém se vyskytl vyhledaný výraz, nezbytné použít [[seznamy:index#zdrojove_texty_korpusu|seznam zdrojových textů]], což je velice nepohodlné a zdlouhavé. Všem zájemcům o práci s texty korpusu SYN2000 proto doporučujeme pracovat namísto toho se subkorpusem korpusu [[SYN]]; ten lze pomocí [[pojmy:atributy_strukturni|strukturního atributu]] ''<opus.syn>'' snadno navolit tak, aby obsahoval [[cnk:syn#referencni_korpusy_jako_subkorpusy_v_syn|právě texty korpusu SYN2000]], ovšem s nejnovější lemmatizací, morfologickým značkováním a se snadno dostupnými bibliografickými údaji. Korpus SYN2000 je [[pojmy:lemma|lemmatizovaný]] a morfologicky [[pojmy:tag|označkovaný]]. Upozorňujeme však, že vzhledem k tomu, že SYN2000 je také korpusem [[pojmy:referencni|referenčním]], jsou jeho lemmatizace a značkování na úrovni roku 2000, tedy nutně zastaralé a nespolehlivé. Kromě toho je pro identifikaci textu, ve kterém se vyskytl vyhledaný výraz, nezbytné použít [[seznamy:index#zdrojove_texty_korpusu|seznam zdrojových textů]], což je velice nepohodlné a zdlouhavé. Všem zájemcům o práci s texty korpusu SYN2000 proto doporučujeme pracovat namísto toho se subkorpusem korpusu [[SYN]]; ten lze pomocí [[pojmy:atributy_strukturni|strukturního atributu]] ''<opus.syn>'' snadno navolit tak, aby obsahoval [[cnk:syn#referencni_korpusy_jako_subkorpusy_v_syn|právě texty korpusu SYN2000]], ovšem s nejnovější lemmatizací, morfologickým značkováním a se snadno dostupnými bibliografickými údaji.
 +
 +Upravenou podobou korpusu SYN2000 s vylepšenou [[pojmy:lemma|lemmatizací]] je korpus [[cnk:FSC2000]], který posloužil jako zdroj //Frekvenčního slovníku češtiny//.
  
 ===== Změny v korpusech řady SYN ===== ===== Změny v korpusech řady SYN =====
Řádek 36: Řádek 38:
 ==== Složení korpusu SYN2000 ==== ==== Složení korpusu SYN2000 ====
  
-[{{:cnk:syn2000-slozeni.png?direct&400|Složení korpusu SYN2000}}]+{{:cnk:syn2000-slozeni.png?direct&400|Složení korpusu SYN2000 na nejobecnější úrovni textové klasifikace}}
  
  
Řádek 56: Řádek 58:
 ===== Související odkazy ===== ===== Související odkazy =====
 <WRAP round box 49%> <WRAP round box 49%>
-[[cnk:syn|SYN]] • [[cnk:SYN2005|SYN2005]] • [[cnk:syn2006pub|SYN2006PUB]] • [[cnk:syn2009pub|SYN2009PUB]] • [[cnk:SYN2010|SYN2010]] • [[cnk:SYN2013PUB|SYN2013PUB]]+[[cnk:syn|SYN]] • [[cnk:FSC2000]] • [[cnk:SYN2005|SYN2005]] • [[cnk:syn2006pub|SYN2006PUB]] • [[cnk:syn2009pub|SYN2009PUB]] • [[cnk:SYN2010|SYN2010]] • [[cnk:SYN2013PUB|SYN2013PUB]]
 </WRAP> </WRAP>