Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
pojmy:struktura_korpusu [2015/04/13 10:01]
Václav Cvrček [Struktura v XML]
pojmy:struktura_korpusu [2016/09/04 10:39] (aktuální)
Michal Škrabal
Řádek 5: Řádek 5:
 Za účelem zachycení takovéto mnohovrstevnaté struktury se užívají značkovací jazyky. Standardem v této oblasti je formát [[wp>​xml|XML]],​ často se ovšem používají i různé formy jazyka [[wp>​Standard_Generalized_Markup_Language|SGML]]. Za účelem zachycení takovéto mnohovrstevnaté struktury se užívají značkovací jazyky. Standardem v této oblasti je formát [[wp>​xml|XML]],​ často se ovšem používají i různé formy jazyka [[wp>​Standard_Generalized_Markup_Language|SGML]].
  
-===== Vertikála ​-- korpusy psaného jazyka =====+===== Vertikála ​– korpusy psaného jazyka =====
  
 Vertikála je interní formát sloužící pro zachycení struktury korpusu a textů v něm (spolu s jejich anotací). V korpusu [[cnk:​syn2010|SYN2010]] má např. následující podobu (jedná se o ukázku z díla A. C. Doyla Příběhy Sherlocka Holmese, konkrétně o větu //Když školení skončilo, přidělili mne k pátému northumberlandskému střeleckému pluku jako pomocného chirurga.//,​ která se nachází na začátku celé knihy): Vertikála je interní formát sloužící pro zachycení struktury korpusu a textů v něm (spolu s jejich anotací). V korpusu [[cnk:​syn2010|SYN2010]] má např. následující podobu (jedná se o ukázku z díla A. C. Doyla Příběhy Sherlocka Holmese, konkrétně o větu //Když školení skončilo, přidělili mne k pátému northumberlandskému střeleckému pluku jako pomocného chirurga.//,​ která se nachází na začátku celé knihy):
Řádek 90: Řádek 90:
 </​code>​ </​code>​
  
-===== Vertikála ​korpusy mluveného jazyka =====+===== Vertikála ​– korpusy mluveného jazyka =====
  
 Analogicky vypadá struktura korpusů mluveného jazyka, viz ukázka z korpusu [[cnk:​oral2008|ORAL2008]]:​ Analogicky vypadá struktura korpusů mluveného jazyka, viz ukázka z korpusu [[cnk:​oral2008|ORAL2008]]:​