Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
pojmy:struktura_korpusu [2015/04/13 10:01] – [Struktura v XML] vaclavcvrcek | pojmy:struktura_korpusu [2023/08/02 17:12] (aktuální) – jankrivan | ||
---|---|---|---|
Řádek 5: | Řádek 5: | ||
Za účelem zachycení takovéto mnohovrstevnaté struktury se užívají značkovací jazyky. Standardem v této oblasti je formát [[wp> | Za účelem zachycení takovéto mnohovrstevnaté struktury se užívají značkovací jazyky. Standardem v této oblasti je formát [[wp> | ||
- | ===== Vertikála | + | ===== Vertikála |
Vertikála je interní formát sloužící pro zachycení struktury korpusu a textů v něm (spolu s jejich anotací). V korpusu [[cnk: | Vertikála je interní formát sloužící pro zachycení struktury korpusu a textů v něm (spolu s jejich anotací). V korpusu [[cnk: | ||
Řádek 80: | Řádek 80: | ||
</ | </ | ||
- | Všimněme si značky, kterou automatický tagger přiřadil tvaru // | + | Všimněme si značky, kterou automatický tagger přiřadil tvaru // |
Jednou ze zásad XML, z něhož je vertikála odvozena, je, že všechny struktury musí mít otevírací i ukončovací značku. Proto jsou nakonec všechny otevřené struktury uzavřeny: | Jednou ze zásad XML, z něhož je vertikála odvozena, je, že všechny struktury musí mít otevírací i ukončovací značku. Proto jsou nakonec všechny otevřené struktury uzavřeny: | ||
Řádek 90: | Řádek 90: | ||
</ | </ | ||
- | ===== Vertikála | + | ===== Vertikála |
Analogicky vypadá struktura korpusů mluveného jazyka, viz ukázka z korpusu [[cnk: | Analogicky vypadá struktura korpusů mluveného jazyka, viz ukázka z korpusu [[cnk: |