Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
| pojmy:struktura_korpusu [2015/04/13 10:01] – [Struktura v XML] vaclavcvrcek | pojmy:struktura_korpusu [2023/08/02 17:12] (aktuální) – jankrivan | ||
|---|---|---|---|
| Řádek 5: | Řádek 5: | ||
| Za účelem zachycení takovéto mnohovrstevnaté struktury se užívají značkovací jazyky. Standardem v této oblasti je formát [[wp> | Za účelem zachycení takovéto mnohovrstevnaté struktury se užívají značkovací jazyky. Standardem v této oblasti je formát [[wp> | ||
| - | ===== Vertikála | + | ===== Vertikála |
| Vertikála je interní formát sloužící pro zachycení struktury korpusu a textů v něm (spolu s jejich anotací). V korpusu [[cnk: | Vertikála je interní formát sloužící pro zachycení struktury korpusu a textů v něm (spolu s jejich anotací). V korpusu [[cnk: | ||
| Řádek 80: | Řádek 80: | ||
| </ | </ | ||
| - | Všimněme si značky, kterou automatický tagger přiřadil tvaru // | + | Všimněme si značky, kterou automatický tagger přiřadil tvaru // |
| Jednou ze zásad XML, z něhož je vertikála odvozena, je, že všechny struktury musí mít otevírací i ukončovací značku. Proto jsou nakonec všechny otevřené struktury uzavřeny: | Jednou ze zásad XML, z něhož je vertikála odvozena, je, že všechny struktury musí mít otevírací i ukončovací značku. Proto jsou nakonec všechny otevřené struktury uzavřeny: | ||
| Řádek 90: | Řádek 90: | ||
| </ | </ | ||
| - | ===== Vertikála | + | ===== Vertikála |
| Analogicky vypadá struktura korpusů mluveného jazyka, viz ukázka z korpusu [[cnk: | Analogicky vypadá struktura korpusů mluveného jazyka, viz ukázka z korpusu [[cnk: | ||