AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Poslední revizeObě strany příští revize
cnk:syn2020:agregat [2021/01/21 09:16] – [Korpus SYN2020: Agregáty] tomasjelinekcnk:syn2020:agregat [2022/01/03 14:04] – [Tokenizace a morfologické značkování] jankrivan
Řádek 32: Řádek 32:
  
 Hodnoty atributů u agregátů jsou tedy tzv. **multihodnoty** (pro daný token platí zároveň více hodnot atributu). V důsledku tohoto řešení lze (v pokročilém dotazu) hledat tokeny, které splňují zdánlivě nesmyslné podmínky, např. lemma tokenu je //proč// a zároveň //být// (%%[lemma = "proč" & lemma = "být"]%%) nebo je token adverbium a zároveň sloveso (%%[pos = "D" & pos = "V"]%%). Hodnoty atributů u agregátů jsou tedy tzv. **multihodnoty** (pro daný token platí zároveň více hodnot atributu). V důsledku tohoto řešení lze (v pokročilém dotazu) hledat tokeny, které splňují zdánlivě nesmyslné podmínky, např. lemma tokenu je //proč// a zároveň //být// (%%[lemma = "proč" & lemma = "být"]%%) nebo je token adverbium a zároveň sloveso (%%[pos = "D" & pos = "V"]%%).
 +
 +Poznámka: K dispozici je i zvláštní atribut ''sforma'' - syntaktický slovní tvar, který v rámci agregátu odpovídá jeho uspořádání (např. a|bych, se|s, na|ň), jinak je totožný s atributem ''word''. Atribut ''sforma'' je využit v syntaktickém značkování agregátů, viz níže.
  
 Chceme-li se z nějakého důvodu agregátům vyhnout, lze do pokročilého dotazu například přidat podmínku %%& tag != ".+\|.+"%% (tag neobsahuje "svislítko", tedy není to "multihodnota", není to "agregát"), například %%[lemma = "být" & tag != ".+\|.+"]%% vypíše všechny tvary slovesa //být// kromě "agregátů". Chceme-li se z nějakého důvodu agregátům vyhnout, lze do pokročilého dotazu například přidat podmínku %%& tag != ".+\|.+"%% (tag neobsahuje "svislítko", tedy není to "multihodnota", není to "agregát"), například %%[lemma = "být" & tag != ".+\|.+"]%% vypíše všechny tvary slovesa //být// kromě "agregátů".