Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:syn2020:agregat [2020/12/17 19:18] – jankrivan | cnk:syn2020:agregat [2020/12/21 14:24] – jankrivan | ||
---|---|---|---|
Řádek 5: | Řádek 5: | ||
Jsou to tyto typy slov: | Jsou to tyto typy slov: | ||
- | 1. **spojky | + | 1. spojky |
- | 2. spojení víceméně jakýchkoli slov s **krátkým tvarem druhé osoby singuláru indikativu slovesa //být//** (//s//): | + | 2. spojení víceméně jakýchkoli slov s **krátkým tvarem druhé osoby singuláru indikativu |
* nejčastěji //ses//, //sis// (//smál ses//, //přála sis//), | * nejčastěji //ses//, //sis// (//smál ses//, //přála sis//), | ||
* dále spojení l-ových příčestí a //s// (// | * dále spojení l-ových příčestí a //s// (// | ||
* méně často spojení se zájmeny (//tos//, //komus//) i jinými slovy (// | * méně často spojení se zájmeny (//tos//, //komus//) i jinými slovy (// | ||
- | 3. zřídka i spojení slov s krátkým tvarem 2. osoby singuláru slovesa // | + | 3. zřídka i spojení slov s krátkým tvarem 2. osoby singuláru slovesa //být// **odděleným |
4. spojení **předložky se zájmenem** //co//, //copak// a //on//: //nač//, //očpak//, //zaň//, //doň//\\ | 4. spojení **předložky se zájmenem** //co//, //copak// a //on//: //nač//, //očpak//, //zaň//, //doň//\\ | ||
- | 5. zcela výjimečně spojení **předložky, | + | 5. zcela výjimečně spojení **předložky, |
Tyto agregáty řešíme tak, že původní slovo necháváme jako jeden token, ale tomuto tokenu přiřadíme dvě (tři) sady lemma + sublemma + tag + verbtag. V každém z těchto atributů jsou hodnoty z různých sad odděleny svislítkem. | Tyto agregáty řešíme tak, že původní slovo necháváme jako jeden token, ale tomuto tokenu přiřadíme dvě (tři) sady lemma + sublemma + tag + verbtag. V každém z těchto atributů jsou hodnoty z různých sad odděleny svislítkem. | ||
Řádek 22: | Řádek 22: | ||
Výsledek pak vypadá třeba takto:\\ | Výsledek pak vypadá třeba takto:\\ | ||
^ word ^ lemma ^ tag ^ verbtag^ | ^ word ^ lemma ^ tag ^ verbtag^ | ||
- | | < | + | | < |
| < | | < | ||
| < | | < |