Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:syn2020:agregat [2020/12/17 19:21] – jankrivan | cnk:syn2020:agregat [2021/01/13 09:42] – tomasjelinek | ||
---|---|---|---|
Řádek 5: | Řádek 5: | ||
Jsou to tyto typy slov: | Jsou to tyto typy slov: | ||
- | 1. **spojky | + | 1. spojky |
- | 2. spojení víceméně jakýchkoli slov s **krátkým tvarem druhé osoby singuláru indikativu slovesa //být//** (//s//): | + | 2. spojení víceméně jakýchkoli slov s **krátkým tvarem druhé osoby singuláru indikativu |
* nejčastěji //ses//, //sis// (//smál ses//, //přála sis//), | * nejčastěji //ses//, //sis// (//smál ses//, //přála sis//), | ||
* dále spojení l-ových příčestí a //s// (// | * dále spojení l-ových příčestí a //s// (// | ||
* méně často spojení se zájmeny (//tos//, //komus//) i jinými slovy (// | * méně často spojení se zájmeny (//tos//, //komus//) i jinými slovy (// | ||
- | 3. zřídka i spojení slov s krátkým tvarem 2. osoby singuláru slovesa // | + | 3. zřídka i spojení slov s krátkým tvarem 2. osoby singuláru slovesa //být// **odděleným |
4. spojení **předložky se zájmenem** //co//, //copak// a //on//: //nač//, //očpak//, //zaň//, //doň//\\ | 4. spojení **předložky se zájmenem** //co//, //copak// a //on//: //nač//, //očpak//, //zaň//, //doň//\\ | ||
- | 5. zcela výjimečně spojení **předložky, | + | 5. zcela výjimečně spojení **předložky, |
Tyto agregáty řešíme tak, že původní slovo necháváme jako jeden token, ale tomuto tokenu přiřadíme dvě (tři) sady lemma + sublemma + tag + verbtag. V každém z těchto atributů jsou hodnoty z různých sad odděleny svislítkem. | Tyto agregáty řešíme tak, že původní slovo necháváme jako jeden token, ale tomuto tokenu přiřadíme dvě (tři) sady lemma + sublemma + tag + verbtag. V každém z těchto atributů jsou hodnoty z různých sad odděleny svislítkem. | ||
Řádek 31: | Řádek 31: | ||
\\ | \\ | ||
+ | Při zobrazení syntaktických stromů se jednotlivé části agregátů chovají jako samostatná syntaktická slova. Ve větě //aby ses měla nač vymluvit// jsou tři agregáty (//aby: aby|být//; //ses: se|být//; //nač: na|co//), celkem je ve větě pět tokenů, ale osm syntaktických slov:\\ | ||
+ | {{: | ||
+ | \\ | ||
%%%% >> [[cnk: | %%%% >> [[cnk: | ||