AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:syn2020:agregat [2020/12/17 19:16] jankrivancnk:syn2020:agregat [2021/01/13 09:42] tomasjelinek
Řádek 5: Řádek 5:
 Jsou to tyto typy slov: Jsou to tyto typy slov:
  
-1. **spojky //aby//, //kdyby//**: chovají se jako spojky, ale zároveň obsahují kondicionálový tvar slovesa //být// (//kdyby pracoval//); podobně je značena **spojka //jako//** v případech, kdy tvoří pravopisný slitek s kondicionálem (//jakoby se ztratil// odpovídající spojení //jako by se ztratil//)+1. spojky **//aby//****//kdyby//**: chovají se jako spojky, ale zároveň obsahují kondicionálový tvar slovesa //být// (//abych zjistila//, //kdyby pracoval//); podobně je značena spojka **//jako//** v případech, kdy tvoří pravopisný slitek s kondicionálovým tvarem (//jakoby se ztratil// odpovídající spojení //jako by se ztratil//)
  
-2. spojení víceméně jakýchkoli slov s **krátkým tvarem druhé osoby singuláru indikativu slovesa //být//** (//s//):+2. spojení víceméně jakýchkoli slov s **krátkým tvarem druhé osoby singuláru indikativu prézentu slovesa //být//** (//s//):
   * nejčastěji //ses//, //sis// (//smál ses//, //přála sis//),   * nejčastěji //ses//, //sis// (//smál ses//, //přála sis//),
   * dále spojení l-ových příčestí a //s// (//dělalas//, //viděls//),    * dále spojení l-ových příčestí a //s// (//dělalas//, //viděls//), 
   * méně často spojení se zájmeny (//tos//, //komus//) i jinými slovy (//vždyťs//, //knihus//)\\   * méně často spojení se zájmeny (//tos//, //komus//) i jinými slovy (//vždyťs//, //knihus//)\\
  
-3. zřídka i spojení slov s krátkým tvarem 2. osoby singuláru slovesa //být// odděleného od původního slovesa **apostrofem** (či znakem apostrofu podobným): //ty´s//+3. zřídka i spojení slov s krátkým tvarem 2. osoby singuláru slovesa //být// **odděleným apostrofem** (či znakem apostrofu podobným): //proto's//, //ty´s//
  
 4. spojení **předložky se zájmenem** //co//, //copak// a //on//: //nač//, //očpak//, //zaň//, //doň//\\ 4. spojení **předložky se zájmenem** //co//, //copak// a //on//: //nač//, //očpak//, //zaň//, //doň//\\
  
-5. zcela výjimečně spojení **předložky, zájmena a tvaru //s//** (2. osoby singuláru //být//): //načs//\\+5. zcela výjimečně spojení **předložky, zájmena a 2. osoby singuláru slovesa //být//**: //načs//\\
  
 Tyto agregáty řešíme tak, že původní slovo necháváme jako jeden token, ale tomuto tokenu přiřadíme dvě (tři) sady lemma + sublemma + tag + verbtag. V každém z těchto atributů jsou hodnoty z různých sad odděleny svislítkem. Tyto agregáty řešíme tak, že původní slovo necháváme jako jeden token, ale tomuto tokenu přiřadíme dvě (tři) sady lemma + sublemma + tag + verbtag. V každém z těchto atributů jsou hodnoty z různých sad odděleny svislítkem.
Řádek 22: Řádek 22:
 Výsledek pak vypadá třeba takto:\\ Výsledek pak vypadá třeba takto:\\
 ^ word ^ lemma ^ tag ^ verbtag^ ^ word ^ lemma ^ tag ^ verbtag^
-| <code>abych</code> | <code>aby|být</code> | <code>J,-------------|Vc-S---1----I--</code> | <code> ------|A----- </code> |+| <code>abych</code> | <code>aby|být</code> | <code>J,-------------|Vc-S---1----I--</code> | <code>------|A----- </code> |
 | <code>ses</code> | <code>se|být</code> | <code>P7--4----------|VB-S---2P-AAI-1</code> | <code>------|A-----</code> | | <code>ses</code> | <code>se|být</code> | <code>P7--4----------|VB-S---2P-AAI-1</code> | <code>------|A-----</code> |
 | <code>naň</code> | <code>na|on</code> | <code>RR--4----------|P5MS2--3-------</code> | <code>------|------</code> | | <code>naň</code> | <code>na|on</code> | <code>RR--4----------|P5MS2--3-------</code> | <code>------|------</code> |
Řádek 31: Řádek 31:
 \\ \\
  
 +Při zobrazení syntaktických stromů se jednotlivé části agregátů chovají jako samostatná syntaktická slova. Ve větě //aby ses měla nač vymluvit// jsou tři agregáty (//aby: aby|být//; //ses: se|být//; //nač: na|co//), celkem je ve větě pět tokenů, ale osm syntaktických slov:\\
 +{{:cnk:syn2020:agregaty_syntax.png?250|Zobrazení agregátů v syntaktickém stromu }}\\
 +\\
 %%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]] %%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]]