AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn2020:lemmatizace [2020/12/22 02:32] – [2. Sublemmata jako synonymní varianty v části paradigmatu] Jan Křivancnk:syn2020:lemmatizace [2022/11/23 11:18] (aktuální) Jan Křivan
Řádek 1: Řádek 1:
-~~NOTOC~~ 
- 
 ====== Korpus SYN2020: Lemmatizace ====== ====== Korpus SYN2020: Lemmatizace ======
  
Řádek 12: Řádek 10:
  
   * **ortografická** variantnost, zejména ve slovech cizího původu: s/z (filozof: filozof/filosof; organismus: organismus/organizmus), o/ó (citron: citron/citrón), t/th (teolog: teolog/theolog) a další změny (camping: camping/kempink; lobbista: lobbista/lobista; tsunami: tsunami/cunami; rádio: rádio/radio; brífink: brífink/briefing aj.)    * **ortografická** variantnost, zejména ve slovech cizího původu: s/z (filozof: filozof/filosof; organismus: organismus/organizmus), o/ó (citron: citron/citrón), t/th (teolog: teolog/theolog) a další změny (camping: camping/kempink; lobbista: lobbista/lobista; tsunami: tsunami/cunami; rádio: rádio/radio; brífink: brífink/briefing aj.) 
 +
   * **hlásková** variantnost: ý/ej (mýdlo: mýdlo/mejdlo), í/ej/é (vylézat: vylézat/vylízat/vylejzat) a další změny (seškrábat: seškrábat/seškrabat; dolík: dolík/ďolík; přilba: přilba/přílba aj.)   * **hlásková** variantnost: ý/ej (mýdlo: mýdlo/mejdlo), í/ej/é (vylézat: vylézat/vylízat/vylejzat) a další změny (seškrábat: seškrábat/seškrabat; dolík: dolík/ďolík; přilba: přilba/přílba aj.)
-  * variantnost v použití **spojovníku**: (emailemail/e-mail; gore-tex: gore-tex/goretex); \\ variantní sublemmata jsou uvedena ve [[cnk:syn2020:seznamy:spojovnik_nespojovnik_sublemmata|zvláštním seznamu]].  + 
-  * speciálním případem jsou alternace tvarů **deverbativních adjektiv**: (stažený: stažený/stáhnutý); \\ variantní sublemmata jsou uvedena ve [[cnk:syn2020:seznamy:deverbativni_adj_sublemmata|zvláštnímu seznamu]].+  * variantnost v použití **spojovníku**: (popmusicpopmusic/pop-music; gore-tex: gore-tex/goretex); \\ variantní sublemmata s alternací spojovníku jsou uvedena ve [[cnk:syn2020:seznamy:spojovnik_nespojovnik_sublemmata|zvláštním seznamu]].  
 + 
 +  * speciálním případem jsou alternace tvarů **deverbativních adjektiv**: (stažený: stažený/stáhnutý); \\ tato variantní sublemmata jsou uvedena ve [[cnk:syn2020:seznamy:deverbativni_adj_sublemmata|zvláštnímu seznamu]].
  
 příklad značení (lemma //citron//): příklad značení (lemma //citron//):
Řádek 25: Řádek 26:
 | atd. ||||| | atd. |||||
  
 +Seznamy sublemmat s hláskovými a ortografickými alternacemi neuvádíme. Publikujeme však návod, jak uvedená sublemmata dohledat v rozhraní Kontext, viz oddíl [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#hlaskova_a_ortograficka_variantnost_apelativ|Hlásková a ortografická variantnost apelativ]].
  
 ===== 2. Sublemmata jako synonymní varianty v části paradigmatu ===== ===== 2. Sublemmata jako synonymní varianty v části paradigmatu =====
Řádek 32: Řádek 34:
 === Příklady variantních sublemmat u sloves: === === Příklady variantních sublemmat u sloves: ===
  
-  * alternace v **infinitivech a minulém příčestí** (myslet: myslet/myslit);\\ seznam slov s touto alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_l-ova_pricesti_sublemmata|zvláštní stránce]]+  * alternace v **infinitivech a minulém příčestí** (myslet: myslet/myslit);\\ seznam sloves s touto alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_l-ova_pricesti_sublemmata|zvláštní stránce]]
  
-  * alternace v **infinitivech** (péci: péci/péct/píct; být: být/bejt);\\ seznam slov s alternací pouze infinitivu je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_infinitivy_sublemmata|zvláštní stránce]]+  * alternace v **infinitivech** (péci: péci/péct/píct; být: být/bejt);\\ seznam sloves s alternací pouze infinitivu je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_infinitivy_sublemmata|zvláštní stránce]]
  
-  * **kombinované alternace** v infinitivech a dalších částech paradigmat (lít: lít/lejt; \\ obléknout: obléknout/obléci/obléct/oblíknout/oblíct/vobléknout/vobléci/vobléct/voblíct);\\ seznam slov s dalšími kombinacemi alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_zvlastni_sublemmata|zvláštní stránce]]+  * **kombinované alternace** v infinitivech a dalších částech paradigmat (lít: lít/lejt; \\ obléknout: obléknout/obléci/obléct/oblíknout/oblíct/vobléknout/vobléci/vobléct/voblíct);\\ seznam sloves s dalšími kombinacemi alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_zvlastni_sublemmata|zvláštní stránce]]
  
  
Řádek 67: Řádek 69:
 | genitiv singuláru   | kuchyně   | kuchyně | kuchyně | %%NNFS2-----A----%% | | genitiv singuláru   | kuchyně   | kuchyně | kuchyně | %%NNFS2-----A----%% |
  
-Seznam pro tento typ variantních sublemmat substantiv je uveden na [[cnk:syn2020:seznamy:substantiva_castecna_paradigmata_sublemmata|zvláštní stránce]].+Seznam těchto variantních sublemmat substantiv je uveden na [[cnk:syn2020:seznamy:substantiva_castecna_paradigmata_sublemmata|zvláštní stránce]].
  
 === Příklady variantních sublemmat u dalších slovních druhů: === === Příklady variantních sublemmat u dalších slovních druhů: ===
  
-  * von (on: on/von) – alternace u tvarů von, vona, vono +  * von (on: on/von) – alternace u tvarů von, vona, vono;\\ voni (oni: oni/voni) – alternace u tvarů voni, vony 
-  * sedum (sedm: sedm/sedum) – alternace u tvarů nominativu singuláru a akuzativu singuláru+  * sedum (sedm: sedm/sedum); osum, vosum (osm: osm/osum/vosum) – alternace u tvarů nominativu singuláru a akuzativu singuláru
  
 [Pozn. Alternace vznikající jen na dalších pozicích paradigmatu mimo lemma (např. předložkové tvary zájmena //on//) nezakládají nové sublemma. Tyto varianty se liší pouze v tagu. Viz příklad.] [Pozn. Alternace vznikající jen na dalších pozicích paradigmatu mimo lemma (např. předložkové tvary zájmena //on//) nezakládají nové sublemma. Tyto varianty se liší pouze v tagu. Viz příklad.]
Řádek 106: Řádek 108:
 | :::                 | sebelíp | sebelíp | dobře | %%Db-------------%% | | :::                 | sebelíp | sebelíp | dobře | %%Db-------------%% |
  
-Seznam všech supletivních paradigmat substantiv i supletivně stupňovaných adjektiv a adverbií je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_zvlastni_sublemmata|zvláštní stránce]].+Seznam všech supletivních paradigmat substantiv i supletivně stupňovaných adjektiv a adverbií je uveden na [[cnk:syn2020:seznamy:supletivismus_sublemmata|zvláštní stránce]]. Pro sublemmata se zvláštním stupňováním (sebe-) publikujeme návod, jak je dohledat, viz sekci [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#sublemmata_zvlastniho_druhu_stupnovani_sebe|Sublemmata zvláštního druhu stupňování]].
  
 [Pozn. V pravidelně stupňovaných paradigmatech adjektiv a adverbií se u všech stupňovaných tvarů sublemma rovná lemmatu, tj. základnímu tvaru pozitivu.)  [Pozn. V pravidelně stupňovaných paradigmatech adjektiv a adverbií se u všech stupňovaných tvarů sublemma rovná lemmatu, tj. základnímu tvaru pozitivu.) 
Řádek 167: Řádek 169:
   * zájmena (jenž: jenž/jenžto; kdo: kdo/kdož/kdože/ktož; který: který/kerý/kterýž/kterýžto)   * zájmena (jenž: jenž/jenžto; kdo: kdo/kdož/kdože/ktož; který: který/kerý/kterýž/kterýžto)
   * vokalizované předložky (k: k/ke/ku)   * vokalizované předložky (k: k/ke/ku)
 +
 +Seznamy variantních sublemmat zvlášť neuvádíme. Každý uživatel si je ale může připravit pomocí pokročilého dotazu v rozhraní Kontext, viz návod v sekci [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#sublemmata_u_neohebnych_slovnich_druhu_a_zajmen|Sublemmata u neohebných slovních druhů a zájmen]]. 
  
 ===== 5. Sublemmata jako varianty u proprií ===== ===== 5. Sublemmata jako varianty u proprií =====
Řádek 202: Řádek 206:
   * o/ó, j/y (Kjóto: Kjóto/Kyoto/Kjótó)   * o/ó, j/y (Kjóto: Kjóto/Kyoto/Kjótó)
   * a/á (Ázerbájdžánec: Ázerbájdžánec/Ázerbajdžánec)   * a/á (Ázerbájdžánec: Ázerbájdžánec/Ázerbajdžánec)
 +
 +\\
 +Seznamy variantních sublemmat u proprií neuvádíme. Publikujeme ale návod, jak sublemmata dohledat v rozhraní Kontext, viz sekci [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#sublemmata_u_proprii|Sublemmata u proprií]].
  
 \\ \\
 %%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]] %%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]]