Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:syn2020:lemmatizace [2020/12/22 12:46] – jankrivan | cnk:syn2020:lemmatizace [2022/11/23 11:18] (aktuální) – jankrivan |
---|
~~NOTOC~~ | |
| |
====== Korpus SYN2020: Lemmatizace ====== | ====== Korpus SYN2020: Lemmatizace ====== |
| |
| |
* **ortografická** variantnost, zejména ve slovech cizího původu: s/z (filozof: filozof/filosof; organismus: organismus/organizmus), o/ó (citron: citron/citrón), t/th (teolog: teolog/theolog) a další změny (camping: camping/kempink; lobbista: lobbista/lobista; tsunami: tsunami/cunami; rádio: rádio/radio; brífink: brífink/briefing aj.) | * **ortografická** variantnost, zejména ve slovech cizího původu: s/z (filozof: filozof/filosof; organismus: organismus/organizmus), o/ó (citron: citron/citrón), t/th (teolog: teolog/theolog) a další změny (camping: camping/kempink; lobbista: lobbista/lobista; tsunami: tsunami/cunami; rádio: rádio/radio; brífink: brífink/briefing aj.) |
| |
* **hlásková** variantnost: ý/ej (mýdlo: mýdlo/mejdlo), í/ej/é (vylézat: vylézat/vylízat/vylejzat) a další změny (seškrábat: seškrábat/seškrabat; dolík: dolík/ďolík; přilba: přilba/přílba aj.) | * **hlásková** variantnost: ý/ej (mýdlo: mýdlo/mejdlo), í/ej/é (vylézat: vylézat/vylízat/vylejzat) a další změny (seškrábat: seškrábat/seškrabat; dolík: dolík/ďolík; přilba: přilba/přílba aj.) |
* variantnost v použití **spojovníku**: (email: email/e-mail; gore-tex: gore-tex/goretex); \\ variantní sublemmata s alternací spojovníku jsou uvedena ve [[cnk:syn2020:seznamy:spojovnik_nespojovnik_sublemmata|zvláštním seznamu]]. | |
| * variantnost v použití **spojovníku**: (popmusic: popmusic/pop-music; gore-tex: gore-tex/goretex); \\ variantní sublemmata s alternací spojovníku jsou uvedena ve [[cnk:syn2020:seznamy:spojovnik_nespojovnik_sublemmata|zvláštním seznamu]]. |
* speciálním případem jsou alternace tvarů **deverbativních adjektiv**: (stažený: stažený/stáhnutý); \\ tato variantní sublemmata jsou uvedena ve [[cnk:syn2020:seznamy:deverbativni_adj_sublemmata|zvláštnímu seznamu]]. | * speciálním případem jsou alternace tvarů **deverbativních adjektiv**: (stažený: stažený/stáhnutý); \\ tato variantní sublemmata jsou uvedena ve [[cnk:syn2020:seznamy:deverbativni_adj_sublemmata|zvláštnímu seznamu]]. |
| |
| atd. ||||| | | atd. ||||| |
| |
| Seznamy sublemmat s hláskovými a ortografickými alternacemi neuvádíme. Publikujeme však návod, jak uvedená sublemmata dohledat v rozhraní Kontext, viz oddíl [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#hlaskova_a_ortograficka_variantnost_apelativ|Hlásková a ortografická variantnost apelativ]]. |
| |
===== 2. Sublemmata jako synonymní varianty v části paradigmatu ===== | ===== 2. Sublemmata jako synonymní varianty v části paradigmatu ===== |
=== Příklady variantních sublemmat u sloves: === | === Příklady variantních sublemmat u sloves: === |
| |
* alternace v **infinitivech a minulém příčestí** (myslet: myslet/myslit);\\ seznam slov s touto alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_l-ova_pricesti_sublemmata|zvláštní stránce]] | * alternace v **infinitivech a minulém příčestí** (myslet: myslet/myslit);\\ seznam sloves s touto alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_l-ova_pricesti_sublemmata|zvláštní stránce]] |
| |
* alternace v **infinitivech** (péci: péci/péct/píct; být: být/bejt);\\ seznam slov s alternací pouze infinitivu je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_infinitivy_sublemmata|zvláštní stránce]] | * alternace v **infinitivech** (péci: péci/péct/píct; být: být/bejt);\\ seznam sloves s alternací pouze infinitivu je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_infinitivy_sublemmata|zvláštní stránce]] |
| |
* **kombinované alternace** v infinitivech a dalších částech paradigmat (lít: lít/lejt; \\ obléknout: obléknout/obléci/obléct/oblíknout/oblíct/vobléknout/vobléci/vobléct/voblíct);\\ seznam slov s dalšími kombinacemi alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_zvlastni_sublemmata|zvláštní stránce]] | * **kombinované alternace** v infinitivech a dalších částech paradigmat (lít: lít/lejt; \\ obléknout: obléknout/obléci/obléct/oblíknout/oblíct/vobléknout/vobléci/vobléct/voblíct);\\ seznam sloves s dalšími kombinacemi alternací je uveden na [[cnk:syn2020:seznamy:slovesa_castecna_paradigmata_zvlastni_sublemmata|zvláštní stránce]] |
| |
| |
| ::: | sebelíp | sebelíp | dobře | %%Db-------------%% | | | ::: | sebelíp | sebelíp | dobře | %%Db-------------%% | |
| |
Seznam všech supletivních paradigmat substantiv i supletivně stupňovaných adjektiv a adverbií je uveden na [[cnk:syn2020:seznamy:supletivismus_sublemmata|zvláštní stránce]]. | Seznam všech supletivních paradigmat substantiv i supletivně stupňovaných adjektiv a adverbií je uveden na [[cnk:syn2020:seznamy:supletivismus_sublemmata|zvláštní stránce]]. Pro sublemmata se zvláštním stupňováním (sebe-) publikujeme návod, jak je dohledat, viz sekci [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#sublemmata_zvlastniho_druhu_stupnovani_sebe|Sublemmata zvláštního druhu stupňování]]. |
| |
[Pozn. V pravidelně stupňovaných paradigmatech adjektiv a adverbií se u všech stupňovaných tvarů sublemma rovná lemmatu, tj. základnímu tvaru pozitivu.) | [Pozn. V pravidelně stupňovaných paradigmatech adjektiv a adverbií se u všech stupňovaných tvarů sublemma rovná lemmatu, tj. základnímu tvaru pozitivu.) |
* zájmena (jenž: jenž/jenžto; kdo: kdo/kdož/kdože/ktož; který: který/kerý/kterýž/kterýžto) | * zájmena (jenž: jenž/jenžto; kdo: kdo/kdož/kdože/ktož; který: který/kerý/kterýž/kterýžto) |
* vokalizované předložky (k: k/ke/ku) | * vokalizované předložky (k: k/ke/ku) |
| |
| Seznamy variantních sublemmat zvlášť neuvádíme. Každý uživatel si je ale může připravit pomocí pokročilého dotazu v rozhraní Kontext, viz návod v sekci [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#sublemmata_u_neohebnych_slovnich_druhu_a_zajmen|Sublemmata u neohebných slovních druhů a zájmen]]. |
| |
===== 5. Sublemmata jako varianty u proprií ===== | ===== 5. Sublemmata jako varianty u proprií ===== |
* o/ó, j/y (Kjóto: Kjóto/Kyoto/Kjótó) | * o/ó, j/y (Kjóto: Kjóto/Kyoto/Kjótó) |
* a/á (Ázerbájdžánec: Ázerbájdžánec/Ázerbajdžánec) | * a/á (Ázerbájdžánec: Ázerbájdžánec/Ázerbajdžánec) |
| |
| \\ |
| Seznamy variantních sublemmat u proprií neuvádíme. Publikujeme ale návod, jak sublemmata dohledat v rozhraní Kontext, viz sekci [[cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata#sublemmata_u_proprii|Sublemmata u proprií]]. |
| |
\\ | \\ |
%%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]] | %%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]] |