| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| hickok:problemy_tokenizace [2025/04/12 15:25] – -tě a -ti. danzeman | hickok:problemy_tokenizace [2025/10/15 11:13] (aktuální) – [Příklonka -ž] jiripergler |
|---|
| | //nebť// | | CCONJ | | | | //nebť// | | CCONJ | | |
| | //neboť// | 411 | CCONJ | | | | //neboť// | 411 | CCONJ | | |
| | //nechť// | 38 | PART | | | | //nechť// | 38 | PART | Včetně variant typu nechať, nechažť apod. Vše bych lemmatizoval jako "nechť". | |
| | | //proto(ž)ť// | | CCONJ/ADV | | |
| | //toť// | 2 | PART | Ne vždy je to lexikalizované, může jít i o běžné spojení zájmena //ten// (DET) s částicí ť (PART). Lexikalizované je to v případech typu //aj toť, budeš mlčěti//. Běžné zájmeno + ť je to v případech typu //toť jest mistr plný milosti; toť chcu učiniti// (zájmeno //ten// v nelexikalizovaných případech může být i v jiných tvarech, např. //tenť obyčěj v sobě jmají//). <fc #008000>(Poznámka DZ k PDT: značka PDNS1. Po vzoru zájmena //to// to v UD dostalo značku DET, ale asi by to mělo být PRON, protože tvary v jiných rodech (//tenť, tať//) se nevyskytují. Ve skutečnosti //toť// funguje jako zájmenná spona.)</fc> | | | //toť// | 2 | PART | Ne vždy je to lexikalizované, může jít i o běžné spojení zájmena //ten// (DET) s částicí ť (PART). Lexikalizované je to v případech typu //aj toť, budeš mlčěti//. Běžné zájmeno + ť je to v případech typu //toť jest mistr plný milosti; toť chcu učiniti// (zájmeno //ten// v nelexikalizovaných případech může být i v jiných tvarech, např. //tenť obyčěj v sobě jmají//). <fc #008000>(Poznámka DZ k PDT: značka PDNS1. Po vzoru zájmena //to// to v UD dostalo značku DET, ale asi by to mělo být PRON, protože tvary v jiných rodech (//tenť, tať//) se nevyskytují. Ve skutečnosti //toť// funguje jako zájmenná spona.)</fc> | |
| | //vždyť// | 100 | CCONJ | Ve stč. typicky funguje jako ADV s významem "vždy", v těchto případech tedy rozkládat na //vždy//+//ť// (?) a anotovat jako ADV. | | | //vždyť// | 100 | CCONJ | Ve stč. typicky funguje jako ADV s významem "vždy", v těchto případech tedy rozkládat na //vždy//+//ť// (?) a anotovat jako ADV. | |
| | | 639 | CCONJ | | | | | 639 | CCONJ | | |
| | | 139 | SCONJ | | | | | 139 | SCONJ | | |
| | //budiž// | 5 | PART | V nové češtině se vyskytuje jako samostatná klauze //(ale budiž)//. Pokud by šlo o imperativ od existenciálního nebo sponového //být//, pak to asi za lexikalizované nepovažujeme? | | | //budiž// | 5 | PART | V nové češtině se vyskytuje jako samostatná klauze //(ale budiž)//. Pokud jde ve starší češtině o imperativ od existenciálního nebo sponového //být//, pak to za lexikalizované nepovažujeme. | |
| | //což// | 653 | PRON | PronType=Rel | | | //což// | 653 | PRON | PronType=Rel | |
| | | 3 | INTJ | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | | | | 3 | INTJ | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | |
| | //dokudž// | | ADV/SCONJ | (PronType=Rel) | | | //dokudž// | | ADV/SCONJ | (PronType=Rel) | |
| | //jakovýž// | 0 | DET | PronType=Rel | | | //jakovýž// | 0 | DET | PronType=Rel | |
| | //jakož// | 23 | SCONJ | | | | //jakož// | 23 | SCONJ/ADV | (PronType=Rel) | |
| | //jakýž// | 0 | DET | PronType=Rel | | | //jakýž// | 0 | DET | PronType=Rel | |
| | //jakž// | 1 | ADV | | | | //jakž(koli)// | 1 | ADV | | |
| | //jeliž// | | SCONJ | | | | //je(st)liž// | | SCONJ | | |
| | //jehož// | 658 | DET | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | | | //jehož// | 658 | DET | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | |
| | //jenž// | 2201 | PRON | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | | | //jenž// | 2201 | PRON | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | |
| | | //kamž// | | ADV | PronType=Rel | |
| | //kakž/kakož// | | ADV | PronType=Rel/Int | | | //kakž/kakož// | | ADV | PronType=Rel/Int | |
| | //kdež// | 0 | ADV | PronType=Rel | | | //kdež// | 0 | ADV | PronType=Rel | |
| | //kterýž// | 0 | DET | PronType=Rel | | | //kterýž// | 0 | DET | PronType=Rel | |
| | //ledaktož// | 0 | PRON | PronType=Ind | | | //ledaktož// | 0 | PRON | PronType=Ind | |
| | | //liž// | | SCONJ/PART | | |
| | //natož// | 18 | PART | | | | //natož// | 18 | PART | | |
| | //někdež// | 0 | ADV | PronType=Ind | | | //někdež// | 0 | ADV | PronType=Ind | |
| | //nikdež// | 0 | ADV | PronType=Neg | | | //nikdež// | 0 | ADV | PronType=Neg | |
| | //nikdož// | 0 | PRON | PronType=Neg. Ve staré češtině také //niktož//. | | | //nikdož// | 0 | PRON | PronType=Neg. Ve staré češtině také //niktož//. | |
| | | //nikdyž// | | ADV | PronType=Neg. | |
| | | //nikterakž// | | ADV | PronType=Neg | |
| | | //odkavadž// | | ADV | PronType=Rel | |
| | | //pokudž// | | ADV/SCONJ | | |
| | //pročež// | | ADV/SCONJ (?) | PronType=Int/Rel| | | //pročež// | | ADV/SCONJ (?) | PronType=Int/Rel| |
| | //protož// | | CCONJ/ADV| | | | //protož// | | CCONJ/ADV| | |
| | //takž// | 1 | ADV | | | | //takž// | 1 | ADV | | |
| | //takož// | | ADV | | | | //takož// | | ADV | | |
| | //takýž// | | DET | PronType=Dem | | | //tak(ov)ýž// | | DET | PronType=Dem | |
| | //tehdaž/tehdáž// | | ADV | PronType=Dem | | | //tehdaž/tehdáž/tehdyž// | | ADV | PronType=Dem | |
| | //tentýž// | 92 | DET | PronType=Dem | | | //tentýž// | 92 | DET | PronType=Dem | |
| | //tenž// | | DET | PronType=Dem | | | //tenž// | | DET | PronType=Dem | |
| | | //tolikéž// | | ADV/DET | | |
| | //tož// | | ADV | PronType=Dem | | | //tož// | | ADV | PronType=Dem | |
| | //tuž// | | ADV | PronType=Dem | | | //tuž// | | ADV | PronType=Dem | |
| | //týž// | 141 | DET | PronType=Dem | | | //týž// | 141 | DET | PronType=Dem | |
| | //všelicož// | 0 | PRON | | | | //všelicož// | 0 | PRON | | |
| | | //zda(li)ž// | | PART/SCONJ | | |
| |
| ==== Spojení předložky se zájmenem ==== | ==== Spojení předložky se zájmenem ==== |