AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
hickok:problemy_tokenizace [2025/06/16 14:32] – [Příklonka -ž] jiriperglerhickok:problemy_tokenizace [2025/10/15 11:13] (aktuální) – [Příklonka -ž] jiripergler
Řádek 30: Řádek 30:
 | //nebť// |      | CCONJ |          | | //nebť// |      | CCONJ |          |
 | //neboť// |     411 | CCONJ |          | | //neboť// |     411 | CCONJ |          |
-| //nechť// |      38 | PART  |          +| //nechť// |      38 | PART  | Včetně variant typu nechať, nechažť apod. Vše bych lemmatizoval jako "nechť"        
-| //protoť// |       | CCONJ/ADV  |          |+| //proto(ž)ť// |       | CCONJ/ADV  |          |
 | //toť//         2 | PART | Ne vždy je to lexikalizované, může jít i o běžné spojení zájmena //ten// (DET) s částicí ť (PART). Lexikalizované je to v případech typu //aj toť, budeš mlčěti//. Běžné zájmeno + ť je to v případech typu //toť jest mistr plný milosti; toť chcu učiniti// (zájmeno //ten// v nelexikalizovaných případech může být i v jiných tvarech, např. //tenť obyčěj v sobě jmají//). <fc #008000>(Poznámka DZ k PDT: značka PDNS1. Po vzoru zájmena //to// to v UD dostalo značku DET, ale asi by to mělo být PRON, protože tvary v jiných rodech (//tenť, tať//) se nevyskytují. Ve skutečnosti //toť// funguje jako zájmenná spona.)</fc> | | //toť//         2 | PART | Ne vždy je to lexikalizované, může jít i o běžné spojení zájmena //ten// (DET) s částicí ť (PART). Lexikalizované je to v případech typu //aj toť, budeš mlčěti//. Běžné zájmeno + ť je to v případech typu //toť jest mistr plný milosti; toť chcu učiniti// (zájmeno //ten// v nelexikalizovaných případech může být i v jiných tvarech, např. //tenť obyčěj v sobě jmají//). <fc #008000>(Poznámka DZ k PDT: značka PDNS1. Po vzoru zájmena //to// to v UD dostalo značku DET, ale asi by to mělo být PRON, protože tvary v jiných rodech (//tenť, tať//) se nevyskytují. Ve skutečnosti //toť// funguje jako zájmenná spona.)</fc> |
 | //vždyť// |     100 | CCONJ | Ve stč. typicky funguje jako ADV s významem "vždy", v těchto případech tedy rozkládat na //vždy//+//ť// (?) a anotovat jako ADV.          | | //vždyť// |     100 | CCONJ | Ve stč. typicky funguje jako ADV s významem "vždy", v těchto případech tedy rozkládat na //vždy//+//ť// (?) a anotovat jako ADV.          |
Řádek 54: Řádek 54:
 |              |     639 | CCONJ |          | |              |     639 | CCONJ |          |
 |              |     139 | SCONJ |          | |              |     139 | SCONJ |          |
-| //budiž//    |       5 | PART  | V nové češtině se vyskytuje jako samostatná klauze //(ale budiž)//. Pokud by šlo o imperativ od existenciálního nebo sponového //být//, pak to asi za lexikalizované nepovažujeme|+| //budiž//    |       5 | PART  | V nové češtině se vyskytuje jako samostatná klauze //(ale budiž)//. Pokud jde ve starší češtině o imperativ od existenciálního nebo sponového //být//, pak to za lexikalizované nepovažujeme|
 | //což//      |     653 | PRON  | PronType=Rel | | //což//      |     653 | PRON  | PronType=Rel |
 |              |       3 | INTJ  | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | |              |       3 | INTJ  | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. |
Řádek 60: Řádek 60:
 | //dokudž//  |       | ADV/SCONJ | (PronType=Rel) | | //dokudž//  |       | ADV/SCONJ | (PronType=Rel) |
 | //jakovýž//  |       0 | DET   | PronType=Rel | | //jakovýž//  |       0 | DET   | PronType=Rel |
-| //jakož//    |      23 | SCONJ |          |+| //jakož//    |      23 | SCONJ/ADV (PronType=Rel)        |
 | //jakýž//    |       0 | DET   | PronType=Rel | | //jakýž//    |       0 | DET   | PronType=Rel |
-| //jakž//           1 | ADV            | +| //jakž(koli)//           1 | ADV            | 
-| //jeliž//           | SCONJ            |+| //je(st)liž//           | SCONJ            |
 | //jehož//    |     658 | DET   | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | | //jehož//    |     658 | DET   | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// |
 | //jenž//        2201 | PRON  | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | | //jenž//        2201 | PRON  | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// |
 +| //kamž//            | ADV   | PronType=Rel |
 | //kakž/kakož//            | ADV   | PronType=Rel/Int | | //kakž/kakož//            | ADV   | PronType=Rel/Int |
 | //kdež//           0 | ADV   | PronType=Rel | | //kdež//           0 | ADV   | PronType=Rel |
Řádek 73: Řádek 74:
 | //kterýž//         0 | DET   | PronType=Rel | | //kterýž//         0 | DET   | PronType=Rel |
 | //ledaktož// |       0 | PRON  | PronType=Ind | | //ledaktož// |       0 | PRON  | PronType=Ind |
 +| //liž// |        | SCONJ/PART  |  |
 | //natož//    |      18 | PART  |          | | //natož//    |      18 | PART  |          |
 | //někdež//         0 | ADV   | PronType=Ind | | //někdež//         0 | ADV   | PronType=Ind |
Řádek 83: Řádek 85:
 | //nikdož//         0 | PRON  | PronType=Neg. Ve staré češtině také //niktož//. | | //nikdož//         0 | PRON  | PronType=Neg. Ve staré češtině také //niktož//. |
 | //nikdyž//          | ADV  | PronType=Neg.  | | //nikdyž//          | ADV  | PronType=Neg.  |
 +| //nikterakž//         | ADV   | PronType=Neg |
 +| //odkavadž//        | ADV | PronType=Rel |
 +| //pokudž//        | ADV/SCONJ | |
 | //pročež//        | ADV/SCONJ (?) | PronType=Int/Rel| | //pročež//        | ADV/SCONJ (?) | PronType=Int/Rel|
 | //protož//        | CCONJ/ADV| | | //protož//        | CCONJ/ADV| |
Řádek 90: Řádek 95:
 | //takž//           1 | ADV            | | //takž//           1 | ADV            |
 | //takož//            | ADV            | | //takož//            | ADV            |
-| //takýž//            | DET   | PronType=Dem    | +| //tak(ov)ýž//            | DET   | PronType=Dem    | 
-| //tehdaž/tehdáž//        | ADV  | PronType=Dem |+| //tehdaž/tehdáž/tehdyž//        | ADV  | PronType=Dem |
 | //tentýž//        92 | DET   | PronType=Dem | | //tentýž//        92 | DET   | PronType=Dem |
 | //tenž//        | DET   | PronType=Dem | | //tenž//        | DET   | PronType=Dem |
 +| //tolikéž//        | ADV/DET    |
 | //tož//        | ADV   | PronType=Dem | | //tož//        | ADV   | PronType=Dem |
 | //tuž//        | ADV   | PronType=Dem | | //tuž//        | ADV   | PronType=Dem |
 | //týž//      |     141 | DET   | PronType=Dem | | //týž//      |     141 | DET   | PronType=Dem |
 | //všelicož// |       0 | PRON  |          | | //všelicož// |       0 | PRON  |          |
-| //zdaliž// |        | PART/SCONJ  |          |+| //zda(li)ž// |        | PART/SCONJ  |          |
  
 ==== Spojení předložky se zájmenem ==== ==== Spojení předložky se zájmenem ====