AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
hickok:problemy_tokenizace [2025/08/19 09:24] – [Příklonka -ž] jiriperglerhickok:problemy_tokenizace [2026/02/16 15:59] (aktuální) – [Příklonka -ť] jiripergler
Řádek 30: Řádek 30:
 | //nebť// |      | CCONJ |          | | //nebť// |      | CCONJ |          |
 | //neboť// |     411 | CCONJ |          | | //neboť// |     411 | CCONJ |          |
-| //nechť// |      38 | PART  | Včetně variant typu nechať, nechažť apod. Vše bych lemmatizoval jako "nechť"        |+| //nechť// |      38 | PART  | Včetně variant typu nechať, nechažť apod. Vše bych lemmatizoval jako "nechť", včetně podoby "nech"        |
 | //proto(ž)ť// |       | CCONJ/ADV  |          | | //proto(ž)ť// |       | CCONJ/ADV  |          |
 | //toť//         2 | PART | Ne vždy je to lexikalizované, může jít i o běžné spojení zájmena //ten// (DET) s částicí ť (PART). Lexikalizované je to v případech typu //aj toť, budeš mlčěti//. Běžné zájmeno + ť je to v případech typu //toť jest mistr plný milosti; toť chcu učiniti// (zájmeno //ten// v nelexikalizovaných případech může být i v jiných tvarech, např. //tenť obyčěj v sobě jmají//). <fc #008000>(Poznámka DZ k PDT: značka PDNS1. Po vzoru zájmena //to// to v UD dostalo značku DET, ale asi by to mělo být PRON, protože tvary v jiných rodech (//tenť, tať//) se nevyskytují. Ve skutečnosti //toť// funguje jako zájmenná spona.)</fc> | | //toť//         2 | PART | Ne vždy je to lexikalizované, může jít i o běžné spojení zájmena //ten// (DET) s částicí ť (PART). Lexikalizované je to v případech typu //aj toť, budeš mlčěti//. Běžné zájmeno + ť je to v případech typu //toť jest mistr plný milosti; toť chcu učiniti// (zájmeno //ten// v nelexikalizovaných případech může být i v jiných tvarech, např. //tenť obyčěj v sobě jmají//). <fc #008000>(Poznámka DZ k PDT: značka PDNS1. Po vzoru zájmena //to// to v UD dostalo značku DET, ale asi by to mělo být PRON, protože tvary v jiných rodech (//tenť, tať//) se nevyskytují. Ve skutečnosti //toť// funguje jako zájmenná spona.)</fc> |
Řádek 54: Řádek 54:
 |              |     639 | CCONJ |          | |              |     639 | CCONJ |          |
 |              |     139 | SCONJ |          | |              |     139 | SCONJ |          |
-| //budiž//    |       5 | PART  | V nové češtině se vyskytuje jako samostatná klauze //(ale budiž)//. Pokud by šlo o imperativ od existenciálního nebo sponového //být//, pak to asi za lexikalizované nepovažujeme|+| //bodejž//                  | PART  |          | 
 +| //budiž//    |       5 | PART  | V nové češtině se vyskytuje jako samostatná klauze //(ale budiž)//. Pokud jde ve starší češtině o imperativ od existenciálního nebo sponového //být//, pak to za lexikalizované nepovažujeme|
 | //což//      |     653 | PRON  | PronType=Rel | | //což//      |     653 | PRON  | PronType=Rel |
 |              |       3 | INTJ  | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | |              |       3 | INTJ  | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. |
Řádek 63: Řádek 64:
 | //jakýž//    |       0 | DET   | PronType=Rel | | //jakýž//    |       0 | DET   | PronType=Rel |
 | //jakž(koli)//           1 | ADV            | | //jakž(koli)//           1 | ADV            |
-| //jeliž//           | SCONJ            |+| //je(st)liž//           | SCONJ            |
 | //jehož//    |     658 | DET   | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | | //jehož//    |     658 | DET   | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// |
 | //jenž//        2201 | PRON  | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | | //jenž//        2201 | PRON  | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// |
Řádek 81: Řádek 82:
 |              |       5 | PART  | Tři z těch pěti případů jsou záporné typu //nezbývá, než ...//, ale asi by to klidně i zde mohlo být SCONJ. | |              |       5 | PART  | Tři z těch pěti případů jsou záporné typu //nezbývá, než ...//, ale asi by to klidně i zde mohlo být SCONJ. |
 | //nicož//          | PRON   | PronType=Neg | | //nicož//          | PRON   | PronType=Neg |
 +| //nijakž//         | ADV   | PronType=Neg |
 | //nikak(e)ž/nikakéž//         | ADV   | PronType=Neg | | //nikak(e)ž/nikakéž//         | ADV   | PronType=Neg |
 | //nikdež//         0 | ADV   | PronType=Neg | | //nikdež//         0 | ADV   | PronType=Neg |
Řádek 95: Řádek 97:
 | //takž//           1 | ADV            | | //takž//           1 | ADV            |
 | //takož//            | ADV            | | //takož//            | ADV            |
-| //takýž//            | DET   | PronType=Dem    | +| //tak(ov)ýž//            | DET   | PronType=Dem    | 
-| //tehdaž/tehdáž//        | ADV  | PronType=Dem |+| //tehdaž/tehdáž/tehdyž//        | ADV  | PronType=Dem |
 | //tentýž//        92 | DET   | PronType=Dem | | //tentýž//        92 | DET   | PronType=Dem |
 | //tenž//        | DET   | PronType=Dem | | //tenž//        | DET   | PronType=Dem |
Řádek 104: Řádek 106:
 | //týž//      |     141 | DET   | PronType=Dem | | //týž//      |     141 | DET   | PronType=Dem |
 | //všelicož// |       0 | PRON  |          | | //všelicož// |       0 | PRON  |          |
-| //zdaliž// |        | PART/SCONJ  |          |+| //zda(li)ž// |        | PART/SCONJ  |          |
  
 ==== Spojení předložky se zájmenem ==== ==== Spojení předložky se zájmenem ====