AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
hickok:problemy_tokenizace [2024/11/13 14:04] – [Příklonka -ž] jiriperglerhickok:problemy_tokenizace [2025/03/03 09:29] (aktuální) – [Příklonka -ž] jiripergler
Řádek 25: Řádek 25:
 |                61 | PART  |          | |                61 | PART  |          |
 | //byť//       120 | SCONJ | **POZOR**, pro starou češtinu //byť// v typických spojeních s l-ovým participiem (//byť přišel//) nechápeme jako lexikalizovanou spojku, ale jako multiword token, totiž spojení //by// (AUX, jde o pomocný tvar kondicionálu) a //ť// (PART). Za spojku //byť// pokládáme pouze v případě, že by to jako pomocný tvar kondicionálu interpetovat nešlo, tj. buď by v kontextu bylo další //by// (//byť by přišel//), nebo by tam nebylo l-ové participium tvořící zbytek kondicionáového tvaru (např. //byť přijde//). | | //byť//       120 | SCONJ | **POZOR**, pro starou češtinu //byť// v typických spojeních s l-ovým participiem (//byť přišel//) nechápeme jako lexikalizovanou spojku, ale jako multiword token, totiž spojení //by// (AUX, jde o pomocný tvar kondicionálu) a //ť// (PART). Za spojku //byť// pokládáme pouze v případě, že by to jako pomocný tvar kondicionálu interpetovat nešlo, tj. buď by v kontextu bylo další //by// (//byť by přišel//), nebo by tam nebylo l-ové participium tvořící zbytek kondicionáového tvaru (např. //byť přijde//). |
 +| //nebť// |      | CCONJ |          |
 | //neboť// |     411 | CCONJ |          | | //neboť// |     411 | CCONJ |          |
 | //nechť// |      38 | PART  |          | | //nechť// |      38 | PART  |          |
Řádek 45: Řádek 46:
 ^              ^ výskyty ^ UPOS  ^          ^ ^              ^ výskyty ^ UPOS  ^          ^
 | //aniž//         120 | SCONJ |          | | //aniž//         120 | SCONJ |          |
 +| //avšakž//         | CCONJ |          |
 | //až//          1384 | PART  |          | | //až//          1384 | PART  |          |
 |              |     639 | CCONJ |          | |              |     639 | CCONJ |          |
Řádek 52: Řádek 54:
 |              |       3 | INTJ  | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | |              |       3 | INTJ  | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. |
 |              |       1 | PART  | //Což se XXX neděje?// | |              |       1 | PART  | //Což se XXX neděje?// |
 +| //dokudž//  |       | ADV/SCONJ | (PronType=Rel) |
 | //jakovýž//  |       0 | DET   | PronType=Rel | | //jakovýž//  |       0 | DET   | PronType=Rel |
 | //jakož//    |      23 | SCONJ |          | | //jakož//    |      23 | SCONJ |          |
Řádek 58: Řádek 61:
 | //jehož//    |     658 | DET   | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | | //jehož//    |     658 | DET   | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// |
 | //jenž//        2201 | PRON  | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | | //jenž//        2201 | PRON  | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// |
 +| //kakž/kakož//            | ADV   | PronType=Rel/Int |
 | //kdež//           0 | ADV   | PronType=Rel | | //kdež//           0 | ADV   | PronType=Rel |
 | //kdož//           3 | PRON  | PronType=Rel. Ve staré češtině také //ktož, kdožež//. | | //kdož//           3 | PRON  | PronType=Rel. Ve staré češtině také //ktož, kdožež//. |
 | //když//        2100 | SCONJ |          | | //když//        2100 | SCONJ |          |
 +| //kterakž//  |        | ADV   | PronType=Rel/Int |
 | //kterýž//         0 | DET   | PronType=Rel | | //kterýž//         0 | DET   | PronType=Rel |
 | //ledaktož// |       0 | PRON  | PronType=Ind | | //ledaktož// |       0 | PRON  | PronType=Ind |
Řádek 68: Řádek 73:
 | //než//      |    2143 | SCONJ |          | | //než//      |    2143 | SCONJ |          |
 |              |       5 | PART  | Tři z těch pěti případů jsou záporné typu //nezbývá, než ...//, ale asi by to klidně i zde mohlo být SCONJ. | |              |       5 | PART  | Tři z těch pěti případů jsou záporné typu //nezbývá, než ...//, ale asi by to klidně i zde mohlo být SCONJ. |
 +| //nikakž/nikakéž//         | ADV   | PronType=Neg |
 | //nikdež//         0 | ADV   | PronType=Neg | | //nikdež//         0 | ADV   | PronType=Neg |
 | //nikdož//         0 | PRON  | PronType=Neg. Ve staré češtině také //niktož//. | | //nikdož//         0 | PRON  | PronType=Neg. Ve staré češtině také //niktož//. |
 +| //pročež//        | ADV/SCONJ (?) | PronType=Int/Rel|
 | //protož//        | CCONJ/ADV| | | //protož//        | CCONJ/ADV| |
 | //rovněž//       457 | ADV            | | //rovněž//       457 | ADV            |
Řádek 75: Řádek 82:
 | //takovýtéž// |      0 | DET   | PronType=Dem | | //takovýtéž// |      0 | DET   | PronType=Dem |
 | //takž//           1 | ADV            | | //takž//           1 | ADV            |
 +| //takož//            | ADV            |
 +| //takýž//            | DET   | PronType=Dem    |
 | //tentýž//        92 | DET   | PronType=Dem | | //tentýž//        92 | DET   | PronType=Dem |
 +| //tenž//        | DET   | PronType=Dem |
 +| //tož//        | ADV   | PronType=Dem |
 | //týž//      |     141 | DET   | PronType=Dem | | //týž//      |     141 | DET   | PronType=Dem |
 | //všelicož// |       0 | PRON  |          | | //všelicož// |       0 | PRON  |          |
Řádek 107: Řádek 118:
 | //zaňž//     | za     | za    | Prep    | nějž | jenž  | Rel      | Acc  | Pre      |        | Sing   | Masc,Neut | | //zaňž//     | za     | za    | Prep    | nějž | jenž  | Rel      | Acc  | Pre      |        | Sing   | Masc,Neut |
  
 +==== Spojka i ====
 +
 +Jednou se vyskytlo //myslilaj déle// ve významu //myslila i déle//. Nevím, jak moc je to produktivní, prozatím jsem implementoval dělení pouze pro tento konkrétní případ.