Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
hickok:problemy_tokenizace [2024/10/31 13:54] – [Příklonka -ž] martinstluka | hickok:problemy_tokenizace [2025/03/03 09:29] (aktuální) – [Příklonka -ž] jiripergler |
---|
| | 61 | PART | | | | | 61 | PART | | |
| //byť// | 120 | SCONJ | **POZOR**, pro starou češtinu //byť// v typických spojeních s l-ovým participiem (//byť přišel//) nechápeme jako lexikalizovanou spojku, ale jako multiword token, totiž spojení //by// (AUX, jde o pomocný tvar kondicionálu) a //ť// (PART). Za spojku //byť// pokládáme pouze v případě, že by to jako pomocný tvar kondicionálu interpetovat nešlo, tj. buď by v kontextu bylo další //by// (//byť by přišel//), nebo by tam nebylo l-ové participium tvořící zbytek kondicionáového tvaru (např. //byť přijde//). | | | //byť// | 120 | SCONJ | **POZOR**, pro starou češtinu //byť// v typických spojeních s l-ovým participiem (//byť přišel//) nechápeme jako lexikalizovanou spojku, ale jako multiword token, totiž spojení //by// (AUX, jde o pomocný tvar kondicionálu) a //ť// (PART). Za spojku //byť// pokládáme pouze v případě, že by to jako pomocný tvar kondicionálu interpetovat nešlo, tj. buď by v kontextu bylo další //by// (//byť by přišel//), nebo by tam nebylo l-ové participium tvořící zbytek kondicionáového tvaru (např. //byť přijde//). | |
| | //nebť// | | CCONJ | | |
| //neboť// | 411 | CCONJ | | | | //neboť// | 411 | CCONJ | | |
| //nechť// | 38 | PART | | | | //nechť// | 38 | PART | | |
^ ^ výskyty ^ UPOS ^ ^ | ^ ^ výskyty ^ UPOS ^ ^ |
| //aniž// | 120 | SCONJ | | | | //aniž// | 120 | SCONJ | | |
| | //avšakž// | | CCONJ | | |
| //až// | 1384 | PART | | | | //až// | 1384 | PART | | |
| | 639 | CCONJ | | | | | 639 | CCONJ | | |
| | 3 | INTJ | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | | | | 3 | INTJ | //což o to; a což teprve; vyplnilo se nám to jen což// – DZ: Když už, tak bych dal spíš PART než INTJ. | |
| | 1 | PART | //Což se XXX neděje?// | | | | 1 | PART | //Což se XXX neděje?// | |
| | //dokudž// | | ADV/SCONJ | (PronType=Rel) | |
| //jakovýž// | 0 | DET | PronType=Rel | | | //jakovýž// | 0 | DET | PronType=Rel | |
| //jakož// | 23 | SCONJ | | | | //jakož// | 23 | SCONJ | | |
| //jehož// | 658 | DET | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | | | //jehož// | 658 | DET | Poss=Yes, PronType=Rel. Ve všech tvarech, tj. např. //jejichž, jejíž, jejímž, jejímiž, ...// | |
| //jenž// | 2201 | PRON | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | | | //jenž// | 2201 | PRON | PronType=Rel. Ve všech tvarech, tj. např. //němž, jehož, nichž, níž, ...// | |
| | //kakž/kakož// | | ADV | PronType=Rel/Int | |
| //kdež// | 0 | ADV | PronType=Rel | | | //kdež// | 0 | ADV | PronType=Rel | |
| //kdož// | 3 | PRON | PronType=Rel. Ve staré češtině také //ktož, kdožež//. | | | //kdož// | 3 | PRON | PronType=Rel. Ve staré češtině také //ktož, kdožež//. | |
| //když// | 2100 | SCONJ | | | | //když// | 2100 | SCONJ | | |
| | //kterakž// | | ADV | PronType=Rel/Int | |
| //kterýž// | 0 | DET | PronType=Rel | | | //kterýž// | 0 | DET | PronType=Rel | |
| //ledaktož// | 0 | PRON | PronType=Ind | | | //ledaktož// | 0 | PRON | PronType=Ind | |
| //než// | 2143 | SCONJ | | | | //než// | 2143 | SCONJ | | |
| | 5 | PART | Tři z těch pěti případů jsou záporné typu //nezbývá, než ...//, ale asi by to klidně i zde mohlo být SCONJ. | | | | 5 | PART | Tři z těch pěti případů jsou záporné typu //nezbývá, než ...//, ale asi by to klidně i zde mohlo být SCONJ. | |
| | //nikakž/nikakéž// | | ADV | PronType=Neg | |
| //nikdež// | 0 | ADV | PronType=Neg | | | //nikdež// | 0 | ADV | PronType=Neg | |
| //nikdož// | 0 | PRON | PronType=Neg. Ve staré češtině také //niktož//. | | | //nikdož// | 0 | PRON | PronType=Neg. Ve staré češtině také //niktož//. | |
| | //pročež// | | ADV/SCONJ (?) | PronType=Int/Rel| |
| //protož// | | CCONJ/ADV| | | | //protož// | | CCONJ/ADV| | |
| //rovněž// | 457 | ADV | | | | //rovněž// | 457 | ADV | | |
| | //takéž// | | ADV | | |
| //takovýtéž// | 0 | DET | PronType=Dem | | | //takovýtéž// | 0 | DET | PronType=Dem | |
| //takž// | 1 | ADV | | | | //takž// | 1 | ADV | | |
| | //takož// | | ADV | | |
| | //takýž// | | DET | PronType=Dem | |
| //tentýž// | 92 | DET | PronType=Dem | | | //tentýž// | 92 | DET | PronType=Dem | |
| | //tenž// | | DET | PronType=Dem | |
| | //tož// | | ADV | PronType=Dem | |
| //týž// | 141 | DET | PronType=Dem | | | //týž// | 141 | DET | PronType=Dem | |
| //všelicož// | 0 | PRON | | | | //všelicož// | 0 | PRON | | |
| //zaňž// | za | za | Prep | nějž | jenž | Rel | Acc | Pre | | Sing | Masc,Neut | | | //zaňž// | za | za | Prep | nějž | jenž | Rel | Acc | Pre | | Sing | Masc,Neut | |
| |
| ==== Spojka i ==== |
| |
| Jednou se vyskytlo //myslilaj déle// ve významu //myslila i déle//. Nevím, jak moc je to produktivní, prozatím jsem implementoval dělení pouze pro tento konkrétní případ. |