| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| hickok:stc_strdc_ud [2025/07/14 16:23] – [Číslovky] janazdenkova | hickok:stc_strdc_ud [2026/03/03 13:17] (aktuální) – [Číslovky] danzeman |
|---|
| * //jedny, dvoje, troje, čtvery, oboje// POS=NUM, NumType=Sets | * //jedny, dvoje, troje, čtvery, oboje// POS=NUM, NumType=Sets |
| * //čtvero, patero, desatero, dvé, tré, obé// POS=NUM, NumType=Card | * //čtvero, patero, desatero, dvé, tré, obé// POS=NUM, NumType=Card |
| * NumType=Frac je definováno pro zlomky typu //-ina// (jmenovatel), ale v současných UD se používá nekonzistentně ([[https://github.com/UniversalDependencies/docs/issues/884#issuecomment-1193721487|viz diskusi zde]]) | * NumType=Frac je teoreticky použitelné pro zlomky typu //-ina// (jmenovatel), ale v současných UD se používá nekonzistentně ([[https://github.com/UniversalDependencies/docs/issues/884#issuecomment-1193721487|viz diskusi zde]] a [[https://github.com/UniversalDependencies/docs/issues/1205|zde]]). Ve shodě s anotací v PDT-C budeme jmenovatele na //-ina// anotovat jako substantiva. |
| * Výrazy jako //jednička, dvojka, trojka; dvojice, trojice// se považují za substantiva (POS=NOUN, žádný NumType), totéž platí pro výrazy typu //pět// (s významem pětice) v substantivní funkci (typ //neb tu pět k němu provrhu//). | * Výrazy jako //jednička, dvojka, trojka; dvojice, trojice// se považují za substantiva (POS=NOUN, žádný NumType), totéž platí pro výrazy typu //pět// (s významem pětice) v substantivní funkci (typ //neb tu pět k němu provrhu//). |
| * Zájmenné číslovky (např. neurčité //několik, mnoho, málo, hodně// (komparativ //víc//); //několikátý; několikery; několikerý// ukazovací //tolik; tolikátý; tolikerý// tázací/vztažné //kolik; kolikátý; kolikerý// jsou POS=DET, mají vyplněný PronType i NumType. | * Zájmenné číslovky (např. neurčité //několik, mnoho, málo, hodně// (komparativ //víc//); //několikátý; několikery; několikerý// ukazovací //tolik; tolikátý; tolikerý// tázací/vztažné //kolik; kolikátý; kolikerý// jsou POS=DET, mají vyplněný PronType i NumType. |
| | NUM Číslovka základní "tři, čtyři, pět, ..." | NumType=Card, NumForm=Word, Number=Plur, Case | | | | NUM Číslovka základní "tři, čtyři, pět, ..." | NumType=Card, NumForm=Word, Number=Plur, Case | | |
| | NUM Číslovka základní "půl" | NumType=Card, NumForm=Word | | | | NUM Číslovka základní "půl" | NumType=Card, NumForm=Word | | |
| | NUM Číslovka pro množiny "jedny, dvoje, troje, čtvery, ..." | NumType=Sets, NumForm=Word, Number=Plur, Case <fc #ff0000>**JP:** jak to lemmatizovat?</fc> **DZ:** Lemmatizoval bych to na nominativ toho duálu/plurálu, tj. na tvary uvedené zde jako příklady. Problém ale je, že celá tahle kategorie pochází z nějaké dávné konverzní tabulky a když jsem teď hledal příklady v datech, tak jich tam jednak je málo, jednak ta jejich anotace neodpovídá. Vypadá to, že //dvoje// je teď analyzováno jako variantní tvar číslovky //dvojí//. | | | | NUM Číslovka pro množiny "jedny, dvoje, troje, čtvery, ..." | NumType=Sets, NumForm=Word, Gender+Animacy, Number=Plur, Case <fc #ff0000>**JP:** jak to lemmatizovat?</fc> **DZ:** Lemmatizoval bych to na nominativ toho duálu/plurálu, tj. na tvary uvedené zde jako příklady. Problém ale je, že celá tahle kategorie pochází z nějaké dávné konverzní tabulky a když jsem teď hledal příklady v datech, tak jich tam jednak je málo, jednak ta jejich anotace neodpovídá. Vypadá to, že //dvoje// je teď analyzováno jako variantní tvar číslovky //dvojí//. | | |
| | VERB/AUX Sloveso v infinitivu nebo supinu | VerbForm=Inf resp. Sup, Polarity, Aspect | Vynechat Aspect u obouvidých sloves. | | | VERB/AUX Sloveso v infinitivu nebo supinu | VerbForm=Inf resp. Sup, Polarity, Aspect | Vynechat Aspect u obouvidých sloves. | |
| | VERB/AUX Sloveso v přítomném tvaru (včetně dokonavých) | VerbForm=Fin, Mood=Ind, Tense=Pres, Voice=Act, Person, Number, Polarity, Aspect | Vynechat Aspect u obouvidých sloves. | | | VERB/AUX Sloveso v přítomném tvaru (včetně dokonavých) | VerbForm=Fin, Mood=Ind, Tense=Pres, Voice=Act, Person, Number, Polarity, Aspect | Vynechat Aspect u obouvidých sloves. | |