Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| cnk:anotacni_standard_cnk [2026/01/15 09:56] – vytvořeno tomasjelinek | cnk:anotacni_standard_cnk [2026/01/15 11:22] (aktuální) – tomasjelinek | ||
|---|---|---|---|
| Řádek 2: | Řádek 2: | ||
| ====== Anotační standard ČNK pro morfologii a lemmatizaci ====== | ====== Anotační standard ČNK pro morfologii a lemmatizaci ====== | ||
| - | ČNK používá v synchronních psaných korpusech (počínaje korpusy SYN2020 a SYN_v9) i v mluvených korpusech (Ortofon_v3) jednotný anotační standard pro morfologické značkování a lemmatizaci. Anotační standard zahrnuje tokenizaci (vymezení tokenů v textu), lemmatizaci (základní, | + | ČNK používá v synchronních psaných korpusech (počínaje korpusy SYN2020 a SYN_v9, dále např. korpusy NET a ONLINE) i v mluvených korpusech (Ortofon_v3) jednotný anotační standard pro morfologické značkování a lemmatizaci. Anotační standard zahrnuje tokenizaci (vymezení tokenů v textu), lemmatizaci (základní, |
| ==== Tokenizace ==== | ==== Tokenizace ==== | ||