AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

cnk:anotacni_standard_cnk [2026/01/15 09:56] – vytvořeno tomasjelinekcnk:anotacni_standard_cnk [2026/01/15 11:22] (aktuální) tomasjelinek
Řádek 2: Řádek 2:
 ====== Anotační standard ČNK pro morfologii a lemmatizaci ====== ====== Anotační standard ČNK pro morfologii a lemmatizaci ======
  
-ČNK používá v synchronních psaných korpusech (počínaje korpusy SYN2020 a SYN_v9) i v mluvených korpusech (Ortofon_v3) jednotný anotační standard pro morfologické značkování a lemmatizaci. Anotační standard zahrnuje tokenizaci (vymezení tokenů v textu), lemmatizaci (základní, slovníkové tvary tokenů) a morfologické značkování včetně speciálních značek pro slovesné tvary.+ČNK používá v synchronních psaných korpusech (počínaje korpusy SYN2020 a SYN_v9, dále např. korpusy NET a ONLINE) i v mluvených korpusech (Ortofon_v3) jednotný anotační standard pro morfologické značkování a lemmatizaci. Anotační standard zahrnuje tokenizaci (vymezení tokenů v textu), lemmatizaci (základní, slovníkové tvary tokenů) a morfologické značkování včetně speciálních značek pro slovesné tvary.
  
 ==== Tokenizace ==== ==== Tokenizace ====