AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
cnk:etalon [2021/06/01 21:17] – vytvořeno jankrivancnk:etalon [2021/06/02 19:13] (aktuální) – [Zpřístupnění korpusu] hanaskoumalova
Řádek 33: Řádek 33:
 ===== Morfologická anotace ===== ===== Morfologická anotace =====
  
-Korpus Etalon je segmentován, lemmatizován a morfologicky anotován stejně jako [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|SYN2020]]: korpus obsahuje atributy [[cnk:syn2020#vicenasobna_lemmatizace_a_znackovani_agregat| word, sforma]], [[cnk:syn2020#lemmatizace|lemma, sublemma]], [[cnk:syn2020#morfologicke_znackovani_tag|tag]] a [[cnk:syn2020#znackovani_sloves_verbtag|verbtag]]. +Korpus Etalon je segmentován, lemmatizován a morfologicky anotován stejně jako [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|SYN2020]]: korpus obsahuje atributy [[cnk:syn2020#vicenasobna_lemmatizace_a_znackovani_agregat| word, synword]], [[cnk:syn2020#lemmatizace|lemma, sublemma]], [[cnk:syn2020#morfologicke_znackovani_tag|tag]] a [[cnk:syn2020#znackovani_sloves_verbtag|verbtag]]. 
  
 ===== Zpřístupnění korpusu ===== ===== Zpřístupnění korpusu =====
Řádek 40: Řádek 40:
  
   - Korpus ČNK v rozhraní [[manualy:kontext|Kontext]].   - Korpus ČNK v rozhraní [[manualy:kontext|Kontext]].
-  - Data ve vertikále: tato data je možné si stáhnout z úložiště LINDAT/CLARIN (pro nekomerční účely). Tato data jsou rozdělena na segmenty o maximálně 100 slovech (bez interpunkce) a segmenty jsou promíchány.+  - Data ve vertikále: tato data je možné si stáhnout z úložiště [[http://hdl.handle.net/11234/1-3698|LINDAT/CLARIN]] (pro nekomerční účely). Tato data jsou rozdělena na segmenty o maximálně 100 slovech (bez interpunkce) a segmenty jsou promíchány.
  
 ===== Poděkování ===== ===== Poděkování =====