Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Následující verze | Předchozí verze |
cnk:etalon [2021/06/01 21:17] – vytvořeno jankrivan | cnk:etalon [2021/06/02 19:13] (aktuální) – [Zpřístupnění korpusu] hanaskoumalova |
---|
===== Morfologická anotace ===== | ===== Morfologická anotace ===== |
| |
Korpus Etalon je segmentován, lemmatizován a morfologicky anotován stejně jako [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|SYN2020]]: korpus obsahuje atributy [[cnk:syn2020#vicenasobna_lemmatizace_a_znackovani_agregat| word, sforma]], [[cnk:syn2020#lemmatizace|lemma, sublemma]], [[cnk:syn2020#morfologicke_znackovani_tag|tag]] a [[cnk:syn2020#znackovani_sloves_verbtag|verbtag]]. | Korpus Etalon je segmentován, lemmatizován a morfologicky anotován stejně jako [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|SYN2020]]: korpus obsahuje atributy [[cnk:syn2020#vicenasobna_lemmatizace_a_znackovani_agregat| word, synword]], [[cnk:syn2020#lemmatizace|lemma, sublemma]], [[cnk:syn2020#morfologicke_znackovani_tag|tag]] a [[cnk:syn2020#znackovani_sloves_verbtag|verbtag]]. |
| |
===== Zpřístupnění korpusu ===== | ===== Zpřístupnění korpusu ===== |
| |
- Korpus ČNK v rozhraní [[manualy:kontext|Kontext]]. | - Korpus ČNK v rozhraní [[manualy:kontext|Kontext]]. |
- Data ve vertikále: tato data je možné si stáhnout z úložiště LINDAT/CLARIN (pro nekomerční účely). Tato data jsou rozdělena na segmenty o maximálně 100 slovech (bez interpunkce) a segmenty jsou promíchány. | - Data ve vertikále: tato data je možné si stáhnout z úložiště [[http://hdl.handle.net/11234/1-3698|LINDAT/CLARIN]] (pro nekomerční účely). Tato data jsou rozdělena na segmenty o maximálně 100 slovech (bez interpunkce) a segmenty jsou promíchány. |
| |
===== Poděkování ===== | ===== Poděkování ===== |