Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
seznamy:abc_seznamy [2016/09/13 14:25] – [Abecední a retrográdní slovníky] michalkren | seznamy:abc_seznamy [2016/09/14 13:32] – [Popis údajů ve slovnících] michalkren |
---|
===== Popis údajů ve slovnících ===== | ===== Popis údajů ve slovnících ===== |
| |
Podobně jako [[seznamy:srovnavaci_seznamy|srovnávací frekvenční seznamy]] jsou i abecední a retrográdní slovníky uloženy v zazipovaných textových souborech v kódování češtiny UTF-8. Z názvu souboru je zřejmé, zda obsahuje slovní tvary nebo lemmata, na kterém korpusu je založen i jeho setřídění. | Podobně jako [[seznamy:srovnavaci_seznamy|srovnávací frekvenční seznamy]] jsou i abecední a retrográdní slovníky uloženy v zazipovaných souborech v kódování češtiny UTF-8. Z názvu souboru je zřejmé, zda obsahuje slovní tvary nebo lemmata, na kterém korpusu je soubor založen i jeho setřídění. |
| |
Každý soubor se skládá ze tří sloupců oddělených tabulátory: | Každý soubor se skládá ze tří sloupců oddělených tabulátory: |
- sloupec - [[pojmy:rank|rank]] (pořadí podle frekvence; mají-li dvě hesla stejnou frekvenci, je stejný i jejich rank) | - sloupec - [[pojmy:rank|rank]] (pořadí podle frekvence; mají-li dvě hesla stejnou frekvenci, je stejný i jejich rank) |
- sloupec - slovní tvar nebo lemma | - sloupec - slovní tvar nebo lemma |
- sloupec - [[pojmy:frekvence|frekvence]] (počet výskytů daného hesla v korpusu) | - sloupec - [[pojmy:frekvence|frekvence]] |
| |
===== Jak citovat abecední a retrográdní slovníky ===== | ===== Jak citovat abecední a retrográdní slovníky ===== |
V případě, že tyto slovníky použijete ve vědecké práci, uvádějte je prosím v bibliografii následujícím způsobem: | V případě, že tyto slovníky použijete ve vědecké práci, uvádějte je prosím v bibliografii následujícím způsobem: |
| |
//Český národní korpus: Abecední a retrográdní slovníky//. Ústav Českého národního korpusu FF UK, Praha 2016. Dostupné z WWW: http://www.korpus.cz. | Český národní korpus: //Abecední a retrográdní slovníky//. Ústav Českého národního korpusu FF UK, Praha 2016. Dostupné z WWW: http://www.korpus.cz. |
| |
===== Download ===== | ===== Download ===== |
Abecední a retrográdní slovníky používají kódování češtiny UTF-8. | Abecední a retrográdní slovníky používají kódování češtiny UTF-8. |
| |
^ Korpus ^ Slovní tvary ^ Lemmata ^ | ^ Korpus ^ Slovní tvary ^ Lemmata ^ |
^ SYN2000 | {{:seznamy:syn2000_word_abc.zip|abecední}} | {{:seznamy:syn2000_lemma_abc.zip|abecední}} | | ^ SYN2000 | {{:seznamy:syn2000_word_abc_utf8.zip|abecední}} | {{:seznamy:syn2000_lemma_abc_utf8.zip|abecední}} | |
^ ::: | {{:seznamy:syn2000_word_cba.zip|retrográdní}} | {{:seznamy:syn2000_lemma_cba.zip|retrográdní}} | | ^ ::: | {{:seznamy:syn2000_word_cba_utf8.zip|retrográdní}} | {{:seznamy:syn2000_lemma_cba_utf8.zip|retrográdní}} | |
^ SYN2005 | {{:seznamy:syn2005_word_abc.zip|abecední}} | {{:seznamy:syn2005_lemma_abc.zip|abecední}} | | ^ SYN2005 | {{:seznamy:syn2005_word_abc_utf8.zip|abecední}} | {{:seznamy:syn2005_lemma_abc_utf8.zip|abecední}} | |
^ ::: | {{:seznamy:syn2005_word_cba.zip|retrográdní}} | {{:seznamy:syn2005_lemma_cba.zip|retrográdní}} | | ^ ::: | {{:seznamy:syn2005_word_cba_utf8.zip|retrográdní}} | {{:seznamy:syn2005_lemma_cba_utf8.zip|retrográdní}} | |
^ SYN2010 | {{:seznamy:syn2010_word_abc.zip|abecední}} | {{:seznamy:syn2010_lemma_abc.zip|abecední}} | | ^ SYN2010 | {{:seznamy:syn2010_word_abc_utf8.zip|abecední}} | {{:seznamy:syn2010_lemma_abc_utf8.zip|abecední}} | |
^ ::: | {{:seznamy:syn2010_word_cba.zip|retrográdní}} | {{:seznamy:syn2010_lemma_cba.zip|retrográdní}} | | ^ ::: | {{:seznamy:syn2010_word_cba_utf8.zip|retrográdní}} | {{:seznamy:syn2010_lemma_cba_utf8.zip|retrográdní}} | |
| ^ SYN2015 | {{:seznamy:syn2015_word_abc_utf8.zip|abecední}} | {{:seznamy:syn2015_lemma_abc_utf8.zip|abecední}} | |
| ^ ::: | {{:seznamy:syn2015_word_cba_utf8.zip|retrográdní}} | {{:seznamy:syn2015_lemma_cba_utf8.zip|retrográdní}} | |
| |
Toto dílo podléhá licenci Creative Commons [[http://creativecommons.org/licenses/by/4.0/ | CC BY 4.0 International]] | Toto dílo podléhá licenci Creative Commons [[http://creativecommons.org/licenses/by/4.0/ | CC BY 4.0 International]] |