Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
seznamy:index [2018/08/13 13:50] – [Zkratky a kódy] vaclavcvrcek | seznamy:index [2020/12/23 15:59] – [Nástroje pro tagování a lemmatizaci] jankrivan |
---|
| Diakorp verze 5 | {{:seznamy:diakorp.ods|ods}} | {{:seznamy:diakorp.xlsx|xlsx}} | | | Diakorp verze 5 | {{:seznamy:diakorp.ods|ods}} | {{:seznamy:diakorp.xlsx|xlsx}} | |
| Diakorp verze 6 | {{:seznamy:diakorp6.ods|ods}} | {{:seznamy:diakorp6.xlsx|xlsx}} | | | Diakorp verze 6 | {{:seznamy:diakorp6.ods|ods}} | {{:seznamy:diakorp6.xlsx|xlsx}} | |
| Diakon do r. 1989 | {{:seznamy:diakon.ods|ods}} | {{:seznamy:diakon.xlsx|xlsx}} | | | Diakon do r. 1989((Poznámka: Technická datace uvedená v tabulkách u korpusu Diakon odpovídá převážně roku vydání, u starých textů s nejistou datací a u textů z několikaletého časového rozmezí je vybrán jeden zástupný rok. Značná část textů byla do korpusu zařazena z jejich novějších edic, a po pravopisné stránce se může odchylovat od původního znění textu. Korpus Diakon tedy není spolehlivou základnou pro zkoumání vývoje pravopisu.)) | {{:seznamy:diakon.ods|ods}} | {{:seznamy:diakon.xlsx|xlsx}} | |
| |
| |
* [[seznamy:pravidla_ksk|Sběr a přepis dopisů - KSK]] | * [[seznamy:pravidla_ksk|Sběr a přepis dopisů - KSK]] |
* [[cnk:zasady_pro_prepis_vyucovacich_hodin|Sběr nahrávek vyučovacích hodin -- zásady pro přepis]] | * [[cnk:zasady_pro_prepis_vyucovacich_hodin|Sběr nahrávek vyučovacích hodin -- zásady pro přepis]] |
| * [[seznamy:pravidla_2006|Pravidla přepisu Oral2006]] |
| * [[seznamy:pravidla_2008|Pravidla přepisu Oral2008]] |
| * {{:cnk:prepisovaci_pravidla_oral2013.pdf|Pravidla přepisu Oral2013}} |
===== Abecední a retrográdní slovníky ===== | ===== Abecední a retrográdní slovníky ===== |
| |
| |
Nástroje pro tagování a lemmatizaci různých jazyků, které se užívají mj. v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], shrnuje následující [[seznamy:tagery|přehled]]. | Nástroje pro tagování a lemmatizaci různých jazyků, které se užívají mj. v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], shrnuje následující [[seznamy:tagery|přehled]]. |
| |
| |
| ===== Seznamy pro tokenizaci a lemmatizaci ===== |
| |
| [[cnk:syn2020:seznamy|Seznamy slov]], s jejichž pomocí se tokenizují a lemmatizují slovní tvary v korpusu [[cnk:syn2020|SYN2020]]. |
| |
---- | ---- |