Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
seznamy:index [2018/08/13 15:06] – [Pravidla pro přepis] vaclavcvrcek | seznamy:index [2022/09/29 14:10] (aktuální) – [Korpusové nástroje] skryt odkaz * [[seznamy:tagery|Přehled nástrojů pro tagování a lemmatizaci různých jazyků]], které se užívají mj. v rámci paralelního korpusu [[cnk:intercorp|InterCorp]]. jankrivan | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | ====== Seznamy | + | ====== Seznamy |
V této sekci jsou k dispozici různé seznamy pro práci s [[cnk: | V této sekci jsou k dispozici různé seznamy pro práci s [[cnk: | ||
- | ===== Zkratky a kódy ===== | + | ===== Přehledy hodnot atributů |
- | **Poziční atributy**: | + | ==== Hodnoty pozičních atributů == |
- | * [[seznamy: | + | Seznam pozičních atributů je k dispozici na [[pojmy:atributy_pozicni|zvláštní stránce]]. |
- | * [[seznamy: | + | |
- | * atributy [[seznamy: | + | |
- | * atributy [[seznamy: | + | |
- | * atributy [[seznamy: | + | |
- | * atribut [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy:frazemy|frazémová anotace]] ('' | + | |
- | **Strukturní | + | Zde jsou podrobně popsány |
- | * [[seznamy: | + | == Morfologická anotace == |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | **Ostatní**: | + | |
+ | | ||
- | * [[přehled entit použitých v korpusech ČNK]] | + | == Syntaktická a frazémová anotace == |
- | ===== Zdrojové texty psaných korpusů ===== | + | * [[seznamy: |
+ | * [[seznamy: | ||
- | Seznamy ve formátu OpenOffice.org a MS Excel obsahují kompletní výčet opusů ve všech korpusech. Ke každému textu v korpusu jsou v tabulce uvedeny následující údaje: | + | == Anotace různých transkripčních vrstev |
- | | + | * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy '' |
- | * **autor** - autor nebo autoři textu (je-li tato informace dostupná) | + | |
- | * **nazev** - název díla, případně | + | |
- | * **rokvyd** - rok vydání díla (nemusí být nutně prvním vydáním) | + | |
- | * **[[pojmy: | + | |
- | * **[[pojmy: | + | |
- | * **[[pojmy: | + | |
- | * **[[pojmy: | + | |
- | * **[[pojmy: | + | |
- | * **[[cnk: | + | |
- | * **délka** - celkový počet [[pojmy: | + | |
+ | == Tokenizace a lemmatizace v aktuálních korpusech == | ||
- | ^ Korpus | + | * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut '' |
- | | [[cnk:syn2000|SYN2000]] | {{:seznamy: | + | |
- | | [[cnk: | + | |
- | | [[cnk: | + | |
- | | [[cnk:syn2009pub|SYN2009PUB]] | {{:seznamy:syn2009pub.ods|ods}} | {{: | + | |
- | | [[cnk: | + | |
- | | [[cnk: | + | |
- | ===== Zdrojové texty diachronních korpusů ===== | + | ==== Hodnoty strukturních atributů ==== |
- | ^ Korpus | + | Strukturní atributy a jejich role ve struktuře korpusů jsou vysvětleny na [[pojmy:atributy_strukturni|zvláštní stránce]]. |
- | | Diakorp verze 5 | {{:seznamy: | + | |
- | | Diakorp verze 6 | {{: | + | |
- | | Diakon do r. 1989 | {{: | + | |
+ | == Strukturní atributy v korpusech řady SYN == | ||
- | ===== Popis verzí korpusových nástrojů ===== | + | Strukturní atributy korpusů řady SYN jsou popsány na stránce |
- | * [[seznamy:kontext_verze|Přehled verzí rozhraní KonText]] | + | * [[seznamy:strukturni_atributy_syn|struktury a strukturní atributy korpusů |
- | ===== Metainformace v korpusech řady ORAL ===== | + | Atributy se standardizovanými hodnotami jsou dále probrány na zvláštních stránkách: |
- | Metainformace | + | * [[seznamy: |
+ | * [[seznamy:txtype|textový typ]] (atribut '' | ||
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
- | ===== Pravidla pro přepis ===== | + | * [[seznamy: |
- | * [[seznamy:pravidla_ksk|Sběr a přepis dopisů - KSK]] | + | * [[seznamy:med|médium]] (atribut '' |
- | * [[cnk:zasady_pro_prepis_vyucovacich_hodin|Sběr nahrávek vyučovacích hodin -- zásady pro přepis]] | + | * [[seznamy:periodicity|periodicita]] (atribut '' |
- | * [[seznamy:pravidla_2006|Pravidla přepisu Oral2006]] | + | |
- | * [[seznamy:pravidla_2008|Pravidla přepisu Oral2008]] | + | * [[seznamy: |
- | * {{:cnk:prepisovaci_pravidla_oral2013.pdf|Pravidla | + | * [[seznamy:audience|adresát]] (atribut '' |
- | ===== Abecední | + | |
+ | * [[seznamy:section|rubrika]] (atribut '' | ||
+ | |||
+ | |||
+ | == Strukturní atributy v mluvených korpusech == | ||
+ | |||
+ | Strukturní atributy dostupné v korpusech řad ORTOFON, ORAL, ORATOR a DIALEKT jsou popsány na stránce | ||
+ | |||
+ | * [[seznamy:strukturni_atributy_mluvene|struktury a strukturní atributy mluvených korpusů]] | ||
+ | |||
+ | == Strukturní atributy v paralelních korpusech == | ||
+ | |||
+ | Strukturní atributy dostupné v korpusech řady InterCorp jsou popsány na stránce | ||
+ | |||
+ | * [[seznamy:strukturni_atributy_intercorp|struktury a strukturní atributy korpusů InterCorp]] | ||
+ | |||
+ | |||
+ | ===== Ostatní | ||
+ | |||
+ | ==== Zvláštní znaky ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | ==== Zdrojové texty korpusů ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | ==== Seznamy slov z publikovaných korpusů ==== | ||
+ | |||
+ | == Abecední a retrográdní slovníky | ||
Z korpusů [[cnk: | Z korpusů [[cnk: | ||
| | ||
- | ===== Srovnávací frekvenční seznamy | + | == Srovnávací frekvenční seznamy == |
Reprezentativní korpusy [[cnk: | Reprezentativní korpusy [[cnk: | ||
- | ===== Nástroje pro tagování a lemmatizaci ===== | + | Další frekvenční seznamy jsou k dispozici v aplikaci [[manualy: |
- | Nástroje pro tagování | + | == Databáze slovních tvarů |
- | ---- | + | V aplikaci [[manualy: |
+ | == Seznamy SYN2020 == | ||
+ | |||
+ | [[cnk: | ||
+ | |||
+ | ==== Pravidla pro přepis ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | * [[cnk: | ||
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
+ | * {{: | ||
+ | |||
+ | ==== Korpusové nástroje ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | ---- | ||
<WRAP center round box 51%> | <WRAP center round box 51%> |