Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
seznamy:index [2015/12/16 16:17] – [Zkratky a kódy] tomasjelinek | seznamy:index [2022/08/29 13:09] – [Hodnoty pozičních atributů] jankrivan | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | ====== Seznamy | + | ====== Seznamy |
V této sekci jsou k dispozici různé seznamy pro práci s [[cnk: | V této sekci jsou k dispozici různé seznamy pro práci s [[cnk: | ||
- | ===== Zkratky a kódy ===== | + | ===== Přehledy hodnot atributů |
- | * [[seznamy: | + | ==== Hodnoty pozičních atributů == |
- | * [[seznamy: | + | |
- | * Atributy [[seznamy: | + | |
- | * Atributy [[seznamy: | + | |
- | * Atributy [[seznamy: | + | |
- | * Atribut [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[přehled entit použitých v korpusech ČNK]] | + | |
+ | Seznam pozičních atributů je k dispozici na stránce | ||
- | ===== Zdrojové texty psaných korpusů ===== | + | * [[pojmy: |
+ | |||
+ | Zde jsou podrobně popsány atributy, které nabývají standardizovaných nebo zvláštních hodnot: | ||
- | Seznamy ve formátu OpenOffice.org a MS Excel obsahují kompletní výčet opusů ve všech korpusech. Ke každému textu v korpusu jsou v tabulce uvedeny následující údaje: | + | == Morfologická anotace == |
- | | + | * [[seznamy:tagy|morfologické značky]] (atribut '' |
- | * **autor** - autor nebo autoři textu (je-li to informace zjistitelná) | + | * [[seznamy:verbtagy|značky gramatických kategorií slovesa]] (atribut '' |
- | * **nazev** - název díla, příp. číslo časopisu/ | + | |
- | * **rokvyd** - rok vydání díla (nemusí být nutně první vydání) | + | |
- | * **[[pojmy: | + | |
- | * **[[pojmy: | + | |
- | * **[[pojmy: | + | |
- | | + | |
- | * **[[pojmy: | + | |
- | * **[[cnk: | + | |
- | * **Délka** - celkový počet [[pojmy: | + | |
+ | == Syntaktická a frazémová anotace == | ||
- | ^ Korpus | + | * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], |
- | | [[cnk:syn2000|SYN2000]] | {{:seznamy:syn2000.ods|ods}} | + | * [[seznamy:frazemy|frazémové značky]] (atributy '' |
- | | [[cnk:syn2005|SYN2005]] | {{: | + | |
- | | [[cnk:syn2006pub|SYN2006PUB]] | {{: | + | |
- | | [[cnk:syn2009pub|SYN2009PUB]] | {{: | + | |
- | | [[cnk:syn2010|SYN2010]] | {{: | + | |
- | | [[cnk:syn|SYN]] | {{: | + | |
- | ===== Zdrojové texty diachronních korpusů ===== | + | == Anotace různých transkripčních vrstev v mluvených korpusech |
- | ^ Korpus | + | * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy '' |
- | | Diakorp verze 5 | {{:seznamy:diakorp.ods|ods}} | + | |
- | | Diakorp verze 6 | {{: | + | |
- | | Diakon do r. 1989 | {{: | + | |
+ | == Tokenizace a lemmatizace v aktuálních korpusech == | ||
+ | * [[cnk: | ||
+ | * [[cnk: | ||
- | ===== Metainformace v korpusech řady ORAL ===== | + | ==== Hodnoty strukturních atributů |
- | Metainformace (strukturní | + | == Strukturní |
- | ===== Pravidla pro přepis mluvených korpusů ===== | + | |
- | FIXME | + | Strukturní atributy korpusů řady SYN jsou popsány na stránce |
- | * [[seznamy:pravidlaprepis2013|pravidla pro přepis korpusu ORAL2013]] | + | * [[seznamy:strukturni_atributy_syn|Struktury a strukturní atributy korpusů |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[seznamy: | + | |
- | * [[sociolingvistické značky korpusu ORAL2013]] | + | Atributy se standardizovanými hodnotami jsou dále probrány na zvláštních stránkách: |
- | * [[sociolingvistické značky korpusu ORAL2008]] | + | |
- | * [[sociolingvistické značky korpusu ORAL2006]] | + | |
- | * [[sociolingvistické značky korpusu PMK]] | + | |
- | * [[sociolingvistické značky korpusu BMK]] | + | |
- | * [[Statistiky ke korpusu SCHOLA2010]] | + | * [[seznamy: |
- | * [[Značky užité v korpusu SCHOLA2010]] | + | * [[seznamy: |
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
- | ===== Další pravidla ===== | + | * [[seznamy: |
- | * [[seznamy:pravidla_ksk|Sběr a přepis dopisů - KSK]] | + | * [[seznamy:med|médium]] (atribut '' |
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
- | ===== Abecední a retrográdní slovníky ===== | + | * [[seznamy: |
- | Z korpusů [[cnk: | + | |
+ | == Strukturní atributy v mluvených korpusech == | ||
+ | |||
+ | Strukturní atributy dostupné v korpusech řad ORTOFON, ORAL, ORATOR a DIALEKT jsou popsány na stránce | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | == Strukturní atributy v paralelních korpusech == | ||
+ | |||
+ | Strukturní atributy dostupné v korpusech řady InterCorp jsou popsány na stránce | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | |||
+ | |||
+ | ===== Ostatní přehledy ===== | ||
+ | |||
+ | ==== Zvláštní znaky ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | ==== Zdrojové texty korpusů ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | |||
+ | ==== Seznamy slov z publikovaných korpusů ==== | ||
+ | |||
+ | == Abecední a retrográdní slovníky == | ||
+ | |||
+ | Z korpusů [[cnk: | ||
| | ||
- | ===== Srovnávací frekvenční seznamy | + | == Srovnávací frekvenční seznamy == |
Reprezentativní korpusy [[cnk: | Reprezentativní korpusy [[cnk: | ||
- | ===== Nástroje pro tagování a lemmatizaci ===== | + | Další frekvenční seznamy jsou k dispozici v aplikaci [[manualy: |
- | Nástroje pro tagování | + | == Databáze slovních tvarů |
- | ---- | + | V aplikaci [[manualy: |
+ | == Seznamy SYN2020 == | ||
+ | |||
+ | [[cnk: | ||
+ | |||
+ | ==== Pravidla pro přepis ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | * [[cnk: | ||
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
+ | * {{: | ||
+ | |||
+ | ==== Korpusové nástroje ==== | ||
+ | |||
+ | * [[seznamy: | ||
+ | * [[seznamy: | ||
+ | |||
+ | ---- | ||
<WRAP center round box 51%> | <WRAP center round box 51%> |