AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:ortofon [2021/10/18 14:34] – [Korpus neformální mluvené češtiny s víceúrovňovým přepisem: ORTOFON] Václav Cvrčekcnk:ortofon [2022/08/29 17:25] (aktuální) – BatchEdit: pojmy>seznamy promluvy Václav Cvrček (admin)
Řádek 14: Řádek 14:
 ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce, hezitačních a citoslovečných zvuků a komentářů |  1 014 786 | ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce, hezitačních a citoslovečných zvuků a komentářů |  1 014 786 |
 ^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  65 294 |   ^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  65 294 |  
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] |  332 | +^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] |  332 | 
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] |  172 736 |+^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] |  172 736 |
 ^ Počet unikátních (různých) mluvčích |  624 |   ^ Počet unikátních (různých) mluvčích |  624 |  
 ^ Délka nahrávek [hh:mm:ss.ms] |  102:41:14.247 |   ^ Délka nahrávek [hh:mm:ss.ms] |  102:41:14.247 |  
Řádek 38: Řádek 38:
 Základní koncepcí byla myšlenka stejného proporčního zastoupení uvedených sociolingvistických kategorií, uplatňovaných při sběru materiálu u všech mluvených korpusů ČNK. S ohledem na cílenou velikost korpusu (1 000 000 slov) byla pro každou kategorii prezentovanou kombinací čtyř proměnných - pohlaví (2) × věk (2) × vzdělání (2) × nářeční oblast pobytu do 15 let (10) - stanovena cílová hranice 12 500 slov. Základní koncepcí byla myšlenka stejného proporčního zastoupení uvedených sociolingvistických kategorií, uplatňovaných při sběru materiálu u všech mluvených korpusů ČNK. S ohledem na cílenou velikost korpusu (1 000 000 slov) byla pro každou kategorii prezentovanou kombinací čtyř proměnných - pohlaví (2) × věk (2) × vzdělání (2) × nářeční oblast pobytu do 15 let (10) - stanovena cílová hranice 12 500 slov.
 Ve snaze o co největší pestrost mluvčích v rámci každé kategorie byl stanoven minimální limit pět různých mluvčích ((Feagin, C. (2002). Entering the community: Fieldwork. Chambers, J. K., Trudgill, P. and Schilling-Estes, N., editors, //The Handbook of Language Variation and Change//, 20–39. Blackwell Publishing, Malden, MA.)). Cílem tohoto opatření bylo omezit vliv idiolektu.  Ve snaze o co největší pestrost mluvčích v rámci každé kategorie byl stanoven minimální limit pět různých mluvčích ((Feagin, C. (2002). Entering the community: Fieldwork. Chambers, J. K., Trudgill, P. and Schilling-Estes, N., editors, //The Handbook of Language Variation and Change//, 20–39. Blackwell Publishing, Malden, MA.)). Cílem tohoto opatření bylo omezit vliv idiolektu. 
 +
 +===== Strukturní atributy korpusu ORTOFON =====
 +
 +Struktury a strukturní atributu korpusu ORTOFON jsou popsány na [[seznamy:strukturni_atributy_mluvene#strukturni_atributy_korpusu_ortofon_a_spojeneho_korpusu_oral|zvláštní stránce]].
  
 ===== Rozdíly mezi korpusem ORAL a ORTOFON ===== ===== Rozdíly mezi korpusem ORAL a ORTOFON =====
Řádek 55: Řádek 59:
 ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce, hezitačních a citoslovečných zvuků a komentářů |  2 101 214 | ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce, hezitačních a citoslovečných zvuků a komentářů |  2 101 214 |
 ^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  101 502 |   ^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  101 502 |  
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] |  615 | +^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] |  615 | 
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] |  360 248 |+^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] |  360 248 |
 ^ Počet unikátních (různých) mluvčích |  960 |   ^ Počet unikátních (různých) mluvčích |  960 |  
 ^ Délka nahrávek [hh:mm:ss.ms] |  210:09:35.155 |   ^ Délka nahrávek [hh:mm:ss.ms] |  210:09:35.155 |