Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:ortofon [2020/12/24 00:38] – lukes | cnk:ortofon [2022/06/02 12:34] – [Strukturní atributy korpusu ORTOFON] jankrivan | ||
---|---|---|---|
Řádek 5: | Řádek 5: | ||
Korpus ORTOFON je také první korpus, který je plně vyvážený v rámci všech základních sociolingvistických kategoriích mluvčích (pohlaví, věková skupina, výše dosaženého vzdělání a oblast pobytu v dětství). Korpus je [[cnk: | Korpus ORTOFON je také první korpus, který je plně vyvážený v rámci všech základních sociolingvistických kategoriích mluvčích (pohlaví, věková skupina, výše dosaženého vzdělání a oblast pobytu v dětství). Korpus je [[cnk: | ||
- | Korpus ORTOFON umožňuje zkoumat různé aspekty mluveného jazyka, tj. lexikum, morfologii, syntax, pragmatiku, výstavbu dialogu. Korpus není primárně určen pro dialektologický ((Pro tento typ výzkumu je určen korpus [[cnk: | + | Korpus ORTOFON umožňuje zkoumat různé aspekty mluveného jazyka, tj. lexikon, morfologii, syntax, pragmatiku, výstavbu dialogu. Korpus není primárně určen pro dialektologický((Pro tento typ výzkumu je určen korpus [[cnk: |
Zveřejněním korpusu ORTOFON spolu se spojeným korpusem [[cnk: | Zveřejněním korpusu ORTOFON spolu se spojeným korpusem [[cnk: | ||
Řádek 38: | Řádek 38: | ||
Základní koncepcí byla myšlenka stejného proporčního zastoupení uvedených sociolingvistických kategorií, uplatňovaných při sběru materiálu u všech mluvených korpusů ČNK. S ohledem na cílenou velikost korpusu (1 000 000 slov) byla pro každou kategorii prezentovanou kombinací čtyř proměnných - pohlaví (2) × věk (2) × vzdělání (2) × nářeční oblast pobytu do 15 let (10) - stanovena cílová hranice 12 500 slov. | Základní koncepcí byla myšlenka stejného proporčního zastoupení uvedených sociolingvistických kategorií, uplatňovaných při sběru materiálu u všech mluvených korpusů ČNK. S ohledem na cílenou velikost korpusu (1 000 000 slov) byla pro každou kategorii prezentovanou kombinací čtyř proměnných - pohlaví (2) × věk (2) × vzdělání (2) × nářeční oblast pobytu do 15 let (10) - stanovena cílová hranice 12 500 slov. | ||
Ve snaze o co největší pestrost mluvčích v rámci každé kategorie byl stanoven minimální limit pět různých mluvčích ((Feagin, C. (2002). Entering the community: Fieldwork. Chambers, J. K., Trudgill, P. and Schilling-Estes, | Ve snaze o co největší pestrost mluvčích v rámci každé kategorie byl stanoven minimální limit pět různých mluvčích ((Feagin, C. (2002). Entering the community: Fieldwork. Chambers, J. K., Trudgill, P. and Schilling-Estes, | ||
+ | |||
+ | ===== Strukturní atributy korpusu ORTOFON ===== | ||
+ | |||
+ | ^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty ^ | ||
+ | | doc | id | jednoznačný identifikátor sondy | ''< | ||
+ | | | year | rok nahrání sondy | např. '' | ||
+ | | | month | měsíc nahrání sondy | např. '' | ||
+ | | | location | ||
+ | | | situation | ||
+ | | | speakers | ||
+ | | | relationship | ||
+ | | | genders | ||
+ | | | generations | ||
+ | | | length | ||
+ | | | tokens | ||
+ | | sp | id | identifikátor segmentu (struktury sp) | např. '' | ||
+ | | | nickname | ||
+ | | | speaker_id | ||
+ | | | gender | ||
+ | | | age_binary | ||
+ | | | age | věk mluvčího (číselně) | ''< | ||
+ | | | edu_binary | ||
+ | | | edu_level | ||
+ | | | edu_field | ||
+ | | | occupation | ||
+ | | | occupation_category | ||
+ | | | reg_childhood | ||
+ | | | loc_childhood | ||
+ | | | locsize_childhood | ||
+ | | | reg_longest | ||
+ | | | locsize_longest | ||
+ | | | reg_current | ||
+ | | | locsize_current | ||
+ | | | proportion | ||
+ | | | soundfile | ||
+ | | para | type | označení slov nebo skupin slov, která jsou vyslovena s určitým charakteristickým/ | ||
+ | | pw | - | struktura obaluje pozice, které tvoří jedno zvukové slovo (přízvukový takt) | - | | ||
+ | | overlap | ||
+ | | unclear | ||
===== Rozdíly mezi korpusem ORAL a ORTOFON ===== | ===== Rozdíly mezi korpusem ORAL a ORTOFON ===== |