Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:ortofon [2017/06/01 07:37] – [Související odkazy] zuzanakomrskova | cnk:ortofon [2019/12/19 13:22] – [Korpus neformální mluvené češtiny s víceúrovňovým přepisem: ORTOFON] mariekoprivova | ||
---|---|---|---|
Řádek 11: | Řádek 11: | ||
^ <fs medium> | ^ <fs medium> | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
- | ^ Počet [[pojmy: | + | ^ Počet [[pojmy: |
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
- | ^ Počet unikátních (různých) mluvčích | | + | ^ Počet unikátních (různých) mluvčích | |
^ Délka nahrávek [hh: | ^ Délka nahrávek [hh: | ||
</ | </ | ||
===== Složení korpusu a sběr dat ===== | ===== Složení korpusu a sběr dat ===== | ||
- | Korpus ORTOFON se skládá z 332 nahrávek z let 2012–2017 a obsahuje 1 013 565 textových slov, tj. celkem 1 240 147 pozic; v sondách vystupuje celkem 624 různých mluvčích. Nahrávky byly pořizovány v Čechách, na Moravě i ve Slezsku, jejich celková délka je téměř 103 hodin. | + | Korpus ORTOFON se skládá z 332 nahrávek z let 2012–2017 a obsahuje 1 014 786 textových slov, tj. celkem 1 236 508 pozic; v sondách vystupuje celkem 624 různých mluvčích. Nahrávky byly pořizovány v Čechách, na Moravě i ve Slezsku, jejich celková délka je téměř 103 hodin. Více kvantitativních údajů viz na stránce o [[cnk: |
Materiál byl sbírán v souladu s [[cnk: | Materiál byl sbírán v souladu s [[cnk: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | Absolutní počty mluvčích podle místa narození i s údaji o zeměpisné šířce a délce jsou k dispozici {{: | ||
===== Vyváženost korpusu ===== | ===== Vyváženost korpusu ===== | ||
Řádek 29: | Řádek 33: | ||
[{{: | [{{: | ||
- | Základní koncepcí byla myšlenka stejného proporčního zastoupení uvedených sociolingvistických kategorií, uplatňovaných při sběru materiálu u všech mluvených korpusů ČNK. S ohledem na cílenou velikost korpusu (1 000 000 slov) byla pro každou kategorii prezentovanou kombinací čtyř proměnných - pohlaví (2) × věk (2) × vzdělání (2) × nářeční oblast pobytu do 15 let (10) stanovena cílová hranice 12 500 slov. | + | Základní koncepcí byla myšlenka stejného proporčního zastoupení uvedených sociolingvistických kategorií, uplatňovaných při sběru materiálu u všech mluvených korpusů ČNK. S ohledem na cílenou velikost korpusu (1 000 000 slov) byla pro každou kategorii prezentovanou kombinací čtyř proměnných - pohlaví (2) × věk (2) × vzdělání (2) × nářeční oblast pobytu do 15 let (10) - stanovena cílová hranice 12 500 slov. |
Ve snaze o co největší pestrost mluvčích v rámci každé kategorie byl stanoven minimální limit pět různých mluvčích ((Feagin, C. (2002). Entering the community: Fieldwork. Chambers, J. K., Trudgill, P. and Schilling-Estes, | Ve snaze o co největší pestrost mluvčích v rámci každé kategorie byl stanoven minimální limit pět různých mluvčích ((Feagin, C. (2002). Entering the community: Fieldwork. Chambers, J. K., Trudgill, P. and Schilling-Estes, | ||
Řádek 39: | Řádek 43: | ||
* **Rozšíření segmentu k poslechu**: Segment odděleného transkriptu může být dlouhý až 25 slov, což zlepšuje možnosti poslechu zvukového segmentu. | * **Rozšíření segmentu k poslechu**: Segment odděleného transkriptu může být dlouhý až 25 slov, což zlepšuje možnosti poslechu zvukového segmentu. | ||
* **Jiný způsob značení překryvů**: | * **Jiný způsob značení překryvů**: | ||
- | * **Dostupnost audia**: Celý korpus | + | * **Dostupnost audia**: Celý korpus |
- | * **Nové metainformace**: | + | * **Nové metainformace**: |
===== Poděkování ===== | ===== Poděkování ===== | ||
Děkujeme všem spolupracovníkům, | Děkujeme všem spolupracovníkům, | ||
+ | |||
+ | Jmenovitě chceme poděkovat především koordinátorům přepisu: PhDr. Iloně Adámkové, Mgr. Vendule Hálkové, dr. Daně Hlaváčkové, | ||
===== Jak citovat ===== | ===== Jak citovat ===== | ||
<WRAP round tip 70%> | <WRAP round tip 70%> | ||
Kopřivová, | Kopřivová, | ||
+ | |||
+ | Komrsková, Z. - Kopřivová, | ||
Kopřivová M. – Goláňová H. – Klimešová P. – Komrsková Z. – Lukeš D. (2014): Multi-tier Transcription of Informal Spoken Czech: The ORTOFON Corpus Approach. In //Complex Visibles Out There//. Olomouc: Univerzita Palackého v Olomouci, 529-544. | Kopřivová M. – Goláňová H. – Klimešová P. – Komrsková Z. – Lukeš D. (2014): Multi-tier Transcription of Informal Spoken Czech: The ORTOFON Corpus Approach. In //Complex Visibles Out There//. Olomouc: Univerzita Palackého v Olomouci, 529-544. |