| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| seznamy:strukturni_atributy_mluvene [2022/06/14 15:05] – [Struktury korpusů mluvené češtiny] jankrivan | seznamy:strukturni_atributy_mluvene [2025/05/28 16:01] (aktuální) – [Strukturní atributy korpusu ORTOFON a spojeného korpusu ORAL] opravit vysvětlení confederate vhorky |
|---|
| | ::: | reg_current | středomoravská | nářeční oblast současného pobytu mluvčího | ''{česko-moravská, jihozápadočeská, pohraničí české, pohraničí moravské, severovýchodočeská, středomoravská, slezská, středočeská, východomoravská}'' nebo ''Y'' | | | ::: | reg_current | středomoravská | nářeční oblast současného pobytu mluvčího | ''{česko-moravská, jihozápadočeská, pohraničí české, pohraničí moravské, severovýchodočeská, středomoravská, slezská, středočeská, východomoravská}'' nebo ''Y'' | |
| | ::: | proportion | 23 % | procentuální zastoupení řeči mluvčího v rámci celé nahrávky | | | ::: | proportion | 23 % | procentuální zastoupení řeči mluvčího v rámci celé nahrávky | |
| | ::: | confederate | ne | informace, zda se daný mluvčí vyskytuje i v jiných nahrávkách | ''{ano, ne}'' | | | ::: | confederate | ne | informace, zda je daný mluvčí nahrávající | ''{ano, ne}'' | |
| | ::: | edu_binary | B | vzdělání mluvčího (hrubé rozlišení) | ''{A'' (altus, vysokoškolské včetně pouze započatého)'',B'' (basis, základní a středoškolské)''}'' nebo ''Y'' | | | ::: | edu_binary | B | vzdělání mluvčího (hrubé rozlišení) | ''{A'' (altus, vysokoškolské včetně pouze započatého)'',B'' (basis, základní a středoškolské)''}'' nebo ''Y'' | |
| | ::: | age_binary | I | věk mluvčího (hrubé rozlišení) | ''{I'' (iunior, mladší: cca 20–35 let)'',V'' (vetus, starší: 35 let a více)''}'' nebo ''Y'' | | | ::: | age_binary | I | věk mluvčího (hrubé rozlišení) | ''{I'' (iunior, mladší: cca 20–35 let)'',V'' (vetus, starší: 35 let a více)''}'' nebo ''Y'' | |
| | ::: | mistodet | Zápy | místo pobytu mluvčího v dětství (do 15 let) | | část obce v kulatých závorkách, např. Kamenný Újezd (Kosov)| | | ::: | mistodet | Zápy | místo pobytu mluvčího v dětství (do 15 let) | | část obce v kulatých závorkách, např. Kamenný Újezd (Kosov)| |
| | ::: | noblastdet | východomoravská | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál | | | ::: | noblastdet | východomoravská | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál | |
| | |
| | |
| | ==== Strukturní atributy korpusu Jazyky v migraci ==== |
| | |
| | Korpus [[cnk:jazyky-v-migraci|Jazyky v migraci]] obsahuje následující údaje: |
| | |
| | ^ Struktura ^ Atribut ^ Příklad ^ Vysvětlení ^ Možné hodnoty ^ |
| | | doc | id | A1CS11 | unikátní identifikátor nahrávky | ''<řetězec čísel a velkých písmen>'' | |
| | | ::: | language | cs | hlavní jazyk | ''{cs, de}'' | |
| | | ::: | speakers | 1 | počet mluvčích, vyjma explorátory | ''<číslo>'' | |
| | | ::: | situation_cs | doma | popis situace česky | ''{doma, kancelář, veřejný prostor}'' | |
| | | ::: | situation_de | zu Hause | popis situace německy | ''{Büro, zu Hause, öffentlicher Raum}'' | |
| | | ::: | topics_cs | emigrace%%|%%známí%%|%%škola | témata česky | více možností, vč. multihodnot | |
| | | ::: | topics_de | Auswanderung%%|%%Bekannte%%|%%Schule | témata německy | více možností, vč. multihodnot | |
| | | sp | id | A1CS11:187 | unikátní identifikátor segmentu | ''<doc.id>:<pořadové číslo v rámci nahrávky>'' | |
| | | ::: | nickname | Erika B. | přezdívka mluvčího | | |
| | | ::: | gender | F | pohlaví mluvčího | ''{F, M}'' | |
| | | ::: | born | 1956 | rok narození mluvčího | ''<číslo>'' | |
| | | ::: | immigrated | 1968 | rok emigrace mluvčího do Německa | ''<číslo>'' | |
| | | ::: | reg_birth | Liberecký kraj | region narození mluvčího | ''{Hlavní město Praha, Jihočeský kraj, Karlovarský kraj, Královéhradecký kraj, Liberecký kraj, Moravskoslezský kraj, Olomoucký kraj, Plzeňský kraj, západní Čechy, Ústecký kraj}'' | |
| | | ::: | reg_current | Bayern | region současného pobytu mluvčího | ''{Baden-Württemberg, Bayern, Hessen}'' | |
| | | ::: | loctype_birth_cs | venkov | typ místa narození mluvčího česky| ''{město, venkov}'' | |
| | | ::: | loctype_birth_de | ländlich | typ místa narození mluvčího německy | ''{ländlich, städtisch}'' | |
| | | ::: | loctype_current_cs | venkov | typ místa současného pobytu mluvčího česky| ''{město, venkov}'' | |
| | | ::: | loctype_current_de | ländlich | typ místa současného pobytu mluvčího německy | ''{ländlich, städtisch}'' | |
| | | ::: | generation_cs | pozdní vysídlenci | generace mluvčího česky | ''{migranti, pozdní vysídlenci}'' | |
| | | ::: | generation_de | Spätaussiedler:innen | generace mluvčího německy | ''{Migrant:innen, Spätaussiedler:innen}'' | |
| | | ::: | education_cs | VŠ | vzdělání mluvčího česky | ''{SŠ, VŠ}'' | |
| | | ::: | education_de | Hochschulabschluss | vzdělání mluvčího německy | ''{Abitur/Berufsbildende Schule, Hochschulabschluss}'' | |
| | | ::: | langgener_category | PAT%%|%%AA | viz první tabulka [[cnk:jazyky-v-migraci#znackovani|v sekci Značkování v popisu korpusu]] | hodnoty z tabulky jako multihodnoty dle pořadí výskytu v segmentu (mohou se i opakovat) | |
| | | ::: | syntactic_phrase | VP%%|%%NP | viz druhá tabulka [[cnk:jazyky-v-migraci#znackovani|v sekci Značkování v popisu korpusu]] | hodnoty z tabulky jako multihodnoty dle pořadí výskytu v segmentu (mohou se i opakovat) | |
| | | ::: | soundfile | 7/f/66466a1f.mp3 | soubor s odpovídající zvukovou nahrávkou | | |
| |
| |
| |
| Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci). | Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci). |
| |