AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
seznamy:strukturni_atributy_mluvene [2023/02/24 17:25] – [Strukturní atributy korpusu Jazyky v migraci] lukesseznamy:strukturni_atributy_mluvene [2023/02/26 21:36] (aktuální) jankrivan
Řádek 138: Řádek 138:
 | ::: | noblastdet     | východomoravská      | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál | | ::: | noblastdet     | východomoravská      | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál |
  
- 
-==== Strukturní atributy korpusů ORAL2006, ORAL2008 a ORAL2013 ==== 
- 
-Korpusy [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a [[cnk:oral2013|ORAL2013]] obsahují následující údaje: 
- 
-^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty ^ 
-| doc | id            | jednoznačný identifikátor sondy | ''<řetězec čísel a velkých písmen>'' | 
-| ::: | temp          | rok nahrání sondy | např. ''2008'' | 
-| ::: | pocet         | počet mluvčích v sondě | ''<číslo>'' | 
-| ::: | promluva      | typ promluvy | ''N'' (neformální) | 
-| ::: | //Další atributy pod strukturou ''doc'' jsou obsažené pouze v korpusu ORAL2013:// ||| 
-| ::: | vztah         | vztah mezi mluvčími | ''{přátelskost,známost}'' | 
-| ::: | situace       | typ situace, v níž byla nahrávka pořízena | ''{hovor při jídle doma,hovor při společné činnosti,hovor v práci,jiné,jízda dopravním prostředkem,na chatě,na zastávce,návštěva,oslava,posezení na zahradě,procházka,restaurace,rozhovor doma,společenská hra,ve škole mimo vyučování,výlet}'' | 
-| sp  | num           | číselné označení mluvčího **v rámci sondy (doc)** | od ''00'' výš (podle počtu mluvčích, přičemž ''00'' označuje mluvčího, který rozhovor nahrával); možné je i ''Y'' | 
-| ::: | pohlavi       | pohlaví mluvčího | ''{M'' (muž)'', Z'' (žena)''}'' nebo ''Y'' | 
-| ::: | vek           | věková kategorie mluvčího | ''{I'' (iunior, mladší: ca 20–35 let)'',V'' (vetus, starší: 35 let a více)''}'' nebo ''Y'' | 
-| ::: | veknum        | věk mluvčího (číselně) | ''<číslo>'' | 
-| ::: | vzdelani      | vzdělání mluvčího (hrubé rozlišení) | ''{A''(altus, vysokoškolské včetně pouze započatého)'',B''(basis, základní a středoškolské)''}'' nebo ''Y'' | 
-| ::: | vzdelanityp   | vzdělání mluvčího (jemnější rozlišení) | ''{SŠ,VŠ,ZŠ}'' nebo ''Y'' | 
-| ::: | oblast        | nářeční oblast místa pobytu mluvčího v dětství (do 15 let) | ''{česko-moravská,jihozápadočeská,pohraničí české,pohraničí moravské,severovýchodočeská,slezská,středočeská,středomoravská,východomoravská}'' nebo ''Y'' | 
-| ::: | //Další atributy pod strukturou ''sp'' jsou obsažené pouze v korpusu ORAL2013:// ||| 
-| ::: | oznacenishody | jednoznačné označení mluvčího **v rámci celého korpusu** | ''<řetězec malých písmen>'' | 
-| ::: | prekryv       | nachází se tato promluva daného mluvčího v překryvu? | ''{ano,ne}'' | 
-| seg | - | nižší hierarchická jednotka členění mluveného textu | 
- 
-Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci). 
  
 ==== Strukturní atributy korpusu Jazyky v migraci ==== ==== Strukturní atributy korpusu Jazyky v migraci ====
Řádek 195: Řádek 169:
 | ::: | syntactic_phrase | VP%%|%%NP | viz druhá tabulka [[cnk:jazyky-v-migraci#znackovani|v sekci Značkování v popisu korpusu]] | hodnoty z tabulky jako multihodnoty dle pořadí výskytu v segmentu (mohou se i opakovat) | | ::: | syntactic_phrase | VP%%|%%NP | viz druhá tabulka [[cnk:jazyky-v-migraci#znackovani|v sekci Značkování v popisu korpusu]] | hodnoty z tabulky jako multihodnoty dle pořadí výskytu v segmentu (mohou se i opakovat) |
 | ::: | soundfile | 7/f/66466a1f.mp3 | soubor s odpovídající zvukovou nahrávkou | | | ::: | soundfile | 7/f/66466a1f.mp3 | soubor s odpovídající zvukovou nahrávkou | |
 +
 +
 +==== Strukturní atributy korpusů ORAL2006, ORAL2008 a ORAL2013 ====
 +
 +Korpusy [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a [[cnk:oral2013|ORAL2013]] obsahují následující údaje:
 +
 +^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty ^
 +| doc | id            | jednoznačný identifikátor sondy | ''<řetězec čísel a velkých písmen>'' |
 +| ::: | temp          | rok nahrání sondy | např. ''2008'' |
 +| ::: | pocet         | počet mluvčích v sondě | ''<číslo>'' |
 +| ::: | promluva      | typ promluvy | ''N'' (neformální) |
 +| ::: | //Další atributy pod strukturou ''doc'' jsou obsažené pouze v korpusu ORAL2013:// |||
 +| ::: | vztah         | vztah mezi mluvčími | ''{přátelskost,známost}'' |
 +| ::: | situace       | typ situace, v níž byla nahrávka pořízena | ''{hovor při jídle doma,hovor při společné činnosti,hovor v práci,jiné,jízda dopravním prostředkem,na chatě,na zastávce,návštěva,oslava,posezení na zahradě,procházka,restaurace,rozhovor doma,společenská hra,ve škole mimo vyučování,výlet}'' |
 +| sp  | num           | číselné označení mluvčího **v rámci sondy (doc)** | od ''00'' výš (podle počtu mluvčích, přičemž ''00'' označuje mluvčího, který rozhovor nahrával); možné je i ''Y'' |
 +| ::: | pohlavi       | pohlaví mluvčího | ''{M'' (muž)'', Z'' (žena)''}'' nebo ''Y'' |
 +| ::: | vek           | věková kategorie mluvčího | ''{I'' (iunior, mladší: ca 20–35 let)'',V'' (vetus, starší: 35 let a více)''}'' nebo ''Y'' |
 +| ::: | veknum        | věk mluvčího (číselně) | ''<číslo>'' |
 +| ::: | vzdelani      | vzdělání mluvčího (hrubé rozlišení) | ''{A''(altus, vysokoškolské včetně pouze započatého)'',B''(basis, základní a středoškolské)''}'' nebo ''Y'' |
 +| ::: | vzdelanityp   | vzdělání mluvčího (jemnější rozlišení) | ''{SŠ,VŠ,ZŠ}'' nebo ''Y'' |
 +| ::: | oblast        | nářeční oblast místa pobytu mluvčího v dětství (do 15 let) | ''{česko-moravská,jihozápadočeská,pohraničí české,pohraničí moravské,severovýchodočeská,slezská,středočeská,středomoravská,východomoravská}'' nebo ''Y'' |
 +| ::: | //Další atributy pod strukturou ''sp'' jsou obsažené pouze v korpusu ORAL2013:// |||
 +| ::: | oznacenishody | jednoznačné označení mluvčího **v rámci celého korpusu** | ''<řetězec malých písmen>'' |
 +| ::: | prekryv       | nachází se tato promluva daného mluvčího v překryvu? | ''{ano,ne}'' |
 +| seg | - | nižší hierarchická jednotka členění mluveného textu |
 +
 +Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci).