Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
pojmy:atributy_strukturni [2017/09/26 14:26]
Václav Cvrček [Struktura korpusů psané češtiny]
pojmy:atributy_strukturni [2019/12/19 13:29]
Marie Kopřivová [Strukturní atributy mluvených korpusů]
Řádek 132: Řádek 132:
 |     | vzdelani ​     | vzdělání mluvčího (hrubé rozlišení) | ''​{A''​(altus,​ vysokoškolské včetně pouze započatého)'',​B''​(basis,​ základní a středoškolské)''​}''​ nebo ''​Y''​ | |     | vzdelani ​     | vzdělání mluvčího (hrubé rozlišení) | ''​{A''​(altus,​ vysokoškolské včetně pouze započatého)'',​B''​(basis,​ základní a středoškolské)''​}''​ nebo ''​Y''​ |
 |     | vzdelanityp ​  | vzdělání mluvčího (jemnější rozlišení) | ''​{SŠ,​VŠ,​ZŠ}''​ nebo ''​Y''​ | |     | vzdelanityp ​  | vzdělání mluvčího (jemnější rozlišení) | ''​{SŠ,​VŠ,​ZŠ}''​ nebo ''​Y''​ |
-|     | oblast ​       | nářeční oblast, kde se mluvčí narodil ​| ''​{česko-moravská,​jihozápadočeská,​pohraničí české,​pohraničí moravské,​severovýchodočeská,​slezská,​středočeská,​středomoravská,​východomoravská}''​ nebo ''​Y''​ |+|     | oblast ​       | nářeční oblast ​místa pobytu ​mluvčího v dětství (do 15 let) | ''​{česko-moravská,​jihozápadočeská,​pohraničí české,​pohraničí moravské,​severovýchodočeská,​slezská,​středočeská,​středomoravská,​východomoravská}''​ nebo ''​Y''​ |
  
 **Atributy dostupné pouze v korpusu [[cnk:​oral2013|ORAL2013]]** **Atributy dostupné pouze v korpusu [[cnk:​oral2013|ORAL2013]]**
Řádek 242: Řádek 242:
 | sp.mistodet ​      | Zápy                 | místo pobytu mluvčího v dětství (do 15 let) | | část obce v kulatých závorkách,​ např. Kamenný Újezd (Kosov)| | sp.mistodet ​      | Zápy                 | místo pobytu mluvčího v dětství (do 15 let) | | část obce v kulatých závorkách,​ např. Kamenný Újezd (Kosov)|
 | sp.noblastdet ​    | východomoravská ​     | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''​{českomoravská,​ jihočeská,​ pohraničí české, severovýchodočeská,​ slezská, sředočeská,​ středomoravská,​ východomoravská,​ západočeská}''​ | pouze hodnoty, pro které se v korpusu nachází nářeční materiál | | sp.noblastdet ​    | východomoravská ​     | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''​{českomoravská,​ jihočeská,​ pohraničí české, severovýchodočeská,​ slezská, sředočeská,​ středomoravská,​ východomoravská,​ západočeská}''​ | pouze hodnoty, pro které se v korpusu nachází nářeční materiál |
 +
 +**Atributy pro korpus [[cnk:​orator|ORATOR]]:​ údaje k nahrávce**
 +^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^
 +| doc | id                | jednoznačný identifikátor sondy | |
 +|     | year              | rok pořízení nahrávky ​          | |
 +|     | location ​         | místo nahrávky ​                 | obce ČR |
 +|     | situation ​        | typ situace | ''​ceremoniál,​ instruktáž,​ jednání, kázání, prohlídka, přednáška,​ slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění,​ zahájení, zakončení''​ |
 +|     | framing ​          | zaměření projevu ​               | ''​oficiální,​ popularizační,​ politické, profesní, vědecké''​ |
 +|     | genre             | žánr projevu ​                   | hodnoty shodné s atributem [[cnk:​klasifikace_textu_syn2015?​s[]=genre|genre]] u psaných korpusů |
 +|     | audience_present ​ | přítomnost publika ​             | ''​ano,​ ne''​ |
 +|     | intended_audience | jakému publiku je projev určen ​ | ''​skupina,​ veřejnost''​ |
 +|     | special ​          | speciální příznak projevu ​      | ''​čtené,​ pro děti, Y''​ (pro projevy bez příznaku) |
 +|     | source ​           | zdroj                           | ''​vlastní sběr, volně dostupná nahrávka''​ |
 +|     | speakers ​         | počet mluvčích v nahrávce ​      | |
 +|     | length ​           | délka nahrávky v minutách ​      | |
 +|     | tokens ​           | počet všech tokenů v nahrávce ​  | |
 +
 +**Atributy pro korpus [[cnk:​orator|ORATOR]]:​ údaje k mluvčímu**
 +^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^
 +| sp | id          | identifikátor segmentu ​                                     |  |
 +|    | nickname ​   | přezdívka mluvčího ​                                         | náhodně přidělená příjmení |
 +|    | gender ​     | pohlaví ​                                                    ​| ​ |
 +|    | proportion ​ | procentuální zastoupení řeči mluvčího v rámci celé nahrávky |  |
 +|    | soundfile ​  | číslo a formát nahrávky ​                                    ​| ​ |
 +
 +
  
 ==== Strukturní atributy korpusu InterCorp ==== ==== Strukturní atributy korpusu InterCorp ====