AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:strukturni_atributy_mluvene [2022/06/14 11:40] jankrivanseznamy:strukturni_atributy_mluvene [2023/02/26 21:36] (aktuální) jankrivan
Řádek 11: Řádek 11:
 ^ Dotaz ^ Vyhodnocení ^ ^ Dotaz ^ Vyhodnocení ^
 | ''[word=<nowiki>"</nowiki>ne<nowiki>"</nowiki>]</doc>'' | výskyty slova //ne// na konci sondy | | ''[word=<nowiki>"</nowiki>ne<nowiki>"</nowiki>]</doc>'' | výskyty slova //ne// na konci sondy |
-| ''<sp> [word=<nowiki>"</nowiki>hm<nowiki>"</nowiki>]'' | výskyty slova //hm// na začátku promluvy |+| ''<sp> [word=<nowiki>"</nowiki>hmm<nowiki>"</nowiki>]'' | výskyty slova //hmm// na začátku promluvy |
  
 Strukturním jednotkám (strukturám) mohou být přiřazeny další údaje (tzv. [[pojmy:metadata|metadata]]), a to prostřednictvím strukturních atributů. Přehled těchto atributů a jejich možné hodnoty u jednotlivých korpusů uvádíme níže. Společně s tím uvádíme i další, tzv. nehierarchické struktury, které jsou u některých korpusů použity. Strukturním jednotkám (strukturám) mohou být přiřazeny další údaje (tzv. [[pojmy:metadata|metadata]]), a to prostřednictvím strukturních atributů. Přehled těchto atributů a jejich možné hodnoty u jednotlivých korpusů uvádíme níže. Společně s tím uvádíme i další, tzv. nehierarchické struktury, které jsou u některých korpusů použity.
Řádek 137: Řádek 137:
 | ::: | mistodet       | Zápy                 | místo pobytu mluvčího v dětství (do 15 let) | | část obce v kulatých závorkách, např. Kamenný Újezd (Kosov)| | ::: | mistodet       | Zápy                 | místo pobytu mluvčího v dětství (do 15 let) | | část obce v kulatých závorkách, např. Kamenný Újezd (Kosov)|
 | ::: | noblastdet     | východomoravská      | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál | | ::: | noblastdet     | východomoravská      | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál |
 +
 +
 +==== Strukturní atributy korpusu Jazyky v migraci ====
 +
 +Korpus [[cnk:jazyky-v-migraci|Jazyky v migraci]] obsahuje následující údaje:
 +
 +^ Struktura ^ Atribut ^ Příklad ^ Vysvětlení ^ Možné hodnoty ^
 +| doc | id | A1CS11 | unikátní identifikátor nahrávky | ''<řetězec čísel a velkých písmen>'' |
 +| ::: | language | cs | hlavní jazyk | ''{cs, de}'' |
 +| ::: | speakers | 1 | počet mluvčích, vyjma explorátory | ''<číslo>'' |
 +| ::: | situation_cs | doma | popis situace česky | ''{doma, kancelář, veřejný prostor}'' |
 +| ::: | situation_de | zu Hause | popis situace německy | ''{Büro, zu Hause, öffentlicher Raum}'' |
 +| ::: | topics_cs | emigrace%%|%%známí%%|%%škola | témata česky | více možností, vč. multihodnot |
 +| ::: | topics_de | Auswanderung%%|%%Bekannte%%|%%Schule | témata německy | více možností, vč. multihodnot |
 +| sp  | id | A1CS11:187 | unikátní identifikátor segmentu | ''<doc.id>:<pořadové číslo v rámci nahrávky>'' |
 +| ::: | nickname | Erika B. | přezdívka mluvčího | |
 +| ::: | gender | F | pohlaví mluvčího | ''{F, M}'' |
 +| ::: | born | 1956 | rok narození mluvčího | ''<číslo>'' |
 +| ::: | immigrated | 1968 | rok emigrace mluvčího do Německa | ''<číslo>'' |
 +| ::: | reg_birth | Liberecký kraj | region narození mluvčího | ''{Hlavní město Praha, Jihočeský kraj, Karlovarský kraj, Královéhradecký kraj, Liberecký kraj, Moravskoslezský kraj, Olomoucký kraj, Plzeňský kraj, západní Čechy, Ústecký kraj}'' |
 +| ::: | reg_current | Bayern | region současného pobytu mluvčího | ''{Baden-Württemberg, Bayern, Hessen}'' |
 +| ::: | loctype_birth_cs | venkov | typ místa narození mluvčího česky| ''{město, venkov}'' |
 +| ::: | loctype_birth_de | ländlich | typ místa narození mluvčího německy | ''{ländlich, städtisch}'' |
 +| ::: | loctype_current_cs | venkov | typ místa současného pobytu mluvčího česky| ''{město, venkov}'' |
 +| ::: | loctype_current_de | ländlich | typ místa současného pobytu mluvčího německy | ''{ländlich, städtisch}'' |
 +| ::: | generation_cs | pozdní vysídlenci | generace mluvčího česky | ''{migranti, pozdní vysídlenci}'' |
 +| ::: | generation_de | Spätaussiedler:innen | generace mluvčího německy | ''{Migrant:innen, Spätaussiedler:innen}'' |
 +| ::: | education_cs | VŠ | vzdělání mluvčího česky | ''{SŠ, VŠ}'' |
 +| ::: | education_de | Hochschulabschluss | vzdělání mluvčího německy | ''{Abitur/Berufsbildende Schule, Hochschulabschluss}'' |
 +| ::: | langgener_category | PAT%%|%%AA | viz první tabulka [[cnk:jazyky-v-migraci#znackovani|v sekci Značkování v popisu korpusu]] | hodnoty z tabulky jako multihodnoty dle pořadí výskytu v segmentu (mohou se i opakovat) |
 +| ::: | syntactic_phrase | VP%%|%%NP | viz druhá tabulka [[cnk:jazyky-v-migraci#znackovani|v sekci Značkování v popisu korpusu]] | hodnoty z tabulky jako multihodnoty dle pořadí výskytu v segmentu (mohou se i opakovat) |
 +| ::: | soundfile | 7/f/66466a1f.mp3 | soubor s odpovídající zvukovou nahrávkou | |
  
  
Řádek 164: Řádek 196:
  
 Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci). Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci).
-