Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- seznamy:strukturni_atributy_mluvene [2022/06/14 11:39] – jankrivan
+++ seznamy:strukturni_atributy_mluvene [2023/02/24 17:08] – lukes
@@ Řádek 11: / Řádek 11: @@
 ^ Dotaz ^ Vyhodnocení ^
 | ''[word=<nowiki>"</nowiki>ne<nowiki>"</nowiki>]</doc>'' | výskyty slova //ne// na konci sondy |
-| ''<sp> [word=<nowiki>"</nowiki>hm<nowiki>"</nowiki>]'' | výskyty slova //hm// na začátku promluvy |
+| ''<sp> [word=<nowiki>"</nowiki>hmm<nowiki>"</nowiki>]'' | výskyty slova //hmm// na začátku promluvy |
 Strukturním jednotkám (strukturám) mohou být přiřazeny další údaje (tzv. [[pojmy:metadata|metadata]]), a to prostřednictvím strukturních atributů. Přehled těchto atributů a jejich možné hodnoty u jednotlivých korpusů uvádíme níže. Společně s tím uvádíme i další, tzv. nehierarchické struktury, které jsou u některých korpusů použity.
@@ Řádek 67: / Řádek 67: @@
 | overlap | - | - | struktura obaluje pozice řečené v překryvu s jiným mluvčím | - |
 | unclear | - | - | struktura obaluje pozice, u nichž si přepisující nebyl jist obsahem řečeného | - |
+==== Strukturní atributy korpusu ORATOR ====
+Korpus [[cnk:orator|ORATOR]] obsahuje tyto údaje:
+^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^
+| doc | id                | jednoznačný identifikátor sondy | |
+| ::: | year              | rok pořízení nahrávky           | |
+| ::: | location          | místo nahrávky                  | obce ČR |
+| ::: | situation         | typ situace | ''{ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení}'' |
+| ::: | framing           | zaměření projevu                | ''{oficiální, popularizační, politické, profesní, vědecké}'' |
+| ::: | genre             | žánr projevu                    | hodnoty shodné s atributem [[cnk:klasifikace_textu_syn2015?s[]=genre|genre]] u psaných korpusů |
+| ::: | audience_present  | přítomnost publika              | ''{ano, ne}'' |
+| ::: | intended_audience | jakému publiku je projev určen  | ''{skupina, veřejnost}'' |
+| ::: | special           | speciální příznak projevu       | ''{čtené, pro děti, Y}'' (''Y'' pro projevy bez příznaku) |
+| ::: | source            | zdroj                           | ''{vlastní sběr, volně dostupná nahrávka}'' |
+| ::: | speakers          | počet mluvčích v nahrávce       | |
+| ::: | length            | délka nahrávky v minutách       | |
+| ::: | tokens            | počet všech tokenů v nahrávce   | |
+| sp | id          | identifikátor segmentu                                      | unikátní číslo pro každý segment |
+| ::: | nickname    | přezdívka mluvčího                                          | náhodně přidělená příjmení |
+| ::: | speaker_id  | číslo doplňující přezdívku mluvčího                         | stejně jako příjmení bude toto číslo stejné u každé promluvy od stejného mluvčího|
+| ::: | gender      | pohlaví                                                     |  |
+| ::: | proportion  | procentuální zastoupení řeči mluvčího v rámci celé nahrávky |  |
+| ::: | soundfile   | číslo a formát nahrávky                                     |  |
@@ Řádek 112: / Řádek 138: @@
 | ::: | noblastdet     | východomoravská      | pobyt mluvčího v dětství (do 15 let) - nářeční oblast | ''{českomoravská, jihočeská, pohraničí české, severovýchodočeská, slezská, sředočeská, středomoravská, východomoravská, západočeská}'' | pouze hodnoty, pro které se v korpusu nachází nářeční materiál |
-==== Strukturní atributy korpusu ORATOR ====
-Korpus [[cnk:orator|ORATOR]] obsahuje tyto údaje:
-^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^
-| doc | id                | jednoznačný identifikátor sondy | |
-| ::: | year              | rok pořízení nahrávky           | |
-| ::: | location          | místo nahrávky                  | obce ČR |
-| ::: | situation         | typ situace | ''{ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení}'' |
-| ::: | framing           | zaměření projevu                | ''{oficiální, popularizační, politické, profesní, vědecké}'' |
-| ::: | genre             | žánr projevu                    | hodnoty shodné s atributem [[cnk:klasifikace_textu_syn2015?s[]=genre|genre]] u psaných korpusů |
-| ::: | audience_present  | přítomnost publika              | ''{ano, ne}'' |
-| ::: | intended_audience | jakému publiku je projev určen  | ''{skupina, veřejnost}'' |
-| ::: | special           | speciální příznak projevu       | ''{čtené, pro děti, Y}'' (''Y'' pro projevy bez příznaku) |
-| ::: | source            | zdroj                           | ''{vlastní sběr, volně dostupná nahrávka}'' |
-| ::: | speakers          | počet mluvčích v nahrávce       | |
-| ::: | length            | délka nahrávky v minutách       | |
-| ::: | tokens            | počet všech tokenů v nahrávce   | |
-| sp | id          | identifikátor segmentu                                      | unikátní číslo pro každý segment |
-| ::: | nickname    | přezdívka mluvčího                                          | náhodně přidělená příjmení |
-| ::: | speaker_id  | číslo doplňující přezdívku mluvčího                         | stejně jako příjmení bude toto číslo stejné u každé promluvy od stejného mluvčího|
-| ::: | gender      | pohlaví                                                     |  |
-| ::: | proportion  | procentuální zastoupení řeči mluvčího v rámci celé nahrávky |  |
-| ::: | soundfile   | číslo a formát nahrávky                                     |  |
 ==== Strukturní atributy korpusů ORAL2006, ORAL2008 a ORAL2013 ====
@@ Řádek 162: / Řádek 164: @@
 Pozn. Některé atributy mluvených korpusů připouštějí hodnotu ''Y'', která značí, že údaj není znám. Bývá uveden u mluvčích, kteří se v rozhovoru objevují krátce (např. servírka v rozhovoru vedeném v restauraci).
+==== Strukturní atributy korpusu Jazyky v migraci ====
+Korpus [[cnk:jazyky-v-migraci|Jazyky v migraci]] obsahuje následující údaje:

Historie: • verze15 • oral • start • lists • cermak • precision • verze13 • index • syn2015 • calc

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence