Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kurz:hledani_v_mluvenych_korpusech [2018/08/13 15:26]
Václav Cvrček
kurz:hledani_v_mluvenych_korpusech [2018/12/17 16:40] (aktuální)
Jan Kocek
Řádek 154: Řádek 154:
 Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//: Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//:
  
-[{{ :​kurz:​kontext_kontext.png?​direct | Specifikace kontextu v rozhraní KonText ​FIXME}}]+[{{ :​kurz:​kontext_kontext.png?​direct&​700 ​| Specifikace kontextu v rozhraní KonText }}]
  
 Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné,​ což usnadní jejich identifikaci:​ Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné,​ což usnadní jejich identifikaci:​
Řádek 166: Řádek 166:
 Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<​sp/>''​),​ které pronesla žena (''​Z''​) starší 35 let (''​V''​) základního nebo středoškolského vzdělání (''​B''​) ze středočeské či česko-moravské nářeční oblasti. Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<​sp/>''​),​ které pronesla žena (''​Z''​) starší 35 let (''​V''​) základního nebo středoškolského vzdělání (''​B''​) ze středočeské či česko-moravské nářeční oblasti.
  
-[{{ kurz:​kontext_metainformace.png?​direct | Výběr textů v rozhraní KonText ​FIXME}}]+[{{ kurz:​kontext_metainformace.png?​direct&​600 ​| Výběr textů v rozhraní KonText }}]
  
 ===== CQL ===== ===== CQL =====
Řádek 317: Řádek 317:
 Alternativní způsob je zobrazit si stejné údaje jako [[manualy:​kontext:​moznosti_zobrazeni#​metainformace|metainformace na levém okraji konkordance]]. Na každém řádku konkordance je pak zobrazen údaj, který odpovídá danému atributu struktury, do níž patří KWIC. Pokud vás tedy tolik nezajímá struktura dialogu a jde vám spíš o vlastnosti konkrétní promluvy, jíž součástí je KWIC, bude toto zobrazení mnohem pohodlnější. Alternativní způsob je zobrazit si stejné údaje jako [[manualy:​kontext:​moznosti_zobrazeni#​metainformace|metainformace na levém okraji konkordance]]. Na každém řádku konkordance je pak zobrazen údaj, který odpovídá danému atributu struktury, do níž patří KWIC. Pokud vás tedy tolik nezajímá struktura dialogu a jde vám spíš o vlastnosti konkrétní promluvy, jíž součástí je KWIC, bude toto zobrazení mnohem pohodlnější.
  
-[{{ :​kurz:​metainformace_oral.png?​direct ​| Výběr zobrazení metainformací v menu Zobrazeni → Korpusová nastavení }}]+[{{ :​kurz:​metainformace_oral.png | Výběr zobrazení metainformací v menu Zobrazeni → Korpusová nastavení }}]
  
 [{{ :​kurz:​metainformace_v_konkordanci_oral.png?​direct | Metainformace se zobrazují na levém kraji konkordanci a vždy se vztahují ke KWIC, nicméně jde o stejný údaj jako u odpovídajícího strukturního atributu (zde např. hodnota ''​sp.prekryv''​) }}] [{{ :​kurz:​metainformace_v_konkordanci_oral.png?​direct | Metainformace se zobrazují na levém kraji konkordanci a vždy se vztahují ke KWIC, nicméně jde o stejný údaj jako u odpovídajícího strukturního atributu (zde např. hodnota ''​sp.prekryv''​) }}]
Řádek 323: Řádek 323:
 Zdrojem velmi zajímavých sociolingvistických analýz mohou být frekvenční distribuce vytvořené na základě metainformací v menu [[manualy:​kontext:​frekvence#​vlastni_nastaveni_frekvencni_distribuce|Frekvence → Vlastní]]. S jejich pomocí je možné zjistit, zda hledaný výraz na pozici KWIC používají více ženy, či muži, mladší, či starší mluvčí, případně zda má nějaká regionální specifika, či se naopak zdá být sdílený všemi mluvčími češtiny bez rozdílů. Zdrojem velmi zajímavých sociolingvistických analýz mohou být frekvenční distribuce vytvořené na základě metainformací v menu [[manualy:​kontext:​frekvence#​vlastni_nastaveni_frekvencni_distribuce|Frekvence → Vlastní]]. S jejich pomocí je možné zjistit, zda hledaný výraz na pozici KWIC používají více ženy, či muži, mladší, či starší mluvčí, případně zda má nějaká regionální specifika, či se naopak zdá být sdílený všemi mluvčími češtiny bez rozdílů.
  
-[{{ :​kurz:​frek_dist_meta_zadani.png?​direct ​| Frekvenční distribuce podle metainformací:​ může nás např. zajímat rozložení podle pohlaví -- užívají daný výraz více ženy, nebo muži? ​FIXME}}]+[{{ :​kurz:​frek_dist_meta_zadani.png | Frekvenční distribuce podle metainformací:​ může nás např. zajímat rozložení podle pohlaví -- užívají daný výraz více ženy, nebo muži? }}]
  
-[{{ :​kurz:​frek_dist_meta_vysledek.png?​direct | Frekvenční distribuce dotazu ''​[word=%%"​(?​i)koč(ič|k).*"​%%]''​ podle pohlaví: zdá se, že alespoň v korpusu ORAL2013 o kočkách, kočičkách ap. mluví více ženy než muži FIXME}}]+[{{ :​kurz:​frek_dist_meta_vysledek.png?​direct | Frekvenční distribuce dotazu ''​[word=%%"​(?​i)koč(ič|k).*"​%%]''​ podle pohlaví: zdá se, že alespoň v korpusu ORAL2013 o kočkách, kočičkách ap. mluví více ženy než muži }}]
 ====== Některé zajímavé dotazy ====== ====== Některé zajímavé dotazy ======
  
Řádek 332: Řádek 332:
 Na to, jak je slovo //​protože//​ v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty výrazu //​protože//:​ Na to, jak je slovo //​protože//​ v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty výrazu //​protože//:​
  
-[{{ :​kurz:​varianty_protoze_oral2013.png?​direct | Varianty //​protože//​ v korpusu ORAL2013 ​FIXME}}]+[{{ :​kurz:​varianty_protoze_oral2013.png?​direct | Varianty //​protože//​ v korpusu ORAL2013 }}]
  
 Zkuste si některé z nich vyhledat. Odhalí [[manualy:​kontext:​frekvencni_distribuce#​frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání?​ Zkuste si některé z nich vyhledat. Odhalí [[manualy:​kontext:​frekvencni_distribuce#​frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání?​