AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:hledani_v_mluvenych_korpusech [2018/08/08 17:34] – [Metainformace u KWIC] vaclavcvrcekkurz:hledani_v_mluvenych_korpusech [2018/12/17 16:06] – [Specifikace kontextu] jankocek
Řádek 154: Řádek 154:
 Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//: Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//:
  
-[{{ :kurz:kontext_kontext.png?direct | Specifikace kontextu v rozhraní KonText FIXME}}]+[{{ :kurz:kontext_kontext.png?direct&700 | Specifikace kontextu v rozhraní KonText FIXME}}]
  
 Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné, což usnadní jejich identifikaci: Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné, což usnadní jejich identifikaci:
Řádek 166: Řádek 166:
 Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<sp/>''), které pronesla žena (''Z'') starší 35 let (''V'') základního nebo středoškolského vzdělání (''B'') ze středočeské či česko-moravské nářeční oblasti. Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<sp/>''), které pronesla žena (''Z'') starší 35 let (''V'') základního nebo středoškolského vzdělání (''B'') ze středočeské či česko-moravské nářeční oblasti.
  
-[{{ kurz:kontext_metainformace.png?direct | Výběr textů v rozhraní KonText FIXME}}]+[{{ kurz:kontext_metainformace.png?direct&600 | Výběr textů v rozhraní KonText FIXME}}]
  
 ===== CQL ===== ===== CQL =====
Řádek 310: Řádek 310:
 [{{ :kurz:konk_with_sp_num_prekryv.png?direct | Konkordance z korpusu ORAL2013 vč. struktury ''<sp/>'' a strukturních atributů ''sp.num'' a ''sp.prekryv'' }}] [{{ :kurz:konk_with_sp_num_prekryv.png?direct | Konkordance z korpusu ORAL2013 vč. struktury ''<sp/>'' a strukturních atributů ''sp.num'' a ''sp.prekryv'' }}]
  
-==== Vizualizace v externím nástroji MluvKonk ==== 
  
-U složitějších dialogů může být luštění linearizovaných konkordancí poněkud náročné, nemluvě o tom, že je těžké na jejich základě nějak intuitivně nahlédnout strukturu dialogu. Pokud je pro vás právě tento aspekt dat důležitý, můžete zkusit konkordanci nahrát do externího nástroje [[https://trnka.korpus.cz/~lukes/mluvkonk/|MluvKonk]] FIXME a analýzu provést v něm. 
- 
-MluvKonk umí konkordanční řádek 
- 
-[{{ :kurz:oral_konk_kontext.png?direct | Konkordanční řádek v KonTextu}}] 
- 
-přeformátovat do konkordanční tabulky, v níž má každý mluvčí vydělenou vlastní vrstvu: 
- 
-[{{ :kurz:oral_konk_mluvkonk.png?direct | Stejný konkordanční řádek jako tabulka v MluvKonk.}}] 
- 
-Takové zobrazení může být užitečné zejména u složitějších dialogů s množstvím překryvů pocházejících z korpusu ORAL2013. Doplnění podobné funkce do KonTextu je ve stadiu plánování. 
 ===== Metainformace u KWIC ===== ===== Metainformace u KWIC =====
  
Řádek 340: Řádek 328:
 ====== Některé zajímavé dotazy ====== ====== Některé zajímavé dotazy ======
  
-Níže uvádíme pro inspiraci některé typy jazykových jevů, které lze v datech z mluvených korpusů vyhledávat a zkoumat. +==== Varianty výrazu protože ====
-===== Varianty =====+
  
-==== protože ====+Na to, jak je slovo //protože// v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty výrazu //protože//:
  
-Na to, jak je slovo //protože// v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty slova //protože//: +[{{ :kurz:varianty_protoze_oral2013.png?direct | Varianty //protože// v korpusu ORAL2013 FIXME}}]
- +
-[{{ :kurz:varianty_protoze_oral2013.png?direct | Varianty //protože// v korpusu ORAL2013 }}]+
  
 Zkuste si některé z nich vyhledat. Odhalí [[manualy:kontext:frekvencni_distribuce#frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání? Zkuste si některé z nich vyhledat. Odhalí [[manualy:kontext:frekvencni_distribuce#frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání?
  
-===== Kolokace ===== +==== Kolokace s pauzami (v korpusu ORAL2013) ====
- +
-==== s pauzami (v korpusu ORAL2013) ====+
  
 Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz ''[word=%%"%%\.{1,2}%%"%%]'' a zobrazit si [[manualy:kontext:kolokace|kolokace]]. Nezapomeňte na možnost zobrazit si pomocí odkazů **p/n** pozitivně/negativně filtrovanou konkordanci k danému kolokátu a prozkoumat tak do detailu, jak jednotlivé kombinace fungují. Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz ''[word=%%"%%\.{1,2}%%"%%]'' a zobrazit si [[manualy:kontext:kolokace|kolokace]]. Nezapomeňte na možnost zobrazit si pomocí odkazů **p/n** pozitivně/negativně filtrovanou konkordanci k danému kolokátu a prozkoumat tak do detailu, jak jednotlivé kombinace fungují.
  
-==== s hezitačními zvuky ====+==== Kolokace s hezitačními zvuky ====
  
 Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu ''[word=%%"mmm|eee"%%]'', v korpusech ORAL2006 a ORAL2008 pak pomocí dotazů ''[word=%%"hmm|eee"%%]''. Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu ''[word=%%"mmm|eee"%%]'', v korpusech ORAL2006 a ORAL2008 pak pomocí dotazů ''[word=%%"hmm|eee"%%]''.