Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- kurz:hledani_v_mluvenych_korpusech [2018/08/08 17:34] – [Metainformace u KWIC] vaclavcvrcek
+++ kurz:hledani_v_mluvenych_korpusech [2018/12/17 16:06] – [Specifikace kontextu] jankocek
@@ Řádek 154: / Řádek 154: @@
 Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//:
-[{{ :kurz:kontext_kontext.png?direct | Specifikace kontextu v rozhraní KonText FIXME}}]
+[{{ :kurz:kontext_kontext.png?direct&700 | Specifikace kontextu v rozhraní KonText FIXME}}]
 Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné, což usnadní jejich identifikaci:
@@ Řádek 166: / Řádek 166: @@
 Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<sp/>''), které pronesla žena (''Z'') starší 35 let (''V'') základního nebo středoškolského vzdělání (''B'') ze středočeské či česko-moravské nářeční oblasti.
-[{{ kurz:kontext_metainformace.png?direct | Výběr textů v rozhraní KonText FIXME}}]
+[{{ kurz:kontext_metainformace.png?direct&600 | Výběr textů v rozhraní KonText FIXME}}]
 ===== CQL =====
@@ Řádek 310: / Řádek 310: @@
 [{{ :kurz:konk_with_sp_num_prekryv.png?direct | Konkordance z korpusu ORAL2013 vč. struktury ''<sp/>'' a strukturních atributů ''sp.num'' a ''sp.prekryv'' }}]
-==== Vizualizace v externím nástroji MluvKonk ====
-U složitějších dialogů může být luštění linearizovaných konkordancí poněkud náročné, nemluvě o tom, že je těžké na jejich základě nějak intuitivně nahlédnout strukturu dialogu. Pokud je pro vás právě tento aspekt dat důležitý, můžete zkusit konkordanci nahrát do externího nástroje [[https://trnka.korpus.cz/~lukes/mluvkonk/|MluvKonk]] FIXME a analýzu provést v něm.
-MluvKonk umí konkordanční řádek
-[{{ :kurz:oral_konk_kontext.png?direct | Konkordanční řádek v KonTextu}}]
-přeformátovat do konkordanční tabulky, v níž má každý mluvčí vydělenou vlastní vrstvu:
-[{{ :kurz:oral_konk_mluvkonk.png?direct | Stejný konkordanční řádek jako tabulka v MluvKonk.}}]
-Takové zobrazení může být užitečné zejména u složitějších dialogů s množstvím překryvů pocházejících z korpusu ORAL2013. Doplnění podobné funkce do KonTextu je ve stadiu plánování.
 ===== Metainformace u KWIC =====
@@ Řádek 340: / Řádek 328: @@
 ====== Některé zajímavé dotazy ======
-Níže uvádíme pro inspiraci některé typy jazykových jevů, které lze v datech z mluvených korpusů vyhledávat a zkoumat.
+==== Varianty výrazu protože ====
-===== Varianty =====
-==== protože ====
+Na to, jak je slovo //protože// v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty výrazu //protože//:
-Na to, jak je slovo //protože// v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty slova //protože//:
+[{{ :kurz:varianty_protoze_oral2013.png?direct | Varianty //protože// v korpusu ORAL2013 FIXME}}]
-[{{ :kurz:varianty_protoze_oral2013.png?direct | Varianty //protože// v korpusu ORAL2013 }}]
 Zkuste si některé z nich vyhledat. Odhalí [[manualy:kontext:frekvencni_distribuce#frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání?
-===== Kolokace =====
+==== Kolokace s pauzami (v korpusu ORAL2013) ====
-==== s pauzami (v korpusu ORAL2013) ====
 Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz ''[word=%%"%%\.{1,2}%%"%%]'' a zobrazit si [[manualy:kontext:kolokace|kolokace]]. Nezapomeňte na možnost zobrazit si pomocí odkazů **p/n** pozitivně/negativně filtrovanou konkordanci k danému kolokátu a prozkoumat tak do detailu, jak jednotlivé kombinace fungují.
-==== s hezitačními zvuky ====
+==== Kolokace s hezitačními zvuky ====
 Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu ''[word=%%"mmm|eee"%%]'', v korpusech ORAL2006 a ORAL2008 pak pomocí dotazů ''[word=%%"hmm|eee"%%]''.

Historie:

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence