Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kurz:hledani_v_mluvenych_korpusech [2018/08/08 16:55]
Michal Škrabal [Specifikace kontextu]
kurz:hledani_v_mluvenych_korpusech [2018/12/17 16:40] (aktuální)
Jan Kocek
Řádek 154: Řádek 154:
 Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//: Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//:
  
-[{{ :​kurz:​kontext_kontext.png?​direct | Specifikace kontextu v rozhraní KonText ​FIXME}}]+[{{ :​kurz:​kontext_kontext.png?​direct&​700 ​| Specifikace kontextu v rozhraní KonText }}]
  
 Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné,​ což usnadní jejich identifikaci:​ Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné,​ což usnadní jejich identifikaci:​
Řádek 162: Řádek 162:
 ==== Omezení hledání ==== ==== Omezení hledání ====
  
-KonText také umožňuje omezit vyhledávání pouze na promluvy mluvčích, jejichž metainformace (věk, pohlaví apod.) splňují jistá kritéria. V zaklikávacím menu jsou dostupné metainformace ''​sp.pohlavi'',​ ''​sp.vek'',​ ''​sp.vzdelani'',​ ''​sp.vzdelanityp''​ a ''​sp.oblast''​ (viz též [[pojmy:​atributy_strukturni#​Strukturní atributy korpusů řady ORAL|přehled metainformací v korpusech mluveného jazyka]]; ostatní metainformace lze specifikovat pouze pomocí dotazu v jazyce CQL (viz níže). Více detailů [[manualy:​kontext:​novy_dotaz#​omezit_hledani|zde]].+KonText také umožňuje ​[[manualy:​kontext:​novy_dotaz#​omezit_hledani|omezit vyhledávání]] pouze na promluvy mluvčích, jejichž metainformace (věk, pohlaví apod.) splňují jistá kritéria. V zaklikávacím menu jsou dostupné metainformace ''​sp.pohlavi'',​ ''​sp.vek'',​ ''​sp.vzdelani'',​ ''​sp.vzdelanityp''​ a ''​sp.oblast''​ (viz též [[pojmy:​atributy_strukturni#​struktura_korpusu_mluvene_cestiny|přehled metainformací v korpusech mluveného jazyka]]); ostatní metainformace lze specifikovat pouze pomocí dotazu v jazyce CQL (viz níže).
  
 Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<​sp/>''​),​ které pronesla žena (''​Z''​) starší 35 let (''​V''​) základního nebo středoškolského vzdělání (''​B''​) ze středočeské či česko-moravské nářeční oblasti. Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''<​sp/>''​),​ které pronesla žena (''​Z''​) starší 35 let (''​V''​) základního nebo středoškolského vzdělání (''​B''​) ze středočeské či česko-moravské nářeční oblasti.
  
-[{{ kurz:​kontext_metainformace.png?​direct | Výběr textů v rozhraní KonText ​FIXME}}]+[{{ kurz:​kontext_metainformace.png?​direct&​600 ​| Výběr textů v rozhraní KonText }}]
  
 ===== CQL ===== ===== CQL =====
  
-Jazyk CQL nabízí při prohledávání některé možnosti, které v rozhraní KonText jednoduše "​naklikat"​ nejdou (nezapomeňte si při tom přepnout na správný [[manualy:​kontext:​novy_dotaz|typ dotazu]]). Pro zadávání takovýchto složitějších dotazů je nutné mít představu o tom, jak je korpus [[pojmy:​atributy_strukturni|strukturován]],​ zejména jak je lineárně reprezentován v tzv. [[pojmy:​struktura_korpusu#​Vertikála - korpusy mluveného jazyka|vertikále]]. Než se pustíte do dotazů v jazyce CQL v rámci korpusů mluveného jazyka, projděte si [[kurz:​pokrocile_dotazy|lekci v Kurzu práce s ČNK]], kde si tento typ dotazů osvojíte na psaných korpusech.+Jazyk CQL nabízí při prohledávání některé možnosti, které v rozhraní KonText jednoduše "​naklikat"​ nejdou (nezapomeňte si při tom přepnout na správný [[manualy:​kontext:​novy_dotaz|typ dotazu]]). Pro zadávání takovýchto složitějších dotazů je nutné mít představu o tom, jak je korpus [[pojmy:​atributy_strukturni#​struktura_korpusu_mluvene_cestiny|strukturován]],​ zejména jak je lineárně reprezentován v tzv. [[pojmy:​struktura_korpusu#​vertikala_korpusy_mluveneho_jazyka|vertikále]]. Než se pustíte do dotazů v jazyce CQL v rámci korpusů mluveného jazyka, projděte si [[kurz:​pokrocile_dotazy|lekci v Kurzu práce s ČNK]], kde si tento typ dotazů osvojíte na psaných korpusech.
  
 Pokud si potřebujete strukturu mluvených korpusů jen osvěžit, následuje rychlý přehled. Mluvené korpusy se člení na struktury ''<​doc/>'',​ které představují jednotlivé sondy (ucelené rozhovory v rámci jedné komunikační situace), a ty jsou dále rozdělené na struktury ''<​sp/>''​. V korpusech ORAL2006 a ORAL2008 představuje jednotka ''<​sp/>''​ ucelenou promluvu jednoho mluvčího, v korpusu ORAL2013 jsou z technických důvodů hranice ''<​sp/>''​ i v místech, kde dochází k překrývání mluvčích, a neexistuje jednoduchý způsob, jak určit, která hranice ''<​sp/>''​ je lingvisticky relevantní (tj. představuje skutečný začátek/​konec promluvy) a která je pouze technickou nutností. Pokud si potřebujete strukturu mluvených korpusů jen osvěžit, následuje rychlý přehled. Mluvené korpusy se člení na struktury ''<​doc/>'',​ které představují jednotlivé sondy (ucelené rozhovory v rámci jedné komunikační situace), a ty jsou dále rozdělené na struktury ''<​sp/>''​. V korpusech ORAL2006 a ORAL2008 představuje jednotka ''<​sp/>''​ ucelenou promluvu jednoho mluvčího, v korpusu ORAL2013 jsou z technických důvodů hranice ''<​sp/>''​ i v místech, kde dochází k překrývání mluvčích, a neexistuje jednoduchý způsob, jak určit, která hranice ''<​sp/>''​ je lingvisticky relevantní (tj. představuje skutečný začátek/​konec promluvy) a která je pouze technickou nutností.
Řádek 201: Řádek 201:
 Kromě funkcí pro [[#​Specifikace kontextu|specifikaci kontextu]], resp. [[manualy:​kontext:​filtr|filtrování]],​ které jsou pohodlně zabudované do rozhraní KonText, lze pro účely vyhledání souvýskytu slov bez ohledu na pořadí používat i operátory [[pojmy:​meet]] a [[pojmy:​union]] jazyka CQL. Dotaz ''​(meet %%"​to"​%% %%"​teda"​%% -1 2)''​((Pro zkrácení zápisu zde předpokládáme,​ že je v KonTextu zadaný implicitní atribut ''​word'',​ jinak by dotaz pochopitelně musel znít ''​(meet [word=%%"​to"​%%] [word=%%"​teda"​%%] 0 2)''​.)) vyhledá výskyty //to//, jimž bezprostředně předchází (levý kontext ''​-1''​) nebo na něž v jedné ze dvou následných pozic navazuje (pravý kontext ''​2''​) slovo //teda//. Výše uvedený příklad na specifikaci kontextu bychom s pomocí //meet// mohli přepsat jako ''​(meet %%"​to"​%% %%"​teda|jo|ne|fakt"​%% -5 5)''​. Kromě funkcí pro [[#​Specifikace kontextu|specifikaci kontextu]], resp. [[manualy:​kontext:​filtr|filtrování]],​ které jsou pohodlně zabudované do rozhraní KonText, lze pro účely vyhledání souvýskytu slov bez ohledu na pořadí používat i operátory [[pojmy:​meet]] a [[pojmy:​union]] jazyka CQL. Dotaz ''​(meet %%"​to"​%% %%"​teda"​%% -1 2)''​((Pro zkrácení zápisu zde předpokládáme,​ že je v KonTextu zadaný implicitní atribut ''​word'',​ jinak by dotaz pochopitelně musel znít ''​(meet [word=%%"​to"​%%] [word=%%"​teda"​%%] 0 2)''​.)) vyhledá výskyty //to//, jimž bezprostředně předchází (levý kontext ''​-1''​) nebo na něž v jedné ze dvou následných pozic navazuje (pravý kontext ''​2''​) slovo //teda//. Výše uvedený příklad na specifikaci kontextu bychom s pomocí //meet// mohli přepsat jako ''​(meet %%"​to"​%% %%"​teda|jo|ne|fakt"​%% -5 5)''​.
  
-Operátor ''​union''​ pak slučuje množiny výsledků definované pomocí jednotlivých operátorů ''​meet''​ do jedné konkordance,​ v důsledku čehož jsou tyto operátory v jistém ohledu flexibilnější než specifikace kontextu pomocí filtru, neboť umožňují vyhledávat libovolné množství arbitrárních dvojic s různými požadavky na kontextovou blízkost. Na druhou stranu ovšem ve výsledné konkordanci ​**chybí zvýraznění** kontextově podmíněných slov, takže pokud vysloveně zmíněnou flexibilitu nepotřebujete,​ je **pohodlnější** (z hlediska zadávání dotazu i následné analýzy) použít ​**specifikaci kontextu pomocí filtru** popsanou výše.+Operátor ''​union''​ pak slučuje množiny výsledků definované pomocí jednotlivých operátorů ''​meet''​ do jedné konkordance,​ v důsledku čehož jsou tyto operátory v jistém ohledu flexibilnější než specifikace kontextu pomocí filtru, neboť umožňují vyhledávat libovolné množství arbitrárních dvojic s různými požadavky na kontextovou blízkost. Na druhou stranu ovšem ve výsledné konkordanci chybí zvýraznění kontextově podmíněných slov, takže pokud vysloveně zmíněnou flexibilitu nepotřebujete,​ je pohodlnější (z hlediska zadávání dotazu i následné analýzy) použít specifikaci kontextu pomocí filtru popsanou výše.
  
 ==== Zúžení prohledávaných struktur podle metainformací ==== ==== Zúžení prohledávaných struktur podle metainformací ====
Řádek 286: Řádek 286:
 ====== Orientace v konkordanci ====== ====== Orientace v konkordanci ======
  
-Jak již bylo zmíněno v úvodu, z povahy materiálu vyplývá, že zorientovat se v konkordančních řádcích z mluveného korpusu bývá těžší než u korpusu psaného, ať už kvůli střídání mluvčích, syntaktické a tématické roztříštěnosti,​ velké závislosti promluv na sdíleném kontextu, který nelze badateli jednoduše zprostředkovat,​ nebo kvůli tomu, že přepis je při nejlepší vůli jen značně ochuzeným odrazem původní promluvy a některé lingvisticky relevantní a pro porozumění důležité informace v něm mohou chybět (intonace, detailní temporální struktura promluvy, která může naznačovat např. váhání, apod.). Obecně platí, že je dobrý nápad v [[manualy:​kontext:​moznosti_zobrazeni#obecne_volby_zobrazeni_konkordance|obecných volbách zobrazení ​konkordance]] rozšířit kontext [[pojmy:​kwic|KWIC]] na větší počet [[pojmy:​pozice|pozic]],​ aby bylo možné si promluvu zasadit do širšího rámce. K témuž účelu poslouží kliknutí na KWIC, které vám zobrazí okénko s delším kusem dialogu. Pro lepší orientaci ve struktuře dialogu je lepší přepnout toto rozšířené okno z Výchozího zobrazení na Promluvy (viz obrázek). Každý mluvčí je barevně odlišen a jeho promluvu je možné si pustit pomocí symbolu reproduktoru. Toto zobrazení také umožňuje lepší přehled o překryvech,​ kterou jsou signalizovány spojením obou mluvčích pomocí +.+Jak již bylo zmíněno v úvodu, z povahy materiálu vyplývá, že zorientovat se v konkordančních řádcích z mluveného korpusu bývá těžší než u korpusu psaného, ať už kvůli střídání mluvčích, syntaktické a tématické roztříštěnosti,​ velké závislosti promluv na sdíleném kontextu, který nelze badateli jednoduše zprostředkovat,​ nebo kvůli tomu, že přepis je při nejlepší vůli jen značně ochuzeným odrazem původní promluvy a některé lingvisticky relevantní a pro porozumění důležité informace v něm mohou chybět (intonace, detailní temporální struktura promluvy, která může naznačovat např. váhání, apod.). Obecně platí, že je dobrý nápad v [[manualy:​kontext:​zobrazeni#obecne_volby_zobrazeni|obecných volbách zobrazení]] rozšířit kontext [[pojmy:​kwic|KWIC]] na větší počet [[pojmy:​pozice|pozic]],​ aby bylo možné si promluvu zasadit do širšího rámce. K témuž účelu poslouží kliknutí na KWIC, které vám zobrazí okénko s delším kusem dialogu. Pro lepší orientaci ve struktuře dialogu je lepší přepnout toto rozšířené okno z **Výchozího zobrazení** na **Promluvy** (viz obrázek). Každý mluvčí je barevně odlišen a jeho promluvu je možné si pustit pomocí symbolu reproduktoru. Toto zobrazení také umožňuje lepší přehled o překryvech,​ kterou jsou signalizovány spojením obou mluvčích pomocí +.
  
 [{{ :​kurz:​dialog_mluv.png?​direct | Zobrazení promluv a překryvu v dialogu}}] [{{ :​kurz:​dialog_mluv.png?​direct | Zobrazení promluv a překryvu v dialogu}}]
Řádek 293: Řádek 293:
 ==== ORAL2006 a ORAL2008 ==== ==== ORAL2006 a ORAL2008 ====
  
-Jak jsme si řekli [[#​CQL|výše]],​ byla v přepisu pro korpusy ORAL2006 a ORAL2008 snaha překrývající se repliky více mluvčích "​rozplést"​ do samostatných ucelených promluv. Když se takový přepis zobrazí linearizovaný do jednoho konkordančního řádku, mělo by tedy být možné jej číst relativně pohodlně. Aby bylo možné určit hranice promluv jednotlivých mluvčích, je ovšem nutné v [[manualy:​kontext:​moznosti_zobrazeni#atributy_struktury_a_metainformace|zobrazení atributů, struktur a metainformací]] zaškrtnout zobrazení struktury ''<​sp/>'',​ která tyto hranice značí. Je dobré zde rovnou zaškrtnout též poziční atribut ''​sp.num'',​ který umožní odlišit v rámci sondy jednotlivé mluvčí.+Jak jsme si řekli [[#​CQL|výše]],​ byla v přepisu pro korpusy ORAL2006 a ORAL2008 snaha překrývající se repliky více mluvčích "​rozplést"​ do samostatných ucelených promluv. Když se takový přepis zobrazí linearizovaný do jednoho konkordančního řádku, mělo by tedy být možné jej číst relativně pohodlně. Aby bylo možné určit hranice promluv jednotlivých mluvčích, je ovšem nutné v [[manualy:​kontext:​zobrazeni#pozicni_atributy|zobrazení atributů, struktur a metainformací]] zaškrtnout zobrazení struktury ''<​sp/>'',​ která tyto hranice značí. Je dobré zde rovnou zaškrtnout též poziční atribut ''​sp.num'',​ který umožní odlišit v rámci sondy jednotlivé mluvčí.
  
 [{{ :​kurz:​strukt_sp_num.png?​direct | Volba zobrazení struktury ''<​sp/>''​ a strukturního atributu ''​sp.num''​}}] [{{ :​kurz:​strukt_sp_num.png?​direct | Volba zobrazení struktury ''<​sp/>''​ a strukturního atributu ''​sp.num''​}}]
Řádek 302: Řádek 302:
  
 Možnost přehrát si k replice odpovídající zvukovou nahrávku v těchto dvou korpusech není k dispozici. Možnost přehrát si k replice odpovídající zvukovou nahrávku v těchto dvou korpusech není k dispozici.
- 
 ==== ORAL2013 ==== ==== ORAL2013 ====
  
Řádek 311: Řádek 310:
 [{{ :​kurz:​konk_with_sp_num_prekryv.png?​direct | Konkordance z korpusu ORAL2013 vč. struktury ''<​sp/>''​ a strukturních atributů ''​sp.num''​ a ''​sp.prekryv''​ }}] [{{ :​kurz:​konk_with_sp_num_prekryv.png?​direct | Konkordance z korpusu ORAL2013 vč. struktury ''<​sp/>''​ a strukturních atributů ''​sp.num''​ a ''​sp.prekryv''​ }}]
  
-==== Vizualizace v externím nástroji MluvKonk ==== 
- 
-U složitějších dialogů může být luštění linearizovaných konkordancí poněkud náročné, nemluvě o tom, že je těžké na jejich základě nějak intuitivně nahlédnout strukturu dialogu. Pokud je pro vás právě tento aspekt dat důležitý,​ můžete zkusit konkordanci nahrát do externího nástroje [[https://​trnka.korpus.cz/​~lukes/​mluvkonk/​|MluvKonk]] a analýzu provést v něm. 
- 
-MluvKonk umí konkordanční řádek 
- 
-[{{ :​kurz:​oral_konk_kontext.png?​direct | Konkordanční řádek v KonTextu}}] 
- 
-přeformátovat do konkordanční tabulky, v níž má každý mluvčí vydělenou vlastní vrstvu: 
- 
-[{{ :​kurz:​oral_konk_mluvkonk.png?​direct | Stejný konkordanční řádek jako tabulka v MluvKonk.}}] 
- 
-Takové zobrazení může být užitečné zejména u složitějších dialogů s množstvím překryvů pocházejících z korpusu ORAL2013. Doplnění podobné funkce do KonTextu je ve stadiu plánování. 
  
 ===== Metainformace u KWIC ===== ===== Metainformace u KWIC =====
Řádek 331: Řádek 317:
 Alternativní způsob je zobrazit si stejné údaje jako [[manualy:​kontext:​moznosti_zobrazeni#​metainformace|metainformace na levém okraji konkordance]]. Na každém řádku konkordance je pak zobrazen údaj, který odpovídá danému atributu struktury, do níž patří KWIC. Pokud vás tedy tolik nezajímá struktura dialogu a jde vám spíš o vlastnosti konkrétní promluvy, jíž součástí je KWIC, bude toto zobrazení mnohem pohodlnější. Alternativní způsob je zobrazit si stejné údaje jako [[manualy:​kontext:​moznosti_zobrazeni#​metainformace|metainformace na levém okraji konkordance]]. Na každém řádku konkordance je pak zobrazen údaj, který odpovídá danému atributu struktury, do níž patří KWIC. Pokud vás tedy tolik nezajímá struktura dialogu a jde vám spíš o vlastnosti konkrétní promluvy, jíž součástí je KWIC, bude toto zobrazení mnohem pohodlnější.
  
-[{{ :​kurz:​metainformace_oral.png?​direct ​| Výběr zobrazení metainformací v menu Zobrazeni → Korpusová nastavení }}]+[{{ :​kurz:​metainformace_oral.png | Výběr zobrazení metainformací v menu Zobrazeni → Korpusová nastavení }}]
  
 [{{ :​kurz:​metainformace_v_konkordanci_oral.png?​direct | Metainformace se zobrazují na levém kraji konkordanci a vždy se vztahují ke KWIC, nicméně jde o stejný údaj jako u odpovídajícího strukturního atributu (zde např. hodnota ''​sp.prekryv''​) }}] [{{ :​kurz:​metainformace_v_konkordanci_oral.png?​direct | Metainformace se zobrazují na levém kraji konkordanci a vždy se vztahují ke KWIC, nicméně jde o stejný údaj jako u odpovídajícího strukturního atributu (zde např. hodnota ''​sp.prekryv''​) }}]
  
-Nezapomínejme také na to, že zdrojem ​velmi zajímavých sociolingvistických analýz mohou být frekvenční distribuce vytvořené na základě metainformací v menu [[manualy:​kontext:​frekvencni_distribuce#frekvencni_distribuce_podle_strukturnich_atributu|Frekvence → Vlastní]]. S jejich pomocí je možné zjistit, zda hledaný výraz na pozici KWIC používají více ženy, či muži, mladší, či starší mluvčí, případně zda má nějaká regionální specifika, či se naopak zdá být sdílený všemi mluvčími češtiny bez rozdílů.+Zdrojem ​velmi zajímavých sociolingvistických analýz mohou být frekvenční distribuce vytvořené na základě metainformací v menu [[manualy:​kontext:​frekvence#vlastni_nastaveni_frekvencni_distribuce|Frekvence → Vlastní]]. S jejich pomocí je možné zjistit, zda hledaný výraz na pozici KWIC používají více ženy, či muži, mladší, či starší mluvčí, případně zda má nějaká regionální specifika, či se naopak zdá být sdílený všemi mluvčími češtiny bez rozdílů.
  
-[{{ :​kurz:​frek_dist_meta_zadani.png?​direct ​| Frekvenční distribuce podle metainformací:​ může nás např. zajímat rozložení podle pohlaví -- užívají daný výraz více ženy, nebo muži? ​FIXME}}] +[{{ :​kurz:​frek_dist_meta_zadani.png | Frekvenční distribuce podle metainformací:​ může nás např. zajímat rozložení podle pohlaví -- užívají daný výraz více ženy, nebo muži? }}]
- +
-[{{ :​kurz:​frek_dist_meta_vysledek.png?​direct | Frekvenční distribuce dotazu ''​[word=%%"​(?​i)koč(ič|k).*"​%%]''​ podle pohlaví: zdá se, že alespoň v korpusu ORAL2013 o kočkách, kočičkách ap. mluví více ženy než muži}}]+
  
 +[{{ :​kurz:​frek_dist_meta_vysledek.png?​direct | Frekvenční distribuce dotazu ''​[word=%%"​(?​i)koč(ič|k).*"​%%]''​ podle pohlaví: zdá se, že alespoň v korpusu ORAL2013 o kočkách, kočičkách ap. mluví více ženy než muži }}]
 ====== Některé zajímavé dotazy ====== ====== Některé zajímavé dotazy ======
  
-Níže uvádíme pro inspiraci některé typy jazykových jevů, které lze v datech z mluvených korpusů vyhledávat a zkoumat. +==== Varianty ​výrazu protože ​====
-===== Varianty ​=====+
  
-==== protože ==== +Na to, jak je slovo //​protože//​ v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty ​výrazu ​//​protože//:​
- +
-Na to, jak je slovo //​protože//​ v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty ​slova //​protože//:​+
  
 [{{ :​kurz:​varianty_protoze_oral2013.png?​direct | Varianty //​protože//​ v korpusu ORAL2013 }}] [{{ :​kurz:​varianty_protoze_oral2013.png?​direct | Varianty //​protože//​ v korpusu ORAL2013 }}]
Řádek 354: Řádek 336:
 Zkuste si některé z nich vyhledat. Odhalí [[manualy:​kontext:​frekvencni_distribuce#​frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání?​ Zkuste si některé z nich vyhledat. Odhalí [[manualy:​kontext:​frekvencni_distribuce#​frekvencni_distribuce_podle_strukturnich_atributu|frekvenční distribuce]] podle sociolingvistických metainformací nějaké vzorce v jejich užívání?​
  
-===== Kolokace ​===== +==== Kolokace s pauzami (v korpusu ORAL2013) ====
- +
-==== s pauzami (v korpusu ORAL2013) ====+
  
 Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz ''​[word=%%"​%%\.{1,​2}%%"​%%]''​ a zobrazit si [[manualy:​kontext:​kolokace|kolokace]]. Nezapomeňte na možnost zobrazit si pomocí odkazů **p/n** pozitivně/​negativně filtrovanou konkordanci k danému kolokátu a prozkoumat tak do detailu, jak jednotlivé kombinace fungují. Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz ''​[word=%%"​%%\.{1,​2}%%"​%%]''​ a zobrazit si [[manualy:​kontext:​kolokace|kolokace]]. Nezapomeňte na možnost zobrazit si pomocí odkazů **p/n** pozitivně/​negativně filtrovanou konkordanci k danému kolokátu a prozkoumat tak do detailu, jak jednotlivé kombinace fungují.
  
-==== s hezitačními zvuky ====+==== Kolokace ​s hezitačními zvuky ====
  
 Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu ''​[word=%%"​mmm|eee"​%%]'',​ v korpusech ORAL2006 a ORAL2008 pak pomocí dotazů ''​[word=%%"​hmm|eee"​%%]''​. Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu ''​[word=%%"​mmm|eee"​%%]'',​ v korpusech ORAL2006 a ORAL2008 pak pomocí dotazů ''​[word=%%"​hmm|eee"​%%]''​.