Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
kurz:hledani_v_mluvenych_korpusech [2018/08/08 17:34] – [Metainformace u KWIC] vaclavcvrcek | kurz:hledani_v_mluvenych_korpusech [2018/12/17 16:06] – [Specifikace kontextu] jankocek | ||
---|---|---|---|
Řádek 154: | Řádek 154: | ||
Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//: | Např. bychom mohli chtít dohledat výskyty slova //to//, které v okolí ±5 pozic obsahují kterékoli ze slov //teda//, //jo//, //ne// nebo //fakt//: | ||
- | [{{ : | + | [{{ : |
Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné, | Ve výsledné konkordanci budou výskyty kontextově požadovaných slov zvýrazněné, | ||
Řádek 166: | Řádek 166: | ||
Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''< | Např. dotaz specifikovaný podle obrázku níže se bude vyhledávat pouze v promluvách (resp. strukturách ''< | ||
- | [{{ kurz: | + | [{{ kurz: |
===== CQL ===== | ===== CQL ===== | ||
Řádek 310: | Řádek 310: | ||
[{{ : | [{{ : | ||
- | ==== Vizualizace v externím nástroji MluvKonk ==== | ||
- | U složitějších dialogů může být luštění linearizovaných konkordancí poněkud náročné, nemluvě o tom, že je těžké na jejich základě nějak intuitivně nahlédnout strukturu dialogu. Pokud je pro vás právě tento aspekt dat důležitý, | ||
- | |||
- | MluvKonk umí konkordanční řádek | ||
- | |||
- | [{{ : | ||
- | |||
- | přeformátovat do konkordanční tabulky, v níž má každý mluvčí vydělenou vlastní vrstvu: | ||
- | |||
- | [{{ : | ||
- | |||
- | Takové zobrazení může být užitečné zejména u složitějších dialogů s množstvím překryvů pocházejících z korpusu ORAL2013. Doplnění podobné funkce do KonTextu je ve stadiu plánování. | ||
===== Metainformace u KWIC ===== | ===== Metainformace u KWIC ===== | ||
Řádek 340: | Řádek 328: | ||
====== Některé zajímavé dotazy ====== | ====== Některé zajímavé dotazy ====== | ||
- | Níže uvádíme pro inspiraci některé typy jazykových jevů, které lze v datech z mluvených korpusů vyhledávat a zkoumat. | + | ==== Varianty |
- | ===== Varianty | + | |
- | ==== protože | + | Na to, jak je slovo //protože// v mluvené řeči běžné, je až nepohodlně dlouhé (3 slabiky!). Není proto divu, že se jej mluvčí často snaží různými způsoby výslovnostně ošidit a artikulační úsilí raději věnovat slovům, která nesou více obsahu a nejsou tak snadno odhadnutelná. V korpusu ORAL2013 se v přepisu vyskytují následující výslovnostní((Korpus ORAL2013 nebyl primárně vytvořen pro fonetický výzkum, jednotlivé varianty a jejich frekvence je tudíž potřeba brát s jistou rezervou. Poskytnou ale velmi dobrý základní přehled o šířce variace.)) varianty výrazu // |
- | Na to, jak je slovo // | + | [{{ : |
- | + | ||
- | [{{ : | + | |
Zkuste si některé z nich vyhledat. Odhalí [[manualy: | Zkuste si některé z nich vyhledat. Odhalí [[manualy: | ||
- | ===== Kolokace | + | ==== Kolokace s pauzami (v korpusu ORAL2013) ==== |
- | + | ||
- | ==== s pauzami (v korpusu ORAL2013) ==== | + | |
Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz '' | Která slova se v naší řeči nápadně často vyskytují v okolí pauz? Zkuste v korpusu ORAL2013 zadat CQL dotaz '' | ||
- | ==== s hezitačními zvuky ==== | + | ==== Kolokace |
Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu '' | Podobně zajímavé jsou i kolokace s hezitačními zvuky. Ty dohledáme v korpusu ORAL2013 pomocí CQL dotazu '' |