Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- kurz:vyhodnoceni_dotazu [2018/08/06 16:43] – [Frekvence] michalskrabal
+++ kurz:vyhodnoceni_dotazu [2018/08/06 16:55] – [Uložení výsledků analýzy] michalskrabal
@@ Řádek 80: / Řádek 80: @@
 ===== Třídění řádků =====
-Kvalitativní analýza konkordančních řádků může těžit z funkce **Třídění**, která je k dispozici v menu pod položkou **Konkordance**. Tuto funkci můžeme využívat, dáváme-li přednost ruční kvalitativní analýze před analýzou frekvenční (viz první část této lekce věnovaná frekvenční distribuci).
+Kvalitativní analýza konkordančních řádků může těžit z funkce **Třídění**, která je k dispozici v menu pod položkou **Konkordance**. Tuto funkci lze využít, dáváme-li přednost ruční kvalitativní analýze před analýzou frekvenční (viz první část této lekce věnovaná frekvenční distribuci).
 Třídit řádky má smysl jen v případě, že celá konkordance není příliš rozsáhlá -- je tedy rozumné pracovat s [[kurz:vytvareni_vzorku|náhodnými vzorky]], tj. s určitým zpracovatelným počtem náhodně vybraných řádků. Náhodný vzorek vytvoříme po zadání dotazu v menu **Konkordance → Vzorek**, kde si zadáme požadovaný rozsah vzorku. Doporučujeme vybírat spíše menší vzorky (defaultně nastavených je 250), které jsou ještě přehledné. Problematice vytváření náhodných vzorků se detailně věnuje [[kurz:vytvareni_vzorku|samostatný článek]].
-Jakmile máme připravený náhodný vzorek, můžeme v něm řádky třídit abecedně, a to buď podle prvního znaku KWICu, nebo podle levého či pravého kontextu. Chceme například pomocí kvalitativní analýzy zjistit, s jakými slovy se obvykle pojí adjektivum //červený//. V menu vybereme položku **Konkordance → Třídění**. Pokud nás zajímá pravý kontext, kde se budou pravděpodobně vyskytovat mj. substantiva rozvíjená slovem //červený//, zvolíme atribut **word** nebo **lemma**, klíč třídění **Pravý kontext** a počet tokenů k třídění **1** (to znamená, že abecedně řadit se bude jen jediné slovo vpravo od KWICu).
+Jakmile máme připravený náhodný vzorek, můžeme v něm řádky abecedně seřadit, a to buď podle prvního znaku KWICu, nebo podle levého či pravého kontextu. Chceme například pomocí kvalitativní analýzy zjistit, s jakými slovy se obvykle pojí adjektivum //červený//. V menu vybereme položku **Konkordance → Třídění**. Pokud nás zajímá pravý kontext, kde se budou pravděpodobně vyskytovat mj. substantiva rozvíjená slovem //červený//, zvolíme atribut **word** nebo **lemma**, klíč třídění **Pravý kontext** a počet tokenů k třídění **1** (to znamená, že abecedně řadit se bude jen jediné slovo vpravo od KWICu).
 Kvalitativní analýzou zjistíme, že po adjektivu //červený// skutečně v textu nejčastěji následují substantiva, např. //víno//, //kříž//, //barva//, //krvinka// či //karta//. Podobnou kvalitativní analýzou levého kontextu (klíč třídění změníme na **Levý kontext**) dospějeme k tomu, že adjektivum //červený// může být rozvíjeno slovy jako //jasně// či //temně//.
 ===== Uložení výsledků analýzy =====
-Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční distribuce či [[manualy:kontext:kolokace|kolokační]] analýzy. Ve výsledné tabulce (pokud data otevíráme v tabulkovém editoru) můžeme dále třídit, promazávat či jinak upravovat řádky podle svých představ a výzkumných záměrů.
+Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční a [[manualy:kontext:kolokace|kolokační]] seznamy. Ve výsledné tabulce (pokud data otevíráme v tabulkovém editoru) můžeme dále třídit, promazávat či jinak upravovat řádky podle svých představ a výzkumných záměrů.
-V korpusu SYN2010 najděte všechna slova obsahující segment //krv// (typ dotazu **Část slova**). Pomocí funkce **Frekvence → Lemmata** vytvořte tabulku, která řadí lemmata obsahující v některém ze svých tvarů řetězec znaků //krv// podle frekvence.
+V korpusu SYN2015 najděte všechna slova obsahující segment //krv// (typ dotazu **Část slova**). Pomocí funkce **Frekvence → Lemmata** vytvořte tabulku, která řadí lemmata obsahující v některém ze svých tvarů řetězec znaků //krv// podle frekvence.
-V horní části výsledné tabulky vidíte, že takových lemmat je celkem 138. Vás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež vám umožní omezit počet exportovaných řádků (od 1 do 39, na řádku 40 je slovo, které je v korpusu SYN2010 pouze devětkrát). Zvolte formát XLSX a data uložte. V okně, které se vám automaticky zobrazí, stačí už jen zvolit, zda chcete soubor otevřít ve formátu Excel (pozor, v tom případě není zatím uložený!), nebo ho rovnou uložit mezi své soubory.
+V horní části výsledné tabulky vidíme, že takových lemmat je celkem 129. Nás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež umožní omezit počet exportovaných řádků (od 1 do 38, na řádku 39 je slovo, které je v korpusu SYN2015 pouze devětkrát). Zvolte formát XLSX a data uložte. V okně, které se automaticky zobrazí, stačí už jen zvolit, zda chcete soubor otevřít ve formátu Excel (pozor, v tom případě není zatím uložený!), nebo ho rovnou uložit mezi své soubory.
 ===== Vyzkoušejte si na závěr =====

Historie:

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence