AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:zobrazeni_dotazu [2018/08/06 15:13] – [Vnitřní struktura korpusu] Václav Cvrčekkurz:zobrazeni_dotazu [2021/01/06 18:41] Michal Škrabal
Řádek 1: Řádek 1:
 ====== 2. lekce: Položili jsme dotaz. Co vše můžeme zobrazit? ====== ====== 2. lekce: Položili jsme dotaz. Co vše můžeme zobrazit? ======
  
-V [[prvni_dotaz|první lekci]] tohoto průvodce pro práci s korpusy jsme se naučili položit korpusu dotaz a rozlišit, který [[prvni_dotaz#typy_dotazu|typ dotazu]] je vhodný na jaký problém. Nyní se budeme věnovat tomu, jaké informace o datech máme k dispozici, jak si je zobrazit a jak je uložit. Řadu těchto informací se ovšem dozvíme i ze samotného [[pojmy:konkordance|konkordančního řádku]]. Abychom jim správně rozuměli, nejprve se zaměříme na to, v jaké podobě jsou data v korpusu uložena a co to znamená pro jejich zobrazování. V dalším kroku si ukážeme možnosti, jež poskytuje např. nastavení různého rozsahu zobrazení metainformací. Pro začátek si však musíme již zmíněné pojmy //[[pojmy:word|word]] (slovní tvar)// a //[[pojmy:lemma|lemma]]// doplnit ještě o jeden -- //tag//.+V [[prvni_dotaz|první lekci]] tohoto průvodce pro práci s korpusy jsme se naučili položit korpusu základní typ dotazu. Nyní se budeme věnovat tomu, jaké informace o datech máme k dispozici, jak si je zobrazit a jak je uložit. Řadu těchto informací se ovšem dozvíme i ze samotného [[pojmy:konkordance|konkordančního řádku]]. Abychom jim správně rozuměli, nejprve se zaměříme na to, v jaké podobě jsou data v korpusu uložena a co to znamená pro jejich zobrazování. V dalším kroku si ukážeme možnosti, jež poskytuje např. nastavení různého rozsahu zobrazení metainformací. Pro začátek si však musíme již zmíněné pojmy //[[pojmy:word|word]] (slovní tvar)// a //[[pojmy:lemma|lemma]]// doplnit ještě o jeden -- //tag//.
  
 ===== Word – lemma – tag ===== ===== Word – lemma – tag =====
Řádek 21: Řádek 21:
  
 <code> <code>
-<doc title="Zářivá světla velkoměsta" subtitle="" author="McInerney, Jay" issue="" publisher="Volvox Globator" pubplace="Praha" pubyear="1994" first_published="1994" translator="Hrubý, Jiří" srclang="en: angličtina" authsex="M: muž" transsex="M: muž" txtype_group="FIC: beletrie" txtype="NOV: próza" genre_group="X: neuvedeno" genre="X: neuvedeno" medium="B: kniha" periodicity="NP: neperiodická publikace" audience="GEN: obecné publikum" isbnissn="80-85769-35-2" biblio="McInerney, Jay (1994): Zářivá světla velkoměsta. Překlad: Hrubý, Jiří. Praha: Volvox Globator." id="zarsvvel">+<doc title="Zářivá světla velkoměsta" subtitle="" author="McInerney, Jay" issue="" publisher="Volvox Globator" pubplace="Praha" pubyear="1994" 
 +first_published="1994" translator="Hrubý, Jiří" srclang="en: angličtina" authsex="M: muž" transsex="M: muž" txtype_group="FIC: beletrie" 
 +txtype="NOV: próza" genre_group="X: neuvedeno" genre="X: neuvedeno" medium="B: kniha" periodicity="NP: neperiodická publikace" 
 +audience="GEN: obecné publikum" isbnissn="80-85769-35-2" biblio="McInerney, Jay (1994): Zářivá světla velkoměsta. Překlad: Hrubý, Jiří.  
 +Praha: Volvox Globator." id="zarsvvel">
 <text section="" section_orig="" author="" id="zarsvvel:1"> <text section="" section_orig="" author="" id="zarsvvel:1">
 ... ...
Řádek 38: Řádek 42:
 </s> </s>
 </p> </p>
 +...
 +</text>
 ... ...
 </doc> </doc>
 </code> </code>
  
-<wrap lo>Každý text začíná specifickou značkou např. ''<doc ...>'', za kterou následují jeho charakteristiky (zachycené [[pojmy:atributy_strukturni|strukturními atributy]]). Samotný text je uspořádán do sloupců. První sloupec představuje originální text (atribut [[pojmy:word|word]]), další sloupce jsou pak vyhrazeny pro jednotlivé [[pojmy:atributy_pozicni|poziční atributy]] (v tomto případě [[pojmy:lemma|lemma]] a [[pojmy:tag|tag]], následovat ale mohou i další atributy).</wrap> +<wrap lo>Každý dokument začíná specifickou značkou např. ''<doc ...>'', za kterou následují jeho charakteristiky (zachycené [[pojmy:atributy_strukturni|strukturními atributy]]). Může být dál vnitřně členěn do částí, jejichž hranice se označují pomocí atributu ''<text>''. Samotný text je uspořádán do sloupců. První sloupec představuje originální text (atribut [[pojmy:word|word]]), další sloupce jsou pak vyhrazeny pro jednotlivé [[pojmy:atributy_pozicni|poziční atributy]] (v tomto případě [[pojmy:lemma|lemma]] a [[pojmy:tag|tag]], následovat ale mohou i další atributy).</wrap> 
  
 <wrap lo>Všechny struktury včetně vět musí mít otevírací i ukončovací značku; po ''<s s id=%%"%%zarsvvel:1:6:1%%"%%>'', tedy identifikátoru začátku této konkrétní věty v rámci konkrétního opusu, tudíž následuje: ''</s>'' a stejně tak jsou ukončeny pomocí lomítka i všechny ostatní [[pojmy:atributy_strukturni|strukturní atributy]] (více v [[subkorpusy#hledame_v_ramci_jedne_vety|7. lekci]]).</wrap>  <wrap lo>Všechny struktury včetně vět musí mít otevírací i ukončovací značku; po ''<s s id=%%"%%zarsvvel:1:6:1%%"%%>'', tedy identifikátoru začátku této konkrétní věty v rámci konkrétního opusu, tudíž následuje: ''</s>'' a stejně tak jsou ukončeny pomocí lomítka i všechny ostatní [[pojmy:atributy_strukturni|strukturní atributy]] (více v [[subkorpusy#hledame_v_ramci_jedne_vety|7. lekci]]).</wrap> 
Řádek 68: Řádek 74:
 Vpravo na zelené liště lze postupně listovat mezi jednotlivými stránkami konkordance, případně je možné zadat konkrétní číslo stránky a na tu přímo přejít. Vpravo na zelené liště lze postupně listovat mezi jednotlivými stránkami konkordance, případně je možné zadat konkrétní číslo stránky a na tu přímo přejít.
  
-Mezi konkordancí a menu vidíme tzv. **drobečkovou navigaci**. Oceníme ji především u složitějších, vícefázových dotazů (ty si nicméně ponechme do pozdějších lekcí): slouží jednak k snazší orientaci, jednak nám umožnuje vrátit se do kterékoliv fáze a dotaz podle potřeby modifikovat.  +Mezi konkordancí a menu vidíme tzv. **drobečkovou navigaci**. Oceníme ji především u složitějších, vícefázových dotazů (ty si nicméně ponechme do pozdějších lekcí): slouží jednak k snazší orientaci, jednak nám umožnuje vrátit se do kterékoliv fáze dotazu a podle potřeby jej modifikovat.  
  
-[{{:kurz:prvni_pohled_na_konkordanci.png?900|}}]+[{{:kurz:prvni_pohled_na_konkordanci.png?896|}}]
  
  
 ===== Rychlé zobrazení informací o textu a rozšíření kontextu ===== ===== Rychlé zobrazení informací o textu a rozšíření kontextu =====
  
-Vyhledejme si výše probíranou kombinaci slov ''Když školení skončilo'' -- typ dotazu //Základní//, korpus [[cnk:syn2010|SYN2010]]. Výsledkem bude jediný konkordanční řádek a vyhledaná kombinace -- [[pojmy:kwic|KWIC]] -- bude barevně zvýrazněná. +Vyhledejme si výše probíranou kombinaci slov ''Jak jsi vlastně zbankrotoval'' v korpusu [[cnk:syn2015|SYN2015]]. Výsledkem bude jediný konkordanční řádek a vyhledaná kombinace -- [[pojmy:kwic|KWIC]] -- bude barevně zvýrazněná. 
  
 Pokud potřebujeme analyzovat širší kontext určitého KWICu, lze ho vyvolat kliknutím přímo na vybraný růžově zobrazený KWIC. V dolní části obrazovky se zobrazí okno s širším kontextem, který je možné pomocí šipek ještě zvětšovat (ne však donekonečna).  Pokud potřebujeme analyzovat širší kontext určitého KWICu, lze ho vyvolat kliknutím přímo na vybraný růžově zobrazený KWIC. V dolní části obrazovky se zobrazí okno s širším kontextem, který je možné pomocí šipek ještě zvětšovat (ne však donekonečna). 
  
-[{{:kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?1000|Rozšíření kontextu po kliknutí na KWIC}}]+[{{:kurz:rozsireni_kontextu.png?896|Rozšíření kontextu po kliknutí na KWIC }}]
  
-Ve výchozím nastavení vidíme vlevo modře zvýrazněný název opusu (textu), z něhož daná kombinace slov pochází. Další informace (např. o autorovi, roku vydání, zdrojovém jazyku nebo u mluvených korpusů o věku mluvčích či geografické oblasti) lze zobrazit kliknutím na tento modrý text. V dolní části obrazovky se objeví barevné pole, v němž jsou všechny údaje o textu, z něhož ukázka pochází, sumarizovány. Toto pole zavřeme kliknutím na křížek v jeho horní části.+Ve výchozím nastavení vidíme vlevo modře zvýrazněný název dokumentu, z něhož daná kombinace slov pochází. Další informace (např. o autorovi, roku vydání, zdrojovém jazyku nebo u mluvených korpusů o věku mluvčích či geografické oblasti) lze zobrazit kliknutím na tento modrý text. V dolní části obrazovky se objeví barevné pole, v němž jsou všechny údaje o textu, z něhož ukázka pochází, sumarizovány. Toto pole zavřeme kliknutím na křížek v jeho horní části.
  
-[{{:kurz:holmes-metadata.png?1000|Zobrazení podrobných metainformací o textu}}]+[{{:kurz:metadata.png?896|Zobrazení podrobných metainformací o textu }}]
  
 <WRAP clear/> <WRAP clear/>
  
-Zdá se vám takovéto bližší seznámení s konkordancí dostatečné? Budiž, ale někdy můžete potřebovat změnu parametrů zobrazení u všech řádků. A jelikož toto školení ještě zdaleka nekončí, naučíme se nastavit si i jiné výchozí zobrazení, šité na míru vašim potřebám. 
  
 ===== Možnosti zobrazení konkordance ===== ===== Možnosti zobrazení konkordance =====
  
-V [[manualy:kontext:index|menu]] si vybereme položku [[manualy:kontext:moznosti_zobrazeni|Zobrazení]], kde se skrývají všechny možnosti nastavení konkordance. Zde si ukážeme pouze nejčastěji používané volby.+V [[manualy:kontext:index|menu]] si vybereme položku [[manualy:kontext:zobrazeni|Zobrazení]], kde se skrývají všechny možnosti nastavení konkordance. Zde si ukážeme pouze nejčastěji používané volby.
  
-==== Jak změnit rozsah konkordančního řádku====+==== Jak změnit rozsah konkordančního řádku ====
  
-Chcete vidět širší kontext KWICu nežli defaultně nastavených 10 [[pojmy:pozice|pozic]] (vlevo a vpravo)? V horním menu zvolíme **Zobrazení → [[manualy:kontext:moznosti_zobrazeni#obecne_volby_zobrazeni_konkordance|Obecné volby zobrazení]]** a do formuláře zadáme požadovanou šířku kontextu v počtu pozic. Výsledek ovšem nebude nutně přehlednější, nastavení příliš širokého kontextu může být spíše kontraproduktivní. Rozmezí 10–15 pozic většinou plně dostačuje. Dále je dobré vědět, že běžný uživatel má limit pro rozšiřování kontextu maximálně 50 pozic. +Chcete vidět širší kontext KWICu nežli defaultně nastavených 10 [[pojmy:pozice|pozic]] (vlevo a vpravo)? V horním menu zvolíme **Zobrazení → [[manualy:kontext:zobrazeni#obecne_volby_zobrazeni_konkordance|Obecné volby zobrazení]]** a do formuláře zadáme požadovanou šířku kontextu v počtu pozic. Výsledek ovšem nebude nutně přehlednější, nastavení příliš širokého kontextu může být spíše kontraproduktivní. Rozmezí 10–15 pozic většinou plně dostačuje. Dále je dobré vědět, že běžný uživatel má limit pro rozšiřování kontextu maximálně 50 pozic. 
-==== Jak zobrazit celé věty s KWICem====+==== Jak zobrazit celé věty s KWICem ====
  
 Možná vás ze všeho nejvíc mate zobrazení zarovnané na střed podle KWICu a ignorující hranice vět. Možná vás ze všeho nejvíc mate zobrazení zarovnané na střed podle KWICu a ignorující hranice vět.
-Pak si přepněte zobrazení pomocí položky **Zobrazení → KWIC/Věta**. Funguje vám to? A je orientace při zobrazení vět snazší? Pokud ano, zvolené nastavení se aplikuje na všechny budoucí dotazy -- pokud ne, jednoduše ho znovu přepněte zpět.+Pak si přepněte zobrazení pomocí položky **Zobrazení → KWIC/Věta**. Je orientace při zobrazení vět snazší? Pokud ano, zvolené nastavení se aplikuje na všechny budoucí dotazy -- pokud ne, jednoduše ho znovu přepněte zpět.
  
 [{{:kurz:zobrazeniveta.png?direct&700 |Zobrazení konkordance po větách}}] [{{:kurz:zobrazeniveta.png?direct&700 |Zobrazení konkordance po větách}}]
  
  
-==== Jak zobrazit dostupné metainformace====+==== Jak zobrazit dostupné metainformace ====
  
-Jelikož se korpusy zpřístupňované rozhraním KonText liší svou povahou i způsobem zpracování, nejsou dostupné informace o původu textů či členění do strukturních jednotek totožné. K zobrazení metainformací se dostanete opět přes volbu **Zobrazení → [[manualy:kontext:moznosti_zobrazeni#atributy_struktury_a_metainformace|Korpusová nastavení]]**, která umožňuje nejpodrobnější vyladění zobrazovaných dat.+Jelikož se korpusy zpřístupňované rozhraním KonText liší svou povahou i způsobem zpracování, nejsou dostupné informace o původu textů či členění do strukturních jednotek totožné. K zobrazení metainformací se dostanete opět přes volbu **Zobrazení → [[manualy:kontext:zobrazeni#korpusova_nastaveni|Korpusová nastavení]]**, která umožňuje nejpodrobnější vyladění zobrazovaných dat.
  
-Pro názornost uveďme příklad -- u každé konkordance chceme zobrazit název díla, autora a rok vydání, u každého KWICu pak chceme zobrazit i jeho tag. Ve formuláři v menu **Zobrazení → Korpusová nastavení** stačí zaškrtnout zkratky odkazující k příslušným kategoriím -- některé jsou celkem intutivní (''rokvyd''), kvůli jiným se možná budete muset podívat do [[seznamy:index#zkratky_a_kody|zvláštního seznamu]]. +Pro názornost uveďme příklad -- u každé konkordance chceme zobrazit název díla, autora a rok vydání, u každého KWICu pak chceme zobrazit i jeho tag. Ve formuláři v menu **Zobrazení → Korpusová nastavení** stačí zaškrtnout zkratky odkazující k příslušným kategoriím -- některé jsou celkem intutivní (''pubyear''), kvůli jiným se možná budete muset podívat do [[seznamy:index#zkratky_a_kody|zvláštního seznamu]]. 
  
 Ve výběru pozičních atributů nezapomeneme zaškrtnout tag (spolu s volbou, která ho zobrazí pouze u klíčového slova, nikoli u všech slov v dané konkordanci). Ve výběru pozičních atributů nezapomeneme zaškrtnout tag (spolu s volbou, která ho zobrazí pouze u klíčového slova, nikoli u všech slov v dané konkordanci).
  
-[{{:manualy:kontext:moznosti-zobrazeni2.png?500 |Formulář možností zobrazení}}]+[{{:manualy:kontext:moznosti-zobrazeni2.png?700 |Formulář možností zobrazení }}]
  
 <WRAP clear/> <WRAP clear/>
Řádek 121: Řádek 126:
 [{{:kurz:moznostizobrazeni_konkordance.png?900 |Konkordanční řádky se zobrazením jmen autorů a roku vydání a tagu (aplikovaného na KWIC)}}] [{{:kurz:moznostizobrazeni_konkordance.png?900 |Konkordanční řádky se zobrazením jmen autorů a roku vydání a tagu (aplikovaného na KWIC)}}]
  
-==== Jak zobrazit dialog v mluvených korpusech==== +==== Jak zobrazit dialog v mluvených korpusech ==== 
-Chcete se lépe orientovat v mluveném dialogu? Výchozí zobrazení, které dostanete při kliknutí na KWIC, je lineární a většinou rychlé orientaci či porozumění příliš nepomáhá. Lepší je zobrazit si dialog tak, aby v každém novém řádku byl jiný mluvčí. Přepnutím Výchozího zobrazení na Promluvy získáte právě takové setřídění. V zobrazení promluv jsou také snáze rozpoznatelné překryvy, tj. simultánní hovor dvou mluvčích. Najdete překryv na obou obrázcích?+Výchozí zobrazení rozšířeného kontextu, které dostanete při kliknutí na KWIC, je lineární a většinou rychlé orientaci či porozumění příliš nepomáhá. Lepší je zobrazit si dialog tak, aby v každém novém řádku byl jiný mluvčí. Přepnutím **Výchozího zobrazení** na **Promluvy** získáte právě takové setřídění. V zobrazení promluv jsou také snáze rozpoznatelné překryvy, tj. simultánní hovor dvou mluvčích. Najdete překryv na obou obrázcích?
    
 [{{:kurz:dialog_vz.png | Výchozí zobrazení rozšířeného dialogu}}] [{{:kurz:dialog_vz.png | Výchozí zobrazení rozšířeného dialogu}}]
Řádek 130: Řádek 135:
 Všechna data, která už umíme vyhledat, si můžeme také uložit. Možnosti, které export dat z našeho manažeru nabízí, shrnuje příslušný oddíl [[manualy:kontext:ulozit|manuálu]]. Výhodné je data ukládat do formátu XLSX (Excel), ten nám totiž umožňuje jednoduchou práci s jednotlivými řádky. Volba **Uložit → Vlastní** poskytuje možnost vlastního nastavení exportu dat, ať už jde o připojení hlavičky, číslování řádků, rozsah ukládaných řádků či jiné volby. Všechna data, která už umíme vyhledat, si můžeme také uložit. Možnosti, které export dat z našeho manažeru nabízí, shrnuje příslušný oddíl [[manualy:kontext:ulozit|manuálu]]. Výhodné je data ukládat do formátu XLSX (Excel), ten nám totiž umožňuje jednoduchou práci s jednotlivými řádky. Volba **Uložit → Vlastní** poskytuje možnost vlastního nastavení exportu dat, ať už jde o připojení hlavičky, číslování řádků, rozsah ukládaných řádků či jiné volby.
  
-==== Co všechno můžu exportovat====+==== Co všechno lze exportovat ====
  
 Exportovat můžete vždy, když je aktivní (tj. černě zbarvená) volba **Uložit**. Ukládat samozřejmě můžete nejen konkordanční řádky, ať už neupravené nebo třeba setříděné, ale také výsledky frekvenční distribuce a kolokační analýzy, o kterých bude řeč v dalších lekcích. Jak vidíte na obrázku níže, volba **Uložit** je aktivní. Exportovat můžete vždy, když je aktivní (tj. černě zbarvená) volba **Uložit**. Ukládat samozřejmě můžete nejen konkordanční řádky, ať už neupravené nebo třeba setříděné, ale také výsledky frekvenční distribuce a kolokační analýzy, o kterých bude řeč v dalších lekcích. Jak vidíte na obrázku níže, volba **Uložit** je aktivní.
Řádek 137: Řádek 142:
  
  
-==== Nač jsou jednotlivé formáty dobré====+==== Nač jsou jednotlivé formáty dobré ====
  
 Při exportu dat si můžete vybrat ze čtyř různých formátů: Při exportu dat si můžete vybrat ze čtyř různých formátů:
Řádek 149: Řádek 154:
 Pokud výsledek **nebudete** chtít zpracovávat v tabulkovém editoru, uložte si ho v tomto formátu. [[pojmy:kwic|KWIC]] zůstane oddělen tabulátory a jednotlivé konkordance budou na samostatných řádcích. Pokud výsledek **nebudete** chtít zpracovávat v tabulkovém editoru, uložte si ho v tomto formátu. [[pojmy:kwic|KWIC]] zůstane oddělen tabulátory a jednotlivé konkordance budou na samostatných řádcích.
  
-<WRAP round tip 75%> 
-TIPY: 
-  * Uložte si své konkordance ve formátu .txt.  
-  * Zjistěte, jaký program váš počítač automaticky zvolí pro otvírání. Notepad -- poznámkový blok? Nebo třeba WordPad či některý produkt řady MS Office? 
-  * Jsou konkordance na samostatných řádcích? Zobrazuje se vám správně diakritika? 
-  * V případě jakýchkoli potíží vřele doporučujeme, abyste si nainstalovali nějaký volně šiřitelný textový editor (např. [[http://notepad-plus-plus.org/|Notepad++]]) a data si zobrazovali v něm. 
-</WRAP> 
  
 +== Extensible Markup Language: .xml ==
  
-<wrap lo>**Extensible Markup Language: .xml** +Tento formát je určen především pro pokročilé uživatele. Takto uložená data nelze otevřít v tabulkových editorech ani s nimi nelze pracovat jako s čistým textem.
-\\ +
-Tento formát je určen především pro pokročilé uživatele. Takto uložená data nelze otevřít v tabulkových editorech ani s nimi nelze pracovat jako s čistým textem.</wrap>+
  
 ==== Uložení konkordance ==== ==== Uložení konkordance ====