Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
kurz:subkorpusy [2018/08/08 12:10] – [Jednorázové vyhledávání v určitém typu textů] michalskrabal | kurz:subkorpusy [2018/08/08 12:14] – [Trvalý subkorpus: vytvoření pomocí naklikání] michalskrabal |
---|
Co jsou to metainformace a kde se o nich dozvíme více? [[pojmy:metadata|Metainformace]], tj. informace o názvu, autorovi, roce vydání apod., obsahuje každý text v korpusu. Lze podle nich i vyhledávat – můžeme například najít všechny texty daného autora, texty, které jsou přeložené z konkrétního jazyka nebo které byly vydány v určitém časovém rozmezí. V mluvených korpusech lze vyhledávat podle sociolingvistických údajů týkajících se mluvčích, jako je věk, vzdělání či nářeční oblast (viz specializovaná [[kurz:hledani_v_mluvenych_korpusech#vyber_textu|bonusová lekce]]). | Co jsou to metainformace a kde se o nich dozvíme více? [[pojmy:metadata|Metainformace]], tj. informace o názvu, autorovi, roce vydání apod., obsahuje každý text v korpusu. Lze podle nich i vyhledávat – můžeme například najít všechny texty daného autora, texty, které jsou přeložené z konkrétního jazyka nebo které byly vydány v určitém časovém rozmezí. V mluvených korpusech lze vyhledávat podle sociolingvistických údajů týkajících se mluvčích, jako je věk, vzdělání či nářeční oblast (viz specializovaná [[kurz:hledani_v_mluvenych_korpusech#vyber_textu|bonusová lekce]]). |
| |
[{{ :kurz:holmes-metadata.png?direct&350|Zobrazení metadat v konkordanci}}] | [{{ :kurz:holmes-metadata.png?direct&350|Zobrazení metadat v konkordanci FIXME}}] |
| |
Kde najdeme seznam příslušných metainformací? | Kde najdeme seznam příslušných metainformací? |
===== Vytvoření trvalého subkorpusu ===== | ===== Vytvoření trvalého subkorpusu ===== |
| |
Vytvoření **trvalého subkorpusu** se do značné míry podobá volbě [[kurz:subkorpusy#jednorazove_vyhledavani_v_urcitem_typu_textu|Omezit hledání]]. Na rozdíl od vytvoření dočasného subkorpusu, který slouží k jednorázovému vyhledávání, lze však stálý subkorpus používat opakovaně. Zůstane totiž součástí konkrétního uživatelského účtu a bude k dispozici kdekoli, kde se daný uživatel přihlásí do KonTextu. | Vytvoření **trvalého subkorpusu** se do značné míry podobá volbě [[kurz:subkorpusy#jednorazove_vyhledavani_v_urcitem_typu_textu|Omezit hledání]]. Na rozdíl od vytvoření dočasného subkorpusu, který slouží k jednorázovému vyhledávání, lze však stálý subkorpus používat opakovaně. Zůstane totiž součástí konkrétního uživatelského účtu a bude k dispozici vždy, když se daný uživatel přihlásí do KonTextu. |
| |
==== Trvalý subkorpus: vytvoření pomocí naklikání ==== | ==== Trvalý subkorpus: vytvoření pomocí naklikání ==== |
| |
* 1. krok je vždy stejný: Musíme vybrat výchozí korpus, z něhož budeme volit odpovídající podmnožinu dat. | * 1. krok je vždy stejný: Musíme vybrat výchozí korpus, z něhož budeme volit odpovídající podmnožinu dat. |
* 2. krok: V jednotlivých kolonkách strukturních typů zaškrtáme své volby příslušných kategorií. Čísla napravo od nich představují velikost textů v dané kategorii (vpravo nahoře lze přepínat mezi počty dokumentů či [[pojmy:token|tokenů]]). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. Svou volbu můžeme upravovat pomocí tlačítek **zúžit výběr** a **zrušit výběr**. Je-li výběr dostatečně úzký, lze vybírat také přímo z konkrétních děl (**doc.title** v SYN2015, **opus.nazev** ve starších psaných korpusech). | * 2. krok: V jednotlivých kolonkách strukturních typů zaškrtáme své volby příslušných kategorií. Čísla napravo od nich představují velikost textů v dané kategorii (vpravo nahoře lze přepínat mezi počty dokumentů či [[pojmy:token|tokenů]]). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. Svou volbu můžeme upravovat pomocí tlačítek **Zúžit výběr** a **Zrušit výběr**. Je-li výběr dostatečně úzký, lze vybírat také přímo z konkrétních děl (**doc.title** v SYN2015, **opus.nazev** ve starších psaných korpusech). |
* 3. krok: Subkorpusu je potřeba přidělit jméno (tj. jednoznačný a jedinečný identifikátor, který v rámci seznamu vašich existujících subkorpusů vytvořených z daného zdrojového korpusu dosud nebyl použit). | * 3. krok: Subkorpusu je potřeba přidělit jméno (tj. jednoznačný a jedinečný identifikátor, který v rámci seznamu vašich existujících subkorpusů vytvořených z daného zdrojového korpusu dosud nebyl použit). |
| |