AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Následující verzeObě strany příští revize
manual:syd [2014/11/25 17:26] – vytvořeno Václav Cvrčekmanualy:syd [2016/09/09 09:42] – [SyD] Václav Cvrček
Řádek 1: Řádek 1:
 ====== SyD ====== ====== SyD ======
  
-Aplikace SyD (ze **SY**nchronní a **D**iachronní analýza variant) slouží především k průzkumu vzájemně si konkurujících jazykových jevů. Jak už název vypovídá, aplikace má dvě (v zásadě oddělené) části:+{{ kurz:syd-logo.png?direct&200|}} 
 + 
 +Aplikace SyD (ze **Sy**nchronní a **D**iachronní analýza variant) slouží především k průzkumu vzájemně si konkurujících jazykových jevů. Slouží jako komplement k univerzálnějším [[pojmy:korpusovy_manazer|korpusovým manažerům]] a pomáhá snadno a rychle zprostředkovat výsledky v korpusu laickým uživatelům. Jak už název vypovídá, aplikace má dvě (v zásadě oddělené) části:
   - synchronní, v níž je možné porovnávat varianty podle jejich frekvence a distribuce v textech   - synchronní, v níž je možné porovnávat varianty podle jejich frekvence a distribuce v textech
   - diachronní, v níž lze sledovat vývojové tendnce v užívání variant.   - diachronní, v níž lze sledovat vývojové tendnce v užívání variant.
  
-{{ :manual:syd-logo.png?direct&200|}} 
  
-Nástroj SyD je webovou aplikací (k jejímu používání se využívá pouze prohlížeč internetu) a je dostupná bez registrace na adrese [[http://syd.korpus.cz|syd.korpus.cz]]. V současnosti je k dispozici ve verzi 2.0, která byla zveřejněna v roce 2014 (první verze byla spuštěna v roce 2011). Součástí aplikace je stručná nápověda, zobrazené výsledky doprovází podrobný komentář. Stejně jako v ostatních aplikacích ([[manual:morfio|Morfio]], [[manual:kwords|KWords]]), je i v rámci SyDu k dispozici permanentní odkaz, který vede k položenému zadání. 
  
 +Nástroj SyD je webovou aplikací (k její obsluze se využívá pouze prohlížeč internetu) a je dostupná bez [[kurz:zaciname|registrace]] na adrese **[[http://syd.korpus.cz|syd.korpus.cz]]**. 
 +
 +V současnosti je k dispozici ve verzi 2.0, která byla zveřejněna v roce 2014 (první verze byla spuštěna v roce 2011). Součástí aplikace je stručná nápověda, zobrazené výsledky doprovází podrobný komentář. Stejně jako v některých ostatních aplikacích (např. [[manualy:morfio|Morfio]]), je i v rámci SyDu k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný pro sdílení a citování.
 ===== Synchronní část ===== ===== Synchronní část =====
  
-V rámci synchronní části může uživatel zadat dva (nebo i více) jevů, které chce porovnat. Konkurence se může týkat jak jejich pravopisné podoby, tak jejich morfologie, lze ale zkoumat i konkurenci slovotvornou, lexikologickou, syntaktickou či slovoslednou. Dotazy můžou být formulovány velmi trivialně (stačí prosté zadání hledaného slova) nebo pomocí dotazovacího jazyka [[pojmy:cql|CQL]]. Aplikace všechny zadané dotazy vyhodnotí a zobrazí výsledky ve formě tabulek a grafů.+V rámci synchronní části může uživatel zadat dva (nebo i více) jevů, které chce porovnat. Konkurence se může týkat jak jejich pravopisné podoby (např. //filozofie// vs. //filosofie//), tak jejich morfologie (//bychom// vs. //bysme//), lze ale zkoumat i konkurenci lexikologickou (//stále// vs. //pořád// vs. //furt//), syntaktickou či slovoslednou (//sebe sama// vs. //sama sebe//). Dotazy můžou být formulovány velmi trivialně (stačí prosté zadání hledaného slova) nebo pomocí dotazovacího jazyka [[pojmy:cql|CQL]]. Aplikace všechny zadané dotazy vyhodnotí a zobrazí výsledky ve formě tabulek a grafů.
  
-Korpusy použité ve verzi 2.0: +Korpusy použité v aplikaci SyD (ve verzi 2.0)
-  * [[cnk:syn2010|SYN2010]] pro psaný veřejný jazyk+  * [[cnk:syn2010|SYN2010]] pro psaný (veřejnýjazyk
   * [[cnk:ksk-dopisy|KSK-Dopisy]] pro psaný neveřejný (a neformální) jazyk   * [[cnk:ksk-dopisy|KSK-Dopisy]] pro psaný neveřejný (a neformální) jazyk
   * [[cnk:oral2006|Oral2006]] + [[cnk:oral2008|Oral2008]] + [[cnk:oral2013|Oral2013]] pro mluvený neformální jazyk   * [[cnk:oral2006|Oral2006]] + [[cnk:oral2008|Oral2008]] + [[cnk:oral2013|Oral2013]] pro mluvený neformální jazyk
Řádek 20: Řádek 23:
 V synchronní části analýzy je možné využívat [[pojmy:lemma|lemmatizaci]] (tj. dotazovat se na celý lexém včetně všech jeho tvarů), při vyhodnocování výsledků je však třeba obezřetnosti. Zatímco v korpusech řady SYN se využívá standardní lemmatizace, data pro mluvenou češtinu a pro korespondenci lemmatizována nejsou a je zde proto rozsah lemmatu odhadován na základě psaného jazyka (dotaz je nejprve vyhodnocen v korpusu SYN2010 a na základě tvarů v něm identifikovaných je sestaven dotaz pro nelemmatizované korpusy). V synchronní části analýzy je možné využívat [[pojmy:lemma|lemmatizaci]] (tj. dotazovat se na celý lexém včetně všech jeho tvarů), při vyhodnocování výsledků je však třeba obezřetnosti. Zatímco v korpusech řady SYN se využívá standardní lemmatizace, data pro mluvenou češtinu a pro korespondenci lemmatizována nejsou a je zde proto rozsah lemmatu odhadován na základě psaného jazyka (dotaz je nejprve vyhodnocen v korpusu SYN2010 a na základě tvarů v něm identifikovaných je sestaven dotaz pro nelemmatizované korpusy).
  
-Synchronní část poskytuje informaci o rozložení jevů v psaných textech (na základě [[pojmy:atributy_strukturni|strukturních atributu]] [[pojmy:txtype|txtype]] a [[pojmy:genre|genre]]) i v mluveném jazyce (na základě atribtutů pohlaví, věk, vždělání a regionální příslušnost). Všechny údaje jsou relativizovány s ohledem na velikost dané kategorie v korpusech.+Synchronní část poskytuje informaci o rozložení jevů v psaných textech (na základě [[pojmy:atributy_strukturni|strukturních atributů]] [[pojmy:txtype|txtype]] a [[pojmy:genre|genre]]) i v mluveném jazyce (na základě atribtutů pohlaví, věk, vždělání a regionální příslušnost). Všechny údaje jsou relativizovány s ohledem na velikost dané kategorie v korpusech.
  
 Pro analýzu lexikálních odlišností zkoumaných variant poskytuje aplikace SyD i zjednodušenou verzi [[pojmy:kolokace|kolokačních]] paradigmat k jednotlivým dotazům. Pro analýzu lexikálních odlišností zkoumaných variant poskytuje aplikace SyD i zjednodušenou verzi [[pojmy:kolokace|kolokačních]] paradigmat k jednotlivým dotazům.
Řádek 26: Řádek 29:
 ===== Diachronní část ===== ===== Diachronní část =====
  
-Základem pro diachronní analýzu je korpus [[cnk:diakorp|Diakorp]] rozšířený o další data z dřívějších podob češtiny, které dosud neprošly ruční kontrolou. Nejmodernější období je reprezentováno výběrem ze synchronních korpusů řady [[cnk:syn|SYN]]. Vzhledem k tomu, že starší texty nejsou dosud [[pojmy:lemma|lemmatizovány]], je možné použít dotazy pouze na atribut [[pojmy:word|word]] (slovní tvar). +Základem pro diachronní analýzu je korpus Diakon, který se skládá z textů korpusu [[cnk:diakorp|Diakorp]] rozšířených o další data z dřívějších podob češtiny, které dosud neprošly ruční kontrolou. Orientační výčet zdrojových textů do roku 1989 je k dispozici v sekci [[seznamy:index#zdrojove_texty_diachronnich_korpusu|seznamů]]. Nejmodernější období je reprezentováno výběrem ze synchronních korpusů řady [[cnk:syn|SYN]]. Vzhledem k tomu, že starší texty nejsou dosud [[pojmy:lemma|lemmatizovány]], je možné použít dotazy pouze na atribut [[pojmy:word|word]] (slovní tvar).
- +
-Aplikace SyD všechny zadané dotazy vyhodnotí a zjistí jejich relativní frekvenci v různých letech. Vzhledem k tomu, že pokrytí časové osy stále není optimální, je třeba brát časové údaje spíše orientačně a pro zobrazení trendů se užívá klouzavý průměr (s nastavitelným oknem).+
  
-Zobrazení na časové ose obsahuje navíc ještě i míru chyby, s níž je třeba při analýze dat počítat. +Aplikace SyD všechny zadané dotazy vyhodnotí a zjistí jejich relativní frekvenci v různých letech. Vzhledem k tomu, že pokrytí časové osy stále není optimální, je třeba brát časové údaje spíše orientačně a pro zobrazení trendů se užívá klouzavý průměr (s nastavitelným oknem). Zobrazení na časové ose obsahuje navíc ještě i míru chyby, s níž je třeba při analýze dat počítat. 
  
 ===== Obrázky aplikace ===== ===== Obrázky aplikace =====
  
-[{{:manual:syd-syn.png?direct&200|Vyhodnocení dotazu v synchronní části}}] +[{{:kurz:syd-syn.png?direct&200|Vyhodnocení dotazu v synchronní části}}] 
-[{{:manual:syd-syn-distr.png?direct&200|Distribuce jevů v psaných textech}}] +[{{:kurz:syd-syn-distr.png?direct&200|Distribuce jevů v psaných textech}}] 
-[{{:manual:syd-syn-kolok.png?direct&200|Kolokační analýza}}] +[{{:kurz:syd-syn-kolok.png?direct&200|Kolokační analýza}}] 
-[{{:manual:syd-dia.png?direct&200|Vyhodnocení dotazu v diachronní části}}] +[{{:kurz:syd-dia.png?direct&200|Vyhodnocení dotazu v diachronní části}}] 
-[{{:manual:syd-dia-roky.png?direct&200|Zobrazení počtu výskytů v jednotlivých letech}}]+[{{:kurz:syd-dia-roky.png?direct&200|Zobrazení počtu výskytů v jednotlivých letech}}]
  
 ==== Související odkazy ==== ==== Související odkazy ====
  
-<WRAP round box 49%> +<WRAP round box 50%> 
-[[manual:menu:index|Rozhraní KonText]] • [[manual:morfio|Morfio]] • [[manual:kwords|KWords]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]]+[[manualy:kontext:index|Rozhraní KonText]] • [[morfio|Morfio]] • [[kwords|KWords]] • [[treq|Treq]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]]
 </WRAP> </WRAP>