AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
manualy:lists [2019/09/27 11:26] – vytvořeno vaclavcvrcekmanualy:lists [2021/02/02 18:26] (aktuální) michalkren
Řádek 2: Řádek 2:
  
  
-Aplikace Lists umožňuje procházet frekvenční seznamy různých jednotek ([[pojmy:lemma|lemma]], [[pojmy:word|word]] a [[pojmy:lc|lc]]) v reprezentativních korpusech psané češtiny ([[cnk:syn2000|SYN2000]], [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]]) a v korpusu spontánní mluvené češtiny [[cnk:oral|Oral v1]]. Pro každý korpus psané češtiny jsou navíc kromě celkových údajů k dispozici i dílčí frekvenční informace o třech jeho subkorpusech (beletrie, oborová literatura a publicistika). Frekvenční seznamy obsahují pouze jednotky, které se skládají výhradně z alfabetických znaků a z pomlčky a které mají v každém z korpusů SYN2000, SYN2005, SYN2010 a SYN2015 nenulovou frekvenci (u korpusu ORAL v1 navíc přistupuje podmínka nenulovosti frekvence v tomto korpusu).+Aplikace //Lists// umožňuje procházet frekvenční seznamy různých jednotek ([[pojmy:lemma|lemma]], [[pojmy:word|word]] a [[pojmy:lc|lc]]) v reprezentativních korpusech psané češtiny ([[cnk:syn2000|SYN2000]], [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]]) a v korpusu spontánní mluvené češtiny [[cnk:oral|Oral v1]]. Pro každý korpus psané češtiny jsou navíc kromě celkových údajů k dispozici i dílčí frekvenční informace o třech jeho subkorpusech (beletrie, oborová literatura a publicistika). Frekvenční seznamy obsahují pouze jednotky, které se skládají výhradně z alfabetických znaků a z pomlčky a které mají v každém z korpusů SYN2000, SYN2005, SYN2010 a SYN2015 nenulovou frekvenci (u korpusu ORAL v1 navíc přistupuje podmínka nenulovosti frekvence v tomto korpusu).
  
 Při prohlížení seznamů podle korpusů (první záložka) jsou ke každé jednotce uvedeny 4 frekvenční údaje: Při prohlížení seznamů podle korpusů (první záložka) jsou ke každé jednotce uvedeny 4 frekvenční údaje:
Řádek 11: Řádek 11:
   * průměrná redukovaná četnost normalizovaná na milion slov (ARFn).   * průměrná redukovaná četnost normalizovaná na milion slov (ARFn).
  
-Tabulka pro lemmata navíc obsahuje sloupec s informací o slovním druhu ([[pojmy:pos|POS]]). Údaje v tabulce lze podle libovolného sloupce řadit nebo filtrovat; podle číselných údajů lze filtrovat také zapsáním konkrétního intervalu v podobě M ... N (např. tedy 10 ... 99) do pole v záhlaví sloupce.+Tabulka pro lemmata navíc obsahuje sloupec s informací o slovním druhu ([[pojmy:pos|POS]]). Údaje v tabulce lze podle libovolného sloupce řadit nebo filtrovat; podle číselných údajů lze filtrovat také zapsáním konkrétního intervalu v podobě ''M ... N'' (např. tedy ''10 ... 99'') do pole v záhlaví sloupce.
  
 Druhá záložka prohlížeče umožňuje i jednoduché srovnání relativních frekvencí (IPM) a průměrných redukovaných četností normalizovaných na milion slov (ARFn) v rámci jednotlivých registrů (ostatní frekvenční údaje jsou závislé na velikost subkorpusu, a nemá je proto smysl přímo srovnávat). Údaje v této záložce jsou odvozeny z korpusů SYN2015 a Oral v1. Druhá záložka prohlížeče umožňuje i jednoduché srovnání relativních frekvencí (IPM) a průměrných redukovaných četností normalizovaných na milion slov (ARFn) v rámci jednotlivých registrů (ostatní frekvenční údaje jsou závislé na velikost subkorpusu, a nemá je proto smysl přímo srovnávat). Údaje v této záložce jsou odvozeny z korpusů SYN2015 a Oral v1.
  
 Kvůli srovnatelnosti a použití nejnovějších verzí lemmatizace a slovnědruhového značkování byly údaje pro korpusy SYN2000, SYN2005, SYN2010 a SYN2015 převzaty z odpovídajících subkorpusů korpusu [[cnk:syn:verze7|SYN v7]]. Kvůli srovnatelnosti a použití nejnovějších verzí lemmatizace a slovnědruhového značkování byly údaje pro korpusy SYN2000, SYN2005, SYN2010 a SYN2015 převzaty z odpovídajících subkorpusů korpusu [[cnk:syn:verze7|SYN v7]].
 +
 +**Aplikace je dostupná na adrese [[http://www.korpus.cz/lists]]**
 +
 +Kromě aplikace //Lists// nabízí ČNK také další možnosti práce s frekvenčními seznamy:
 +  * registrovaní uživatelé ČNK mohou vytvářet parametrizovatelné frekvenční seznamy přímo ve webovém rozhraní [[https://kontext.korpus.cz/|KonText]] pomocí funkce [[manualy:kontext:novy_dotaz#seznam_slov|Seznam slov]],
 +  * je možné stáhnout také speciálně upravené [[seznamy:srovnavaci_seznamy|srovnávací frekvenční seznamy]],
 +  * pokud byste měli zájem o jinak zpracovaná data, napište nám na e-mail na cnk (at) korpus.cz
 +
 +
 +===== Jak citovat Lists =====
 +
 +<WRAP round tip 80%>
 +Křen, M. - Cvrček, V. : Lists: Prohlížeč frekvenčních seznamů. FF UK. Praha 2019. Dostupný z WWW: <http://www.korpus.cz/lists>.
 +</WRAP>