AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manualy:akalex [2021/02/18 17:12] jankocekmanualy:akalex [2021/03/15 09:12] (aktuální) – [Akalex] vaclavcvrcek
Řádek 3: Řádek 3:
 {{ :manualy:akalex_logo.png?nolink&200|}} {{ :manualy:akalex_logo.png?nolink&200|}}
  
-Webová aplikace Akalex je věnována slovní zásobě akademické češtiny. Jejím hlavním cílem je poskytnout uživatelům z akademické sféry seznam nejčastějších akademických slov a víceslovných jednotek v češtině; takové seznamy známe i z jiných jazyků, zvláště pak z angličtiny. Tento seznam může sloužit jako pomůcka při výuce či při psaní akademických textů, zvláště pak kvalifikačních prací. Dále je určen pro studenty vysokých škol, pro něž čeština není mateřským jazykem. Aplikace Akalex je založena na datech z korpusu SYN2015.+Webová aplikace Akalex je věnována slovní zásobě akademické češtiny. Jejím hlavním cílem je poskytnout uživatelům z akademické sféry seznam nejčastějších akademických slov a víceslovných jednotek v češtině; takové seznamy známe i z jiných jazyků, zvláště pak z angličtiny. Tento seznam může sloužit jako pomůcka při výuce či při psaní akademických textů, zvláště pak kvalifikačních prací. Dále je určen pro studenty vysokých škol, pro něž čeština není mateřským jazykem. 
  
-**Seznam akademických slov**+Aplikace Akalex je založena na datech z korpusu [[cnk:syn2015|SYN2015]].
  
-Do seznamu akademických slov Akalex jsou zahrnuty 1-gramy, které splňují následující podmínky: +===== Seznam akademických slov =====
  
-1. jsou znatelně častější v korpusu akademických textů, než v korpusu referenčním (3x častější) 
  
-2. jsou v akademických textech frekventované (jejich relativní frekvence v korpusu akademických textů je alespoň 20) +Do seznamu akademických slov Akalex jsou zahrnuty 1-gramy, které splňují následující podmínky: 
- +
-3.  vyskytují se ve velkém počtu akademických oborů (alespoň ve 20 z 24)+
  
-4. jejich rozmístění v akademických disciplínách je rovnoměrné (maximální hodnota disperze v oborech je 1,5)+  - jsou znatelně častější v korpusu akademických textů, než v korpusu referenčním (3x častější) 
 +  - jsou v akademických textech frekventované (jejich relativní frekvence v korpusu akademických textů je alespoň 20) 
 +  - vyskytují se ve velkém počtu akademických oborů (alespoň ve 20 z 24) 
 +  - jejich rozmístění v akademických disciplínách je rovnoměrné (maximální hodnota disperze v oborech je 1,5)
  
 Pro angličtinu vzniklo v posledních dvou desetiletích několik seznamů akademických slov, mezi nejznámější patří Academic Word List (AWL, Coxhead 2000) s 570 položkami a Academic Keyword List s 930 položkami (AKL, Paquot 2010). Naším cílem bylo vytvořit seznam co do velikosti řádově srovnatelný s těmito seznamy. Hlavní motivací byla pochopitelně uživatelská perspektiva, seznam obsahující zhruba 1000 slov (a víceslovných jednotek) je ještě uchopitelný, ale není příliš stručný. Bonusem je i to, že český seznam lze porovnávat s už existujícími anglickými také co do obsahu.  Pro angličtinu vzniklo v posledních dvou desetiletích několik seznamů akademických slov, mezi nejznámější patří Academic Word List (AWL, Coxhead 2000) s 570 položkami a Academic Keyword List s 930 položkami (AKL, Paquot 2010). Naším cílem bylo vytvořit seznam co do velikosti řádově srovnatelný s těmito seznamy. Hlavní motivací byla pochopitelně uživatelská perspektiva, seznam obsahující zhruba 1000 slov (a víceslovných jednotek) je ještě uchopitelný, ale není příliš stručný. Bonusem je i to, že český seznam lze porovnávat s už existujícími anglickými také co do obsahu. 
  
-**Databázová část aplikace** +===== Databázová část aplikace ===== 
 + 
  
 Vedle toho však aplikace slouží i jako materiál pro další výzkum české akademické slovní zásoby. Obsahuje totiž tisíce n-gramů (1- až 6-gramy), které se v akademických textech vyskytují častěji než v textech obecných, a v jejich rámci lze za pomoci atributů různého typu vyhledávat a třídit.  Vedle toho však aplikace slouží i jako materiál pro další výzkum české akademické slovní zásoby. Obsahuje totiž tisíce n-gramů (1- až 6-gramy), které se v akademických textech vyskytují častěji než v textech obecných, a v jejich rámci lze za pomoci atributů různého typu vyhledávat a třídit. 
Řádek 27: Řádek 28:
 Výzkumu prostřednictvím databázové části Akalexu se věnuje připravovaný článek Víceslovné jednotky typické pro české akademické texty (Kováříková et al., v tisku). Výzkumu prostřednictvím databázové části Akalexu se věnuje připravovaný článek Víceslovné jednotky typické pro české akademické texty (Kováříková et al., v tisku).
  
-**Seznam akademických frází**+===== Seznam akademických frází =====
  
 Ve třetí části je seznam více než 400 často používaných 2- a 3-gramů. Tento počet vysoko převyšuje počet základních akademických frází v seznamu Základní akademická slovní zásoba a je určen výhradně pro pedagogické účely (zvláště pro výuku češtiny pro cizince). Ve třetí části je seznam více než 400 často používaných 2- a 3-gramů. Tento počet vysoko převyšuje počet základních akademických frází v seznamu Základní akademická slovní zásoba a je určen výhradně pro pedagogické účely (zvláště pro výuku češtiny pro cizince).