AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:reprezentativnost [2019/10/16 15:39] – [Reprezentativnost korpusu] Václav Cvrčekpojmy:reprezentativnost [2022/11/29 12:49] (aktuální) – [Korpusy psané češtiny] Michal Škrabal
Řádek 13: Řádek 13:
 ==== Korpusy psané češtiny ==== ==== Korpusy psané češtiny ====
  
-Reprezentativnost a vyváženost psaných korpusů řady [[cnk:syn|SYN]] v ČNK se v průběhu let vyvíjela. Korpusy aspirující na reprezentativnost vydané do roku 2010 včetně ([[cnk:syn2000|SYN2000]], [[cnk:syn2005|SYN2005]] a [[cnk:syn2010|SYN2010]]) opírají svoje složení o řadu průzkumů, které se pokoušely různými způsoby kvantifikovat výše //recepci// psaných textů běžnými čtenáři. Tento způsob zjišťování proporcí jednotlivých [[pojmy:genre|žánrů]] a [[pojmy:txtype|textových typů]] má celou řadu praktických i metodologických problémů (je např. otázka, do jaké míry a jak přesně jsou mluvčí schopni reflektovat svoje vlastní čtenářství v průběhu delšího úseku); klíčová je rovněž otázka zastarávání takovýchto průzkumů (a potřeby jejich neustále aktualizace) stejně jako jejich finanční a organizační náročnost.+Reprezentativnost a vyváženost psaných korpusů řady [[cnk:syn|SYN]] v ČNK se v průběhu let vyvíjela. Korpusy aspirující na reprezentativnost vydané do roku 2010 včetně ([[cnk:syn2000|SYN2000]], [[cnk:syn2005|SYN2005]] a [[cnk:syn2010|SYN2010]]) opírají svoje složení o řadu průzkumů, které se pokoušely různými způsoby kvantifikovat //recepci// psaných textů běžnými čtenáři. Tento způsob zjišťování proporcí jednotlivých [[pojmy:genre|žánrů]] a [[pojmy:txtype|textových typů]] má celou řadu praktických i metodologických problémů (je např. otázka, do jaké míry a jak přesně jsou mluvčí schopni reflektovat svoje vlastní čtenářství v průběhu delšího úseku); klíčová je rovněž otázka zastarávání takovýchto průzkumů (a potřeby jejich neustále aktualizace) stejně jako jejich finanční a organizační náročnost.
  
-Počínaje korpusem [[cnk:syn2015|SYN2015]] byla s revizí [[cnk:klasifikace_textu_syn2015|klasifikace textů]] přepracována i koncepce vyvažování korpusu((Cvrček, V. - Čermáková, A. - Křen, M.: [[http://sas.ujc.cas.cz/archiv.php?art=4324|Nová koncepce synchronních korpusů psané češtiny]]. Slovo a slovesnost 77, s. 83–101)), která spíše než proporce jednotlivých textových typů zohledňuje jejich klasifikaci a hierarchii. Na základě zkušeností z předchozích korpusů tak neabsolutizuje nějaký konkrétní poměr textů určitého typu, ale staví jednotlivé kategorie textů na stejnou úroveň a snaží se o rovnoměrné zastoupení. Rezignuje tím na vyváženost (proporce stanovené arbitrárně pro jednotlivé kategorie nemusí odpovídat jejich zastoupení v populaci), při zachování reprezentativnosti (každý hlavní typ textu by měl být v korpusu zastoupen). Zodpovědnost za sestavení korpusu se tak do určité míry přesouvá na uživatele, který zároveň dostává v rozhraní [[manualy:kontext:index|KonText]] k dispozici nástroje na tvorbu vlastního [[manualy:kontext:subkorpus|subkorpusu]] se složením, které by líp reflektovalo jeho aktuální výzkumné potřeby.+Počínaje korpusem [[cnk:syn2015|SYN2015]] byla s revizí [[cnk:klasifikace_textu_syn2015|klasifikace textů]] přepracována i koncepce vyvažování korpusu((Cvrček, V. - Čermáková, A. - Křen, M.: [[http://sas.ujc.cas.cz/archiv.php?art=4324|Nová koncepce synchronních korpusů psané češtiny]]. Slovo a slovesnost 77, s. 83–101)), která spíše než proporce jednotlivých textových typů zohledňuje jejich klasifikaci a hierarchii. Na základě zkušeností z předchozích korpusů tak neabsolutizuje nějaký konkrétní poměr textů určitého typu, ale staví jednotlivé kategorie textů na stejnou úroveň a snaží se o //rovnoměrné// zastoupení. Rezignuje tím na vyváženost (proporce stanovené arbitrárně pro jednotlivé kategorie nemusí odpovídat jejich zastoupení v populaci), avšak při zachování reprezentativnosti (každý hlavní typ textu by měl být v korpusu zastoupen). Zodpovědnost za sestavení korpusu se tak do určité míry přesouvá na uživatele, který zároveň dostává v rozhraní [[manualy:kontext:index|KonText]] k dispozici nástroje na tvorbu vlastního [[manualy:kontext:subkorpus|subkorpusu]] se složením, které by líp reflektovalo jeho aktuální výzkumné potřeby.
  
 ==== Mluvené korpusy ==== ==== Mluvené korpusy ====
  
-Situace u mluvených korpusů (řady [[cnk:oral|Oral]] a [[cnk:ortofon|Ortofon]]) je výrazně limitována dostatkem dat. Pokud to sesbíraný materiál dovoloval, byly korpusy uspořádány tak, aby byly vyvážené z hlediska zastoupení hlavních sociolingvistických kategorií (pohlaví, věk, vzdělání a oblast pobytu mluvčího v dětství.). V zásadě se tak stejně jako v případě korpusů psaných (od SYN2015 dále) preferuje vyváženost jednotlivých kategorií mluvčích (viz [[cnk:ortofon#vyvazenost_korpusu|popis korpusu Ortofon]]) na úkor demografických proporcí.+Situace u mluvených korpusů (řady [[cnk:oral|Oral]] a [[cnk:ortofon|Ortofon]]) je výrazně limitována množstvím dostupných dat. Pokud to sesbíraný materiál dovoloval, byly korpusy uspořádány tak, aby byly vyvážené z hlediska zastoupení hlavních sociolingvistických kategorií (pohlaví, věk, vzdělání a oblast pobytu mluvčího v dětství.). V zásadě se tak stejně jako v případě korpusů psaných (od SYN2015 dále) preferuje vyváženost jednotlivých kategorií mluvčích (viz [[cnk:ortofon#vyvazenost_korpusu|popis korpusu Ortofon]]) na úkor demografických proporcí.
  
 ==== Specializované korpusy ==== ==== Specializované korpusy ====
  
-Specializované korpusy nereprezentují jazykový úzus jako celek, ale informují nás o velmi specifickém užití jazyka, vzhledem k němuž můžou být jsou-li kvalitně zpracovány reprezentativní.+Specializované korpusy nereprezentují jazykový úzus jako celek, ale informují nás o velmi specifickém užití jazyka, vzhledem k němuž můžou být – jsou-li kvalitně zpracovány – reprezentativní.
  
 Příklady:  Příklady: