AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:reprezentativnost [2013/06/20 14:11] – vytvořeno vaclavcvrcekpojmy:reprezentativnost [2013/07/09 17:24] olgarichterova
Řádek 1: Řádek 1:
 ====== Reprezentativnost korpusu ====== ====== Reprezentativnost korpusu ======
  
-korpusové lingvistice jde o často používané, ale nejednoznačně definované pojmy dotýkající se vztahu mezi korpusem (jako vzorkem) a jazykovou realitou (jako populací), který dosud nebyl uspokojivě vyřešen. +//Reprezentativnost// a //vyváženost// jsou v korpusové lingvistice často používané, ale nejednoznačně definované pojmy dotýkající se vztahu mezi [[pojmy:korpus|korpusem]] (jako vybraným vzorkem jazyka) a jazykovou realitou (jako celou populací). Je třeba stále znovu zdůrazňovatže žádný korpus nepokrývá kompletní spektrum užití žádného jazyka a že problém reprezentativnosti dosud nebyl uspokojivě vyřešen. 
  
-Obecně lze říci, že [[pojmy:korpus|korpus]] je vzhledem k jazyku (případně jeho části, např. jazyku psanému) **reprezentativní**, obsahuje-li v dostatečném množství texty všech jeho variet. Odpovídají-li poměry mezi varietami v korpusu jejich poměrům v reálném úzu, jedná se navíc o korpus **vyvážený**. V jiných pohledech se však pojmy reprezentativnost a vyváženost zaměňují.+Obecně lze říci, že korpus je vzhledem k jazyku (v realitě tedy vzhledem k jeho části, např. jazyku psanému) **reprezentativní**, obsahuje-li v dostatečném množství texty všech jeho variet. Odpovídají-li poměry mezi varietami v korpusu jejich poměrům v reálném úzu, jedná se navíc o korpus **vyvážený** právě z hlediska užívání (v řadě [[cnk:syn|SYN]] definovaného jako recepce textů určitého typu v určitém poměru). V jiných pohledech se však pojmy //reprezentativnost// //vyváženost// zaměňují.
  
-Tyto definice přinášejí řadu otázek: jaké množství je dostatečné, jak vymezit jednotlivé variety, a hlavně jak zjistit poměry jejich zastoupení v úzu. Motivace je však zřejmá: korpus by měl být věrným odrazem jazyka, malým vzorkem, který však v maximální možné míře odpovídá celku. Zásadním problémem je ovšem nemožnost objektivně měřit míru, v níž korpus jazyku odpovídá. +Tyto definice přinášejí řadu otázek: jaké množství textů je dostatečné, jak vymezit jednotlivé variety, a hlavně jak zjistit poměry jejich zastoupení v úzu. Motivace je však zřejmá: korpus by měl být věrným odrazem jazyka, malým vzorkem, který však v maximální možné míře odpovídá celku. Zásadním problémem je ovšem nemožnost skutečně objektivně měřit míru, v níž korpus jazyku odpovídá. 
  
-Na druhé straně je však reprezentativnost a vyváženost korpusů nezbytná proto, že bez nich nelze korpusová data interpretovat ve vztahu k jazyku, tj. udělat nutný krok od popisu dat v korpusu k popisu jazyka, kterému dávají opodstatnění právě reprezentativnost a vyváženost. Mezi korpusem a jazykovou realitou je tedy vztah, který nezbývá než korigovat (nutně subjektivní) intuicí.+Na druhé straně je však reprezentativnost a vyváženost korpusů nezbytná proto, že bez nich nelze korpusová data interpretovat ve vztahu k jazyku, tj. udělat nutný krok od popisu dat v korpusu k popisu jazyka: ten umožňují právě principy reprezentativnosti a vyváženosti. Mezi korpusem a jazykovou realitou je tedy vztah, který nezbývá než korigovat (nutně subjektivní) intuicí.
  
-Reprezentativnost a vyváženost psaných korpusů řady SYN v ČNK jsou založeny na řadě průzkumů, které se pokoušely různými způsoby kvantifikovat recepci (ne tedy např. produkci) psaných textů běžnými čtenáři. Přestože je výsledné složení těchto korpusů v některých ohledech diskutabilní, jde o pokus uchopit reprezentativnost a vyváženost obecných, nespecializovaných jazykových korpusů na solidním základě.+Reprezentativnost a vyváženost psaných korpusů řady SYN v ČNK se zakládá na řadě průzkumů, které se pokoušely různými způsoby kvantifikovat výše zmíněnou recepci (ne tedy např. produkci) psaných textů běžnými čtenáři. Přestože je výsledné složení těchto korpusů v některých ohledech diskutabilní, jde o pokus uchopit reprezentativnost a vyváženost obecných, nespecializovaných jazykových korpusů na solidním základě.
  
- --- //Michal Křen//+====== Specializované korpusy ====== 
 + 
 +Nereprezentují větší část jazykového úzu, ale podávají obraz o velmi specifickém užití jazyka. 
 + 
 +Příklady:  
 +  * [[cnk:czesl-plain|Korpus CzeSL-plain]] 
 +  * [[cnk:ksk-dopisy|Korpus soukromé korespondence]] 
 +  * [[cnk:link|Korpus LINK]] 
 +  * [[cnk:orwell|Korpus ORWELL]] 
 + 
 + --- //Michal Křen, Olga Richterová//
  
 ==== Související odkazy ==== ==== Související odkazy ====
Řádek 19: Řádek 29:
 [[pojmy:atributy_strukturni|Strukturní atributy]] [[pojmy:atributy_strukturni|Strukturní atributy]]
  
 +[[cnk:struktura#korpusy_psane_soucasne_cestiny_rada_syn|Obecné a specializované korpusy řady SYN]]
 +
 +[[cnk:struktura|Struktura Českého národního korpusu]]