Následující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:reprezentativnost [2013/06/20 14:11] – vytvořeno vaclavcvrcek | pojmy:reprezentativnost [2013/07/09 17:24] – olgarichterova |
---|
====== Reprezentativnost korpusu ====== | ====== Reprezentativnost korpusu ====== |
| |
V korpusové lingvistice jde o často používané, ale nejednoznačně definované pojmy dotýkající se vztahu mezi korpusem (jako vzorkem) a jazykovou realitou (jako populací), který dosud nebyl uspokojivě vyřešen. | //Reprezentativnost// a //vyváženost// jsou v korpusové lingvistice často používané, ale nejednoznačně definované pojmy dotýkající se vztahu mezi [[pojmy:korpus|korpusem]] (jako vybraným vzorkem jazyka) a jazykovou realitou (jako celou populací). Je třeba stále znovu zdůrazňovat, že žádný korpus nepokrývá kompletní spektrum užití žádného jazyka a že problém reprezentativnosti dosud nebyl uspokojivě vyřešen. |
| |
Obecně lze říci, že [[pojmy:korpus|korpus]] je vzhledem k jazyku (případně jeho části, např. jazyku psanému) **reprezentativní**, obsahuje-li v dostatečném množství texty všech jeho variet. Odpovídají-li poměry mezi varietami v korpusu jejich poměrům v reálném úzu, jedná se navíc o korpus **vyvážený**. V jiných pohledech se však pojmy reprezentativnost a vyváženost zaměňují. | Obecně lze říci, že korpus je vzhledem k jazyku (v realitě tedy vzhledem k jeho části, např. jazyku psanému) **reprezentativní**, obsahuje-li v dostatečném množství texty všech jeho variet. Odpovídají-li poměry mezi varietami v korpusu jejich poměrům v reálném úzu, jedná se navíc o korpus **vyvážený** právě z hlediska užívání (v řadě [[cnk:syn|SYN]] definovaného jako recepce textů určitého typu v určitém poměru). V jiných pohledech se však pojmy //reprezentativnost// a //vyváženost// zaměňují. |
| |
Tyto definice přinášejí řadu otázek: jaké množství je dostatečné, jak vymezit jednotlivé variety, a hlavně jak zjistit poměry jejich zastoupení v úzu. Motivace je však zřejmá: korpus by měl být věrným odrazem jazyka, malým vzorkem, který však v maximální možné míře odpovídá celku. Zásadním problémem je ovšem nemožnost objektivně měřit míru, v níž korpus jazyku odpovídá. | Tyto definice přinášejí řadu otázek: jaké množství textů je dostatečné, jak vymezit jednotlivé variety, a hlavně jak zjistit poměry jejich zastoupení v úzu. Motivace je však zřejmá: korpus by měl být věrným odrazem jazyka, malým vzorkem, který však v maximální možné míře odpovídá celku. Zásadním problémem je ovšem nemožnost skutečně objektivně měřit míru, v níž korpus jazyku odpovídá. |
| |
Na druhé straně je však reprezentativnost a vyváženost korpusů nezbytná proto, že bez nich nelze korpusová data interpretovat ve vztahu k jazyku, tj. udělat nutný krok od popisu dat v korpusu k popisu jazyka, kterému dávají opodstatnění právě reprezentativnost a vyváženost. Mezi korpusem a jazykovou realitou je tedy vztah, který nezbývá než korigovat (nutně subjektivní) intuicí. | Na druhé straně je však reprezentativnost a vyváženost korpusů nezbytná proto, že bez nich nelze korpusová data interpretovat ve vztahu k jazyku, tj. udělat nutný krok od popisu dat v korpusu k popisu jazyka: ten umožňují právě principy reprezentativnosti a vyváženosti. Mezi korpusem a jazykovou realitou je tedy vztah, který nezbývá než korigovat (nutně subjektivní) intuicí. |
| |
Reprezentativnost a vyváženost psaných korpusů řady SYN v ČNK jsou založeny na řadě průzkumů, které se pokoušely různými způsoby kvantifikovat recepci (ne tedy např. produkci) psaných textů běžnými čtenáři. Přestože je výsledné složení těchto korpusů v některých ohledech diskutabilní, jde o pokus uchopit reprezentativnost a vyváženost obecných, nespecializovaných jazykových korpusů na solidním základě. | Reprezentativnost a vyváženost psaných korpusů řady SYN v ČNK se zakládá na řadě průzkumů, které se pokoušely různými způsoby kvantifikovat výše zmíněnou recepci (ne tedy např. produkci) psaných textů běžnými čtenáři. Přestože je výsledné složení těchto korpusů v některých ohledech diskutabilní, jde o pokus uchopit reprezentativnost a vyváženost obecných, nespecializovaných jazykových korpusů na solidním základě. |
| |
--- //Michal Křen// | ====== Specializované korpusy ====== |
| |
| Nereprezentují větší část jazykového úzu, ale podávají obraz o velmi specifickém užití jazyka. |
| |
| Příklady: |
| * [[cnk:czesl-plain|Korpus CzeSL-plain]] |
| * [[cnk:ksk-dopisy|Korpus soukromé korespondence]] |
| * [[cnk:link|Korpus LINK]] |
| * [[cnk:orwell|Korpus ORWELL]] |
| |
| --- //Michal Křen, Olga Richterová// |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
[[pojmy:atributy_strukturni|Strukturní atributy]] | [[pojmy:atributy_strukturni|Strukturní atributy]] |
| |
| [[cnk:struktura#korpusy_psane_soucasne_cestiny_rada_syn|Obecné a specializované korpusy řady SYN]] |
| |
| [[cnk:struktura|Struktura Českého národního korpusu]] |
| |