Obě strany předchozí revizePředchozí verze | Následující verzeObě strany příští revize |
pojmy:reprezentativnost [2013/09/13 15:32] – Schvaleno pro 1. verzi vaclavcvrcek | pojmy:reprezentativnost [2019/10/16 13:41] – [Reprezentativnost korpusu] vaclavcvrcek |
---|
====== Reprezentativnost korpusu ====== | ====== Reprezentativnost korpusu ====== |
| |
//Reprezentativnost// a //vyváženost// jsou v korpusové lingvistice často používané, ale nejednoznačně definované pojmy dotýkající se vztahu mezi [[pojmy:korpus|korpusem]] (jako vybraným vzorkem jazyka) a jazykovou realitou (jako celou populací). Je třeba stále znovu zdůrazňovat, že žádný korpus nepokrývá kompletní spektrum užití žádného jazyka a že problém reprezentativnosti dosud nebyl uspokojivě vyřešen. V porovnání s metodami [[pojmy:introspekce|introspekce]] či náhodným výběrem dokladů určitého jevu ovšem jde o výrazné přiblížení požadavku opakovatelnosti a ověřitelnosti výzkumů. | //Reprezentativnost// a //vyváženost// jsou v korpusové lingvistice často používané, ale nejednoznačně definované pojmy dotýkající se vztahu mezi [[pojmy:korpus|korpusem]] (jako vybraným vzorkem jazyka) a jazykovou realitou (jako celou populací). Je třeba stále znovu zdůrazňovat, že žádný korpus nepokrývá kompletní spektrum užití žádného jazyka a že problém reprezentativnosti dosud nebyl uspokojivě vyřešen. V porovnání s metodami [[pojmy:introspekce|introspekce]] či náhodným výběrem dokladů určitého jevu ovšem využití korpusů představuje výrazné přiblížení požadavku opakovatelnosti a ověřitelnosti výzkumů. |
| |
Obecně lze říci, že korpus je vzhledem k jazyku (resp. k jeho části, např. jazyku psanému) **reprezentativní**, obsahuje-li v dostatečném množství texty všech jeho variet. Odpovídají-li poměry mezi varietami v korpusu jejich poměrům v reálném úzu, jedná se navíc o korpus **vyvážený** právě z hlediska užívání (v řadě [[cnk:syn|SYN]] definovaného jako recepce textů určitého typu v určitém poměru). V jiných pohledech se však pojmy //reprezentativnost// a //vyváženost// zaměňují. | Obecně lze říci, že korpus je vzhledem k jazyku (resp. k jeho části, např. jazyku psanému) **reprezentativní**, obsahuje-li v dostatečném množství texty všech jeho variet. Odpovídají-li poměry mezi varietami v korpusu jejich poměrům v reálném úzu, jedná se navíc o korpus **vyvážený** právě z hlediska užívání. V jiných přístupech se však pojmy //reprezentativnost// a //vyváženost// zaměňují. |
| |
Tyto definice přinášejí řadu otázek: jaké množství textů je dostatečné, jak vymezit jednotlivé variety, a hlavně jak zjistit poměry jejich zastoupení v úzu? Motivace je však zřejmá: korpus by měl být věrným odrazem jazyka, malým vzorkem, který však v maximální možné míře odpovídá celku. Zásadním problémem je ovšem nemožnost skutečně objektivně měřit míru, v níž korpus jazyku odpovídá. | Tyto problémy přinášejí řadu praktických otázek pro výstavbu korpusu: jaké množství textů je dostatečné, jak vymezit všechny jednotlivé variety, a hlavně jak zjistit poměry jejich zastoupení v úzu? Reprezentativnost korpusu je proto třeba chápat jako //desiderátum//, zároveň se však jedná o úlohu, která současnými metodami a prostředky není zcela uspokojivé řešitelná. Symptomatické pro tento typ problémů je i to, že neexistuje způsob, jak objektivně měřit reprezentativnost, tedy míru, v níž korpus jazyku odpovídá. |
| |
Na druhé straně je však reprezentativnost a vyváženost korpusů nezbytná proto, že bez nich nelze korpusová data interpretovat ve vztahu k jazyku, tj. udělat nutný krok od popisu dat v korpusu k popisu jazyka. To umožňují právě principy reprezentativnosti a vyváženosti. Mezi korpusem a jazykovou realitou je tedy vztah, který nezbývá než korigovat (nutně subjektivní) intuicí. | Na druhé straně je však reprezentativnost a vyváženost korpusů nezbytná proto, že bez nich nelze korpusová data interpretovat ve vztahu k jazyku, tj. udělat nutný krok od popisu dat v korpusu k popisu jazyka. To umožňují právě principy reprezentativnosti a vyváženosti. Mezi korpusem a jazykovou realitou je tedy vztah, který nezbývá než korigovat (nutně subjektivní) intuicí. |