Corpus-based přístup
Corpus-based přístup je metodologický přístup uplatňovaný v korpusové lingvistice, viz též korpusem ověřovaný, příp. na korpusu založený přístup (český ekvivalent není ustálen).
Jde o jeden ze dvou přístupů k vytěžování korpusů, vymezuje se v opozici ke corpus-driven (korpusem řízenému) přístupu. Základem corpus-based přístupu je postup od introspektivně vybudované hypotézy směrem k jejímu ověřování na rozsáhlých datech. Pro hypotézu jsou pak nacházeny doklady, které ji potvrzují nebo vyvracejí, a na jejich základě je upravována a zpřesňována. Výzkum se ovšem nesnaží vystoupit z rámce tradičních popisných kategorií (např. redefinováním základních pojmů apod.).
Jazykový korpus využívaný při corpus-based přístupu je zde především zdrojem informace o frekvenci sledovaných forem a jevů, která je introspekcí nedostupná. Slouží také jako způsob, jak domněnky doložit na různých příkladech (exemplifikace), a jako zdroj dat pro testování hypotéz. To umožňuje dospět k velké míře shody mezi popisem a zkoumanou jazykovou realitou, příp. omezit platnost lingvistických hypotéz a tvrzení na určitou oblast jazyka.
Vedle corpus-based přístupu se jako samostatný někdy vyděluje i corpus-assisted přístup, který využívá rozsáhlé korpusy k objektivizaci výchozích předpokladů o užívání nějakých jazykových jevů. Korpus v takovém výzkumu funguje pouze jako doplněk, který obohacuje analýzu založenou na nekorpusových metodách.
Související odkazy
Elena Tognini-Bonelli: Corpus Linguistics at Work. John Benjamins. 2001.