Toto je starší verze dokumentu!

Multidimenzionální analýza češtiny

Multidimenzionální analýza češtiny (MDA) je analýza jazykové variability založená na empirickém zkoumání jazykových rysů (na několika rovinách: morfologie, slovotvorba, lexikon, syntax, fonologie atd.) sdružených v rámci jednotlivých dimenzí projevujících určité charakteristiky (viz Dimenze české MDA). Model registrové variability se během let ustálil a setrvává z následujících kroků:

příprava korpusu (viz korpus Koditex),
výběr rysů a jejich operacionalizace,
faktorová analýza,
interpretace výsledků.

Dimenze české MDA

Pro českou MDA byl na základě empirického šetření¹⁾ stanoven počet 8 dimenzí. Každá z dimenzí je charakterizována několika prominentními jazykovými rysy, které na škále zaujímají kladné nebo záporné hodnoty. Pro jednotlivé dimenze byl zvolen zastřešující název odrážející interpretaci obou extrémů.

Dimenze české MDA:

dynamický (+) vs. statický (−)
spontánní (+) vs. připravený (–)
vyšší (+) vs. nižší (–) stupeň koheze
polytematický (+) vs. monotematický (–)
vyšší (+) vs. nižší (–) míra explicitní adresnosti
obecný (+) vs. konkrétní (–)
prospektivní (+) vs. retrospektivní (–)
postojovost (+) vs. faktuálnost (–)

Přehled prominentních jazykových rysů

Dimenze	Rysy (+)	Rysy (–)
dynamický (+) vs. statický (–)	slovesný čas – min. (0.98) slovesa (0.96) verba finita (0.95) indikativ (0.95) slovesný vid (perf.) (0.93) zájmena pro 3. os. (0.78)	subst. přívlastky neshodné postponované (-0.79) adjektiva (-0.78) abstrakta (-0.72) přívlastky shodné anteponované (-0.72) genitiv (-0.72) klastry adjektiv (-0.70)
spontánní (+) vs. připravený (–)	kontaktové výrazy (0.97) výplňková slova (0.85) ukazovací zájmena (bez „to“) (0.82) citoslovce (0.82) expresivní částice (ostatní – zbytek z COH2, AMP a DOWN) (0.80) pronoun non-dropping (0.79)	předložkové pády obecně (-0.62) věty s interog. a vztaž. adv. (-0.57) předložky (-0.56) slovesný vid (perf.) (-0.49) nominativ + akuzativ (-0.46) unigramy (zTTR) (-0.46)
vyšší (+) vs. nižší (–) stupeň koheze	korelativa (0.59) jmenný přísudek subst. (0.53) vztažné věty typu který (0.45) přivlastňovací zájmena (0.44) inventář zájmen (0.44)	numerale (-0.43)
polytematický (+) vs. monotematický (–)	bigramy (zTTR) (0.76) unigramy (zTTR) (0.70) toponyma (0.37)	tematická koncentrace (-0.61) Yulův koeficient (-0.49) verbální substantiva (-0.45) slovesný rod (pasivum) (-0.42)
vyšší (+) vs. nižší (–) míra explicitní adresnosti	otázky (všechny) (0.69) 2. slovesná osoba (0.66) otázky (doplňovací) (0.63) zájmena pro 2. os. (0.62) slovesný čas – bud. (0.53)	průměrná délka věty v tokenech (-0.36) frekventované ngramy (-0.30)
obecný (+) vs. konkrétní (–)	koordinace (0.58) sémanticky vyprázdněná adjektiva (0.41)	antroponyma (-0.49) numerale (-0.40) časové výrazy (-0.36)
prospektivní (+) vs. retrospektivní (–)	slovesný čas – přít. (0.77) slovesný čas – bud. (0.55) jmenný přísudek adj. (0.52) imperativ (0.42) 2. slovesná osoba (0.40)	slovesný čas – min (-0.74) zájmena pro 3. os. (-0.43) přivlastňovací adjektiva (-0.39) vztažné věty typu jenž (-0.36)
postojovost (+) vs. faktuálnost (–)	částice oslabující význam (downtoners/hedges) (0.68) restriktory (0.63) částice zesilující význam (amplifiers/boosters) (0.57) částice členící text (0.52) adverbia (0.50)	koordinace (-0.33)

Související odkazy

Registrová klasifikace • Seznam hodnot atributu register • Register • Txtype • Genre • Koditex

¹⁾

Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A. J. (2018): From extra- to intratextual characteristics: Charting the space of variation in Czech through MDA. Corpus Linguistics and Linguistic Theory.

Historie: • mda