AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Multidimenzionální analýza češtiny

Multidimenzionální analýza češtiny (MDA) je analýza jazykové variability založená na empirickém zkoumání jazykových rysů (na několika rovinách: morfologie, slovotvorba, lexikon, syntax, fonologie atd.) sdružených v rámci jednotlivých dimenzí projevujících určité charakteristiky (viz Dimenze české MDA). Model registrové variability se během let ustálil a setrvává z následujících kroků:

  • příprava korpusu (viz korpus Koditex),
  • výběr rysů a jejich operacionalizace,
  • faktorová analýza,
  • interpretace výsledků.

Dimenze české MDA

Pro českou MDA byl na základě empirického šetření1) stanoven počet 8 dimenzí. Každá z dimenzí je charakterizována několika prominentními jazykovými rysy, které na škále zaujímají kladné nebo záporné hodnoty. Pro jednotlivé dimenze byl zvolen zastřešující název odrážející interpretaci obou extrémů.

Dimenze české MDA:

  1. dynamický (+) vs. statický (−)
  2. spontánní (+) vs. připravený (–)
  3. vyšší (+) vs. nižší (–) stupeň koheze
  4. polytematický (+) vs. monotematický (–)
  5. vyšší (+) vs. nižší (–) míra explicitní adresnosti
  6. obecný (+) vs. konkrétní (–)
  7. prospektivní (+) vs. retrospektivní (–)
  8. postojovost (+) vs. faktuálnost (–)

Přehled prominentních jazykových rysů

Číselný údaj v závorce u rysů odkazuje k loadingu, tj. k míře, s jakou přítomnost daného rysu v textu přispívá k jeho umístění v dimenzi.

Dimenze Rysy (+) Rysy (–)
dynamický (+) vs. statický (–) slovesný čas – min. (0.98)
slovesa (0.96)
verba finita (0.95)
indikativ (0.95)
slovesný vid (perf.) (0.93)
zájmena pro 3. os. (0.78)
subst. přívlastky neshodné postponované (-0.79)
adjektiva (-0.78)
abstrakta (-0.72)
přívlastky shodné anteponované (-0.72)
genitiv (-0.72)
klastry adjektiv (-0.70)
spontánní (+) vs. připravený (–) kontaktové výrazy (0.97)
výplňková slova (0.85)
ukazovací zájmena (bez „to“) (0.82)
citoslovce (0.82)
expresivní částice (ostatní – zbytek z COH2, AMP a DOWN) (0.80)
pronoun non-dropping (0.79)
předložkové pády obecně (-0.62)
věty s interog. a vztaž. adv. (-0.57)
předložky (-0.56)
slovesný vid (perf.) (-0.49)
nominativ + akuzativ (-0.46)
unigramy (zTTR) (-0.46)
vyšší (+) vs. nižší (–) stupeň koheze korelativa (0.59)
jmenný přísudek subst. (0.53)
vztažné věty typu který (0.45)
přivlastňovací zájmena (0.44)
inventář zájmen (0.44)
numerale (-0.43)
polytematický (+) vs. monotematický (–) bigramy (zTTR) (0.76)
unigramy (zTTR) (0.70)
toponyma (0.37)
tematická koncentrace (-0.61)
Yulův koeficient (-0.49)
verbální substantiva (-0.45)
slovesný rod (pasivum) (-0.42)
vyšší (+) vs. nižší (–) míra explicitní adresnosti otázky (všechny) (0.69)
2. slovesná osoba (0.66)
otázky (doplňovací) (0.63)
zájmena pro 2. os. (0.62)
slovesný čas – bud. (0.53)
průměrná délka věty v tokenech (-0.36)
frekventované ngramy (-0.30)
obecný (+) vs. konkrétní (–) koordinace (0.58)
sémanticky vyprázdněná adjektiva (0.41)
antroponyma (-0.49)
numerale (-0.40)
časové výrazy (-0.36)
prospektivní (+) vs. retrospektivní (–) slovesný čas – přít. (0.77)
slovesný čas – bud. (0.55)
jmenný přísudek adj. (0.52)
imperativ (0.42)
2. slovesná osoba (0.40)
slovesný čas – min (-0.74)
zájmena pro 3. os. (-0.43)
přivlastňovací adjektiva (-0.39)
vztažné věty typu jenž (-0.36)
postojovost (+) vs. faktuálnost (–) částice oslabující význam (downtoners/hedges) (0.68)
restriktory (0.63)
částice zesilující význam (amplifiers/boosters) (0.57)
částice členící text (0.52)
adverbia (0.50)
koordinace (-0.33)

Související odkazy

1)
Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A. J. (2018): From extra- to intratextual characteristics: Charting the space of variation in Czech through MDA. Corpus Linguistics and Linguistic Theory.