~~NOTOC~~ ====== Multidimenzionální analýza češtiny ====== Multidimenzionální analýza češtiny (MDA) je metoda vyvinutá Douglasem Biberem((Biber, D. (1988). //Variation Across Speech and Writing//. Cambridge, England: Cambridge University Press; Biber, D. (1995). //Dimensions of Register Variation: A Cross-Linguistic Comparison//. Cambridge, England: Cambridge University Press; Biber, D., & Conrad, S. (2009). //Register, Genre, and Style//. Cambridge, England: Cambridge University Press.)) pro empirický výzkum textové variability. MDA je založená na předpokladu, že variabilita textů se manifestuje ve využití jazykových rysů z různých rovin (od fonologie a morfologie přes lexikon až po syntax a pragmatiku). Při koncipování textu je přitom využití jedněch rysů často podmíněno či podpořeno použitím rysů jiných, což vede k domněnce, že pro popis variability je optimální rysy shlukovat do dimenzí podle toho, jak se společně v textech vyskytují. Takto vytvořené dimenze založené na zjištěném souvýskytu jazykových rysů v textech reprezentují základní charakteristiky, podél nichž texty variují a na základě nichž lze vymezovat jednotlivé [[pojmy:register|registry]]. Postup při modelování registrové variability prostřednictvím MDA se během let ustálil a sestává z následujících kroků: * příprava korpusu (viz korpus [[cnk:koditex|Koditex]]), * výběr rysů a jejich operacionalizace, * faktorová analýza, * interpretace výsledků. ===== Dimenze české MDA ===== Pro českou MDA byl na základě empirického šetření((Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A. J. (2018): [[https://www.degruyter.com/view/j/cllt.ahead-of-print/cllt-2018-0020/cllt-2018-0020.xml|From extra- to intratextual characteristics: Charting the space of variation in Czech through MDA]]. //Corpus Linguistics and Linguistic Theory.//)) stanoven počet 8 dimenzí. Každá z dimenzí je charakterizována několika prominentními jazykovými rysy, které na škále zaujímají kladné nebo záporné hodnoty. Pro jednotlivé dimenze byl zvolen zastřešující název odrážející interpretaci obou extrémů. ===Dimenze české MDA:=== - dynamický (+) vs. statický (−) - spontánní (+) vs. připravený (–) - vyšší (+) vs. nižší (–) stupeň koheze - polytematický (+) vs. monotematický (–) - vyšší (+) vs. nižší (–) míra explicitní adresnosti - obecný (+) vs. konkrétní (–) - prospektivní (+) vs. retrospektivní (–) - postojovost (+) vs. faktuálnost (–) ===Přehled prominentních jazykových rysů=== Číselný údaj v závorce u rysů odkazuje k loadingu, tj. k míře, s jakou přítomnost daného rysu v textu přispívá k jeho umístění v dimenzi. ^ Dimenze ^ Rysy (+) ^ Rysy (–) ^|| | ** dynamický (+) vs. statický (–)** | slovesný čas – min. (0.98)\\ slovesa (0.96)\\ verba finita (0.95)\\ indikativ (0.95)\\ slovesný vid (perf.) (0.93)\\ zájmena pro 3. os. (0.78) | subst. přívlastky neshodné postponované (-0.79)\\ adjektiva (-0.78)\\ abstrakta (-0.72)\\ přívlastky shodné anteponované (-0.72)\\ genitiv (-0.72)\\ klastry adjektiv (-0.70) ||| | **spontánní (+) vs. připravený (–)** | kontaktové výrazy (0.97)\\ výplňková slova (0.85)\\ ukazovací zájmena (bez "to") (0.82)\\ citoslovce (0.82)\\ expresivní částice (ostatní – zbytek z COH2, AMP a DOWN) (0.80)\\ pronoun non-dropping (0.79) | předložkové pády obecně (-0.62)\\ věty s interog. a vztaž. adv. (-0.57)\\ předložky (-0.56)\\ slovesný vid (perf.) (-0.49)\\ nominativ + akuzativ (-0.46)\\ unigramy (zTTR) (-0.46) ||| | **vyšší (+) vs. nižší (–) stupeň koheze** | korelativa (0.59)\\ jmenný přísudek subst. (0.53)\\ vztažné věty typu který (0.45)\\ přivlastňovací zájmena (0.44)\\ inventář zájmen (0.44) | numerale (-0.43) ||| | **polytematický (+) vs. monotematický (–)** | bigramy (zTTR) (0.76)\\ unigramy (zTTR) (0.70)\\ toponyma (0.37) | tematická koncentrace (-0.61)\\ Yulův koeficient (-0.49)\\ verbální substantiva (-0.45)\\ slovesný rod (pasivum) (-0.42) ||| | **vyšší (+) vs. nižší (–) míra explicitní adresnosti** | otázky (všechny) (0.69)\\ 2. slovesná osoba (0.66)\\ otázky (doplňovací) (0.63)\\ zájmena pro 2. os. (0.62)\\ slovesný čas – bud. (0.53) | průměrná délka věty v tokenech (-0.36)\\ frekventované ngramy (-0.30) ||| | **obecný (+) vs. konkrétní (–)** | koordinace (0.58)\\ sémanticky vyprázdněná adjektiva (0.41) | antroponyma (-0.49)\\ numerale (-0.40)\\ časové výrazy (-0.36) ||| | **prospektivní (+) vs. retrospektivní (–)** | slovesný čas – přít. (0.77)\\ slovesný čas – bud. (0.55)\\ jmenný přísudek adj. (0.52)\\ imperativ (0.42)\\ 2. slovesná osoba (0.40) | slovesný čas – min (-0.74)\\ zájmena pro 3. os. (-0.43)\\ přivlastňovací adjektiva (-0.39)\\ vztažné věty typu jenž (-0.36) ||| | **postojovost (+) vs. faktuálnost (–)** | částice oslabující význam (downtoners/hedges) (0.68)\\ restriktory (0.63)\\ částice zesilující význam (amplifiers/boosters) (0.57)\\ částice členící text (0.52)\\ adverbia (0.50) | koordinace (-0.33) ||| ==== Související odkazy ==== [[cnk:registrova_klasifikace|Registrová klasifikace]] • [[seznamy:register|Seznam hodnot atributu register]] • [[pojmy:register|Register]] • [[pojmy:txtype|Txtype]] • [[pojmy:genre|Genre]] • [[cnk:koditex|Koditex]]