AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
cnk:mda [2019/06/19 10:32] – vytvořeno vaclavcvrcekcnk:mda [2019/06/24 11:55] (aktuální) – [Multidimenzionální analýza češtiny] vaclavcvrcek
Řádek 1: Řádek 1:
 ~~NOTOC~~ ~~NOTOC~~
 ====== Multidimenzionální analýza češtiny ====== ====== Multidimenzionální analýza češtiny ======
-Multidimenzionální analýza češtiny (MDA) je analýza jazykové variability založená na empirickém zkoumání jazykových rysů (na několika rovinách: morfologie, slovotvorba, lexikonsyntax, fonologie atd.sdružených v rámci jednotlivých dimenzí projevujících určité charakteristiky (viz Dimenze české MDA)Model [[pojmy:register|registrové]] variability se během let ustálil a setrvává z následujících kroků:+ 
 +Multidimenzionální analýza češtiny (MDA) je metoda vyvinutá Douglasem Biberem((Biber, D. (1988). //Variation Across Speech and Writing//. Cambridge, England: Cambridge University Press; Biber, D. (1995). //Dimensions of Register Variation: A Cross-Linguistic Comparison//. Cambridge, England: Cambridge University Press; Biber, D., & Conrad, S. (2009). //Register, Genre, and Style//. Cambridge, England: Cambridge University Press.))  
 +pro empirický výzkum textové variability. MDA je založená na předpokladu, že variabilita textů se manifestuje ve využití jazykových rysů z různých rovin (od fonologie a morfologie přes lexikon až po syntax a pragmatiku). Při koncipování textu je přitom využití jedněch rysů často podmíněno či podpořeno použitím rysů jiných, což vede k domněnce, že pro popis variability je optimální rysy shlukovat do dimenzí podle toho, jak se společně v textech vyskytujíTakto vytvořené dimenze založené na zjištěném souvýskytu jazykových rysů v textech reprezentují základní charakteristiky, podél nichž texty variují a na základě nichž lze vymezovat jednotlivé [[pojmy:register|registry]]
 + 
 +Postup při modelování registrové variability prostřednictvím MDA se během let ustálil a sestává z následujících kroků: 
   * příprava korpusu (viz korpus [[cnk:koditex|Koditex]]),   * příprava korpusu (viz korpus [[cnk:koditex|Koditex]]),
   * výběr rysů a jejich operacionalizace,   * výběr rysů a jejich operacionalizace,
Řádek 9: Řádek 14:
 Pro českou MDA byl na základě empirického šetření((Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A. J. (2018): [[https://www.degruyter.com/view/j/cllt.ahead-of-print/cllt-2018-0020/cllt-2018-0020.xml|From extra- to intratextual characteristics: Charting the space of variation in Czech through MDA]]. //Corpus Linguistics and Linguistic Theory.//)) stanoven počet 8 dimenzí. Každá z dimenzí je charakterizována několika prominentními jazykovými rysy, které na škále zaujímají kladné nebo záporné hodnoty. Pro jednotlivé dimenze byl zvolen zastřešující název odrážející interpretaci obou extrémů.  Pro českou MDA byl na základě empirického šetření((Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A. J. (2018): [[https://www.degruyter.com/view/j/cllt.ahead-of-print/cllt-2018-0020/cllt-2018-0020.xml|From extra- to intratextual characteristics: Charting the space of variation in Czech through MDA]]. //Corpus Linguistics and Linguistic Theory.//)) stanoven počet 8 dimenzí. Každá z dimenzí je charakterizována několika prominentními jazykovými rysy, které na škále zaujímají kladné nebo záporné hodnoty. Pro jednotlivé dimenze byl zvolen zastřešující název odrážející interpretaci obou extrémů. 
  
-**Dimenze české MDA:**+===Dimenze české MDA:===
   - dynamický (+) vs. statický (−)   - dynamický (+) vs. statický (−)
   - spontánní (+) vs. připravený (–)   - spontánní (+) vs. připravený (–)
Řádek 18: Řádek 23:
   - prospektivní (+) vs. retrospektivní (–)   - prospektivní (+) vs. retrospektivní (–)
   - postojovost (+) vs. faktuálnost (–)   - postojovost (+) vs. faktuálnost (–)
 +
 +===Přehled prominentních jazykových rysů===
 +
 +Číselný údaj v závorce u rysů odkazuje k loadingu, tj. k míře, s jakou přítomnost daného rysu v textu přispívá k jeho umístění v dimenzi.
 +
 +^ Dimenze ^ Rysy (+) ^ Rysy (–) ^||
 +| ** dynamický (+) vs. statický (–)** | slovesný čas – min. (0.98)\\ slovesa (0.96)\\ verba finita (0.95)\\ indikativ (0.95)\\ slovesný vid (perf.) (0.93)\\ zájmena pro 3. os. (0.78) | subst. přívlastky neshodné postponované (-0.79)\\ adjektiva (-0.78)\\ abstrakta (-0.72)\\ přívlastky shodné anteponované (-0.72)\\ genitiv (-0.72)\\ klastry adjektiv (-0.70) |||
 +| **spontánní (+) vs. připravený (–)** | kontaktové výrazy (0.97)\\ výplňková slova (0.85)\\ ukazovací zájmena (bez "to") (0.82)\\ citoslovce (0.82)\\ expresivní částice (ostatní – zbytek z COH2, AMP a DOWN) (0.80)\\ pronoun non-dropping (0.79) | předložkové pády obecně (-0.62)\\ věty s interog. a vztaž. adv. (-0.57)\\ předložky (-0.56)\\ slovesný vid (perf.) (-0.49)\\ nominativ + akuzativ (-0.46)\\ unigramy (zTTR) (-0.46) |||
 +| **vyšší (+) vs. nižší (–) stupeň koheze** | korelativa (0.59)\\ jmenný přísudek subst. (0.53)\\ vztažné věty typu který (0.45)\\ přivlastňovací zájmena (0.44)\\ inventář zájmen (0.44) | numerale (-0.43) |||
 +| **polytematický (+) vs. monotematický (–)** | bigramy (zTTR) (0.76)\\ unigramy (zTTR) (0.70)\\ toponyma (0.37) | tematická koncentrace (-0.61)\\ Yulův koeficient (-0.49)\\ verbální substantiva (-0.45)\\ slovesný rod (pasivum) (-0.42) |||
 +| **vyšší (+) vs. nižší (–) míra explicitní adresnosti** | otázky (všechny) (0.69)\\ 2. slovesná osoba (0.66)\\ otázky (doplňovací) (0.63)\\ zájmena pro 2. os. (0.62)\\ slovesný čas – bud. (0.53) | průměrná délka věty v tokenech (-0.36)\\ frekventované ngramy (-0.30) |||
 +| **obecný (+) vs. konkrétní (–)** | koordinace (0.58)\\ sémanticky vyprázdněná adjektiva (0.41) | antroponyma (-0.49)\\ numerale (-0.40)\\ časové výrazy (-0.36) |||
 +| **prospektivní (+) vs. retrospektivní (–)** | slovesný čas – přít. (0.77)\\ slovesný čas – bud. (0.55)\\ jmenný přísudek adj. (0.52)\\ imperativ (0.42)\\ 2. slovesná osoba (0.40) | slovesný čas – min (-0.74)\\ zájmena pro 3. os. (-0.43)\\ přivlastňovací adjektiva (-0.39)\\ vztažné věty typu jenž (-0.36) |||
 +| **postojovost (+) vs. faktuálnost (–)** | částice oslabující význam (downtoners/hedges) (0.68)\\ restriktory (0.63)\\ částice zesilující význam (amplifiers/boosters) (0.57)\\ částice členící text (0.52)\\ adverbia (0.50) | koordinace (-0.33) |||
 ==== Související odkazy ==== ==== Související odkazy ====