Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
cnk:registrova_klasifikace [2019/06/20 10:20] – [Popularizace: statický polytematický obecný] vaclavcvrcek | cnk:registrova_klasifikace [2021/02/12 14:50] (aktuální) – [Spolehlivost registrové klasifikace] michalskrabal | ||
---|---|---|---|
Řádek 8: | Řádek 8: | ||
bylo vymezeno 10 registrů, které pokrývají celé spektrum textů od mluvených přes webové až po psané. Přiřazení textu k registru je automatické na základě lingvistických rysů, které se v textu využívají. | bylo vymezeno 10 registrů, které pokrývají celé spektrum textů od mluvených přes webové až po psané. Přiřazení textu k registru je automatické na základě lingvistických rysů, které se v textu využívají. | ||
- | Název registru se skládá ze dvou částí. První označuje prototypickou vlastnost dané skupiny textů jako vodítko pro představu: může jí být slohový postup (// | + | Název registru se skládá ze dvou částí. První označuje prototypickou vlastnost dané skupiny textů jako vodítko pro představu: může jí být slohový postup (// |
**Statické registry:** | **Statické registry:** | ||
Řádek 41: | Řádek 41: | ||
- postojovost (+) vs. faktuálnost (-) | - postojovost (+) vs. faktuálnost (-) | ||
- | Pro každý text lze na základě jazykových rysů, které obsahuje, zjistit jeho pozici na každé z 8 dimenzí (viz graf). Na základě těchto pozic lze pak vytvořit shluky textů, které mají podobné pozice a jsou si tedy z hlediska využití těchto lingvistických rysů podobné (mají stejný registr). A z druhé strany: pozice těchto registrů slouží k jejich interpretaci či popisu typických vlastností. | + | Pro každý text lze na základě jazykových rysů, které obsahuje, zjistit jeho pozici na každé z 8 dimenzí (viz graf). Na základě těchto pozic lze pak vytvořit shluky textů, které mají podobné pozice, a jsou si tedy z hlediska využití těchto lingvistických rysů podobné (mají stejný registr). A z druhé strany: pozice těchto registrů slouží k jejich interpretaci či popisu typických vlastností. |
Při popisu registrů budeme odkazovat jednak k průměrnému umístění textů daného registru na jednotlivých dimenzích a jednak se registr pokusíme přiblížit ukázkou z korpusu [[cnk: | Při popisu registrů budeme odkazovat jednak k průměrnému umístění textů daného registru na jednotlivých dimenzích a jednak se registr pokusíme přiblížit ukázkou z korpusu [[cnk: | ||
+ | |||
+ | ===== Spolehlivost registrové klasifikace ===== | ||
+ | |||
+ | To, jestli je text nebo výsek textu příkladem určitého registru, je v zásadě určeno tím, jakou vzdálenost má v multidimenzionálním prostoru od pomyslného prototypického textu. Kromě případů, které jsou jednoznačné, | ||
+ | |||
+ | * text je stejně podobný dvěma registrům (má stejně blízko k prototypickým zástupcům dvou registrů), v takovém případě jde o text či úsek textu registrově **smíšený** | ||
+ | * text není podobný žádnému z registrů (je vzdálen od všech registrů více, než je obvyklé), v takovém případě mluvíme o textech nebo úsecích registrově **nevyhraněných** či **okrajových** | ||
+ | |||
+ | Do registrové anotace se tato informace propíše prostřednictvím atributu '' | ||
+ | |||
+ | * spolehlivý -- nadpoloviční většina textu má jednoznačné a jednotné registrové určení | ||
+ | * smíšený -- text se skládá z částí, které mají různou registrovou platnost, a/nebo části textu jsou ve většině registrově smíšené | ||
+ | * okrajový -- text je z větší části složen z úseků registrově nevyhraněných | ||
+ | * NA (prázdná hodnota) -- žádný registr v textu nepřevažuje | ||
+ | |||
===== Statické registry ===== | ===== Statické registry ===== | ||