AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:registrova_klasifikace [2019/06/19 15:26] – [Argumentace: statický kohezní] vaclavcvrcekcnk:registrova_klasifikace [2021/02/12 14:50] (aktuální) – [Spolehlivost registrové klasifikace] michalskrabal
Řádek 8: Řádek 8:
 bylo vymezeno 10 registrů, které pokrývají celé spektrum textů od mluvených přes webové až po psané. Přiřazení textu k registru je automatické na základě lingvistických rysů, které se v textu využívají. bylo vymezeno 10 registrů, které pokrývají celé spektrum textů od mluvených přes webové až po psané. Přiřazení textu k registru je automatické na základě lingvistických rysů, které se v textu využívají.
  
-Název registru se skládá ze dvou částí. První označuje prototypickou vlastnost dané skupiny textů jako vodítko pro představu: může jí být slohový postup (//narace//, //argumentace//, //analýza//)komunikační oblast (//žurnalistika//), popřípadě formát (//komentář//, //scénář//, //anketa//) nebo cíl sdělení (//popularizace//, //fakta//). Druhou část názvu tvoří zpřesňující adjektiva charakterizující registr na základě výrazných dimenzí: první adjektivum odkazuje k základní distinkci mezi dynamickými a statistickými texty, druhé (příp. třetí) adjektivum odkazuje k doplňkové vlastnosti charakteristické pro daný registr.+Název registru se skládá ze dvou částí. První označuje prototypickou vlastnost dané skupiny textů jako vodítko pro představu: může jí být slohový postup (//narace//, //argumentace//, //analýza//, //fakta//), komunikační oblast, popřípadě formát (//žurnalistika//, //scénář//, //anketa//) nebo záměr sdělení (//popularizace//, //komentář//). Druhou část názvu tvoří zpřesňující adjektiva charakterizující registr na základě výrazných dimenzí: první adjektivum odkazuje k základní distinkci mezi dynamickými a statistickými texty, druhé (příp. třetí) adjektivum odkazuje k doplňkové vlastnosti charakteristické pro daný registr.
  
 **Statické registry:** **Statické registry:**
Řádek 29: Řádek 29:
  
 Charakteristika registrů vychází z jejich průměrného postavení na jednotlivých dimenzích [[cnk:mda|multidimenzionálního modelu]] variability českých textů. Tento model je založen na 8 dimenzích, které podchycují různé aspekty funkční variability češtiny na základě jazykových rysů, které texty využívají (vnitrotextové hledisko). Tyto dimenze jsou: Charakteristika registrů vychází z jejich průměrného postavení na jednotlivých dimenzích [[cnk:mda|multidimenzionálního modelu]] variability českých textů. Tento model je založen na 8 dimenzích, které podchycují různé aspekty funkční variability češtiny na základě jazykových rysů, které texty využívají (vnitrotextové hledisko). Tyto dimenze jsou:
 +
 +[{{ :cnk:clusters-means.png?direct&500|Průměrná pozice registrů v jednotlivých dimenzích (v korpusu Koditex).}}]
  
   - dynamický (+) vs. statický (-)    - dynamický (+) vs. statický (-) 
Řádek 39: Řádek 41:
   - postojovost (+) vs. faktuálnost (-)     - postojovost (+) vs. faktuálnost (-)  
  
-Pro každý text lze na základě jazykových rysů, které obsahuje, zjistit jeho pozici na každé z 8 dimenzí. Na základě těchto pozic lze pak vytvořit shluky textů, které mají podobné pozice a jsou si tedy z hlediska využití těchto lingvistických rysů podobné (mají stejný registr). A z druhé strany: pozice těchto registrů slouží k jejich interpretaci či popisu typických vlastností.+Pro každý text lze na základě jazykových rysů, které obsahuje, zjistit jeho pozici na každé z 8 dimenzí (viz graf). Na základě těchto pozic lze pak vytvořit shluky textů, které mají podobné pozicea jsou si tedy z hlediska využití těchto lingvistických rysů podobné (mají stejný registr). A z druhé strany: pozice těchto registrů slouží k jejich interpretaci či popisu typických vlastností.
  
 Při popisu registrů budeme odkazovat jednak k průměrnému umístění textů daného registru na jednotlivých dimenzích a jednak se registr pokusíme přiblížit ukázkou z korpusu [[cnk:koditex|Koditex]], včetně informace o vnětextové klasifikaci textu, z něhož ukázka pochází (význam zkratek viz popis korpusu).  Při popisu registrů budeme odkazovat jednak k průměrnému umístění textů daného registru na jednotlivých dimenzích a jednak se registr pokusíme přiblížit ukázkou z korpusu [[cnk:koditex|Koditex]], včetně informace o vnětextové klasifikaci textu, z něhož ukázka pochází (význam zkratek viz popis korpusu). 
 +
 +===== Spolehlivost registrové klasifikace =====
 +
 +To, jestli je text nebo výsek textu příkladem určitého registru, je v zásadě určeno tím, jakou vzdálenost má v multidimenzionálním prostoru od pomyslného prototypického textu. Kromě případů, které jsou jednoznačné, můžou nastat ještě dvě specifické situace:
 +
 +  * text je stejně podobný dvěma registrům (má stejně blízko k prototypickým zástupcům dvou registrů), v takovém případě jde o text či úsek textu registrově **smíšený**
 +  * text není podobný žádnému z registrů (je vzdálen od všech registrů více, než je obvyklé), v takovém případě mluvíme o textech nebo úsecích registrově **nevyhraněných** či **okrajových**
 +
 +Do registrové anotace se tato informace propíše prostřednictvím atributu ''register_reliability'', který nabývá hodnot //okrajový//, //smíšený//, //spolehlivý//. Tento atribut se přitom neobjevuje pouze u struktury ''<chunk>'', ale i u struktury ''<doc>'', kde vyjadřuje jednak míru spolehlivosti určení převažujícího registru (''prevailing_register''), ale také zároveň spolehlivost určení registrů u dílčích chunků daného dokumentu. Jeho hodnoty je třeba interpretovat takto:
 +
 +  * spolehlivý -- nadpoloviční většina textu má jednoznačné a jednotné registrové určení
 +  * smíšený -- text se skládá z částí, které mají různou registrovou platnost, a/nebo části textu jsou ve většině registrově smíšené
 +  * okrajový -- text je z větší části složen z úseků registrově nevyhraněných
 +  * NA (prázdná hodnota) -- žádný registr v textu nepřevažuje
  
 ===== Statické registry ===== ===== Statické registry =====
Řádek 51: Řádek 67:
 == Ukázka == == Ukázka ==
  
-//Nejčastější námitkoukterou lze rozvojový charakter sovětských aktivit v "třetím světě" zpochybnitjsou mocenské benefity, které ze spolupráce plynuly pro SSSR jeho spojence. Už tento fakt nám poskytuje cenné ponaučení pro současnostOba znepřátelené bloky zpochybňovaly odhodlání druhé strany naplňovat morální imperativ rozvojové pomoci pomáhat potřebnýmObě strany k tomu itom používaly shodných argumentů, poukazovaly na fakt, že vztah velmoci a rozvojových zemí mezinárodním systému je vztahem dominantního a závislého, tedy vztahem nerovným.//+//Velmi zajímavé užití grafických a analytických programových produktů existuje při zobrazování a analýze Phillipsovy křivky. U nás se analýza pomocí modelu modifikované Phillipsovy křivky prováděla za období VI/1990-VIII/1991. Z analýzy vyplynulože průběh Phillipsovy křivky měl typický průběhcharakterizovaný záporným koeficientem korelace mezi mírou inflace mírou nezaměstnanosti: Liberalizační šok v lednu 1991, který se projevil na růstu cenové hladiny, sleduje dále vývoj nezaměstnanostiKrátkodobý odhad stabilizace cenové hladiny se ukázal jako reálnýBylo dosaženo i velmi malé odchylky oproti později zaznamenaným empirickým údajům, pokud jde o objem íspěvků v nezaměstnanosti čerpaných ze státního rozpočtu.//
  
-Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''leich_rozvojovas_3'', vnětextová klasifikace: ''wri-nfs-sci-ssc''+Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''vyptech_2'', vnětextová klasifikace: ''wri-nfc-sci-fts''
 ==== Popularizace: statický polytematický obecný ==== ==== Popularizace: statický polytematický obecný ====
  
-Tento registr rovněž patří mezi **statické** (1. dimenze) rejstříky, jeho odlišujícím rysem je nicméně krajní poloha na dimenzi 6 ukazující na převahu textů s **obecnou** platností, nezaměřujících se na konkréta. Charakteristická je pro tento registr obsahující typicky výkladové texty koncipované se zřetelem na čtenáře i značná **polytematičnost** (4. dimenze), **připravenost** (2. dimenze) a **nízká míra koheze** (3. dimenze), která odkazuje k vysokému zastoupení encyklopedických děl, popularizací a návodů v tomto registru.+Tento registr rovněž patří mezi **statické** (1. dimenze) rejstříky, jeho odlišujícím rysem je nicméně krajní poloha na dimenzi 6 ukazující na převahu textů s **obecnou** platností, nezaměřujících se na jevy v bezprostředním kontextu komunikační situace ("tady a teď") 
 +Charakteristická je pro tento registr i značná **polytematičnost** (4. dimenze), **připravenost** (2. dimenze) a **nízká míra koheze** (3. dimenze).  Poslední dimenze odkazuje k vysokému zastoupení encyklopedických děl, popularizací a návodů v tomto registru a svědčí o tom, že jde o texty koncipované s ohledem na srozumitelnost pro čtenáře. 
  
 == Ukázka == == Ukázka ==
Řádek 82: Řádek 100:
 ==== Argumentace: statický kohezní ==== ==== Argumentace: statický kohezní ====
  
-Výrazným rysem tohoto **statického** registru je **extrémní míra koheze** (3. dimenze) odkazující k připravenému výkladu. Toto zaměření se odráží i v relativní **připravenosti** (2. dimenze) a vyšší míře **postojovosti** (dimenze 8), jakou bychom očekávali v argumentaci. Dalším rysem je i poměrně vyšší postavení v dimenzi 6 značící zaměření na **obecné** jevy spíše než na konkréta.+Výrazným rysem tohoto **statického** registru je **extrémní míra koheze** (3. dimenze) odkazující k připravenému výkladu. Toto zaměření se odráží i v relativní **připravenosti** (2. dimenze) a vyšší míře **postojovosti** (dimenze 8), jakou bychom očekávali v argumentaci. Dalším rysem je i poměrně vyšší postavení v dimenzi 6 značící zaměření na **obecné** jevy spíše než na jedinečné jevy s aktuálním významem pro komunikaci.
  
 == Ukázka == == Ukázka ==
  
-//Chtěl bych se podívat na dva momenty, které, myslím si, zatím diskutovány nebyly, a sice to, že potřebujeme integrovaný energetický systém v Evropě, který bude propojovat jednotlivé druhy energií, který bude propojovat jednotlivé sítě tak, aby bylo možné nahradit případné výpadky. Nedávná plynová krize nám ukázala , že to je úkol, který je nanejvýš nutný. A druhá věc je to, že potřebujeme, aby byly tyto energetické sítě navázány na obdobné sítě v jiných oblastech, tzn. sítě dopravní a sítě komunikační, aby mezi nimi existovala určitá symetrie.//+//Chtěl bych se podívat na dva momenty, které, myslím si, zatím diskutovány nebyly, a sice to, že potřebujeme integrovaný energetický systém v Evropě, který bude propojovat jednotlivé druhy energií, který bude propojovat jednotlivé sítě tak, aby bylo možné nahradit případné výpadky. Nedávná plynová krize nám ukázala, že to je úkol, který je nanejvýš nutný. A druhá věc je to, že potřebujeme, aby byly tyto energetické sítě navázány na obdobné sítě v jiných oblastech, tzn. sítě dopravní a sítě komunikační, aby mezi nimi existovala určitá symetrie.//
  
 Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''europarl/Miloslav Ransdorf_0'', vnětextová klasifikace: ''%%spo-nin--wbs%%'' Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''europarl/Miloslav Ransdorf_0'', vnětextová klasifikace: ''%%spo-nin--wbs%%''
Řádek 94: Řádek 112:
 ==== Anketa: dynamický neadresný ==== ==== Anketa: dynamický neadresný ====
  
-Registr patří mezi **dynamické** rejstříky, přičemž nejvýraznějšími vlastnostmi jsou jeho **monologický/neadresný** (5. dimenze) a **prospektivní** (7. dimenze) charakter. Za zmínku stojí rovněž inklinace ke **spontánnosti** (2. dimenze) a **postojovosti** (8. dimenze), které ukazují na jistou míru interaktivnosti a argumentativnosti. Oproti následujícímu, taktéž velmi spontánnímu registru (//konverzace//je pozoruhodnéže je tento vysoce **kohezní** (3. dimenze).+Registr patří mezi **dynamické** rejstříky, přičemž nejvýraznějšími vlastnostmi jsou jeho **monologický/neadresný** (5. dimenze) a **prospektivní** (7. dimenze) charakter. Za zmínku stojí rovněž inklinace ke **spontánnosti** (2. dimenze) a **postojovosti** (8. dimenze), které ukazují na jistou míru interaktivnosti a argumentativnosti. Od následujícího, taktéž velmi spontánního registru (//konverzace//), se odlišuje vysokou mírou **koheze** (3. dimenze).
  
 == Ukázka == == Ukázka ==
 //no já si mysim že . @ existují . ženská a mužská povolání .. ta žena vlastně by neměla dělat nějakou těžkou práci . takže spíš takovou nějakou .. práci která není manuální .. takže . jeřábnici například rozhodně ne teda . ta přece jenom občas musí něco zavěsit a musí nějak se tahat s něčím s něčím těžkým . a neměly by dělat nebezpečnou práci měly by se spíš držet tak jako zpátky třeba učitelka je rozhodně typicky ženský povolání . a . ta žena . by se podle mě měla držet spíš spíš doma a . starat se o toho svého manžela .. chachacha .. zatímco muž teda . ten by měl pracovat . tvrdě přes den aby teda . až příde večer domů tak si vážil toho jak se má doma dobře a co mu ženuška dobrého přichystala k obědu k večeři a tak . takže . ten by měl hlavně teda vydělávat peníze a . a měl by jich vydělávat . oproti té ženě . hodně teda ..// //no já si mysim že . @ existují . ženská a mužská povolání .. ta žena vlastně by neměla dělat nějakou těžkou práci . takže spíš takovou nějakou .. práci která není manuální .. takže . jeřábnici například rozhodně ne teda . ta přece jenom občas musí něco zavěsit a musí nějak se tahat s něčím s něčím těžkým . a neměly by dělat nebezpečnou práci měly by se spíš držet tak jako zpátky třeba učitelka je rozhodně typicky ženský povolání . a . ta žena . by se podle mě měla držet spíš spíš doma a . starat se o toho svého manžela .. chachacha .. zatímco muž teda . ten by měl pracovat . tvrdě přes den aby teda . až příde večer domů tak si vážil toho jak se má doma dobře a co mu ženuška dobrého přichystala k obědu k večeři a tak . takže . ten by měl hlavně teda vydělávat peníze a . a měl by jich vydělávat . oproti té ženě . hodně teda ..//
  
-Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''BMK183/720''+Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''BMK183/720'', vnětextová klasifikace: ''%%spo-int--eli%%''
  
 ==== Konverzace: dynamický spontánní ==== ==== Konverzace: dynamický spontánní ====
Řádek 106: Řádek 124:
  
 == Ukázka == == Ukázka ==
-//řikám nejsi prdlej já sem leta jezdila autem a v životě sem ne* netankovala mně každej sám a mně čerpadlářka a řikám a navíc já našim autem nejedu do Mostu . já bych se bála i dyž to je jako . jedno . prostě nejela bych já akorát tak tady . a von Jana a já řikám no tak . Jana nepojede našim autem to ani omylem eště to rozbije ne . víš co takovýdle věci zase a vona pak řikala že by se s nim bála dyž ho nezná . no tak . sme natankovali dojeli sme tam . vona zase v kufru ani klíč . to víš já zas řvala na půl eee Hrobčic . kurva hlavně že NP má vybavenej kufr . já řikám ty vole dyby se nám cestou stalo tak sme v prdeli budem stopovat auta aby nám pučili třinácku klíč jo ?// +//no tak . sme natankovali dojeli sme tam . vona zase v kufru ani klíč . to víš já zas řvala na půl eee Hrobčic . kurva hlavně že NP má vybavenej kufr . já řikám ty vole dyby se nám cestou stalo tak sme v prdeli budem stopovat auta aby nám pučili třinácku klíč jo?//
- +
-Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''08A069N/tikisa''+
  
 +Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''08A069N/tikisa'', vnětextová klasifikace: ''%%spo-int--inf%%''
  
 ==== Komentář: dynamický postojový ==== ==== Komentář: dynamický postojový ====
Řádek 118: Řádek 135:
 //Podívejte nejsem religionista, takže se nehodlám pouštět do debat, kdo je nebo není víc budhista, nebo muslim, nebo zda je božská entita nezbytně nutná, k náboženství. Pravda je taková, že se při vraždění zaštiťovali náboženstvím, úplně stejně jako to dělají příslušníci ISIL, také je pravda, že lidé, kteří měli potřebu svoje zločiny omlouvat nebo schovávat za nějaké idee, náboženství, ochranu národa, rasy, pracujících, chudých, bohatých a co já vím koho ještě tu byli od nepaměti a budou tu dál. Neznamená to že, bychom s tím neměli nic dělat, ale také je potřeba se s tím smířit, protože se to jen tak nezmění. Nejlepší co můžeme dělat, je zůstat pevní ve svých zásadách a zákonech a rovném přístupu. Poslat k soudu, každého nesnášenlivého Imáma i každého nesnášenlivého Konvičku a po zásluze je oba potrestat. Vysmát se Okamurovi a jeho traktátům z internetu, stejně jako tomu kašparovi s bradkou, který zasvěceně vykládal, jak všichni muslimům lžou a ve skutečnosti se otáčí Slunce okolo Země.// //Podívejte nejsem religionista, takže se nehodlám pouštět do debat, kdo je nebo není víc budhista, nebo muslim, nebo zda je božská entita nezbytně nutná, k náboženství. Pravda je taková, že se při vraždění zaštiťovali náboženstvím, úplně stejně jako to dělají příslušníci ISIL, také je pravda, že lidé, kteří měli potřebu svoje zločiny omlouvat nebo schovávat za nějaké idee, náboženství, ochranu národa, rasy, pracujících, chudých, bohatých a co já vím koho ještě tu byli od nepaměti a budou tu dál. Neznamená to že, bychom s tím neměli nic dělat, ale také je potřeba se s tím smířit, protože se to jen tak nezmění. Nejlepší co můžeme dělat, je zůstat pevní ve svých zásadách a zákonech a rovném přístupu. Poslat k soudu, každého nesnášenlivého Imáma i každého nesnášenlivého Konvičku a po zásluze je oba potrestat. Vysmát se Okamurovi a jeho traktátům z internetu, stejně jako tomu kašparovi s bradkou, který zasvěceně vykládal, jak všichni muslimům lžou a ve skutečnosti se otáčí Slunce okolo Země.//
  
-Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''discussions_17761''+Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''discussions_17761'', vnětextová klasifikace: ''%%web-mul--dis%%''
  
 ==== Scénář: dynamický adresný ==== ==== Scénář: dynamický adresný ====
Řádek 126: Řádek 143:
 == Ukázka == == Ukázka ==
  
-//Václav (S mírným posměchem.) Já beru Karlíka velice vážně. Karel (Velice vztekle, možná k němu i pokročí.) Okamžitě mi přestaň říkat Karlík. Václav (Chladně.) Proč, Karlíku, ty malý tajtrlíku ? Karel (Přiskočí k němu a zalomcuje s ním.) Copak si neuvědomuješ, že jsi skončil? A že tvé invektivy jsou směšné? Přišel jsi o všecko. (Pustí ho.) I o Hanu. Zhroutilo se ti to pod rukama. A já, já tady teď budu vládnout. Sice mám někdy pocit, že jsem sebevrah, když to beru, ale jdu do toho. Kvůli lidem. (Teď už se otáčí k Haně, Václav ho přestává zajímat.) Kvůli dějinné nutnosti.//+//Václav (S mírným posměchem.) Já beru Karlíka velice vážně. Karel (Velice vztekle, možná k němu i pokročí.) Okamžitě mi přestaň říkat Karlík. Václav (Chladně.) Proč, Karlíku, ty malý tajtrlíku? Karel (Přiskočí k němu a zalomcuje s ním.) Copak si neuvědomuješ, že jsi skončil? A že tvé invektivy jsou směšné? Přišel jsi o všecko. (Pustí ho.) I o Hanu. Zhroutilo se ti to pod rukama. A já, já tady teď budu vládnout. Sice mám někdy pocit, že jsem sebevrah, když to beru, ale jdu do toho. Kvůli lidem. (Teď už se otáčí k Haně, Václav ho přestává zajímat.) Kvůli dějinné nutnosti.//
  
-Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''zacek_domaciprit_4''+Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''zacek_domaciprit_4'', vnětextová klasifikace: ''%%wri-fic--scr%%''
  
 ==== Narace: dynamický retrospektivní ==== ==== Narace: dynamický retrospektivní ====
Řádek 138: Řádek 155:
 //Nakonec se jí podařilo zachytit přední tlapou zbytek oštěpu a vytrhnout hrot z rány. Pak zvíře zvedlo hlavu, z doširoka otevřené tlamy se mu řinula krev, a upřelo oči vzhůru na své nepřátele s tak soustředěnou a vědoucí nenávistí, že Valerie uskočila a tasila meč. Šupiny, kryjící zvíře zvláště na hřbetě a na bocích, změnily barvu z rezavé hnědé na sytě červenou. K hrůze obou přihlížejících v té chvíli porušilo zvíře své mlčení. Zvuky, které se draly z krví potřísněné tlamy, nezněly jako nic, co by mohlo vydávat pozemské stvoření. S hrubým, skřípavým řevem se obluda vrhla na útes, který byl útočištěm jeho nepřátel. Znovu a znovu prorážela obrovská hlava větvemi vzhůru a divoce chňapala do prázdna.// //Nakonec se jí podařilo zachytit přední tlapou zbytek oštěpu a vytrhnout hrot z rány. Pak zvíře zvedlo hlavu, z doširoka otevřené tlamy se mu řinula krev, a upřelo oči vzhůru na své nepřátele s tak soustředěnou a vědoucí nenávistí, že Valerie uskočila a tasila meč. Šupiny, kryjící zvíře zvláště na hřbetě a na bocích, změnily barvu z rezavé hnědé na sytě červenou. K hrůze obou přihlížejících v té chvíli porušilo zvíře své mlčení. Zvuky, které se draly z krví potřísněné tlamy, nezněly jako nic, co by mohlo vydávat pozemské stvoření. S hrubým, skřípavým řevem se obluda vrhla na útes, který byl útočištěm jeho nepřátel. Znovu a znovu prorážela obrovská hlava větvemi vzhůru a divoce chňapala do prázdna.//
  
-Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''howar_barbarcona_1''+Zdroj: korpus [[cnk:koditex|Koditex]], chunk id: ''howar_barbarcona_1'', vnětextová klasifikace: ''wri-fic-nov-fan''