====== Classification of registers ====== The classification of registers in the CNC corpora serves to provide an insight into textual variability that is complementary to the [[en:pojmy:txtype|txtype]] categories and [[en:pojmy:genre|genres]]. While these attributes capture a //text-external perspective// (how the text is conventionally perceived based on formal characteristics, e.g. novel, letter or scientific article), the [[en:pojmy:register|register]] attribute is an attempt to evaluate texts based on groups of linguistic features which are regularly used in them (//text-internal perspective//). ===== List of registers ===== Based on a multidimensional analysis of Czech((see Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A. J. (2018): Variability of Czech: a multidimensional analysis. //Slovo a slovesnost// 79, (s. 293-321); Cvrček, V. – Komrsková, Z. – Lukeš, D. – Poukarová, P. – Řehořková, A. – Zasina, A.J. (2018): [[https://www.degruyter.com/view/j/cllt.ahead-of-print/cllt-2018-0020/cllt-2018-0020.xml|From extra- to intratextual characteristics: Charting the space of variation in Czech through MDA]]. //Corpus Linguistics and Linguistic Theory//.)) we defined 10 registers which cover the entire spectrum of texts, ranging from spoken to written, including online texts. Registers are assigned to the texts automatically based on the linguistic features which appear in the given text. The names of registers have two components. The first represents a prototypical feature of the given group of texts, which should provide a better overall idea of the text type: this can be based on the type of discourse (//narration//, //argumentation//, //analysis//, //facts//), area of communication, format (//journalism//, //screenplay//, //question answering//) or the author's intent (//popularization//, //commentary//). The second part of the name contains specifying adjectives which characterize the register based on its prominent dimensions: the first adjective marks the basic distinction between dynamic and static texts, the second (or also third) adjective(s) describe the additional features which are characteristic of the given register. **Static registers:** * analysis: static monothematic * popularization: static polythematic general * journalism: static mixed * facts: static polythematic particular * argumentation: static cohesive **Dynamic registers**: * question answering: dynamic without addressee coding * conversation: dynamic spontaneous * commentary: dynamic attitudinal * screenplay: dynamic with addressee coding * narration: dynamic retrospective ===== Characterization of registers ===== The characterization of registers is based on their average placement in the individual dimensions of the [[en:cnk:mda|multidimensional model]] of variability in Czech texts. This model is based on 8 dimensions which capture various aspects of functional variability in Czech based on the linguistic features used in the texts (text-internal perspective). The dimensions are as follows: [{{ :cnk:clusters-means.png?direct&500|The average position of registers within the individual dimensions (in the Koditex corpus).}}] - dynamic (+) vs. static (−) - spontaneous (+) vs. prepared (–) - higher (+) vs. lower (–) level of cohesion - polythematic (+) vs. monothematic (–) - higher (+) vs. lower (–) amount of addressee coding - general (+) vs. particular (–) - prospective (+) vs. retrospective (–) - attitudinal (+) vs. factual (–) Based on the linguistic features that each text contains, we can determine the its position on each of the 8 dimensions (see graph). Using these positions it is then possible to create clusters of texts which have similar positions and can be considered similar (belonging to the same register) as far as the use of these linguistic features is concerned. Conversely: the position of these registers can be used for their interpretation or for a description of their typical characteristics. When characterizing the registers we will be firstly referring to the average position of the given register's texts within the individual dimensions, and secondly we will provide an illustration of each register using excerpts from the [[en:cnk:koditex|Koditex]] corpus, including information on the text-external classification of the text in which the excerpt was found (abbreviations are explained in the corpus description). ===== Static registers ===== ==== Analysis: static monothematic ==== For this register, extremely negative polarity on dimension 1 (these are the most **static** texts) is a typical feature. Analyses and lectures, which are typical for this register, are usually very focused on one single topic (within dimension 4 this register has a prominent position on the **monothematic** side), **prepared** in advance (dimension 2) and have a noticeably **factual** tone (dimension 8). == Excerpt == //Velmi zajímavé užití grafických a analytických programových produktů existuje při zobrazování a analýze Phillipsovy křivky. U nás se analýza pomocí modelu modifikované Phillipsovy křivky prováděla za období VI/1990-VIII/1991. Z analýzy vyplynulo, že průběh Phillipsovy křivky měl typický průběh, charakterizovaný záporným koeficientem korelace mezi mírou inflace a mírou nezaměstnanosti: Liberalizační šok v lednu 1991, který se projevil na růstu cenové hladiny, sleduje dále vývoj nezaměstnanosti. Krátkodobý odhad stabilizace cenové hladiny se ukázal jako reálný. Bylo dosaženo i velmi malé odchylky oproti později zaznamenaným empirickým údajům, pokud jde o objem příspěvků v nezaměstnanosti čerpaných ze státního rozpočtu.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''vyptech_2'', text-external classification: ''wri-nfc-sci-fts'' ==== Popularization: static polythematic general ==== This is also one of the **static** (dimension 1) registers, however its distinguishing feature is its extreme position within dimension 6, which shows the dominance of texts with a **general** application, i.e. those which are not focused on phenomena in the immediate context of the communication situation ("here and now"). The scope of register is occupied by texts which are also considerably **polythematic** (dimension 4), **prepared** (dimension 2) and with a **low level of cohesion** (dimension 3). The last dimension points to a substantial representation of encyclopedias, popularizing texts and instruction manuals which is evident in this register, which confirms that these texts were designed to provide a maximum level of clarity to the reader. == Excerpt == //Dlouhověkost si juka zajišťuje tvorbou postranních růžic. Tyto odnože používáme k množení. Celou rostlinu opatrně na jaře vyzvedneme a rýčem rozdělíme. Odnož by měla mít dostatek vlastních kořenů. Pro lepší manipulaci při sázení svážeme dlouhé listy, klidně i listem z juky, který obsahuje jedny z nejpevnějších rostlinných vláken. Po výsadbě půdu okolo rostliny patou přitlačíme, abychom odstranili vzduchové kapsy a zabránili jejímu vyvrácení. Juky zakoupené v květináči lze vysazovat během celé vegetační sezony.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''duby1326_1'', text-external classification: ''wri-nmg-lei-hou'' ==== Journalism: static mixed ==== One of the most prominent features of this **static** register is its **polythematicity** (dimension 4), which is typically found in journalistic texts. It reaches average values in all other dimensions, and can therefore be considered to be of an unspecified (i.e. mixed) register. == Excerpt == //Rychlý prachy pro vinaře Svatomartinské víno je pro domácí vinaře jako požehnání: prodají první dva miliony lahví z letošní sklizně, peníze mají doma do Vánoc a ještě si udělají reklamu. Navíc z českého trhu takřka vystrnadili Beaujolais nouveau. Tenhle příběh by se měl jednou objevit v učebnicích marketingu a reklamy. Úspěch Svatomartinského vína dokázal, že i za relativně malé peníze lze přitáhnout masy k ne zcela dokonalému produktu, za jaký ho někteří znalci považují – tvrdí, že mladé moravské víno je nedozrálé, tudíž příliš kyselé. Jenže běžným konzumentům zachutnalo.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''Týden_210071/ekonomika_48'', text-external classification: ''wri-nmg-new-eco'' ==== Facts: static polythematic particular ==== The emphasis on the transmission of information in this **static** register is manifested by its extreme values ​​in three dimensions: **factuality** (dimension 8), **polythematicity** (dimension 4) and **specificity** (dimension 6). == Excerpt == // Výrobce toyot, peugeotů a citroënů chce zaměstnat až 700 nových lidí. TPCA začne od května vyrábět nové modely, které nedávno představila na autosalonu v Ženevě. „Tempo jsme však zrychlili již na konci února, takže aktuálně sjede z výrobní linky nový vůz Toyota Aygo, Peugeot 107 nebo Citroën C1 každých 55 vteřin,“ uvedl mluvčí automobilky Radek Kňava. Důvodem je podle něj oživení poptávky v západní Evropě, například prodej modelu Toyota Aygo vzrostl v prvním čtvrtletí o 17 procent. A tak díky rostoucím prodejům současných modelů a očekávanému zájmu o modely nové generace firma opět rozšiřuje nábor nových zaměstnanců. „Náborové aktivity TPCA byly dosud zaměřeny zejména na Kolínsko a střední Čechy, nyní se rozšiřují i na další regiony,“ uvedl Kňava.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''Metro_49058/ekonomika_5'', text-external classification: ''wri-nmg-new-eco'' ==== Argumentation: static cohesive ==== A prominent feature of this **static** register is its **extreme level of cohesion** (dimension 3) which is typical of a prepared text. This particular focus is reflected by the relative **preparedness** (dimension 2) and higher degree of **attitudinality** (dimension 8), which we would expect from an argumentation. Another feature is the relatively high position in dimension 6, indicating that there is focus on **general** rather than unique phenomena with immediate significance to the communication situation. == Excerpt == //Chtěl bych se podívat na dva momenty, které, myslím si, zatím diskutovány nebyly, a sice to, že potřebujeme integrovaný energetický systém v Evropě, který bude propojovat jednotlivé druhy energií, který bude propojovat jednotlivé sítě tak, aby bylo možné nahradit případné výpadky. Nedávná plynová krize nám ukázala, že to je úkol, který je nanejvýš nutný. A druhá věc je to, že potřebujeme, aby byly tyto energetické sítě navázány na obdobné sítě v jiných oblastech, tzn. sítě dopravní a sítě komunikační, aby mezi nimi existovala určitá symetrie.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''europarl/Miloslav Ransdorf_0'', text-external classification: ''%%spo-nin--wbs%%'' ===== Dynamic registers ===== ==== Question answering: dynamic without addressee coding ==== This is one of the **dynamic** registers, with its most distinctive features being its **monological/unaddressed** (dimension 5) and **prospective** (dimension 7) character. We may also mention its inclination to **spontaneity** (dimension 2) and **attitudinality** (dimension 8), which show a certain degree of interactivity and argumentativeness. It differs from the upcoming, also very spontaneous register (//conversation//), with a high level of **cohesion** (dimension 3). == Excerpt == //no já si mysim že . @ existují . ženská a mužská povolání .. ta žena vlastně by neměla dělat nějakou těžkou práci . takže spíš takovou nějakou .. práci která není manuální .. takže . jeřábnici například rozhodně ne teda . ta přece jenom občas musí něco zavěsit a musí nějak se tahat s něčím s něčím těžkým . a neměly by dělat nebezpečnou práci měly by se spíš držet tak jako zpátky třeba učitelka je rozhodně typicky ženský povolání . a . ta žena . by se podle mě měla držet spíš spíš doma a . starat se o toho svého manžela .. chachacha .. zatímco muž teda . ten by měl pracovat . tvrdě přes den aby teda . až příde večer domů tak si vážil toho jak se má doma dobře a co mu ženuška dobrého přichystala k obědu k večeři a tak . takže . ten by měl hlavně teda vydělávat peníze a . a měl by jich vydělávat . oproti té ženě . hodně teda ..// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''BMK183/720'', text-external classification: ''%%spo-int--eli%%'' ==== Conversation: dynamic spontaneous ==== The formative feature of this **dynamic** register is its extreme position within dimension 2, denoting a high degree of **spontaneity**, in this case also associated with a **lower level of cohesion** (dimension 3) and a **higher amount of explicit addressee coding** (dimension 5), which all points to an informal interaction. == Excerpt == //no tak . sme natankovali dojeli sme tam . vona zase v kufru ani klíč . to víš já zas řvala na půl eee Hrobčic . kurva hlavně že NP má vybavenej kufr . já řikám ty vole dyby se nám cestou stalo tak sme v prdeli budem stopovat auta aby nám pučili třinácku klíč jo?// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''08A069N/tikisa'', text-external classification: ''%%spo-int--inf%%'' ==== Commentary: dynamic attitudinal ==== This **dynamic** register is most noticeably characterized by high degrees of **attitudinality** within dimension 8, which is typical for a presentation of opinions. Except for the slight prevalence of **spontaneous** texts (dimension 2), the register is also typically characterized by a higher degree of features linked to a **prospective** mood (dimension 7). == Excerpt == //Podívejte nejsem religionista, takže se nehodlám pouštět do debat, kdo je nebo není víc budhista, nebo muslim, nebo zda je božská entita nezbytně nutná, k náboženství. Pravda je taková, že se při vraždění zaštiťovali náboženstvím, úplně stejně jako to dělají příslušníci ISIL, také je pravda, že lidé, kteří měli potřebu svoje zločiny omlouvat nebo schovávat za nějaké idee, náboženství, ochranu národa, rasy, pracujících, chudých, bohatých a co já vím koho ještě tu byli od nepaměti a budou tu dál. Neznamená to že, bychom s tím neměli nic dělat, ale také je potřeba se s tím smířit, protože se to jen tak nezmění. Nejlepší co můžeme dělat, je zůstat pevní ve svých zásadách a zákonech a rovném přístupu. Poslat k soudu, každého nesnášenlivého Imáma i každého nesnášenlivého Konvičku a po zásluze je oba potrestat. Vysmát se Okamurovi a jeho traktátům z internetu, stejně jako tomu kašparovi s bradkou, který zasvěceně vykládal, jak všichni muslimům lžou a ve skutečnosti se otáčí Slunce okolo Země.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''discussions_17761'', text-external classification: ''%%web-mul--dis%%'' ==== Screenplay: dynamic with addressee coding ==== A characteristic feature of this **dynamic** register is first and foremost its extremely high **amount of addressee coding** (dimension 5). This is also associated with a higher degree of **spontaneity** (dimension 2), both of which are instrumental in creating the interactive character of this register. This register is also prominent in dimension 6 with its focus on **particular** phenomena. == Excerpt == //Václav (S mírným posměchem.) Já beru Karlíka velice vážně. Karel (Velice vztekle, možná k němu i pokročí.) Okamžitě mi přestaň říkat Karlík. Václav (Chladně.) Proč, Karlíku, ty malý tajtrlíku? Karel (Přiskočí k němu a zalomcuje s ním.) Copak si neuvědomuješ, že jsi skončil? A že tvé invektivy jsou směšné? Přišel jsi o všecko. (Pustí ho.) I o Hanu. Zhroutilo se ti to pod rukama. A já, já tady teď budu vládnout. Sice mám někdy pocit, že jsem sebevrah, když to beru, ale jdu do toho. Kvůli lidem. (Teď už se otáčí k Haně, Václav ho přestává zajímat.) Kvůli dějinné nutnosti.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''zacek_domaciprit_4'', text-external classification: ''%%wri-fic--scr%%'' ==== Narration: dynamic retrospective ==== The specificity of this register is mainly due to its **retrospective** (dimension 7) focus. Apart from its **dynamic** character (dimension 1), another significant feature of this register is a ** higher amount of addressee coding** (dimension 5). == Excerpt == //Nakonec se jí podařilo zachytit přední tlapou zbytek oštěpu a vytrhnout hrot z rány. Pak zvíře zvedlo hlavu, z doširoka otevřené tlamy se mu řinula krev, a upřelo oči vzhůru na své nepřátele s tak soustředěnou a vědoucí nenávistí, že Valerie uskočila a tasila meč. Šupiny, kryjící zvíře zvláště na hřbetě a na bocích, změnily barvu z rezavé hnědé na sytě červenou. K hrůze obou přihlížejících v té chvíli porušilo zvíře své mlčení. Zvuky, které se draly z krví potřísněné tlamy, nezněly jako nic, co by mohlo vydávat pozemské stvoření. S hrubým, skřípavým řevem se obluda vrhla na útes, který byl útočištěm jeho nepřátel. Znovu a znovu prorážela obrovská hlava větvemi vzhůru a divoce chňapala do prázdna.// Source: [[en:cnk:koditex|Koditex]] corpus, chunk id: ''howar_barbarcona_1'', text-external classification: ''wri-fic-nov-fan''