Both sides previous revisionPrevious revisionNext revision | Previous revision |
en:cnk:klasifikace_textu_syn2015 [2020/08/25 10:12] – [2. Oborová literatura] veronikapojarova | en:cnk:klasifikace_textu_syn2015 [2020/08/25 14:17] (current) – [Overall classification] veronikapojarova |
---|
The most significant changes compared to the previous SYN series classification: | The most significant changes compared to the previous SYN series classification: |
| |
* **Non-fiction** (previously scientific) **literature** (NFC) reflects a certain level of „proficiency“ and specialization of the target audience, and consists of three main types (''txtype''): scientific (SCI), professional (PRO) and popular (POP) literature. This macrogroup should be understood as the opposite of fiction and journalistic texts: for this reason, it also contains administrative texts (ADM) in the broadest sense as well as a group of texts that are on the borderline between fiction and non-fiction, most typically memoirs and autobiographies (MEM). By changing the name of this group from //scientific// to the more general //non-fiction// we hope to achieve a more accurate representation of its heterogeneous contents, přičemž termín //odborná// zůstal nově vyhrazen pouze akademickým textům (SCI). Nově definovaná profesní literatura (PRO) zahrnuje texty charakterizované převahou praktických informací, které jsou určeny především profesionálům v oboru. | * **Non-fiction** (previously scientific) **literature** (NFC) reflects a certain level of „proficiency“ and specialization of the target audience, and consists of three main types (''txtype''): scientific (SCI), professional (PRO) and popular (POP) literature. This macro-group should be understood as the opposite of fiction and journalistic texts: for this reason, it also contains administrative texts (ADM) in the broadest sense as well as a group of texts that are on the borderline between fiction and non-fiction, most typically memoirs and autobiographies (MEM). By changing the name of this group from //scientific// to the more general //non-fiction// we hope to achieve a more accurate representation of its heterogeneous contents, while the term //scientific// is now assigned only to academic texts (SCI). The newly defined category of professional literature (PRO) includes texts which are characterized by large quantities of practical information primarily intended for professionals in a given field. |
* V oborové literatuře nově přibyla pro txtype SCI, PRO a POP další úroveň – ''genre_group'', která vznikla seskupením jednotlivých disciplín či oborů do větších skupin a umožňuje tak zkoumat texty z blízkých oborů pohromadě: humanitní vědy (HUM), sociální vědy (SSC), přírodní vědy (NAT) a formální a technické vědy (FTS). | * Non-fiction literature newly contains an additional level for the SCI, PRO and POP txtype – ''genre_group'', which was created by grouping together individual disciplines or fields into larger categories and makes it possible to analyze texts from similar or related fields together: humanities (HUM), social sciences (SSC), natural sciences (NAT) and technical sciences (FTS). |
* Na úrovni ''genre'', která představuje nejpodrobnější členění a odráží konkrétní obor či disciplínu, byly jednotlivé texty klasifikovány v maximální možné míře v souladu s předmětovou kategorizací používanou v [[http://text.nkp.cz/o-knihovne/odborne-cinnosti/zpracovani-fondu/vecne-zpracovani-vecne-autority/material-kon2|Národní knihovně ČR]]. Obory jsou podrobně uvedeny dále v přehledové tabulce. | * On the ''genre'' level, which contains the most detailed classification and reflects each specific field or discipline, the individual texts were classified in a way that would most accurately correspond with the subject categorization used by the [[http://text.nkp.cz/o-knihovne/odborne-cinnosti/zpracovani-fondu/vecne-zpracovani-vecne-autority/material-kon2|National Library of the Czech Republic]]. The fields are featured in detail in the table below. |
| |
Oborová literatura (NFC) se na úrovni [[pojmy:txtype|txtype]] nově dělí na: | Non-fiction literature (NFC) on the [[en:pojmy:txtype|txtype]] level is newly divided into: |
- **SCI: odbornou literaturu** – vědecko-naučné texty, včetně akademických publikací a vysokoškolských skript | - **SCI: scientific literature** – scientific texts, including academic publications and university textbooks |
- **PRO: profesní literaturu** – texty určené profesionálům v oboru, včetně specializovaných časopisů (např. Logistika, Lékařské listy, Sestra, Zeměměřič, Stavitel, Konstrukce) | - **PRO: professional literature** – texts intended for professionals in a given field, including specialized periodicals (e.g. Logistika, Lékařské listy, Sestra, Zeměměřič, Stavitel, Konstrukce) |
- **POP: populárně naučnou literaturu** – texty určené pro nejširší laickou veřejnost se zájmem o daný obor (např. Bydlí s námi sladkovodní želva, Botanické zahrady a arboreta České republiky, Praktický houbař) | - **POP: popular literature** – texts intended for a lay audience with an interest in the field (e.g. Bydlí s námi sladkovodní želva, Botanické zahrady a arboreta České republiky, Praktický houbař) |
- **ADM: administrativu** – provozní řády, zápisy z jednání, pokyny a návody, výroční zprávy apod. | - **ADM: administrative texts** – rules and regulations, meeting minutes, instructions and guidelines, annual reports, etc. |
- **MEM: memoáry, (auto)biografie** – paměti, (auto)biografie (s výjimkou beletrizovaných autobiografií, které jsou řazeny do beletrie), korespondence (např. Bojoval jsem u Berlína, Chirurgovy poznámky, Meda Mládková - Můj úžasný život) | - **MEM: memoirs, (auto)biographies** – memoirs, (auto)biographies (with the exception of fictionalized autobiographies, which are included in the fiction category), written correspondence (e.g. Bojoval jsem u Berlína, Chirurgovy poznámky, Meda Mládková - Můj úžasný život) |
| |
=== Genre_group === | === Genre_group === |
| |
Skupina NFC obsahuje další novou klasifikační úroveň **[[pojmy:genre_group|genre_group]]**, která je relevantní pro texty ve skupinách SCI, PRO a POP. Vznikla seskupením jednotlivých oborů (v ČNK označovaných termínem [[pojmy:genre|genre]]) do větších skupin: humanitní vědy (HUM), sociální vědy (SSC), přírodní vědy (NAT) a formální a technické vědy (FTS), viz tabulka níže. | The NFC category contains a new layer of classification, **[[en:pojmy:genre_group|genre_group]]**, which is relevant for texts in the SCI, PRO and POP categories. It was created by grouping together the individual fields (labelled [[en:pojmy:genre|genre]] in the CNC) into larger groups: humanities (HUM), social sciences (SSC), natural sciences (NAT) and formal and technical sciences (FTS), please refer to the table below. |
| |
Na úrovni ''genre'', tedy na úrovni nejpodrobnějšího členění textů, byly jednotlivé texty klasifikovány až na výjimky v souladu s předmětovou kategorizací používanou v Národní knihovně ČR. Sporné případy klasifikace byly řešeny prostřednictvím konsenzu několika klasifikátorů. Obory jsou podrobně uvedeny dále v přehledové tabulce. | On the ''genre'' level, in other words the most detailed level of text classification, the individual texts (with very few exceptions) were classified in compliance with the subject-based categorization which is used in the National Library of the Czech Republic. Ambiguous cases were resolved through the consensus of several classifiers. The fields are shown in detail in the table below. |
| |
^ HUM: humanitní vědy ^ SSC: sociální vědy ^ NAT: přírodní vědy ^ FTS: formální a technické vědy ^ ITD: interdisciplinární ^ | ^ HUM: humanities ^ SSC: social sciences ^ NAT: natural sciences ^ FTS: formal and technical sciences ^ ITD: interdisciplinary ^ |
| ANT: antropologie, etnografie\\ THE: divadlo, film, tanec\\ PHI: filozofie, náboženství\\ HIS: historie\\ LAN: filologie\\ INF: knihovnictví, informatika\\ ART: umění, architektura | ECO: ekonomika, obchod, logistika\\ POL: politika, vojenství\\ LAW: právo\\ PSY: psychologie\\ SOC: sociologie\\ REC: sport, rekreace, hobby\\ EDU: pedagogika | BIO: biologie \\ PHY: fyzika\\ GEO: geografie, geologie\\ CHE: chemie\\ MED: lékařství\\ AGR: zemědělství, chovatelství | MAT: matematika\\ TEC: technika\\ ICT: výpočetní technika | ITD: interdisciplinární | | | ANT: anthropology, ethnography\\ THE: theatre, film, dance\\ PHI: philosophy, religion\\ HIS: history\\ LAN: philology\\ INF: library and information science\\ ART: art, architecture | ECO: economy, business, logistics\\ POL: politics, military\\ LAW: law\\ PSY: psychology\\ SOC: sociology\\ REC: sports, recreation, hobbies\\ EDU: education | BIO: biology \\ PHY: physics\\ GEO: geography, geology\\ CHE: chemistry\\ MED: medicine\\ AGR: agriculture | MAT: mathematics\\ TEC: technology\\ ICT: information technology | ITD: interdisciplinary | |
| |
===== 3. Publicistika ===== | ===== 3. Newspapers and magazines ===== |
| |
Nejvýznamnější změny oproti předchozím korpusům řady SYN: | The most significant changes compared to the previous SYN series classification: |
| |
* Původně monolitická **publicistika** (NMG) se nově dělí na úrovni ''txtype'' na publicistiku **tradiční** (NEW) a **volnočasovou** (LEI). Tradiční publicistika (typicky zpravodajské deníky) se dále na úrovni ''genre'' dělí na **celostátní** (NTW) a **regionální** (REG). Volnočasovou publicistiku (především různě zaměřené zájmové časopisy) rovněž na úrovni ''genre'' rozdělujeme tematicky do následujících skupin: bydlení, zahrada, hobby (HOU), životní styl (LIF), společenský život (SCT), sport (SPO), zahraniční zajímavosti (INT) a společnost (MIX). | * The once monolithic category of **newspapers and magazines** (NMG) is now newly divided on the ''txtype'' level into the groups **traditional** (NEW) and **leisure** (LEI). Traditional newspapers (typically daily newspapers) are further divided on the ''genre'' level into the groups **national** (NTW) and **regional** (REG). Leisure magazines (mostly various types of special interest magazines) are also divided on the ''genre'' level into the following thematic groups: home, garden, hobbies (HOU), lifestyle (LIF), social life (SCT), sports (SPO), international curiosities (INT) and society (MIX). |
* Kde to bylo možné, jsou významné publicistické tituly vydané po roce 2010 nově podrobněji členěny (na úrovni článků) do tematických **rubrik** (atribut ''[[seznamy:section|text.section]]''): zpravodajství (zahraniční, domácí, regionální), politika, ekonomika, sport, kultura, volný čas, komentáře, krimi, společenský život a titulní strana. | * Wherever possible, important journalistic titles published after 2010 are newly given a more detailed classification (on the level of individual articles) into thematic **sections** (the ''[[en:seznamy:section|text.section]]'' attribute): news (foreign, domestic, regional), politics, economy, sports, culture, leisure, commentaries, crime, social life and front page. |
| |
[{{ :cnk:syn2015-lei-new.png?direct&450|Podíl kategorií LEI a NEW v jednotlivých letech.}}] | [{{ :cnk:syn2015-lei-new.png?direct&450|Share of texts in the LEI and NEW categories per year.}}] |
| |
Publicistika (NMG) se na úrovni [[pojmy:txtype|txtype]] nově dělí na: | The category of newspapers and magazines (NMG) on the [[en:pojmy:txtype|txtype]] level is newly divided into: |
- **NEW: tradiční publicistiku** (důraz na aktuální zpravodajství, zprávy z politiky, dění doma i ve světě) | - **NEW: traditional newspapers** (emphasis on current events, political news, news from home and abroad) |
- **LEI: volnočasovou publicistiku** (především zájmové časopisy) | - **LEI: leisure magazines** (predominantly special interest magazines) |
| |
==== Tradiční publicistika (NEW) ==== | ==== Traditional newspapers (NEW) ==== |
| |
Tradiční publicistika (NEW) se dělí na úrovni [[pojmy:genre|genre]] na: | The category of traditional newspapers (NEW) is divided on the [[en:pojmy:genre|genre]] level into: |
* **NTW: celostátní** (např. Lidové noviny, Hospodářské noviny, Mladá fronta DNES, Právo, Respekt, Reflex) | * **NTW: national** (e.g. Lidové noviny, Hospodářské noviny, Mladá fronta DNES, Právo, Respekt, Reflex) |
* **REG: regionální** (např. Chrudimský zpravodaj, Kopřivnické noviny, Týnecké listy) | * **REG: regional** (e.g. Chrudimský zpravodaj, Kopřivnické noviny, Týnecké listy) |
| |
==== Volnočasová publicistika (LEI) ==== | ==== Leisure magazines (LEI) ==== |
| |
Volnočasová publicistika (LEI) se na úrovni [[pojmy:genre|genre]] dělí tematicky na: | The category of leisure magazines (LEI) is further divided on the [[en:pojmy:genre|genre]] level based on the topic: |
* **HOU: bydlení, zahrada, hobby** (např. Bydlení, Chatař & chalupář, Blesk Hobby, Dům a zahrada) | * **HOU: home, garden, hobbies** (e.g. Bydlení, Chatař & chalupář, Blesk Hobby, Dům a zahrada) |
* **LIF: životní styl** (např. Marianne, Elle, JOY, Esprit, Žena a život, Kondice, Maxim, Vlasta) | * **LIF: lifestyle** (e.g. Marianne, Elle, JOY, Esprit, Žena a život, Kondice, Maxim, Vlasta) |
* **SCT: společenský život** (např. Blesk, Aha!, Story, Rytmus života) | * **SCT: social life** (e.g. Blesk, Aha!, Story, Rytmus života) |
* **SPO: sport** (např. Sport, Nedělní sport, Sport magazín, Sport GÓÓÓL!) | * **SPO: sports** (e.g. Sport, Nedělní sport, Sport magazín, Sport GÓÓÓL!) |
* **INT: zajímavosti ze světa** (např. 100+1 zahraniční zajímavost, ABC, Lidé a země, Geo, National Geographic Česko) | * **INT: international curiosities** (e.g. 100+1 zahraniční zajímavost, ABC, Lidé a země, Geo, National Geographic Česko) |
* **MIX: společnost** (např. Instinkt, Kraus, Květy, IN Magazín, Magazín Práva, Pátek Lidových novin) | * **MIX: society** (e.g. Instinkt, Kraus, Květy, IN Magazín, Magazín Práva, Pátek Lidových novin) |
| |
[{{ :cnk:syn2015-nmg-tituly.png?direct&500|Zastoupení hlavních titulů v rámci publicistiky.}}] | [{{ :cnk:syn2015-nmg-tituly.png?direct&500|The representation of major titles in the newspapers and magazines category.}}] |
| |
=== Rubriky === | === Sections === |
| |
U vybraných periodik (Mladá fronta Dnes, Právo, Hospodářské noviny, Lidové noviny, Deníky Bohemia, Týden, Deníky Moravia, Respekt, Regionální týdeník, Blesk, Dobrý den s kurýrem, Metro, E15, Jihlavské listy, Sedmička, Aha! neděle, Nedělní Blesk) jsou k dispozici informace o rubrice, v níž daný článek vyšel. Tato informace je uložena v atributu [[seznamy:section|section]], která charakterizuje strukturu ''<text>'' a může nabývat těchto hodnot: | Selected periodicals (Mladá fronta Dnes, Právo, Hospodářské noviny, Lidové noviny, Deníky Bohemia, Týden, Deníky Moravia, Respekt, Regionální týdeník, Blesk, Dobrý den s kurýrem, Metro, E15, Jihlavské listy, Sedmička, Aha! neděle, Nedělní Blesk) furthermore offer information about the section in which the article was originally published. This information is contained in the [[en:seznamy:section|section]] attribute, which characterizes the structure of the ''<text>'' and has one of the following values: |
* zpravodajství | * current events |
* zahraniční zpravodajství | * foreign news |
* domácí zpravodajství | * domestic news |
* regionální zpravodajství | * regional news |
* politika | * politics |
* ekonomika | * economy |
* sport | * sports |
* kultura | * culture |
* volný čas | * leisure |
* komentáře | * commentaries |
* krimi | * crime |
* společenský život | * social life |
* titulní strana | * front page |
| |
===== Souhrnná klasifikace ===== | ===== Overall classification ===== |
| |
Tabulka shrnuje klasifikaci textu do skupin podle atributů ''txtype_group'', ''txtype'', ''genre_group'' a ''genre''. | The following table offers a comprehensive summary of how texts are divided into categories based on the ''txtype_group'', ''txtype'', ''genre_group'' and ''genre'' attributes. |
| |
^ txtype_group ^ txtype ^ genre_group ^ genre ^ | ^ txtype_group ^ txtype ^ genre_group ^ genre ^ |
| FIC: beletrie | NOV: próza | X: neuvedeno | X: neuvedeno | | | FIC: fiction | NOV: novels | X: other | X: other | |
| ::: | COL: kratší próza | ::: | ::: | | | ::: | COL: short stories | ::: | ::: | |
| ::: | VER: poezie | ::: | ::: | | | ::: | VER: poetry | ::: | ::: | |
| ::: | SCR: drama | ::: | ::: | | | ::: | SCR: drama, screenplays | ::: | ::: | |
| ::: | X: neuvedeno | ::: | ::: | | | ::: | X: other | ::: | ::: | |
| NFC: oborová literatura | SCI: odborná literatura\\ PRO: profesní literatura\\ POP: populárně naučná literatura | HUM: humanitní vědy | ANT: antropologie, etnografie| | | NFC: non-fiction literature | SCI: scientific literature\\ PRO: professional literature\\ POP: popular literature | HUM: humanities | ANT: anthropology, ethnography| |
| ::: | ::: | ::: | THE: divadlo, film, tanec | | | ::: | ::: | ::: | THE: theatre, film, dance | |
| ::: | ::: | ::: | PHI: filozofie, náboženství | | | ::: | ::: | ::: | PHI: philosophy, religion | |
| ::: | ::: | ::: | HIS: historie, biografie | | | ::: | ::: | ::: | HIS: history, biography | |
| ::: | ::: | ::: | MUS: hudba | | | ::: | ::: | ::: | MUS: music | |
| ::: | ::: | ::: | LAN: filologie | | | ::: | ::: | ::: | LAN: philology | |
| ::: | ::: | ::: | INF: knihovnictví, informatika | | | ::: | ::: | ::: | INF: library and information science | |
| ::: | ::: | ::: | ART: umění, architektura | | | ::: | ::: | ::: | ART: art, architecture | |
| ::: | ::: | SSC: sociální vědy | ECO: ekonomika, obchod, logistika | | | ::: | ::: | SSC: social sciences | ECO: economy, business, logistics | |
| ::: | ::: | ::: | POL: politika, vojenství | | | ::: | ::: | ::: | POL: politics, military | |
| ::: | ::: | ::: | LAW: právo | | | ::: | ::: | ::: | LAW: law | |
| ::: | ::: | ::: | PSY: psychologie | | | ::: | ::: | ::: | PSY: psychology | |
| ::: | ::: | ::: | SOC: sociologie | | | ::: | ::: | ::: | SOC: sociology | |
| ::: | ::: | ::: | REC: sport, rekreace, hobby | | | ::: | ::: | ::: | REC: sports, recreation, hobbies | |
| ::: | ::: | ::: | EDU: pedagogika | | | ::: | ::: | ::: | EDU: education | |
| ::: | ::: | NAT: přírodní vědy | BIO: biologie | | | ::: | ::: | NAT: natural sciences | BIO: biology | |
| ::: | ::: | ::: | PHY: fyzika | | | ::: | ::: | ::: | PHY: physics | |
| ::: | ::: | ::: | GEO: geografie, geologie | | | ::: | ::: | ::: | GEO: geography, geology | |
| ::: | ::: | ::: | CHE: chemie | | | ::: | ::: | ::: | CHE: chemistry | |
| ::: | ::: | ::: | MED: lékařství | | | ::: | ::: | ::: | MED: medicine | |
| ::: | ::: | ::: | AGR: zemědělství, chovatelství | | | ::: | ::: | ::: | AGR: agriculture | |
| ::: | ::: | FTS: formální a technické vědy | MAT: matematika | | | ::: | ::: | FTS: formal and technical sciences | MAT: mathematics | |
| ::: | ::: | ::: | TEC: technika | | | ::: | ::: | ::: | TEC: technology | |
| ::: | ::: | ::: | ICT: výpočetní technika | | | ::: | ::: | ::: | ICT: information technology | |
| ::: | ::: | ITD : interdisciplinární | ITD: interdisciplinární | | | ::: | ::: | ITD : interdisciplinary | ITD: interdisciplinary | |
| ::: | MEM: memoáry, autobiografie | MEM: memoáry, autobiografie | MEM: memoáry, autobiografie | | | ::: | MEM: memoirs, autobiographies | MEM: memoirs, autobiographies | MEM: memoirs, autobiographies | |
| ::: | ADM: administrativa | ADM: administrativa | ADM: administrativa | | | ::: | ADM: administrative | ADM: administrative | ADM: administrative | |
| NMG: publicistika | NEW: tradiční publicistika | X: neuvedeno | NTW: celostátní tisk | | | NMG: newspapers and magazines| NEW: traditional journalistic texts | X: other | NTW: nationwide newspapers | |
| ::: | ::: | ::: | REG: regionální tisk | | | ::: | ::: | ::: | REG: regional newspapers | |
| ::: | LEI: volnočasová publicistika | X: neuvedeno | HOU: bydlení, zahrada, hobby | | | ::: | LEI: leisure magazines | X: other | HOU: home, garden, hobbies | |
| ::: | ::: | ::: | LIF: životní styl | | | ::: | ::: | ::: | LIF: lifestyle | |
| ::: | ::: | ::: | SCT: společenský život | | | ::: | ::: | ::: | SCT: social life | |
| ::: | ::: | ::: | SPO: sport | | | ::: | ::: | ::: | SPO: sports | |
| ::: | ::: | ::: | INT: zajímavosti ze světa | | | ::: | ::: | ::: | INT: curiosities | |
| ::: | ::: | ::: | MIX: společnost | | | ::: | ::: | ::: | MIX: society| |
| |
Klasifikace textů je v SYN2015 doplněna o jejich další charakteristiky. Každý text má nově atribut [[seznamy:med|médium]], nabývající jednu z následujících hodnot: | The classification of texts in SYN2015 is supplemented by some of their other characteristics. Each text newly has the [[en:seznamy:med|medium]] attribute, which assigns to it one of the following values: |
* B: kniha | * B: book |
* J: časopis | * J: journal |
* NWS: noviny | * NWS: newspaper |
* OTH: jiná tiskovina | * OTH: other printed medium |
* REF: referenční příručka | * REF: reference handbook |
* TXB: učební materiál | * TXB: textbook |
| |
[{{ :cnk:syn2015-periodicita.png?direct&250|Podíl periodik a neperiodik v SYN2015.}}] | [{{ :cnk:syn2015-periodicita.png?direct&250|The share of journals vs. non-journals in the SYN2015 corpus.}}] |
| |
Dále vznikla i zcela nová kategorie udávající [[seznamy:periodicity|periodicitu]] daného titulu, která nabývá těchto hodnot: | In addition, we have created a new attribute which identifies the [[en:seznamy:periodicity|periodicity]] of the given publication and can have one of the following values: |
* BI: nižší než měsíčník | * BI: less than monthly |
* DA: deník | * DA: daily |
* MO: měsíčník | * MO: monthly |
* NP: neperiodická publikace | * NP: non-periodical publication |
* WE: týdeník, čtrnáctideník | * WE: weekly, fortnightly |
| |
V atributu [[seznamy:audience|audience]] je uvedena informace o **věku předpokládaného čtenáře** textu: rozlišujeme texty určené pro obecné publikum (GEN) a dětem a mládeži (JUN). | In the [[en:seznamy:audience|audience]] attribute you can find information about the **age of the text's intended reader**: we differentiate among texts written for the general public (GEN) and children and adolescents (JUN). |
| |
Nově lze také u každého textu dohledat **pohlaví autora** ([[seznamy:authsex-transsex|authsex]]), případně **překladatele** ([[seznamy:authsex-transsex|transsex]]): žena (F), muž (M), neuvedeno (X). | Each text also newly contains information about the **author's sex** ([[en:seznamy:authsex-transsex|authsex]]), or the **translator's sex** ([[en:seznamy:authsex-transsex|transsex]]): female (F), male (M), not specified (X). |
| |
Stejně jako v předešlých korpusech patří mezi metainformace o textu samozřejmě název díla (''title''), autor (''author''), překladatel (''translator''), rok vydání (''pubyear''), rok prvního vydání (''first_published''), zdrojový jazyk (''[[seznamy:srclang|srclang]]'') a další charakteristiky. | Of course, the metainformation available in previous corpora is also available here, namely ''title'', ''author'', ''translator'', year of publication (''pubyear''), year of first publication (''first_published''), source language (''[[en:seznamy:srclang|srclang]]'') and other characteristics. |
===== Podíly jednotlivých typů textů ===== | ===== The share of text types in the corpus===== |
| |
| |
Ačkoli se při vyvažování korpusu přihlíží ke všem kategoriím, aby byl výsledný korpus co možná nejpestřejší, základní rámec pro stanovení podílů textů tvoři pouze kategorie ''txtype_group'', ''txtype'' a ''genre_group''. Proporce jednotlivých kategorií byly zvoleny pragmaticky s ohledem na texty, které má ČNK k dispozici od nakladatelů a jiných poskytovatelů textů. | Although all categories are taken into account when making a balanced corpus, in order for the resulting corpus to be as varied as possible, the basic framework for determining the share of text types consists only of the categories ''txtype_group'', ''txtype'' and ''genre_group''. The proportions of the individual categories were selected rather pragmatically based on the texts which the CNC had at its disposal from publishers and other sources of texts. |
| |
^ txtype ^ genre / genre_group ^ kategorie ^ proporce ^ | ^ txtype ^ genre / genre_group ^ category ^ percentage ^ |
| **Beletrie** (FIC) ||| 33,33 % | | | **Fiction** (FIC) ||| 33.33 % | |
| NOV | | próza | 26 % | | | NOV | | novels | 26 % | |
| COL | | kratší próza | 5 % | | | COL | | short stories | 5 % | |
| VER | | poezie | 1 % | | | VER | | poetry | 1 % | |
| SCR | | drama | 1 % | | | SCR | | drama | 1 % | |
| X | | ostatní beletrie | 0,33 % | | | X | | other fiction | 0.33 % | |
| **Oborová literatura** (NFC) ||| 33,33 % | | | **Non-fiction** (NFC) ||| 33.33 % | |
| SCI/PRO/POP | HUM | humanitní vědy | 7 % | | | SCI/PRO/POP | HUM | humanities | 7 % | |
| ::: | SSC | sociální vědy | 7 % | | | ::: | SSC | social sciences | 7 % | |
| ::: | NAT | přírodní vědy | 7 % | | | ::: | NAT | natural sciences | 7 % | |
| ::: | FTS | formální a technické vědy | 7 % | | | ::: | FTS | formal and technical sciences | 7 % | |
| ::: | ITD | interdisciplinární | 1 % | | | ::: | ITD | interdisciplinary | 1 % | |
| MEM | | memoáry, autobiografie | 4 % | | | MEM | | memoirs, autobiographies | 4 % | |
| ADM | | administrativní texty | 0,33 % | | | ADM | | administrative texts | 0.33 % | |
| **Publicistika** (NMG) ||| 33,33 % | | | **Newspapers and magazines** (NMG) ||| 33.33 % | |
| NEW | NTW | celostátní publicistika – konkrétní tituly (MF, LN, HN, Právo) | 10 % | | | NEW | NTW | national newspapers – specific (MF, LN, HN, Právo) | 10 % | |
| ::: | NTW | celostátní publicistika – ostatní | 5 % | | | ::: | NTW | national newspapers – other | 5 % | |
| ::: | REG | regionální publicistika | 5 % | | | ::: | REG | regional newspapers | 5 % | |
| LEI | | volnočasová publicistika | 13,33 % | | | LEI | | leisure magazines | 13.33 % | |
| |
--- //Václav Cvrček, Michal Křen, Anna Čermáková, Lucie Chlumská, Michal Škrabal, Dominika Kováříková// | --- //Václav Cvrček, Michal Křen, Anna Čermáková, Lucie Chlumská, Michal Škrabal, Dominika Kováříková// |
| |