Both sides previous revisionPrevious revisionNext revision | Previous revisionNext revisionBoth sides next revision |
en:cnk:klasifikace_textu_syn2015 [2020/08/25 13:21] – [Podíly jednotlivých typů textů] veronikapojarova | en:cnk:klasifikace_textu_syn2015 [2020/08/25 14:13] – [Overall classification] veronikapojarova |
---|
| ANT: anthropology, etnography\\ THE: theatre, film, dance\\ PHI: philosophy, religion\\ HIS: history\\ LAN: philology\\ INF: library and information science\\ ART: art, architecture | ECO: economy, business, logistics\\ POL: politics, military\\ LAW: law\\ PSY: psychology\\ SOC: sociology\\ REC: sports, recreation, hobbies\\ EDU: education | BIO: biology \\ PHY: physics\\ GEO: geography, geology\\ CHE: chemistry\\ MED: medicine\\ AGR: agriculture | MAT: mathematics\\ TEC: technology\\ ICT: information technology | ITD: interdisciplinary | | | ANT: anthropology, etnography\\ THE: theatre, film, dance\\ PHI: philosophy, religion\\ HIS: history\\ LAN: philology\\ INF: library and information science\\ ART: art, architecture | ECO: economy, business, logistics\\ POL: politics, military\\ LAW: law\\ PSY: psychology\\ SOC: sociology\\ REC: sports, recreation, hobbies\\ EDU: education | BIO: biology \\ PHY: physics\\ GEO: geography, geology\\ CHE: chemistry\\ MED: medicine\\ AGR: agriculture | MAT: mathematics\\ TEC: technology\\ ICT: information technology | ITD: interdisciplinary | |
| |
===== 3. Publicistika ===== | ===== 3. Newspapers and magazines ===== |
| |
Nejvýznamnější změny oproti předchozím korpusům řady SYN: | The most significant changes compared to the previous SYN series classification: |
| |
* Původně monolitická **publicistika** (NMG) se nově dělí na úrovni ''txtype'' na publicistiku **tradiční** (NEW) a **volnočasovou** (LEI). Tradiční publicistika (typicky zpravodajské deníky) se dále na úrovni ''genre'' dělí na **celostátní** (NTW) a **regionální** (REG). Volnočasovou publicistiku (především různě zaměřené zájmové časopisy) rovněž na úrovni ''genre'' rozdělujeme tematicky do následujících skupin: bydlení, zahrada, hobby (HOU), životní styl (LIF), společenský život (SCT), sport (SPO), zahraniční zajímavosti (INT) a společnost (MIX). | * The once monolithic category of **newspapers and magazines** (NMG) is now newly divided on the ''txtype'' level into the groups **traditional** (NEW) and **leisure** (LEI). Traditional newspapers (typically daily newspapers) are further divided on the ''genre'' level into the groups **national** (NTW) and **regional** (REG). Leisure magazines (mostly various types of special interest magazines) are also divided on the ''genre'' level into the following thematic groups: home, garden, hobbies (HOU), lifestyle (LIF), social life (SCT), sports (SPO), international curiosities (INT) and society (MIX). |
* Kde to bylo možné, jsou významné publicistické tituly vydané po roce 2010 nově podrobněji členěny (na úrovni článků) do tematických **rubrik** (atribut ''[[seznamy:section|text.section]]''): zpravodajství (zahraniční, domácí, regionální), politika, ekonomika, sport, kultura, volný čas, komentáře, krimi, společenský život a titulní strana. | * Wherever possible, important journalistic titles published after 2010 are newly given a more detailed classification (on the level of individual articles) into thematic **sections** (the ''[[en:seznamy:section|text.section]]'' attribute): news (foreign, domestic, regional), politics, economy, sports, culture, leisure, commentaries, crime, social life and front page. |
| |
[{{ :cnk:syn2015-lei-new.png?direct&450|Podíl kategorií LEI a NEW v jednotlivých letech.}}] | [{{ :cnk:syn2015-lei-new.png?direct&450|Share of texts in the LEI and NEW categories per year.}}] |
| |
Publicistika (NMG) se na úrovni [[pojmy:txtype|txtype]] nově dělí na: | The category of newspapers and magazines (NMG) on the [[en:pojmy:txtype|txtype]] level is newly divided into: |
- **NEW: tradiční publicistiku** (důraz na aktuální zpravodajství, zprávy z politiky, dění doma i ve světě) | - **NEW: traditional newspapers** (emphasis on current events, political news, news from home and abroad) |
- **LEI: volnočasovou publicistiku** (především zájmové časopisy) | - **LEI: leisure magazines** (predominantly special interest magazines) |
| |
==== Tradiční publicistika (NEW) ==== | ==== Traditional newspapers (NEW) ==== |
| |
Tradiční publicistika (NEW) se dělí na úrovni [[pojmy:genre|genre]] na: | The category of traditional newspapers (NEW) is divided on the [[en:pojmy:genre|genre]] level into: |
* **NTW: celostátní** (např. Lidové noviny, Hospodářské noviny, Mladá fronta DNES, Právo, Respekt, Reflex) | * **NTW: national** (e.g. Lidové noviny, Hospodářské noviny, Mladá fronta DNES, Právo, Respekt, Reflex) |
* **REG: regionální** (např. Chrudimský zpravodaj, Kopřivnické noviny, Týnecké listy) | * **REG: regional** (e.g. Chrudimský zpravodaj, Kopřivnické noviny, Týnecké listy) |
| |
==== Volnočasová publicistika (LEI) ==== | ==== Leisure magazines (LEI) ==== |
| |
Volnočasová publicistika (LEI) se na úrovni [[pojmy:genre|genre]] dělí tematicky na: | The category of leisure magazines (LEI) is further divided on the [[en:pojmy:genre|genre]] level based on the topic: |
* **HOU: bydlení, zahrada, hobby** (např. Bydlení, Chatař & chalupář, Blesk Hobby, Dům a zahrada) | * **HOU: home, garden, hobbies** (e.g. Bydlení, Chatař & chalupář, Blesk Hobby, Dům a zahrada) |
* **LIF: životní styl** (např. Marianne, Elle, JOY, Esprit, Žena a život, Kondice, Maxim, Vlasta) | * **LIF: lifestyle** (e.g. Marianne, Elle, JOY, Esprit, Žena a život, Kondice, Maxim, Vlasta) |
* **SCT: společenský život** (např. Blesk, Aha!, Story, Rytmus života) | * **SCT: social life** (e.g. Blesk, Aha!, Story, Rytmus života) |
* **SPO: sport** (např. Sport, Nedělní sport, Sport magazín, Sport GÓÓÓL!) | * **SPO: sports** (e.g. Sport, Nedělní sport, Sport magazín, Sport GÓÓÓL!) |
* **INT: zajímavosti ze světa** (např. 100+1 zahraniční zajímavost, ABC, Lidé a země, Geo, National Geographic Česko) | * **INT: international curiosities** (e.g. 100+1 zahraniční zajímavost, ABC, Lidé a země, Geo, National Geographic Česko) |
* **MIX: společnost** (např. Instinkt, Kraus, Květy, IN Magazín, Magazín Práva, Pátek Lidových novin) | * **MIX: society** (e.g. Instinkt, Kraus, Květy, IN Magazín, Magazín Práva, Pátek Lidových novin) |
| |
[{{ :cnk:syn2015-nmg-tituly.png?direct&500|Zastoupení hlavních titulů v rámci publicistiky.}}] | [{{ :cnk:syn2015-nmg-tituly.png?direct&500|The representation of major titles in the newspapers and magazines category.}}] |
| |
=== Rubriky === | === Sections === |
| |
U vybraných periodik (Mladá fronta Dnes, Právo, Hospodářské noviny, Lidové noviny, Deníky Bohemia, Týden, Deníky Moravia, Respekt, Regionální týdeník, Blesk, Dobrý den s kurýrem, Metro, E15, Jihlavské listy, Sedmička, Aha! neděle, Nedělní Blesk) jsou k dispozici informace o rubrice, v níž daný článek vyšel. Tato informace je uložena v atributu [[seznamy:section|section]], která charakterizuje strukturu ''<text>'' a může nabývat těchto hodnot: | Selected periodicals (Mladá fronta Dnes, Právo, Hospodářské noviny, Lidové noviny, Deníky Bohemia, Týden, Deníky Moravia, Respekt, Regionální týdeník, Blesk, Dobrý den s kurýrem, Metro, E15, Jihlavské listy, Sedmička, Aha! neděle, Nedělní Blesk) furthermore offer information about the section in which the article was originally published. This information is contained in the [[en:seznamy:section|section]] attribute, which characterizes the structure of the ''<text>'' and has one of the following values: |
* zpravodajství | * current events |
* zahraniční zpravodajství | * foreign news |
* domácí zpravodajství | * domestic news |
* regionální zpravodajství | * regional news |
* politika | * politics |
* ekonomika | * economy |
* sport | * sports |
* kultura | * culture |
* volný čas | * leisure |
* komentáře | * commentaries |
* krimi | * crime |
* společenský život | * social life |
* titulní strana | * front page |
| |
===== Souhrnná klasifikace ===== | ===== Overall classification ===== |
| |
Tabulka shrnuje klasifikaci textu do skupin podle atributů ''txtype_group'', ''txtype'', ''genre_group'' a ''genre''. | The following table offers a comprehensive summary of how texts are divided into categories based on the ''txtype_group'', ''txtype'', ''genre_group'' and ''genre'' attributes. |
| |
^ txtype_group ^ txtype ^ genre_group ^ genre ^ | ^ txtype_group ^ txtype ^ genre_group ^ genre ^ |
| ::: | ::: | ::: | MIX: society| | | ::: | ::: | ::: | MIX: society| |
| |
Klasifikace textů je v SYN2015 doplněna o jejich další charakteristiky. Každý text má nově atribut [[seznamy:med|médium]], nabývající jednu z následujících hodnot: | The classification of texts in SYN2015 is supplemented by some of their other characteristics. Each text newly has the [[en:seznamy:med|medium]] attribute, which assigns to it one of the following values: |
* B: kniha | * B: book |
* J: časopis | * J: journal |
* NWS: noviny | * NWS: newspaper |
* OTH: jiná tiskovina | * OTH: other printed medium |
* REF: referenční příručka | * REF: reference handbook |
* TXB: učební materiál | * TXB: textbook |
| |
[{{ :cnk:syn2015-periodicita.png?direct&250|Podíl periodik a neperiodik v SYN2015.}}] | [{{ :cnk:syn2015-periodicita.png?direct&250|The share of journals vs. non-journals in the SYN2015 corpus.}}] |
| |
Dále vznikla i zcela nová kategorie udávající [[seznamy:periodicity|periodicitu]] daného titulu, která nabývá těchto hodnot: | In addition, we have created a new attribute which identifies the [[en:seznamy:periodicity|periodicity]] of the given publication and can have one of the following values: |
* BI: nižší než měsíčník | * BI: less than monthly |
* DA: deník | * DA: daily |
* MO: měsíčník | * MO: monthly |
* NP: neperiodická publikace | * NP: non-periodical publication |
* WE: týdeník, čtrnáctideník | * WE: weekly, fortnightly |
| |
V atributu [[seznamy:audience|audience]] je uvedena informace o **věku předpokládaného čtenáře** textu: rozlišujeme texty určené pro obecné publikum (GEN) a dětem a mládeži (JUN). | In the [[en:seznamy:audience|audience]] attribute you can find information about the **age of the text's intended reader**: we differentiate among texts written for the general public (GEN) and children and adolescents (JUN). |
| |
Nově lze také u každého textu dohledat **pohlaví autora** ([[seznamy:authsex-transsex|authsex]]), případně **překladatele** ([[seznamy:authsex-transsex|transsex]]): žena (F), muž (M), neuvedeno (X). | Each text also newly contains information about the **author's sex** ([[en:seznamy:authsex-transsex|authsex]]), or the **translator's sex** ([[en:seznamy:authsex-transsex|transsex]]): female (F), male (M), not specified (X). |
| |
Stejně jako v předešlých korpusech patří mezi metainformace o textu samozřejmě název díla (''title''), autor (''author''), překladatel (''translator''), rok vydání (''pubyear''), rok prvního vydání (''first_published''), zdrojový jazyk (''[[seznamy:srclang|srclang]]'') a další charakteristiky. | Of course, the metainformation available in previous corpora is also available here, namely ''title'', ''author'', ''translator'', year of publication (''pubyear''), year of first publication (''first_published''), source language (''[[en:seznamy:srclang|srclang]]'') and other characteristics. |
===== The share of text types in the corpus===== | ===== The share of text types in the corpus===== |
| |
| |
^ txtype ^ genre / genre_group ^ category ^ percentage ^ | ^ txtype ^ genre / genre_group ^ category ^ percentage ^ |
| **Fiction** (FIC) ||| 33,33 % | | | **Fiction** (FIC) ||| 33.33 % | |
| NOV | | novels | 26 % | | | NOV | | novels | 26 % | |
| COL | | short stories | 5 % | | | COL | | short stories | 5 % | |
| VER | | poetry | 1 % | | | VER | | poetry | 1 % | |
| SCR | | drama | 1 % | | | SCR | | drama | 1 % | |
| X | | other fiction | 0,33 % | | | X | | other fiction | 0.33 % | |
| **Non-fiction** (NFC) ||| 33,33 % | | | **Non-fiction** (NFC) ||| 33.33 % | |
| SCI/PRO/POP | HUM | humanities | 7 % | | | SCI/PRO/POP | HUM | humanities | 7 % | |
| ::: | SSC | social sciences | 7 % | | | ::: | SSC | social sciences | 7 % | |
| ::: | ITD | interdisciplinary | 1 % | | | ::: | ITD | interdisciplinary | 1 % | |
| MEM | | memoirs, autobiographies | 4 % | | | MEM | | memoirs, autobiographies | 4 % | |
| ADM | | administrative texts | 0,33 % | | | ADM | | administrative texts | 0.33 % | |
| **Newspapers and magazines** (NMG) ||| 33,33 % | | | **Newspapers and magazines** (NMG) ||| 33.33 % | |
| NEW | NTW | national newspapers – specific (MF, LN, HN, Právo) | 10 % | | | NEW | NTW | national newspapers – specific (MF, LN, HN, Právo) | 10 % | |
| ::: | NTW | national newspapers – other | 5 % | | | ::: | NTW | national newspapers – other | 5 % | |
| ::: | REG | regional newspapers | 5 % | | | ::: | REG | regional newspapers | 5 % | |
| LEI | | leisure magazines | 13,33 % | | | LEI | | leisure magazines | 13.33 % | |
| |
--- //Václav Cvrček, Michal Křen, Anna Čermáková, Lucie Chlumská, Michal Škrabal, Dominika Kováříková// | --- //Václav Cvrček, Michal Křen, Anna Čermáková, Lucie Chlumská, Michal Škrabal, Dominika Kováříková// |
| |