AplikaceAplikace
Nastavení

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revisionBoth sides next revision
en:cnk:klasifikace_textu_syn2015 [2020/08/25 13:52] – [Volnočasová publicistika (LEI)] veronikapojarovaen:cnk:klasifikace_textu_syn2015 [2020/08/25 14:03] – [Souhrnná klasifikace] veronikapojarova
Line 96: Line 96:
   * front page   * front page
  
-===== Souhrnná klasifikace =====+===== Overall classification =====
  
-Tabulka shrnuje klasifikaci textu do skupin podle atributů ''txtype_group'', ''txtype'', ''genre_group'' ''genre''.+The following table offers a comprehensive summary of how texts are divided into categories based on the ''txtype_group'', ''txtype'', ''genre_group'' and ''genre'' attributes.
  
 ^  txtype_group  ^  txtype  ^  genre_group  ^  genre  ^ ^  txtype_group  ^  txtype  ^  genre_group  ^  genre  ^
Line 142: Line 142:
 | ::: | ::: | ::: | MIX: society| | ::: | ::: | ::: | MIX: society|
  
-Klasifikace textů je v SYN2015 doplněna o jejich další charakteristikyKaždý text má nově atribut [[seznamy:med|médium]], nabývající jednu z následujících hodnot:  +The classification of texts in SYN2015 is supplemented by some of their other characteristicsEach text newly has the [[en:seznamy:med|medium]] attributewhich assigns to it one of the following values:  
-  * B: kniha  +  * B: book  
-  * J: časopis +  * J: journal 
-  * NWS: noviny  +  * NWS: newspaper  
-  * OTH: jiná tiskovina +  * OTH: other printed medium 
-  * REF: referenční příručka +  * REF: reference handbook 
-  * TXB: učební materiál +  * TXB: textbook 
  
-[{{ :cnk:syn2015-periodicita.png?direct&250|Podíl periodik a neperiodik v SYN2015.}}]+[{{ :cnk:syn2015-periodicita.png?direct&250|The share of journals vs. non-journals in the SYN2015 corpus.}}]
  
-Dále vznikla i zcela nová kategorie udávající [[seznamy:periodicity|periodicitu]] daného titulu, která nabývá těchto hodnot+In addition, we have created a new attribute which identifies the [[en:seznamy:periodicity|periodicity]] of the given publication and can have one of the following values
-  * BI: nižší než měsíčník +  * BI: less than monthly 
-  * DA: deník +  * DA: daily 
-  * MO: měsíčník +  * MO: monthly 
-  * NP: neperiodická publikace +  * NP: non-periodical publication 
-  * WE: týdeníkčtrnáctideník+  * WE: weeklyfortnightly
  
-V atributu [[seznamy:audience|audience]] je uvedena informace o **věku předpokládaného čtenáře** texturozlišujeme texty určené pro obecné publikum (GEN) a dětem a mládeži (JUN). +In the [[en:seznamy:audience|audience]] attribute you can find information about the **age of the text's intended reader**: we differentiate among texts written for the general public (GEN) and children and adolescents (JUN). 
  
-Nově lze také u každého textu dohledat **pohlaví autora** ([[seznamy:authsex-transsex|authsex]]), případně **překladatele** ([[seznamy:authsex-transsex|transsex]]): žena (F), muž (M), neuvedeno (X).+Nově lze také u každého textu dohledat **pohlaví autora** ([[seznamy:authsex-transsex|authsex]]), případně **translator** ([[en:seznamy:authsex-transsex|transsex]]): žena (F), muž (M), neuvedeno (X).
  
 Stejně jako v předešlých korpusech patří mezi metainformace o textu samozřejmě název díla (''title''), autor (''author''), překladatel (''translator''), rok vydání (''pubyear''), rok prvního vydání (''first_published''), zdrojový jazyk (''[[seznamy:srclang|srclang]]'') a další charakteristiky. Stejně jako v předešlých korpusech patří mezi metainformace o textu samozřejmě název díla (''title''), autor (''author''), překladatel (''translator''), rok vydání (''pubyear''), rok prvního vydání (''first_published''), zdrojový jazyk (''[[seznamy:srclang|srclang]]'') a další charakteristiky.