Atribut section
Strukturní atribut section
popisuje, v jaké rubrice vyšel daný text. Je vyplněn pouze u vybraných periodik, a to jako součást charakteristiky struktury <text>
(není tedy atributem celého dokumentu, ale pouze jeho části). Poprvé byl použit v korpusu SYN2015.
Hodnota atributu section
je automaticky generována z originálního názvu rubriky (atribut section_orig
), který je napříč jednotlivými tituly poměrně značně variabilní. Např. rubrika souhrně nazvaná v rámci atributu section="zahraniční zpravodajství"
se v různých periodikách objevuje v podobě nadpisů Svět, Ze zahraničí, Ze světa, Zahraničí, Svět – téma, Deset světových zpráv apod. Vzhledem k objemu publicistických dat, které nelze zpracovávat ručně, je nutné sjednocování originálních názvů rubrik provádět automaticky; při práci s tímto atributem je proto třeba počítat s jistou mírou chybovosti.
Hodnoty atributu section
v korpusu SYN2015:
- zpravodajství
- zahraniční zpravodajství
- domácí zpravodajství
- regionální zpravodajství
- politika
- ekonomika
- sport
- kultura
- volný čas
- komentáře
- krimi
- společenský život
- titulní strana