Strukturní atribut section
popisuje, v jaké rubrice vyšel daný text. Je vyplněn pouze u vybraných periodik, a to jako součást charakteristiky struktury <text>
(není tedy atributem celého dokumentu, ale pouze jeho části). Poprvé byl použit v korpusu SYN2015.
Hodnota atributu section
je automaticky generována z originálního názvu rubriky (atribut section_orig
), který je napříč jednotlivými tituly poměrně značně variabilní. Např. rubrika souhrně nazvaná v rámci atributu section="zahraniční zpravodajství"
se v různých periodikách objevuje v podobě nadpisů Svět, Ze zahraničí, Ze světa, Zahraničí, Svět – téma, Deset světových zpráv apod. Vzhledem k objemu publicistických dat, které nelze zpracovávat ručně, je nutné sjednocování originálních názvů rubrik provádět automaticky; při práci s tímto atributem je proto třeba počítat s jistou mírou chybovosti.
Hodnoty atributu section
v korpusu SYN2015: