Atribut section

Strukturní atribut section popisuje, v jaké rubrice vyšel daný text. Je vyplněn pouze u vybraných periodik, a to jako součást charakteristiky struktury <text> (není tedy atributem celého dokumentu, ale pouze jeho části). Poprvé byl použit v korpusu SYN2015.

Hodnota atributu section je automaticky generována z originálního názvu rubriky (atribut section_orig), který je napříč jednotlivými tituly poměrně značně variabilní. Např. rubrika souhrně nazvaná v rámci atributu section="zahraniční zpravodajství" se v různých periodikách objevuje v podobě nadpisů Svět, Ze zahraničí, Ze světa, Zahraničí, Svět – téma, Deset světových zpráv apod. Vzhledem k objemu publicistických dat, které nelze zpracovávat ručně, je nutné sjednocování originálních názvů rubrik provádět automaticky; při práci s tímto atributem je proto třeba počítat s jistou mírou chybovosti.

Hodnoty atributu section v korpusu SYN2015: