Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
seznamy:tagy [2016/10/31 17:51] – [Pozice 15 - Varianta (stylový příznak)] michalkren | seznamy:tagy [2017/06/15 17:27] – [Pozice 1 - Slovní druh] michalkren | ||
---|---|---|---|
Řádek 13: | Řádek 13: | ||
V případě, že značka je tvořena symbolem, který v rámci regulárních výrazů má speciální význam, je třeba naznačit zpětným lomítkem, že máme na mysli doslovný význam znaku. Např. pomocí znaku hvězdičky (*) jsou na druhé pozici tagovány výrazy jako plus, krát apod. ve funkci spojek (J). Chceme-li vyhledat slova s tímto tagem, musíme před hvězdičku přidat zpětné lomítko, abychom vyznačili, že nejde o její speciální význam: '' | V případě, že značka je tvořena symbolem, který v rámci regulárních výrazů má speciální význam, je třeba naznačit zpětným lomítkem, že máme na mysli doslovný význam znaku. Např. pomocí znaku hvězdičky (*) jsou na druhé pozici tagovány výrazy jako plus, krát apod. ve funkci spojek (J). Chceme-li vyhledat slova s tímto tagem, musíme před hvězdičku přidat zpětné lomítko, abychom vyznačili, že nejde o její speciální význam: '' | ||
- | ===== Změny v morfologickém značkování ===== | + | ===== Změny v morfologickém značkování |
S uveřejněním korpusu [[cnk: | S uveřejněním korpusu [[cnk: | ||
Řádek 20: | Řádek 20: | ||
Pro sestavení morfologické značky můžete kromě následujícího seznamu použít i jednoduchý program pro vytváření tagů, který je integrován do rozhraní [[manualy: | Pro sestavení morfologické značky můžete kromě následujícího seznamu použít i jednoduchý program pro vytváření tagů, který je integrován do rozhraní [[manualy: | ||
+ | |||
+ | ===== Změny v morfologickém značkování mluvených korpusů ===== | ||
===== Popis jednotlivých pozic značky ===== | ===== Popis jednotlivých pozic značky ===== | ||
Řádek 58: | Řádek 60: | ||
| X | neznámý, neurčený, neurčitelný slovní druh | | | X | neznámý, neurčený, neurčitelný slovní druh | | ||
| Z | interpunkce, | | Z | interpunkce, | ||
+ | |||
+ | V korpusu ORALv1 z června 2017 přibyly na první pozici tagu tři značky, specifické pro spontánní mluvenou řeč. | ||
+ | |||
+ | ^ Značka | ||
+ | | F | fragmenty (nedořečená slova) | | ||
+ | | H | neverbální zvuky (např. hezitační) | | ||
+ | | M | komentáře přepisujících (v kulatých závorkách) | | ||
+ | |||
==== Pozice 2 - Detailní určení slovního druhu ==== | ==== Pozice 2 - Detailní určení slovního druhu ==== |