AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
seznamy:tagy [2016/10/31 17:51] – [Pozice 15 - Varianta (stylový příznak)] michalkrenseznamy:tagy [2017/06/15 17:27] – [Pozice 1 - Slovní druh] michalkren
Řádek 13: Řádek 13:
 V případě, že značka je tvořena symbolem, který v rámci regulárních výrazů má speciální význam, je třeba naznačit zpětným lomítkem, že máme na mysli doslovný význam znaku. Např. pomocí znaku hvězdičky (*) jsou na druhé pozici tagovány výrazy jako plus, krát apod. ve funkci spojek (J). Chceme-li vyhledat slova s tímto tagem, musíme před hvězdičku přidat zpětné lomítko, abychom vyznačili, že nejde o její speciální význam: ''[tag=%%"J\*.*"%%]'' (viz [[pojmy:regularni_vyrazy|regulární výrazy]]). V případě, že značka je tvořena symbolem, který v rámci regulárních výrazů má speciální význam, je třeba naznačit zpětným lomítkem, že máme na mysli doslovný význam znaku. Např. pomocí znaku hvězdičky (*) jsou na druhé pozici tagovány výrazy jako plus, krát apod. ve funkci spojek (J). Chceme-li vyhledat slova s tímto tagem, musíme před hvězdičku přidat zpětné lomítko, abychom vyznačili, že nejde o její speciální význam: ''[tag=%%"J\*.*"%%]'' (viz [[pojmy:regularni_vyrazy|regulární výrazy]]).
  
-===== Změny v morfologickém značkování =====+===== Změny v morfologickém značkování psaných korpusů =====
  
 S uveřejněním korpusu [[cnk:syn2005|SYN2005]] byla přidána 16. pozice, vyjadřující slovesný vid. I všechny následující korpusy používají morfologickou značku, kterou tvoří 16 pozic.  S uveřejněním korpusu [[cnk:syn2005|SYN2005]] byla přidána 16. pozice, vyjadřující slovesný vid. I všechny následující korpusy používají morfologickou značku, kterou tvoří 16 pozic. 
Řádek 20: Řádek 20:
  
 Pro sestavení morfologické značky můžete kromě následujícího seznamu použít i jednoduchý program pro vytváření tagů, který je integrován do rozhraní [[manualy:kontext:index|KonText]]. Pro sestavení morfologické značky můžete kromě následujícího seznamu použít i jednoduchý program pro vytváření tagů, který je integrován do rozhraní [[manualy:kontext:index|KonText]].
 +
 +===== Změny v morfologickém značkování mluvených korpusů =====
  
 ===== Popis jednotlivých pozic značky ===== ===== Popis jednotlivých pozic značky =====
Řádek 58: Řádek 60:
 |  X | neznámý, neurčený, neurčitelný slovní druh | |  X | neznámý, neurčený, neurčitelný slovní druh |
 |  Z | interpunkce, hranice věty | |  Z | interpunkce, hranice věty |
 +
 +V korpusu ORALv1 z června 2017 přibyly na první pozici tagu tři značky, specifické pro spontánní mluvenou řeč. 
 +
 +^  Značka  ^  Význam  ^
 +|  F | fragmenty (nedořečená slova) |
 +|  H    | neverbální zvuky (např. hezitační) |
 +|  M | komentáře přepisujících (v kulatých závorkách) |
 +
  
 ==== Pozice 2 - Detailní určení slovního druhu ==== ==== Pozice 2 - Detailní určení slovního druhu ====