Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
cnk:nkjp [2018/11/05 12:29]
Adrian Zasina [Klasifikace textů]
cnk:nkjp [2018/11/06 10:25] (aktuální)
Adrian Zasina [Poziční anotace a značkování]
Řádek 39: Řádek 39:
 ===== Poziční anotace a značkování ===== ===== Poziční anotace a značkování =====
  
-Oproti českým korpusům ​NKJP obsahuje navíc poziční atribut specifický pro polštinu, tzv. **flexém**. Jde o kategorii vycházející ze slovních druhů, jež jsou jejím prostřednictvím dále členěny do specifičtějších tříd lexémů. Tak jsou např. ze skupiny substantiv (//subst//) vydělována depreciativa (//depr//), kromě běžných adjektiv (//adj//) jsou rozlišovány jmenné tvary adjektiva a) jsoucí částí složeniny (//adja//, typ //​__biało__-czerwony//,​ //​__sportowo__-rekreacyjny//​),​ b) jsoucí součástí předložkových skupin (//adjp//, typ //po __polsku__//,​ //od __dawna__//​),​ c) v roli přísudku (//adjc//, typ //jestem __pewien__//,​ //był __wesół__ i __zdrów__//​)obzvláště jemná je distinkce slovesných kategorií (více než 10 různých flexémů).+Oproti českým korpusům ​NKJP_1M ​obsahuje navíc poziční atribut specifický pro polštinu, tzv. **flexém**. Jde o kategorii vycházející ze slovních druhů, jež jsou jejím prostřednictvím dále členěny do specifičtějších tříd lexémů. Tak jsou např. ze skupiny substantiv (//subst//) vydělována depreciativa (//depr//), kromě běžných adjektiv (//adj//) jsou rozlišovány jmenné tvary adjektivaa) jsoucí částí složeniny (//adja//, typ //​__biało__-czerwony//,​ //​__sportowo__-rekreacyjny//​),​ b) jsoucí součástí předložkových skupin (//adjp//, typ //po __polsku__//,​ //od __dawna__//​),​ c) v roli přísudku (//adjc//, typ //jestem __pewien__//,​ //był __wesół__ i __zdrów__//​)obzvláště jemná je distinkce slovesných kategorií (více než 10 různých flexémů).
  
 Mimoto se liší polský tagset od českého, jeho podrobný popis (včetně výčtu všech flexémů) najdete [[http://​nkjp.pl/​poliqarp/​help/​ense2.html|zde]]. Mimoto se liší polský tagset od českého, jeho podrobný popis (včetně výčtu všech flexémů) najdete [[http://​nkjp.pl/​poliqarp/​help/​ense2.html|zde]].