Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:nkjp [2018/10/31 16:04] – [Jak citovat NKJP_1M] michalkren | cnk:nkjp [2018/11/06 10:25] (aktuální) – [Poziční anotace a značkování] adrianzasina |
---|
| ::: | #typ_urzed | právní texty | 2,97 % | | | ::: | #typ_urzed | právní texty | 2,97 % | |
| ::: | #typ_nd | vědecko-naučné texty | 1,91 % | | | ::: | #typ_nd | vědecko-naučné texty | 1,91 % | |
| ::: | #typ_nklas | non-fiction | 1,00 % | | | ::: | #typ_nklas | nezařazená nebeletristická kniha | 1,00 % | |
| ::: | #typ_listy | korespondence | 0,04 % | | | ::: | #typ_listy | korespondence | 0,04 % | |
| ::: | #typ_lit_poezja | poezie | 0,01 % | | | ::: | #typ_lit_poezja | poezie | 0,01 % | |
===== Poziční anotace a značkování ===== | ===== Poziční anotace a značkování ===== |
| |
Oproti českým korpusům NKJP obsahuje navíc poziční atribut specifický pro polštinu, tzv. **flexém**. Jde o kategorii vycházející ze slovních druhů, jež jsou jejím prostřednictvím dále členěny do specifičtějších tříd lexémů. Tak jsou např. ze skupiny substantiv (//subst//) vydělována depreciativa (//depr//), kromě běžných adjektiv (//adj//) jsou rozlišovány jmenné tvary adjektiva a) jsoucí částí složeniny (//adja//, typ //biało-czerwony//, //sportowo-rekreacyjny//), b) jsoucí součástí předložkových skupin (//adjp//, typ //po polsku//, //od dawna//), c) v roli přísudku (//adjc//, typ //jestem pewien//, //był wesół i zdrów//), obzvláště jemná je distinkce slovesných kategorií (více než 10 různých flexémů). | Oproti českým korpusům NKJP_1M obsahuje navíc poziční atribut specifický pro polštinu, tzv. **flexém**. Jde o kategorii vycházející ze slovních druhů, jež jsou jejím prostřednictvím dále členěny do specifičtějších tříd lexémů. Tak jsou např. ze skupiny substantiv (//subst//) vydělována depreciativa (//depr//), kromě běžných adjektiv (//adj//) jsou rozlišovány jmenné tvary adjektiva: a) jsoucí částí složeniny (//adja//, typ //__biało__-czerwony//, //__sportowo__-rekreacyjny//), b) jsoucí součástí předložkových skupin (//adjp//, typ //po __polsku__//, //od __dawna__//), c) v roli přísudku (//adjc//, typ //jestem __pewien__//, //był __wesół__ i __zdrów__//); obzvláště jemná je distinkce slovesných kategorií (více než 10 různých flexémů). |
| |
Mimoto se liší polský tagset od českého, jeho podrobný popis (včetně výčtu všech flexémů) najdete [[http://nkjp.pl/poliqarp/help/ense2.html|zde]]. | Mimoto se liší polský tagset od českého, jeho podrobný popis (včetně výčtu všech flexémů) najdete [[http://nkjp.pl/poliqarp/help/ense2.html|zde]]. |
Przepiórkowski,. A. – Degórski, Ł. – Murzynowski, G. – Szałkiewicz, Ł. – Czelakowska, A.– Savary, A. – Głowińska, K.: //NKJP_1M: ręcznie znakowany milionowy podkorpus NKJP//. Ústav Českého národního korpusu FF UK, Praha 2018. Dostupný z WWW: http://www.korpus.cz | Przepiórkowski,. A. – Degórski, Ł. – Murzynowski, G. – Szałkiewicz, Ł. – Czelakowska, A.– Savary, A. – Głowińska, K.: //NKJP_1M: ręcznie znakowany milionowy podkorpus NKJP//. Ústav Českého národního korpusu FF UK, Praha 2018. Dostupný z WWW: http://www.korpus.cz |
| |
Degórski, Ł. – Przepiórkowski, A. (2012): Ręcznie znakowany milionowy podkorpus NKJP. In: A. Przepiórkowski – M. Bańko – R. L. Górski – B. Lewandowska-Tomaszczyk (eds), //Narodowy Korpus Języka Polskiego//, pp. 51–58. Warszawa: Wydawnictwo Naukowe PWN. ISBN 978-83-01-16700-4. | Degórski, Ł. – Przepiórkowski, A. (2012): Ręcznie znakowany milionowy podkorpus NKJP. In: A. Przepiórkowski – M. Bańko – R. L. Górski – B. Lewandowska-Tomaszczyk (eds), //[[http://nkjp.pl/settings/papers/NKJP_ksiazka.pdf|Narodowy Korpus Języka Polskiego]]//, pp. 51–58. Warszawa: Wydawnictwo Naukowe PWN. ISBN 978-83-01-16700-4. |
</WRAP> | </WRAP> |
| |
//-- Adrian Zasina, Michal Škrabal// | //-- Adrian Zasina, Michal Škrabal// |
| |