Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
seznamy:tagy [2013/11/10 21:41] – [Popis jednotlivých pozic značky] alexandrrosen | seznamy:tagy [2022/04/18 18:32] (aktuální) – jankrivan | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | ===== Popis jednotlivých pozic značky ===== | + | ====== Morfologické |
- | Pozice | + | Morfologické [[pojmy: |
+ | |||
+ | Morfologická analýza je obecně nejednoznačná; | ||
+ | |||
+ | Morfologické značky slouží k snadnějšímu hledání v korpusech (povětšinou pouze [[cnk: | ||
+ | |||
+ | Morfologická analýza je předmětem neustálého vyvoje a zlepšování. V různých korpusech proto můžete narazit na různé verze analýzy, což se může projevit v odlišnostech jak u anotačního schématu, tak u samotných výsledků a jejich chybovosti. | ||
+ | ===== Struktura značky ===== | ||
+ | |||
+ | [{{: | ||
+ | Každá značka je počínaje korpusem SYN2020 řetězcem 15 znaků (ke změnám ve značkování viz následující oddíl). | ||
+ | |||
+ | Značka je konstruována tak, aby každá | ||
+ | |||
+ | V případě, že značka je tvořena symbolem, který má v rámci [[pojmy: | ||
+ | |||
+ | ===== Změny v morfologickém značkování psaných korpusů ===== | ||
+ | |||
+ | Se zveřejněním korpusu [[cnk: | ||
+ | |||
+ | === Původní morfologická značka (vývoj značení) === | ||
+ | |||
+ | 1. V prvních zveřejněných | ||
+ | |||
+ | 2. S uveřejněním korpusu | ||
+ | |||
+ | 3. S publikací korpusu [[cnk: | ||
+ | |||
+ | Na [[seznamy: | ||
+ | |||
+ | === Aktuální morfologická značka === | ||
+ | |||
+ | Počínaje korpusem [[cnk: | ||
+ | |||
+ | Zároveň však došlo ke změnám ve značení na jednotlivých pozicích: Na 1. pozici (slovní druh) se nově rozlišují hodnoty F (cizí slovo), B (zkratka) a S (segment). Na 2. pozici (detailní určení slovního druhu) jsou v souvislosti s novými slovními druhy zavedeny nové značky a jiné jsou naopak zrušeny, komplexně bylo upraveno členění číslovek a také vznikla značka 0 pro identifikaci nekoncové interpunkce. K jedné změně dále dochází na 15. pozici (varianta): číslo 8 (dosud vyhrazené zkratkám) se nově využívá jako značka pro další hovorovou variantu. Podrobný popis změn ve vztahu k původní značce je uveden na stránce [[cnk: | ||
+ | |||
+ | Níže uvádíme kompletní přehled pozic aktuální morfologické značky. | ||
+ | |||
+ | ===== Nástroj pro sestavení morfologické značky ===== | ||
+ | |||
+ | Pro sestavení morfologické značky můžete kromě následujícího seznamu použít i jednoduchý program pro vytváření tagů, který je integrován do rozhraní [[manualy: | ||
+ | |||
+ | ===== Popis jednotlivých pozic aktuální morfologické značky ===== | ||
+ | |||
+ | Pozice jsou číslovány od 1 do 15. Každé pozici odpovídá jiná gramatická kategorie: | ||
- [[seznamy: | - [[seznamy: | ||
Řádek 15: | Řádek 59: | ||
- [[seznamy: | - [[seznamy: | ||
- [[seznamy: | - [[seznamy: | ||
- | - pozice nepoužita | + | - [[seznamy: |
- pozice nepoužita | - pozice nepoužita | ||
- [[seznamy: | - [[seznamy: | ||
- | | + | |
+ | ==== Pozice 1 - Slovní druh ==== | ||
+ | |||
+ | Označuje hlavní slovní druh, víceméně podle obvyklého schématu známého z českých gramatik včetně školních (viz tabulka v následujícím oddíle): N (substantivum), | ||
+ | |||
+ | Nové slovní druhy S, B a F jsou představeny na stránce | ||
+ | |||
+ | ==== Pozice 2 - Detailní určení slovního druhu ==== | ||
+ | |||
+ | Detailní určení slovního druhu slouží především k zachycení dalších relevantních morfologických kategorií, které jsou uvedeny na dalších pozicích (ne vždy však jednoznačně). Ze znaku použitého pro detailní určení slovního druhu je možné vyvodit hlavní slovní druh (s tou výjimkou, že teoreticky každý znak může vedle svého hlavního slovního druhu značit i proměnné slovní druhy B (zkratka) a S (segment, přesněji sufixoid). | ||
+ | |||
+ | ==== Souhrnný přehled pozic 1 a 2 ==== | ||
+ | |||
+ | ^ Poz. 1 ^ Slovní druh ^ Poz. 2 ^ Detailní určení slovního druhu ^ | ||
+ | | N | substantivum (podstatné jméno) | N | substantivum obyčejné | | ||
+ | | A | adjektivum (přídavné jméno) | | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | P | pronomen (zájmeno) | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | C | numerál (číslovka, | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | V | verbum (sloveso) | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | D | adverbium (příslovce) | ||
+ | | ::: | ::: | ||
+ | | R | prepozice (předložka) | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | J | konjunkce (spojka) | ||
+ | | ::: | ::: | ||
+ | | ::: | ::: | ||
+ | | T | partikule (částice) | ||
+ | | I | interjekce (citoslovce) | ||
+ | | S | segment | ||
+ | | ::: | ::: | ||
+ | | B | zkratka | [ ] | u zkratek se na druhé pozici vyskytují detailní určení jiných slovních druhů v závislosti na tom, jaké slovo zkratka zkracuje | ||
+ | | Z | interpunkce, | ||
+ | | ::: | ::: | ||
+ | | F | cizí slovo | % | cizí slovo | | ||
+ | | X | neznámý, neurčený, neurčitelný slovní druh | @ | morfologickou analýzou nerozpoznaný tvar | | ||
+ | | ::: | ::: | ||
+ | |||
+ | |||
+ | ==== Pozice 3 - Jmenný rod ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | M | maskulinum animatum (rod mužský životný) | | ||
+ | | I | maskulinum inanimatum (rod mužský neživotný) | | ||
+ | | F | femininum (ženský rod) | | ||
+ | | N | neutrum (střední rod) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 4 - Číslo ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | S | singulár (jednotné číslo) | | ||
+ | | P | plurál (množné číslo) | | ||
+ | | D | duál (pouze 7. pád feminin) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 5 - Pád ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | 1 | nominativ (1. pád) | | ||
+ | | 2 | genitiv (2. pád) | | ||
+ | | 3 | dativ (3. pád) | | ||
+ | | 4 | akuzativ (4. pád) | | ||
+ | | 5 | vokativ (5. pád) | | ||
+ | | 6 | lokál (6. pád) | | ||
+ | | 7 | instrumentál (7. pád) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 6 - Přivlastňovací rod ==== | ||
+ | |||
+ | Vyjadřuje rod subjektu nebo objektu, jemuž zájmeno nebo adjektivum přivlastňuje: | ||
+ | |||
+ | Rody mužský neživotný a střední se nikdy jako samostatná kategorie nevyskytují. Rod mužský životný (M) se může vyskytnout jen u přivlastňovacích adjektiv. | ||
+ | |||
+ | ^ Značka | ||
+ | | M | maskulinum animatum (rod mužský životný) | | ||
+ | | F | femininum (ženský rod) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 7 - Přivlastňovací číslo ==== | ||
+ | |||
+ | Kategorie, která se uplatňuje u zájmen: //můj, tvůj, jeho// atp. představují přivlastňovací singulár, protože přivlastňují subjektu nebo objektu v singuláru, zatímco //náš, váš jejich// jsou označeny jako přivlastňovací plurál. | ||
+ | |||
+ | ^ Značka | ||
+ | | S | singulár (jednotné číslo) | | ||
+ | | P | plurál (množné číslo) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 8 - Osoba ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | 1 | 1. osoba | | ||
+ | | 2 | 2. osoba | | ||
+ | | 3 | 3. osoba | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 9 - Čas ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | P | prézens (přítomný čas) | | ||
+ | | R | minulý čas | | ||
+ | | F | futurum (budoucí čas) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 10 - Stupeň ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | 1 | 1. stupeň (pozitiv) | | ||
+ | | 2 | 2. stupeň (komparativ) | | ||
+ | | 3 | 3. stupeň (superlativ) | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 11 - Negace ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | A | afirmativ (bez negativní předpony " | ||
+ | | N | negace (tvar s negativní předponou " | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 12 - Aktivum/ | ||
+ | |||
+ | ^ Značka | ||
+ | | A | aktivum nebo ' | ||
+ | | P | pasívum | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 13 - Vid ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | P | perfektivum (dokonavé sloveso) | | ||
+ | | I | imperfektivum (nedokonavé sloveso) | | ||
+ | | B | obouvidé sloveso | | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 14 - Nepoužito ==== | ||
+ | |||
+ | ^ Značka | ||
+ | | - | neurčuje se | | ||
+ | |||
+ | ==== Pozice 15 - Varianta (stylový příznak) ==== | ||
+ | |||
+ | Značkování stylového příznaku je z podstaty věci značně subjektivní a vázané na širší kontext, který při automatickém zpracování nelze brát v úvahu. Hodnoty přisuzované jednotlivým jevům jsou založeny na hodnocení, které se objevují v tradičních jazykovědných příručkách, | ||
+ | |||
+ | ^ Značka | ||
+ | | 1 | varianta víceméně rovnocenná | | ||
+ | | 2 | varianta gramaticky nebo stylisticky příznaková, | ||
+ | | 3 | další varianta gramaticky nebo stylisticky příznaková, | ||
+ | | 4 | další varianta gramaticky nebo stylisticky příznaková, | ||
+ | | 5 | další varianta stylisticky příznaková, | ||
+ | | 6 | varianta stylisticky příznaková, | ||
+ | | 7 | další varianta stylisticky příznaková, | ||
+ | | 8 | další varianta stylisticky příznaková, | ||
+ | | 9 | speciální použití | | ||
+ | | - | neurčuje se (" | ||
+ | |||
+ | |||
+ |