AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:mwe [2026/01/03 02:19] – [Atribut mwe_lemma] krivanseznamy:mwe [2026/01/23 12:00] (aktuální) – [Značkování víceslovných lexikálních jednotek] krivan
Řádek 1: Řádek 1:
 ====== Značkování víceslovných lexikálních jednotek ====== ====== Značkování víceslovných lexikálních jednotek ======
  
-Počínaje korpusem [[cnk:syn2025|SYN2025]] a korpusem [[cnk:syn:verze14|SYNv14]] označujeme v korpusech víceslovné lexikální jednotky (VLJ) novým značením propojeným s databází VLJ LEMUR (**L**exicon of **Mu**ltiword Exp**r**essions). Toto značkování je zatím spuštěno v pilotní verzi a navazuje na dosavadní [[seznamy:frazemy|značkování frazémů nástrojem FRANTA]].+Počínaje korpusem [[cnk:syn:verze14|SYNv14]] označujeme v korpusech víceslovné lexikální jednotky (VLJ) novým značením propojeným s [[https://db.korpus.cz/search/_lemur_simple|databází VLJ LEMUR]] (**L**exicon of **Mu**ltiword Exp**r**essions). Toto značkování je zatím spuštěno v pilotní verzi a navazuje na dosavadní [[seznamy:frazemy|značkování frazémů nástrojem FRANTA]].
  
 <WRAP round important 70%> <WRAP round important 70%>
Řádek 17: Řádek 17:
 **mwe_tag** (multi-word expression tag): poziční [[pojmy:tag|tag]] víceslovné jednotky s deseti pozicemi.  **mwe_tag** (multi-word expression tag): poziční [[pojmy:tag|tag]] víceslovné jednotky s deseti pozicemi. 
  
-===== 1. pozice =====+==== 1. pozice ====
  
 Na první pozici označujeme typ užití VLJ (např. přísloví, citace, slovesný frazém).  Na první pozici označujeme typ užití VLJ (např. přísloví, citace, slovesný frazém). 
Řádek 24: Řádek 24:
 | **c** | citace | důvěřuj,_ale_prověřuj | | **c** | citace | důvěřuj,_ale_prověřuj |
 | **f** | cizojazyčné spojení | comme_il_faut | | **f** | cizojazyčné spojení | comme_il_faut |
 +| **g** | zeměpisný název | České_Budějovice |
 | **j** | větný frazém: jiný než přísloví, pranostiky | nemůžu_si_pomoct | | **j** | větný frazém: jiný než přísloví, pranostiky | nemůžu_si_pomoct |
 | **k** | přirovnání | jako_malý_kluk | | **k** | přirovnání | jako_malý_kluk |
Řádek 36: Řádek 37:
 | **v** | slovesný frazém | vidět_na_vlastní_oči | | **v** | slovesný frazém | vidět_na_vlastní_oči |
  
-===== 2. pozice =====+==== 2. pozice ====
  
-Druhá pozice rozlišuje syntaktický typ dané VLJ (např. jmenná fráze, klauze, souvětí). Přesněji jde o syntaktický typ konkrétního dokladu dané VLJ, např. pod MWE lemmatem vytřeštit_oči (typ **v**) jsou obsaženy i doklady //vytřeštěné oči// a //třeštící oči// (typ **a**).+Druhá pozice rozlišuje syntaktický typ dané VLJ (např. jmenná fráze, klauze, souvětí). Přesněji jde o syntaktický typ konkrétního dokladu dané VLJ, např. pod mwe_lemmatem ''vytřeštit_oči'' (typ **v**) jsou obsaženy i doklady //vytřeštěné oči// a //třeštící oči// (typ **a**).
  
 ^ 2. pozice ^ význam ^ příklad víceslovného lemmatu ^ ^ 2. pozice ^ význam ^ příklad víceslovného lemmatu ^
Řádek 54: Řádek 55:
 | **v** | slovesná fráze plnovýznamová | lapat_po_dechu | | **v** | slovesná fráze plnovýznamová | lapat_po_dechu |
  
-===== 3. pozice =====+==== 3. pozice ====
  
 Je-li označená VLJ výsledkem syntaktické transformace (např. pasivizace či nominalizace) základní varianty VLJ, označujeme to na třetí pozici. Je-li označená VLJ výsledkem syntaktické transformace (např. pasivizace či nominalizace) základní varianty VLJ, označujeme to na třetí pozici.
Řádek 69: Řádek 70:
 | **T** | verbální adjektivum zakončené na -telný/-itelný | viditelný pouhým okem (vidět_pouhým_okem) |  | **T** | verbální adjektivum zakončené na -telný/-itelný | viditelný pouhým okem (vidět_pouhým_okem) | 
  
-===== Další pozice =====+==== Další pozice ====
  
 Pozice 4-9 zůstávají zatím nevyužité (hodnota **_**), protože dané vlastnosti VLJ nejsou v databázi LEMUR dostatečně spolehlivě anotované. Pozice 4-9 zůstávají zatím nevyužité (hodnota **_**), protože dané vlastnosti VLJ nejsou v databázi LEMUR dostatečně spolehlivě anotované.