AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:mwe [2026/01/13 00:49] krivanseznamy:mwe [2026/01/23 12:00] (aktuální) – [Značkování víceslovných lexikálních jednotek] krivan
Řádek 1: Řádek 1:
 ====== Značkování víceslovných lexikálních jednotek ====== ====== Značkování víceslovných lexikálních jednotek ======
  
-Počínaje korpusem [[cnk:syn:verze14|SYNv14]] označujeme v korpusech víceslovné lexikální jednotky (VLJ) novým značením propojeným s databází VLJ LEMUR (**L**exicon of **Mu**ltiword Exp**r**essions). Toto značkování je zatím spuštěno v pilotní verzi a navazuje na dosavadní [[seznamy:frazemy|značkování frazémů nástrojem FRANTA]].+Počínaje korpusem [[cnk:syn:verze14|SYNv14]] označujeme v korpusech víceslovné lexikální jednotky (VLJ) novým značením propojeným s [[https://db.korpus.cz/search/_lemur_simple|databází VLJ LEMUR]] (**L**exicon of **Mu**ltiword Exp**r**essions). Toto značkování je zatím spuštěno v pilotní verzi a navazuje na dosavadní [[seznamy:frazemy|značkování frazémů nástrojem FRANTA]].
  
 <WRAP round important 70%> <WRAP round important 70%>
Řádek 17: Řádek 17:
 **mwe_tag** (multi-word expression tag): poziční [[pojmy:tag|tag]] víceslovné jednotky s deseti pozicemi.  **mwe_tag** (multi-word expression tag): poziční [[pojmy:tag|tag]] víceslovné jednotky s deseti pozicemi. 
  
-===== 1. pozice =====+==== 1. pozice ====
  
 Na první pozici označujeme typ užití VLJ (např. přísloví, citace, slovesný frazém).  Na první pozici označujeme typ užití VLJ (např. přísloví, citace, slovesný frazém). 
Řádek 37: Řádek 37:
 | **v** | slovesný frazém | vidět_na_vlastní_oči | | **v** | slovesný frazém | vidět_na_vlastní_oči |
  
-===== 2. pozice =====+==== 2. pozice ====
  
 Druhá pozice rozlišuje syntaktický typ dané VLJ (např. jmenná fráze, klauze, souvětí). Přesněji jde o syntaktický typ konkrétního dokladu dané VLJ, např. pod mwe_lemmatem ''vytřeštit_oči'' (typ **v**) jsou obsaženy i doklady //vytřeštěné oči// a //třeštící oči// (typ **a**). Druhá pozice rozlišuje syntaktický typ dané VLJ (např. jmenná fráze, klauze, souvětí). Přesněji jde o syntaktický typ konkrétního dokladu dané VLJ, např. pod mwe_lemmatem ''vytřeštit_oči'' (typ **v**) jsou obsaženy i doklady //vytřeštěné oči// a //třeštící oči// (typ **a**).
Řádek 55: Řádek 55:
 | **v** | slovesná fráze plnovýznamová | lapat_po_dechu | | **v** | slovesná fráze plnovýznamová | lapat_po_dechu |
  
-===== 3. pozice =====+==== 3. pozice ====
  
 Je-li označená VLJ výsledkem syntaktické transformace (např. pasivizace či nominalizace) základní varianty VLJ, označujeme to na třetí pozici. Je-li označená VLJ výsledkem syntaktické transformace (např. pasivizace či nominalizace) základní varianty VLJ, označujeme to na třetí pozici.
Řádek 70: Řádek 70:
 | **T** | verbální adjektivum zakončené na -telný/-itelný | viditelný pouhým okem (vidět_pouhým_okem) |  | **T** | verbální adjektivum zakončené na -telný/-itelný | viditelný pouhým okem (vidět_pouhým_okem) | 
  
-===== Další pozice =====+==== Další pozice ====
  
 Pozice 4-9 zůstávají zatím nevyužité (hodnota **_**), protože dané vlastnosti VLJ nejsou v databázi LEMUR dostatečně spolehlivě anotované. Pozice 4-9 zůstávají zatím nevyužité (hodnota **_**), protože dané vlastnosti VLJ nejsou v databázi LEMUR dostatečně spolehlivě anotované.