AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
seznamy:verbtagy_detail [2022/02/08 17:29] – [Víceslovné slovesné tvary z hlediska syntaxe a automatického značkování] vladmirpetkevicseznamy:verbtagy_detail [2022/02/08 17:37] – [Poznámka 1] vladmirpetkevic
Řádek 1: Řádek 1:
 ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování====== ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování======
  
-V tomto detailním přehledu nejprve popíšeme, které morfologické kategorie a jejich hodnoty v atributu //verbtag// zachycujeme a kterým slovním tvarům jsou tyto údaje připisovány. Poté předvádíme na příkladech, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec stručně popíšeme některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.+V tomto detailním přehledu je nejprve uvedeno, které morfologické kategorie a jejich hodnoty v atributu //verbtag// se při značkování zachycují a kterým slovním tvarům jsou tyto údaje připisovány. Poté se na příkladech předvádí, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec jsou stručně popsány některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.
  
 Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní). Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní).
Řádek 10: Řádek 10:
  
  
-Nyní uvedeme nejprve přehledově a poté podrobně obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:+V této části je nejprve přehledově a poté podrobně popsán obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:
  
  
Řádek 64: Řádek 64:
  
 Hodnotu V mají: Hodnotu V mají:
-   * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež chápeme jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i:+   * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež se při značkování chápou jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i:
      * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//.      * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//.
      * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//.      * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//.
Řádek 130: Řádek 130:
  
  
-Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... chápeme jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...:+Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... se chápou jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...:
    * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý//    * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý//
  
Řádek 176: Řádek 176:
  
  
-Ve verbtagu nezachycujeme reflexivní diatezi (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm nezachycujeme reflexivní pasivum, značkujeme pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční.+Ve verbtagu není zachycena reflexivní diateze (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm není zachyceno reflexivní pasivum, značkuje se pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční.
  
  
Řádek 202: Řádek 202:
      * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel//      * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel//
  
-Na 4. pozici verbtagu zachycujeme také sémanticky třetí osobu imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.+Na 4. pozici verbtagu je vyjádřena i sémanticky třetí osoba imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.
  
  
Řádek 290: Řádek 290:
 Hodnotu Q mají: Hodnotu Q mají:
      * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q      * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q
-     * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu jsme ji nenalezli.+     * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu nebyla nalezena.
  
 Čas se neuvádí (jeho hodnota je tedy: %%-%%): Čas se neuvádí (jeho hodnota je tedy: %%-%%):