AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
cnk:syn2020:seznamy:tokenizace_dohromady [2020/12/22 14:55] – [Slova se spojovníkem] jankrivancnk:syn2020:seznamy:tokenizace_dohromady [2020/12/22 14:56] – [Slova se spojovníkem] jankrivan
Řádek 5: Řádek 5:
 V této sekci najdete seznamy slov, která obsahují spojovník, ale přesto jsou v korpusu SYN2020 (v případě jejich výskytu) tokenizována jako jedna jednotka. Jde zejména o  V této sekci najdete seznamy slov, která obsahují spojovník, ale přesto jsou v korpusu SYN2020 (v případě jejich výskytu) tokenizována jako jedna jednotka. Jde zejména o 
  
-  * přejatá slova a slova od nich odvozená (bail-out, in-liny), některé názvy produktů a firem (H-System) a matematické výrazy označující proměnné (k-tice, n-tý) a+  * přejatá slova a slova od nich odvozená (//bail-out////in-liny//), některé názvy produktů a firem (//H-System//) a matematické výrazy označující proměnné (//k-tice////n-tý//) 
   * konvenci zachycení asijských (nebo jiných neevropských, fikčních apod.) jmen.   * konvenci zachycení asijských (nebo jiných neevropských, fikčních apod.) jmen.