Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:syn2020:seznamy:tokenizace_dohromady [2020/12/22 14:54] – [Složeniny obsahující číslovku a odvozeniny od číslovek] jankrivan | cnk:syn2020:seznamy:tokenizace_dohromady [2020/12/22 15:00] – [Konvencializované zkratky] jankrivan | ||
---|---|---|---|
Řádek 3: | Řádek 3: | ||
===== Slova se spojovníkem ===== | ===== Slova se spojovníkem ===== | ||
- | V této sekci najdete seznamy slov, která obsahují spojovník, ale přesto jsou v korpusu SYN2020 tokenizována jako jedna jednotka. Jde zejména o | + | V této sekci najdete seznamy slov, která obsahují spojovník, ale přesto jsou v korpusu SYN2020 |
+ | |||
+ | * přejatá slova a slova od nich odvozená (// | ||
- | * přejatá slova a slova od nich odvozená (bail-out, in-liny), některé názvy produktů a firem (H-System) a matematické výrazy označující proměnné (k-tice, n-tý) a | ||
* konvenci zachycení asijských (nebo jiných neevropských, | * konvenci zachycení asijských (nebo jiných neevropských, | ||
Řádek 35: | Řádek 36: | ||
==== Konvencializované zkratky ==== | ==== Konvencializované zkratky ==== | ||
- | 2D, | + | 2D\\ |
- | 3D, | + | 3D\\ |
- | 4D, | + | 4D\\ |
- | 5D, | + | 5D\\ |
- | 3G, | + | 3G\\ |
- | 4G, | + | 4G\\ |
- | 5G, | + | 5G\\ |
- | 3M, | + | 3M\\ |
- | 5P | + | 5P\\ |
==== Složeniny obsahující číslovku a odvozeniny od číslovek ==== | ==== Složeniny obsahující číslovku a odvozeniny od číslovek ==== |