AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Korpus SYN2020: Seznamy

Na této stránce naleznete přehled všech seznamů slov, které byly vydány ke korpusu SYN2020.

Tokenizace

Lemmatizace a značkování

Seznam slov se spojovníkem/pomlčkou tokenizovaných dohromady jako jeden token

V této sekci najdete seznam slov, která obsahují spojovník, ale přesto jsou v korpusu SYN2020 tokenizována jako jedna jednotka. Jde zejména o

  • přejatá slova a slova od nich odvozená (bail-out, in-liny), některé názvy produktů a firem (H-System) a matematické výrazy označující proměnné (k-tice, n-tý) a
  • konvenci zachycení asijských (nebo jiných neevropských, fikčních apod.) jmen.

Běžně užívaná slova

a-tý, all-in-one, Ant-Man, anti-aging, anti-agingový, au-pair, au-pairka, B-komplex, b-tý, bail-out, blu-ray, C-reaktivní, c-tý, Coca-Cola, coca-cola, Coca-cola, coca-colový, cut-off, čchi-kung, d-tý, dial-up, dot-com, dot-comový, drive-in, Dum-dum, e-banking, e-book, e-cigareta, e-cigaretový, E-coli, e-government, e-kniha, e-knihovna, e-knížka, e-knižní, e-learning, e-learningový, e-mail, e-mailování, e-mailovat, e-mailový, E-on, e-podpis, e-recept, e-shop, e-shopový, e-twinningový, er-forma, feng-shui, feng-šuej, Feng-šuej, Feng-žuej, gore-tex, H-System, ha-šoa, head-up, hi-fi, hi-fikvalita, hi-fiměnič, hi-fina, hi-fiprodukt, hi-fisestava, hi-fisouprava, hi-fisoustava, hi-fisystém, hi-fivěž, hi-fizvuk, hi-tech, hi-tech, hi-techový, hip-hop, cha-cha, check-in, check-out, i-tý, ich-forma, ich-formový, In-karta, in-line, in-linista, in-linový, in-liny, in-store, j-tý, jin-jang, jin-jangový, jiu-jitsu, Jiu-jitsu, K-centrum, k-krát, k-tice, k-tý, kick-down, know-how, Koh-i-noor, Kon-Tiki, ku-klux-klan, kung-fu, kung-pao, Kung-pao, L-karnitin, l-tý, li-ion, li-ionka, li-ionový, li-iontový, lo-fi, low-end, low-endový, m-krát, m-tý, make-up, marx-leninismus, marx-leninský, mash-up, n-krát, n-násobek, n-násobný, n-tý, net-a-porter, Obi-Wan, off-line, off-road, on-line, op-art, op-artový, opt-in, opt-out, Pac-Man, Pac-Manův, pepsi-cola, Pchu-er, pick-up, pick-upový, pin-up, pin-upka, ping-pong, play-up, plug-in, pop-art, pop-artově, pop-artový, pop-up, Post-It, prét-a-porter, propan-butan, Pu-erh, push-up, push-upka, r-krát, r-násobný, real-time, real-timový, rendez-vous, RM-Systém, roll-on, roll-up, S-Bahn, S-karta, s-tý, s'-čchuanský, sado-maso, sado-masochismus, sado-masochistický, sci-fi, sci-fiatmosféra, sci-fičlánek, sci-fidancefloor, sci-fidebut, sci-fideník, sci-fidoba, sci-fidobrodružství, sci-fiepos, sci-fifanoušek, sci-fifantasy, sci-fifikomedie, sci-fifilm, sci-fihit, sci-fihoror, sci-fihra, sci-fihrdinka, sci-fiklasika, sci-fikniha, sci-fikomedie, sci-fikomiks, sci-filiteratura, sci-fiměsíčník, sci-fiměsto, sci-finovela, sci-fipodpatky, sci-fipohádka, sci-fipovídka, sci-fiprostředí, sci-fiprvek, sci-fipředstava, sci-fipříběh, sci-firáj, sci-firodinka, sci-firomán, sci-fisága, sci-fiscénář, sci-fiseriál, sci-fisérie, sci-fisnímek, sci-fispisovatel, sci-fistrategie, sci-fistřílečka, sci-fisvět, sci-fitechnologie, sci-fitematika, sci-fitématika, sci-fititul, sci-fitrhák, sci-fitrilogie, sci-fiuniverzum, sci-fiutopie, sci-fivesmírný, sci-fivize, sci-fiwestern, sci-fizávody, sci-fižánr, Shangri-la, shi-tzu, shih-tzu, Shih-tzu, shii-take, spin-off, stand-by, stand-up, start-up, super-star, Šangri-la, T-bone, T-mobile, T-Rex, T-shirt, t-tý, tae-bo, tai-či, tank-mix, tchai-ťi, tchaj-ti, tie-break, tie-breakový, tiki-taka, time-out, trip-hop, true-typový, tse-tse, Ty-já-tr, U-Bahn, U-rampa, Wal-Mart, wi-fi, Wi-Fi, wi-fiaccess, wi-fiadaptér, wi-fianténa, Wi-fiDirect, wi-fifree, wi-fihotspot, wi-fiintegrovaný, Wi-fiIntel, wi-fiinternet, wi-fiinternetový, wi-fikamera, wi-fikarta, Wi-fimesh, Wi-fiMini, wi-fimodem, wi-fimodul, Wi-fipaměti, wi-fipropojení, wi-fipřijímač, wi-fipřipojení, wi-fipřístup, wi-fireproduktor, wi-firouter, wi-firozhraní, wi-fisignál, wi-fisíť, wi-fistandard, wi-fitechnologie, Wi-fitethering, wi-fitlačítko, wi-fizóna, win-win, wu-shu, X-Factor, X-Files, X-Man, x-manovský, x-tý, ylang-ylang, Z-karta, zen-buddhismus, zen-buddhista, zen-buddhistický, zen-buddhistka.

Asijská jména

Aj-kuo, Aj-lien, An-chuej, An-jang, An-ling, An-shih, An-š', An-šun, An-tung, Bagh-e, Binimel-la, C'-jang, Ce-min, Ce-tchien, Ce-tung, Cch'-sin, Cchaj-sin, Cchang-čou, Cchung-ming, Cing-chua, Cung-nien, Cuo-lin, Č'-šeng, Čang-čou, Čang-chua, Čang-chua-Kao-siung, Čang-jie, Čang-su, Če-in, Če-jong, Če-on, Če-pom, Če-ťiang, Če-un, Čen-čen, Čen-in, Čen-jün, Čen-ming, Čen-ning, Čeng-čchao, Čeng-čou, Čeng-i, Čhung-čching|Čhung-čchingu, Čcha-já, Čchan-kan, Čchang-an, Čchang-čching, Čchang-čchun, Čchang-čou, Čchang-e, Čchang-fu, Čchang-kuej, Čchang-lo, Čchang-paj, Čchang-ša, Čchang-tchang, Čchang-ťiang, Čchao-jang, Čchao-liang, Čcheng-tu, Čchi-jang, Čchi-jüan, Čchi-šan, Čchien-tao, Čchien-žuej, Čchin-ling, Čching-čao, Čching-čcheng, Čching-čchuan, Čching-chaj, Čching-chua, Čching-lien, Čching-lin, Čching-ming, Čching-tao, Čchiung-chaj, Čchiung-laj, Čchu-čou, Čchun-čchiao, Čchun-jing, Čchun-sien, Čchung-čching, Čchung-jang, Čchung-tching, Či-min, Či-song, Či-un, Čin-jong, Čing-tao, Čon-na, Čong-čchol, Čong-hui, Čong-il, Čong-jang, Čong-jong, Čong-nam, Čong-suk, Čong-un, Čonk-suk, Čou-čuang, Čou-šan, Ču-chaj, Ču-jong, Ču-jung, Ču-ti, Čung-č', Čung-čou, Čung-che, Čung-i, Čung-kuo, Čung-min, Čung-nan-chaj, Čung-pching, Čung-suk, Čung-šu, Čung-ťün, Dai-iči, Dang-dong, Dašt-e, Dum-dum, Džin-šim, En-laj, Er-chaj, Fa-lun, Fang-čou, Feng-čou, Feng-šan, Feng-tchaj, Fu-čou, Fu-lin, Fu-ling, Fu-sang, Fu-ťien, Fudži-san, Hao-ching, Haram-e, Hazrat-e, He-čchan, He-chaluc, Hee-beom, Hje-kjong, Hje-rim, Hjo-čun, Hjon-hu, Hjun-jun, Hon-jong, Hung-min, Cha-mi, Chae-rin, Chaj-čcheng, Chaj-feng, Chaj-jang, Chaj-nan, Chaj-nan|Chaj-nanu, Chaj-tien, Chan-čchao, Chan-woo, Chan-wook, Chang-čou, Chang-dong, Chao-ming, Che-nan, Che-pej, Che-tchien, Chej-che, Cheng-du, Chu-čou, Chu-lan, Chu-nan, Chu-pej, Chua-feng, Chua-chua, Chua-lien, Chua-tcheng, Chuaj-chaj, Chuaj-che, Chuaj-nan, Chuan-chu, Chuan-chuan, Chuang-che, Chuang-pchu, Chuang-šan, Chuej-cung, Chuej-čou, Chuej-chuej, Chuej-kang, Chung-kchou, Chung-liang, Chung-po, Chung-š', Chung-wej, Chung-wen, I-čchien, I-Fan, I-ming, I-mou, I-wu, Il-čchon, Il-song, Il-sung, Ir-sen, Issyk-kul, Ja-an, Ja-lu, Ja-pching, Jae-in, Jang-c', Jang-c'-ťiang, Jang-c'ťiang, Jang-čou, Jang-ming, Jang-ťiang, Jao-pang, Je-son, Jen-an, Jen-čcheng, Jen-čchi, Jen-hsun, Jen-chua, Jen-jen, Jen-nan, Jen-sung, Jen-šeng, Jen-tchaj, Ji-lin, Ji-nan, Jie-suej, Jing-jing, Jing-ťiou, Jing-wen, Jong-čchol, Jong-ho, Jong-hui, Jong-chol, Jong-il, Jong-kwon, Jong-mu, Jong-nam, Jong-so, Jong-suk, Jong-taem|Jong-tao, Joon-ho, Jou-cchaj, Jou-wej, Jü-čcheng, Jü-jüan, Jü-šan, Jüan-ming-jüan, Jün-šan, Jun-ťioua, Jung-čcheng, Jung-čching, Jung-čo|Jung-čou, Jung-čou, Jung-chung, Jung-kchang, Jung-ting, Jwing-ming, Ka-i, Ka-shing, Kaa-wa, Kan-su, Kao-jou, Kao-li, Kao-lim, Kao-siung, Ke-pching, Kcha-šing, Kchaj-k Kchang-ting, Kche-čchiang, Kche-čchin, Kche-čching, Kche-pching, Kche-ťin, Kchun-lun, Kchun-ming, Kchun-šan, Kchung-ming, Ki-duk, Ki-mun, Kin-man, Kjo-an, Kjong-hi, Kjong-tu, Kuan-čung, Kuan-ťiao, Kuan-tung, Kuang-čou, Kuang-chu|Kuang-chua, Kuang-jao, Kuang-jao|Kuang-já, Kuang-jü, Kuang-ming, Kuang-si, Kuang-su, Kuang-tung, Kuej-čou, Kuej-jing, Kuej-lin, Kun-hee, Kun-hje, Kuo-an, Kuo-čchiang, Kuo-chua, Kuo-kuang, Kuo-pin, Kwok-hung, Kyung-min, Laj-kuej, Laj-ťün, Lan-čou, Lan-tchien, Lao-c, Lao-c', Lao-kai, Lao-šan, Li-c', Li-č', Li-chu, Li-lian, Li-ming, Li-ou, Li-po, Li-šuej, Li-tiang, Li-ťiang, Li-ťing, Li-ťün, Li-žen, Liang-šan, Liao-jang, Liao-ning, Lien-jün-kang, Lien-kche, Liko-s, Lin-i, Lin-ťin, Ling-ling, Ling-wej, Lu-ku, Lu-neng, Lung-chua, Lung-chuej, Lung-jang, Lung-jen, Lung-si, Lung-sing, Luo-jang, Luo-kche, Mao-čchun, Mej-čou, Mej-ling, Mej-mej, Mej-si, Meng-i, Mien-ču, Mien-jang, Min-ho, Min-sok, Min-šeng, Min-ťiang, Min-ťün, Ming-čche, Ming-chuej, Ming-kchang, Ming-ming, Mjong-bak, Mjong-ki, Mjong-kjon, Mo-che, Mo-je, Nakš-e, Nan-čchang, Nan-čchiao, Nan-čchung, Nan-chua, Nan-king, Nan-nan, Nan-ning, Nan-si, Nan-šan, Nan-ťing, Ni-na, Ning-ning, Ning-po, Paj-čchang, Paj-se, Paj-š', Pao-sing, Pej-chaj, Pej-ťing, Pen-si, Pcheng-čcheng, Pching-jaa|Pching-jao, Pching-jao, Pching-liang, Pching-pching, Pching-tchang, Pchjong-il, Pcho-jang, Pchu-i, Pchu-tung, Pchunggje-ri, Pien-liang, Pin-pin, Ping-ping, Po-chaj, Po-jang, Po-lin, Po-ta, Pyong-il, S'-čchuan, Saj-saj, San-já, San-men, Se-čong, Se-dol, Se-tol, Si-an, Si-an|Si-anu, Si-čchang, Si-čcheng, Si-čching, Si-laj, Si-si, Si-tan, Si-ti, Si-ťiang, Sia-men, Siang-žu, Siao-čchen, Siao-čchiou, Siao-čchuan, Siao-čchun, Siao-che, Siao-chuej, Siao-i, Siao-jüan, Siao-kang, Siao-lin, Siao-mej, Siao-ming, Siao-pching, Siao-ping, Siao-po, Siao-šan, Siao-tung, Sien-jang, Sien-tchien, Sien-tching, Sien-ťin, Sin-ču, Sin-chua, Sin-i, Sin-jang, Sin-jen, Sin-jü, Sin-ling, Sin-šiang, Sin-ťiang, Sing-ťien, Sing-sing, Sing-tou, Sing-wen, Sok-hi, Sol-ču, Sol-song, Son-mjong, Son-sil, Song-čin, Song-ho, Song-jung, Song-tchek, Su-čou, Sung-kju, Sung-man, Sung-ťiang, Š'-chuang-ti, Š'-wen, Šan-dong, Šan-si, Šan-šan, Šan-tchou, Šan-tung, Šang-kchun, Šao-čchi, Šao-jung, Šao-kuan, Šao-sing, Šao-š', Šao-šan, Šen-čen, Šen-čou, Šen-chua, Šen-jang, Šen-nung, Šen-si, Šeng-s', Šeng-sien, Šeng-ťi, Šou-tea, Šou-wen, Šu-čen, Šu-čching, Šu-čung, Šu-fu, Šu-wej, Šuej-show, Šun-i, Ta-čching, Ta-jen, Ta-lian, Ta-lien, Ta-pao, Ta-pin, Ta-pu, Ta-sin, Ta-sing, Ta-tchung, Ta-tu, Tai-chi, Tan-jang-Kchun-šan, Ťan-šan, Tan-tan, Tan-tung, Te-čo, Te-džung, Te-chuaj, Te-min, Te-šeng, Tchai-pej, Tchaj-an, Tchaj-čung, Tchaj-chu, Tchaj-nan, Tchaj-pej, Tchaj-pching, Tchaj-po, Tchaj-šan, Tchaj-wan, Tchang-šan, Tchao-pao, Tchie-ťün, Tchien-an-men, Tchien-che, Tchien-jang, Tchien-kung, Tchien-tchien, Tchien-ťin, Tchien-ťing, Tchien-wan, Tchu-men, Tchung-čou, Tchung-chua, Tchung-ling, Tchung-pcho, Tchung-žen, Tchuo-ťiang, Ťi-kchun, Ti-lin, Ťi-lin, Ťi-lung, Ťi-nan, Ťi-wej, Ťia-jin, Ťia-pao, Ťia-sing, Ťia-ťia, Ťia-ťia|Ťia-ťiao, Ťia-wej, Ťiang-čching, Ťiang-si, Ťiang-su, Ťiao-čou, Ťie-min, Ťien-cung, Ťien-chua, Ťien-jie, Ťien-jing, Ťien-kchuej, Ťien-kuo, Ťien-mej, Ťien-min, Ťien-ming, Ťien-sin, Ťien-siung, Ťien-wej, Ťieng-ming, Tin-chuej, Ťin-ling, Ťin-men, Ťin-pching, Ťin-sun, Ťin-tchaa|Ťin-tchao, Ťin-tchao, Ťin-ťiang, Ťing-c', Ťing-čou, Ťing-čung, Ťing-jen, Ťing-lej, Ťing-pching, Ťing-pien, Ťing-šan, Ťing-šeng, Ťing-ťing, Ton-hjuk, Tong-pin, Tu-hwan, Tu-siou, Tun-chuang, Tun-i, Tung-čcheng, Tung-jing, Tung-kuan, Tung-pcho, Tung-pin, Tung-tung, Ui-hwou, Un-kju, Wai-ching, Wan-čou, Wan-nien, Wang-lang, Wej-min, Wej-ning, Wej-te, Wej-ti, Wej-ťing, Wej-wej, Wen-čcheng, Wen-čchuan, Wen-čou, Wen-pin, Wen-siang, Wen-ťie, Wen-ťün, Wi-fije, Wo-lung, Won-hong, Won-taek, Wu-čen, Wu-čchang, Wu-čchiao, Wu-chan, Wu-jen, Wu-kchung, Wu-ťi|Wu-ťia, Xi-an, Yang-tse, Yiu-ming, Yong-ho, Yung-jan, Žu-kao, Žuej-kang, Žung-čcheng, Žung-ťi.

Seznam slov začínajících číslicí a tokenizovaných dohromady

  • Konvencializované zkratky

2D, 3D, 4D, 5D, 3G, 4G, 5G, 3M, 5P

  • Složeniny obsahující číslovku a odvozeniny od číslovek

V seznamu uvádíme pouze alfabetickou druhou část

ampérový, arový, bilionkrát, bilionový, bodový, boký, centimetrový, členný, denní, dílný, dolarový, dveřový, gigabitový, gramový, hektarový, hlavý, hodinový, hranný, hvězdičkový, chodový, kanálový, karátový, kilogramový, kilometrový, kilový, kilowattový, kolový, koňový, korunový, krát, kubíkový, letý, litrový, megapixelový, megawattový, megový, měsíční, metrový, mikronový, miliardkrát, miliardový, miligramový, mililitrový, milimetrový, milionový, minutový, místný, násobek, násobně, násobný, osý, palcový, patrový, pístkový, podlažní, pokojový, polový, pozicový, pozicový, procentní, prstý, prvkový, qubitový, ramenný, ranný, rozměrný, rychlostní, řadý, sekundový, stěn, stránkový, stupňový, ti, tiletý, timegawatový, tiny, tiprocentní, tisícový, tunový, tý, týdenní, úhelník, voltový, vrstvý, vteřinový, wattový, zubý.