AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Korpus SYN2020: Seznamy slov tokenizovaných dohromady

Slova se spojovníkem

V této sekci najdete seznamy slov, která obsahují spojovník, ale přesto jsou v korpusu SYN2020 tokenizována jako jedna jednotka. Jde zejména o

  • přejatá slova a slova od nich odvozená (bail-out, in-liny), některé názvy produktů a firem (H-System) a matematické výrazy označující proměnné (k-tice, n-tý) a
  • konvenci zachycení asijských (nebo jiných neevropských, fikčních apod.) jmen.

Běžně užívaná slova

Asijská jména

Aj-kuo, Aj-lien, An-chuej, An-jang, An-ling, An-shih, An-š', An-šun, An-tung, Bagh-e, Binimel-la, C'-jang, Ce-min, Ce-tchien, Ce-tung, Cch'-sin, Cchaj-sin, Cchang-čou, Cchung-ming, Cing-chua, Cung-nien, Cuo-lin, Č'-šeng, Čang-čou, Čang-chua, Čang-chua-Kao-siung, Čang-jie, Čang-su, Če-in, Če-jong, Če-on, Če-pom, Če-ťiang, Če-un, Čen-čen, Čen-in, Čen-jün, Čen-ming, Čen-ning, Čeng-čchao, Čeng-čou, Čeng-i, Čhung-čching, Čcha-já, Čchan-kan, Čchang-an, Čchang-čching, Čchang-čchun, Čchang-čou, Čchang-e, Čchang-fu, Čchang-kuej, Čchang-lo, Čchang-paj, Čchang-ša, Čchang-tchang, Čchang-ťiang, Čchao-jang, Čchao-liang, Čcheng-tu, Čchi-jang, Čchi-jüan, Čchi-šan, Čchien-tao, Čchien-žuej, Čchin-ling, Čching-čao, Čching-čcheng, Čching-čchuan, Čching-chaj, Čching-chua, Čching-lien, Čching-lin, Čching-ming, Čching-tao, Čchiung-chaj, Čchiung-laj, Čchu-čou, Čchun-čchiao, Čchun-jing, Čchun-sien, Čchung-čching, Čchung-jang, Čchung-tching, Či-min, Či-song, Či-un, Čin-jong, Čing-tao, Čon-na, Čong-čchol, Čong-hui, Čong-il, Čong-jang, Čong-jong, Čong-nam, Čong-suk, Čong-un, Čonk-suk, Čou-čuang, Čou-šan, Ču-chaj, Ču-jong, Ču-jung, Ču-ti, Čung-č', Čung-čou, Čung-che, Čung-i, Čung-kuo, Čung-min, Čung-nan-chaj, Čung-pching, Čung-suk, Čung-šu, Čung-ťün, Dai-iči, Dang-dong, Dašt-e, Dum-dum, Džin-šim, En-laj, Er-chaj, Fa-lun, Fang-čou, Feng-čou, Feng-šan, Feng-tchaj, Fu-čou, Fu-lin, Fu-ling, Fu-sang, Fu-ťien, Fudži-san, Hao-ching, Haram-e, Hazrat-e, He-čchan, He-chaluc, Hee-beom, Hje-kjong, Hje-rim, Hjo-čun, Hjon-hu, Hjun-jun, Hon-jong, Hung-min, Cha-mi, Chae-rin, Chaj-čcheng, Chaj-feng, Chaj-jang, Chaj-nan, Chaj-nan, Chaj-tien, Chan-čchao, Chan-woo, Chan-wook, Chang-čou, Chang-dong, Chao-ming, Che-nan, Che-pej, Che-tchien, Chej-che, Cheng-du, Chu-čou, Chu-lan, Chu-nan, Chu-pej, Chua-feng, Chua-chua, Chua-lien, Chua-tcheng, Chuaj-chaj, Chuaj-che, Chuaj-nan, Chuan-chu, Chuan-chuan, Chuang-che, Chuang-pchu, Chuang-šan, Chuej-cung, Chuej-čou, Chuej-chuej, Chuej-kang, Chung-kchou, Chung-liang, Chung-po, Chung-š', Chung-wej, Chung-wen, I-čchien, I-Fan, I-ming, I-mou, I-wu, Il-čchon, Il-song, Il-sung, Ir-sen, Issyk-kul, Ja-an, Ja-lu, Ja-pching, Jae-in, Jang-c', Jang-c'-ťiang, Jang-c'ťiang, Jang-čou, Jang-ming, Jang-ťiang, Jao-pang, Je-son, Jen-an, Jen-čcheng, Jen-čchi, Jen-hsun, Jen-chua, Jen-jen, Jen-nan, Jen-sung, Jen-šeng, Jen-tchaj, Ji-lin, Ji-nan, Jie-suej, Jing-jing, Jing-ťiou, Jing-wen, Jong-čchol, Jong-ho, Jong-hui, Jong-chol, Jong-il, Jong-kwon, Jong-mu, Jong-nam, Jong-so, Jong-suk, Jong-taem, Jong-tao, Joon-ho, Jou-cchaj, Jou-wej, Jü-čcheng, Jü-jüan, Jü-šan, Jüan-ming-jüan, Jün-šan, Jun-ťioua, Jung-čcheng, Jung-čching, Jung-čo, Jung-čou, Jung-chung, Jung-kchang, Jung-ting, Jwing-ming, Ka-i, Ka-shing, Kaa-wa, Kan-su, Kao-jou, Kao-li, Kao-lim, Kao-siung, Ke-pching, Kcha-šing, Kchaj-k Kchang-ting, Kche-čchiang, Kche-čchin, Kche-čching, Kche-pching, Kche-ťin, Kchun-lun, Kchun-ming, Kchun-šan, Kchung-ming, Ki-duk, Ki-mun, Kin-man, Kjo-an, Kjong-hi, Kjong-tu, Kuan-čung, Kuan-ťiao, Kuan-tung, Kuang-čou, Kuang-chu, Kuang-jao, Kuang-já, Kuang-jü, Kuang-ming, Kuang-si, Kuang-su, Kuang-tung, Kuej-čou, Kuej-jing, Kuej-lin, Kun-hee, Kun-hje, Kuo-an, Kuo-čchiang, Kuo-chua, Kuo-kuang, Kuo-pin, Kwok-hung, Kyung-min, Laj-kuej, Laj-ťün, Lan-čou, Lan-tchien, Lao-c, Lao-c', Lao-kai, Lao-šan, Li-c', Li-č', Li-chu, Li-lian, Li-ming, Li-ou, Li-po, Li-šuej, Li-tiang, Li-ťiang, Li-ťing, Li-ťün, Li-žen, Liang-šan, Liao-jang, Liao-ning, Lien-jün-kang, Lien-kche, Liko-s, Lin-i, Lin-ťin, Ling-ling, Ling-wej, Lu-ku, Lu-neng, Lung-chua, Lung-chuej, Lung-jang, Lung-jen, Lung-si, Lung-sing, Luo-jang, Luo-kche, Mao-čchun, Mej-čou, Mej-ling, Mej-mej, Mej-si, Meng-i, Mien-ču, Mien-jang, Min-ho, Min-sok, Min-šeng, Min-ťiang, Min-ťün, Ming-čche, Ming-chuej, Ming-kchang, Ming-ming, Mjong-bak, Mjong-ki, Mjong-kjon, Mo-che, Mo-je, Nakš-e, Nan-čchang, Nan-čchiao, Nan-čchung, Nan-chua, Nan-king, Nan-nan, Nan-ning, Nan-si, Nan-šan, Nan-ťing, Ni-na, Ning-ning, Ning-po, Paj-čchang, Paj-se, Paj-š', Pao-sing, Pej-chaj, Pej-ťing, Pen-si, Pcheng-čcheng, Pching-jaa, Pching-jao, Pching-liang, Pching-pching, Pching-tchang, Pchjong-il, Pcho-jang, Pchu-i, Pchu-tung, Pchunggje-ri, Pien-liang, Pin-pin, Ping-ping, Po-chaj, Po-jang, Po-lin, Po-ta, Pyong-il, S'-čchuan, Saj-saj, San-já, San-men, Se-čong, Se-dol, Se-tol, Si-an, Si-čchang, Si-čcheng, Si-čching, Si-laj, Si-si, Si-tan, Si-ti, Si-ťiang, Sia-men, Siang-žu, Siao-čchen, Siao-čchiou, Siao-čchuan, Siao-čchun, Siao-che, Siao-chuej, Siao-i, Siao-jüan, Siao-kang, Siao-lin, Siao-mej, Siao-ming, Siao-pching, Siao-ping, Siao-po, Siao-šan, Siao-tung, Sien-jang, Sien-tchien, Sien-tching, Sien-ťin, Sin-ču, Sin-chua, Sin-i, Sin-jang, Sin-jen, Sin-jü, Sin-ling, Sin-šiang, Sin-ťiang, Sing-ťien, Sing-sing, Sing-tou, Sing-wen, Sok-hi, Sol-ču, Sol-song, Son-mjong, Son-sil, Song-čin, Song-ho, Song-jung, Song-tchek, Su-čou, Sung-kju, Sung-man, Sung-ťiang, Š'-chuang-ti, Š'-wen, Šan-dong, Šan-si, Šan-šan, Šan-tchou, Šan-tung, Šang-kchun, Šao-čchi, Šao-jung, Šao-kuan, Šao-sing, Šao-š', Šao-šan, Šen-čen, Šen-čou, Šen-chua, Šen-jang, Šen-nung, Šen-si, Šeng-s', Šeng-sien, Šeng-ťi, Šou-tea, Šou-wen, Šu-čen, Šu-čching, Šu-čung, Šu-fu, Šu-wej, Šuej-show, Šun-i, Ta-čching, Ta-jen, Ta-lian, Ta-lien, Ta-pao, Ta-pin, Ta-pu, Ta-sin, Ta-sing, Ta-tchung, Ta-tu, Tai-chi, Tan-jang-Kchun-šan, Ťan-šan, Tan-tan, Tan-tung, Te-čo, Te-džung, Te-chuaj, Te-min, Te-šeng, Tchai-pej, Tchaj-an, Tchaj-čung, Tchaj-chu, Tchaj-nan, Tchaj-pej, Tchaj-pching, Tchaj-po, Tchaj-šan, Tchaj-wan, Tchang-šan, Tchao-pao, Tchie-ťün, Tchien-an-men, Tchien-che, Tchien-jang, Tchien-kung, Tchien-tchien, Tchien-ťin, Tchien-ťing, Tchien-wan, Tchu-men, Tchung-čou, Tchung-chua, Tchung-ling, Tchung-pcho, Tchung-žen, Tchuo-ťiang, Ťi-kchun, Ti-lin, Ťi-lin, Ťi-lung, Ťi-nan, Ťi-wej, Ťia-jin, Ťia-pao, Ťia-sing, Ťia-ťia, Ťia-wej, Ťiang-čching, Ťiang-si, Ťiang-su, Ťiao-čou, Ťie-min, Ťien-cung, Ťien-chua, Ťien-jie, Ťien-jing, Ťien-kchuej, Ťien-kuo, Ťien-mej, Ťien-min, Ťien-ming, Ťien-sin, Ťien-siung, Ťien-wej, Ťieng-ming, Tin-chuej, Ťin-ling, Ťin-men, Ťin-pching, Ťin-sun, Ťin-tchao, Ťin-ťiang, Ťing-c', Ťing-čou, Ťing-čung, Ťing-jen, Ťing-lej, Ťing-pching, Ťing-pien, Ťing-šan, Ťing-šeng, Ťing-ťing, Ton-hjuk, Tong-pin, Tu-hwan, Tu-siou, Tun-chuang, Tun-i, Tung-čcheng, Tung-jing, Tung-kuan, Tung-pcho, Tung-pin, Tung-tung, Ui-hwou, Un-kju, Wai-ching, Wan-čou, Wan-nien, Wang-lang, Wej-min, Wej-ning, Wej-te, Wej-ti, Wej-ťing, Wej-wej, Wen-čcheng, Wen-čchuan, Wen-čou, Wen-pin, Wen-siang, Wen-ťie, Wen-ťün, Wi-fije, Wo-lung, Won-hong, Won-taek, Wu-čen, Wu-čchang, Wu-čchiao, Wu-chan, Wu-jen, Wu-kchung, Wu-ťi, Xi-an, Yang-tse, Yiu-ming, Yong-ho, Yung-jan, Žu-kao, Žuej-kang, Žung-čcheng, Žung-ťi.

Slova začínající číslicí

Konvencializované zkratky

2D, 3D, 4D, 5D, 3G, 4G, 5G, 3M, 5P

Složeniny obsahující číslovku a odvozeniny od číslovek

V seznamu uvádíme pouze druhou, alfabetickou část:

akrový, ampérový, archový, arový, barevný, bilionkrát, biliónkrát, bilionový, biliónový, blizný, bodový, boký, brankový, břitý, buněčný, centimetrový, ciferný, cípý, četný, členný, člený, denní, detektorový, dílný, dimenzionální, diskový, dolarový, dveřový, dvéřový, fázový, gigabajtový, gigabitový, gigapixelový, gigový, gólový, gramový, harový, hektarový, hektolitrový, herzový, hlasý, hlavý, hodinový, hranný, hvězdičkový, chodový, chodý, jamkový, jednotkový, kanálový, karátový, kilogramový, kiloherzový, kilometrový, kilovoltový, kilový, kilowatový, kilowatthodinový, kilowattový, kolový, komorový, koňový, korunový, krát, kreditový, krokový, kubíkový, květý, laločnatý, lampový, letý, liberní, librový, listý, litrovka, litrový, lůžkový, megaherzový, megapixelový, megawatový, megawattový, megový, měsíční, metrákový, metrový, mikrogramový, mikrometrový, mikronový, miliampérový, miliardkrát, miliardový, miliardtý, miligramový, mililitrový, milimetrový, milimolární, milionkrát, miliónkrát, milionový, miliónový, miliontý, minutový, místný, molární, nápravový, násobek, násobně, násobný, nedělní, nohý, ohmový, osý, otiskový, palcový, paprskový, parový, patrový, pesetový, pinový, pístkový, podlažní, pokojový, polový, porcový, poschoďový, pouzdrý, pozicový, procentní, procetní, proudový, proudý, prstý, pruhový, prutový, prvkový, putnový, pyský, qubitový, radličný, ramenný, ranný, roční, rozměrný, rychlostní, řádkový, řadý, sedačkový, sedadlový, sekundový, semestrální, slabičný, slovný, stanicový, stěn, stěnný, stránkový, stranný, strunný, stupňový, svazkový, tabulkový, ti, tiakrový, tiampérový, tiarový, tibilionový, tibiliónový, tiblizný, tibodový, tiboký, tibřitý, ticentimetrový, ticípý, tičlenný, tičlený, tidenní, tidetektorový, tidílný, tidolarový, tidveřový, tidvéřový, tigigabajtový, tigigabitový, tigigapixelový, tigigový, tigramový, tiharový, tihektarový, tihektolitrový, tiherzový, tihlasý, tihlavý, tihodinový, tihranný, tihvězdičkový, tichodový, tichodý, tikanálový, tikarátový, tikilogramový, tikiloherzový, tikilometrový, tikilovoltový, tikilový, tikilowatový, tikilowatthodinový, tikilowattový, tikolový, tikoňový, tikorunový, tikrát, tikreditový, tikubíkový, tikvětý, tilaločnatý, tiletý, tilistý, tilitrovka, tilitrový, timegaherzový, timegapixelový, timegawatový, timegawattový, timegový, timěsíční, timetrový, timikrogramový, timikrometrový, timikronový, timiliampérový, timiliardový, timiliardtý, timiligramový, timililitrový, timilimetrový, timilimolární, timilionový, timiliónový, timiliontý, timinutový, timístný, timolární, tinásobek, tinásobně, tinásobný, tinohý, tiny, tiosý, tiotiskový, tipalcový, tiparový, tipatrový, tipesetový, tipístkový, tipodlažní, tipokojový, tipolový, tiporcový, tipouzdrý, tipozicový, tiprocentní, tiprocetní, tiproudý, tiprstý, tipyský, tiqubitový, tiramenný, tiranný, tiroční, tirychlostní, tiřadý, tisekundový, tisíckrát, tisícový, tistanicový, tistěn, tistránkový, tistranný, tistupňový, titisící, titisícový, titunový, titýdenní, tiúhelník, tiuncový, tivalentní, tivoltový, tivrstvý, tivteřinový, tiwatový, tiwattový, tizubý, tunový, tý, týdenní, úhelník, úhelníkový, úhlý, uncový, válcový, valentní, voltový, vozový, vrstvý, vteřinový, watový, wattový, zápasový, zónový, zubý


» Zpět na hlavní stránku Korpus SYN2020
» Všechny seznamy slov SYN2020
» Tokenizace SYN2020