Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
kurz:regularni_vyrazy [2020/03/09 11:58] – [Tečka: libovolný znak] vaclavcvrcek | kurz:regularni_vyrazy [2021/01/06 18:54] – [Další speciální symboly] michalskrabal |
---|
| |
[{{ frekvdistr_vedom.png?250|Frekvenční distribuce deseti nejčastějších lemmat získaných díky tečce a hvězdičce}}] | [{{ frekvdistr_vedom.png?250|Frekvenční distribuce deseti nejčastějších lemmat získaných díky tečce a hvězdičce}}] |
| FIXME! NESEDÍ VÝSLEDKY!? |
| |
Nejmocnější kombinací je vyhledání libovolného počtu opakování libovolných znaků, tj. ''.*'' (tečka a hvězdička). Ta může reprezentovat celé slovo nebo jeho libovolnou část. Proto není vhodné zadávat samotný dotaz ''.*'', není-li to nutné, protože výsledkem zdlouhavého a výpočetně náročného hledání budou všechna slova v daném korpusu. | Nejmocnější kombinací je vyhledání libovolného počtu opakování libovolných znaků, tj. ''.*'' (tečka a hvězdička). Ta může reprezentovat celé slovo nebo jeho libovolnou část. Proto není vhodné zadávat samotný dotaz ''.*'', není-li to nutné, protože výsledkem zdlouhavého a výpočetně náročného hledání budou všechna slova v daném korpusu. |
| |
<WRAP round help 60%> | <WRAP round help 60%> |
* Vyhledejte v korpusu [[cnk:syn2015|SYN2010]] v typu dotazu **Slovní tvar** řetězec znaků ''.*vědom.*''. | * Vyhledejte v korpusu [[cnk:syn2015|SYN2010]] v jednoduchém typu dotazu řetězec znaků ''.*vědom.*'' (je zapotřebí zapnout možnost **Povolit regulární výrazy**!). |
* Zobrazte si frekvenční distribuci takto identifikovaných lemmat a výsledný frekvenční seznam si uložte. | * Zobrazte si frekvenční distribuci takto identifikovaných lemmat a výsledný frekvenční seznam si uložte. |
</WRAP> | </WRAP> |
| |
<WRAP round help 50%> | <WRAP round help 50%> |
Vyhledejte v korpusu [[cnk:syn2015|SYN2015]] v typu dotazu **Lemma** prefigovaná adjektiva na //vy-// zakončená na //-lý// nebo //-ný// (např. //vyčpělý// a //vydýchaný//). | Vyhledejte v korpusu [[cnk:syn2015|SYN2015]] prefigovaná adjektivní lemmata začínající na //vy-// a zakončená na //-lý// nebo //-ný// (např. //vyčpělý// a //vydýchaný//). |
</WRAP> | </WRAP> |
| |
Použili jsme dotaz ''vy.+(lý|ný)'', slovní druh jsme omezili na přídavná jména. Celkem jsme dostali 105 328 případů, mezi nejčastějšími figurují slova //vyspělý// (2220), //vytrvalý// (1127), //vybledlý// (695) z první skupiny, z druhé pak //vybraný// (6390), //vyrovnaný// (3158), //vyrobený// (2760) a další. | Použili jsme dotaz ''vy.+(lý|ný)'' s výchozím atributem ''lemma|word'', slovní druh jsme omezili na přídavná jména. Celkem jsme dostali 105 328/373 FIXME případů, mezi nejčastějšími figurují slova //vyspělý// (2220), //vytrvalý// (1127), //vybledlý// (695) z první skupiny, z druhé pak //vybraný// (6390), //vyrovnaný// (3158), //vyrobený// (2760) a další. |
| |
S tímto dotazem úzce souvisí nástroj [[manualy:morfio|Morfio]], který slouží pro slovotvornou analýzu. | S tímto dotazem úzce souvisí nástroj [[manualy:morfio|Morfio]], který slouží pro slovotvornou analýzu. |