Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
pojmy:frekvence [2016/09/29 17:09] – [Využití a význam frekvence] davidlukes | pojmy:frekvence [2021/02/22 18:36] (aktuální) – [Využití a význam frekvence] dominikakovarikova | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Frekvence ====== | ====== Frekvence ====== | ||
- | Frekvence v korpusové lingvistice označuje počet výskytů jevu v korpusu, **četnost** formy nebo jevu. Uvádí se buď v **absolutních hodnotách**, | + | Frekvence v korpusové lingvistice označuje počet výskytů jevu v korpusu, **četnost** formy nebo jevu. Uvádí se buď v **absolutních hodnotách**, |
Zatímco absolutní frekvence (tj. prostý počet výskytů slov v korpusu) vyžaduje pro jejich zhodnocení další upřesnění (v podobě celkové velikosti korpusu nebo frekvence jiného jevu pro srovnání), | Zatímco absolutní frekvence (tj. prostý počet výskytů slov v korpusu) vyžaduje pro jejich zhodnocení další upřesnění (v podobě celkové velikosti korpusu nebo frekvence jiného jevu pro srovnání), | ||
Řádek 51: | Řádek 51: | ||
Frekvence jako základní veličina libovolné jednotky ([[pojmy: | Frekvence jako základní veličina libovolné jednotky ([[pojmy: | ||
- | Pro korektní interpretaci frekvence je třeba si uvědomit, že se jedná o bodový odhad četnosti jevu v celém jazyce. Každý korpus je více či méně přesnou aproximací zkoumané populace (= texty určitého druhu), a tudíž v různých korpusech vytvořených podle téže metodologie (i kdybychom byli schopni zaručit jejich plnou srovnatelnost) se bude frekvence zkoumaného jevu drobně lišit. K podchycení této variability hodnot slouží **[[wp> | + | Pro korektní interpretaci frekvence je třeba si uvědomit, že se jedná o bodový odhad četnosti jevu v celém jazyce. Každý korpus je více či méně přesnou aproximací zkoumané populace (= texty určitého druhu), a tudíž v různých korpusech vytvořených podle téže metodologie (i kdybychom byli schopni zaručit jejich plnou srovnatelnost) se bude frekvence zkoumaného jevu drobně lišit. K podchycení této variability hodnot slouží **[[wp> |
- | < | + | Pro účely zjištění konfidenčních intervalů můžeme použít např. korpusovou kalkulačku **Calc** ([[https://www.korpus.cz/calc/|www.korpus.cz/calc]]), konkrétně první modul [[https://www.korpus.cz/calc/? |
- | <iframe id=" | + | |
- | < | + | |
- | (function() { | + | |
- | //////////////////////////////////////////// | + | |
- | // CONFIGURE THESE TO MATCH YOUR USE CASE // | + | |
- | //////////////////////////////////////// | + | |
- | // this should be the root URL of the child frame (Shiny app) which you want | + | Konfidenční interval okolo naměřené |
- | // to allow to send messages to the parent | + | |
- | var allowedOrigin = " | + | |
- | /////////////////////// | + | === Příklady === |
- | // END CONFIGURATION // | + | |
- | /////////////////////// | + | |
- | var embeddedApp = document.getElementById(" | + | Když v korpusu o velikosti zhruba 100 mil. slov (např. [[cnk: |
- | function resizeIframe(pixels) { | + | Zjistíme-li, |
- | embeddedApp.style.height = pixels + " | + | |
- | } | + | |
- | // cross-browser compatible infrastructure | ||
- | var eventMethod = window.addEventListener ? " | ||
- | var eventer = window[eventMethod]; | ||
- | var messageEvent = eventMethod == " | ||
- | |||
- | // listen to message from iframe | ||
- | eventer(messageEvent, | ||
- | if (e.origin === allowedOrigin) { | ||
- | var key = e.message ? " | ||
- | var data = e[key]; | ||
- | resizeIframe(data); | ||
- | } else { | ||
- | console.log(" | ||
- | } | ||
- | }, false); | ||
- | |||
- | // send message to iframe on window resize | ||
- | window.onresize = function() { | ||
- | embeddedApp.contentWindow.postMessage(" | ||
- | }; | ||
- | })(); | ||
- | </ | ||
- | </ | ||
- | |||
- | Konfidenční interval okolo naměřené (zjištěné) frekvence na hladině významnosti 95 % říká, že v pokusu, který by zahrnoval nekonečné množství srovnatelných a stejně rozsáhlých korpusů, by frekvence hledaného jevu byla v 95 % měření v rámci tohoto intervalu. Při analýze bychom tedy měli vždy počítat s tím, že frekvence jevu může nabývat kterékoli hodnoty z konfidenčního intervalu. | ||
===== Disperze jevů ===== | ===== Disperze jevů ===== | ||