AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:ngram [2013/08/21 12:40] alzbetavitkovapojmy:ngram [2015/01/21 17:45] (aktuální) – upraveno mimo DokuWiki 127.0.0.1
Řádek 7: Řádek 7:
 Studium n-gramů je výrazem snahy objevovat v textu opakovaně se vyskytující shluky jednotek, které mají [[http://en.wikipedia.org/wiki/Langue_and_parole|languovou]] povahu (srov. [[pojmy:kolokace|kolokace]], [[pojmy:corpus_driven|corpus-driven přístup]]). Studium n-gramů je výrazem snahy objevovat v textu opakovaně se vyskytující shluky jednotek, které mají [[http://en.wikipedia.org/wiki/Langue_and_parole|languovou]] povahu (srov. [[pojmy:kolokace|kolokace]], [[pojmy:corpus_driven|corpus-driven přístup]]).
  
-Bigramy jsou tak v základu zkoumání [[pojmy:kolokace|kolokací]] (ačkoli i kolokace mohou být více než dvouslovné). V čem se ale bigram od kolokace liší? Členy bigramu nejsou provázané ani ustálené. Každá kolokace je tedy vždy zároveň bigramem, kdežto bigram nutně nemusí být kolokací (srov. nejčastější bigram //jak se//).+Bigramy jsou tak v základu zkoumání [[pojmy:kolokace|kolokací]] (ačkoli i kolokace mohou být více než dvouslovné). Bigram se od kolokace liší především v tom, že jednotlivé členy bigramu nemusí být provázané a celá kombinace nemusí být ustálená. Každá kolokace je tedy vždy zároveň bigramem, kdežto bigram nutně nemusí být kolokací (srov. nejčastější bigram //jak se//).
  
-Trigramy, tetragramy apod. vznikají sřetězením více slov, jejich frekventovaný souvýskyt značí ustálenou jednotku, jejíž význam může vyjadřovat celý smysluplný výrok (//zdálo se mi, že; jsem si myslel, že; podíval jsem se na; to je v pořádku// apod.). +Trigramy, tetragramy apod. vznikají sřetězením více slov, jejich frekventovaný souvýskyt značí ustálenou jednotku, jejíž význam může vyjadřovat celou propozici (//zdálo se mi, že; jsem si myslel, že; podíval jsem se na; to je v pořádku// apod.). 
  
 ==== Související odkazy ==== ==== Související odkazy ====
-<WRAP round box 49%> + 
-[[pojmy:koligace|Koligace]] • [[pojmy:kolokace|Kolokace]] • [[manual:menu:frekvencni_distribuce|Frekvenční distribuce]]+<WRAP round box 50%> 
 +[[pojmy:kolokace|Kolokace]] • [[pojmy:koligace|Koligace]] • [[manualy:kontext:frekvencni_distribuce|Frekvenční distribuce]] • [[pojmy:bundles|Lexical bundles]]
 </WRAP> </WRAP>
 +