Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:ngram [2013/08/21 12:40] – alzbetavitkova | pojmy:ngram [2014/11/23 15:41] – olgarichterova |
---|
Studium n-gramů je výrazem snahy objevovat v textu opakovaně se vyskytující shluky jednotek, které mají [[http://en.wikipedia.org/wiki/Langue_and_parole|languovou]] povahu (srov. [[pojmy:kolokace|kolokace]], [[pojmy:corpus_driven|corpus-driven přístup]]). | Studium n-gramů je výrazem snahy objevovat v textu opakovaně se vyskytující shluky jednotek, které mají [[http://en.wikipedia.org/wiki/Langue_and_parole|languovou]] povahu (srov. [[pojmy:kolokace|kolokace]], [[pojmy:corpus_driven|corpus-driven přístup]]). |
| |
Bigramy jsou tak v základu zkoumání [[pojmy:kolokace|kolokací]] (ačkoli i kolokace mohou být více než dvouslovné). V čem se ale bigram od kolokace liší? Členy bigramu nejsou provázané ani ustálené. Každá kolokace je tedy vždy zároveň bigramem, kdežto bigram nutně nemusí být kolokací (srov. nejčastější bigram //jak se//). | Bigramy jsou tak v základu zkoumání [[pojmy:kolokace|kolokací]] (ačkoli i kolokace mohou být více než dvouslovné). Bigram se od kolokace liší především v tom, že jednotlivé členy bigramu nemusí být provázané a celá kombinace nemusí být ustálená. Každá kolokace je tedy vždy zároveň bigramem, kdežto bigram nutně nemusí být kolokací (srov. nejčastější bigram //jak se//). |
| |
Trigramy, tetragramy apod. vznikají sřetězením více slov, jejich frekventovaný souvýskyt značí ustálenou jednotku, jejíž význam může vyjadřovat celý smysluplný výrok (//zdálo se mi, že; jsem si myslel, že; podíval jsem se na; to je v pořádku// apod.). | Trigramy, tetragramy apod. vznikají sřetězením více slov, jejich frekventovaný souvýskyt značí ustálenou jednotku, jejíž význam může vyjadřovat celou propozici (//zdálo se mi, že; jsem si myslel, že; podíval jsem se na; to je v pořádku// apod.). |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
<WRAP round box 49%> | |
[[pojmy:koligace|Koligace]] • [[pojmy:kolokace|Kolokace]] • [[manual:menu:frekvencni_distribuce|Frekvenční distribuce]] | <WRAP round box 50%> |
| [[pojmy:koligace|Koligace]] • [[pojmy:kolokace|Kolokace]] • [[manual:menu:frekvencni_distribuce|Frekvenční distribuce]] • [[pojmy:bundles|Lexical bundles]] |
</WRAP> | </WRAP> |