AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
pojmy:ngram [2013/06/18 17:58] – vytvořeno Václav Cvrčekpojmy:ngram [2015/01/21 17:45] (aktuální) – upraveno mimo DokuWiki 127.0.0.1
Řádek 5: Řádek 5:
 Mezi členy n-gramu se automaticky nepředpokládá lingvistický vztah. O n-gramech se mluví většinou jako o [[pojmy:typ|typech]], při jejich popisu tedy není zkoumána jejich konkrétní realizace, ale celková [[pojmy:frekvence|frekvence]], příp. distribuce v textech atp.  Mezi členy n-gramu se automaticky nepředpokládá lingvistický vztah. O n-gramech se mluví většinou jako o [[pojmy:typ|typech]], při jejich popisu tedy není zkoumána jejich konkrétní realizace, ale celková [[pojmy:frekvence|frekvence]], příp. distribuce v textech atp. 
  
-Studium n-gramů je výrazem snahy objevovat v povrchově pouze syntagmatickém toku textu opakovaně se vyskytující shluky jednotek, které mají languovou povahu (srov. [[pojmy:kolokace|kolokace]], [[pojmy:corpus_driven|corpus-driven přístup]]).+Studium n-gramů je výrazem snahy objevovat v textu opakovaně se vyskytující shluky jednotek, které mají [[http://en.wikipedia.org/wiki/Langue_and_parole|languovou]] povahu (srov. [[pojmy:kolokace|kolokace]], [[pojmy:corpus_driven|corpus-driven přístup]]).
  
-Bigramy jsou tak v základu zkoumání [[pojmy:kolokace|kolokací]] (ačkoli i kolokace mohou být více než dvouslovné). Základní odlišnost bigramu od kolokace je fakt jeho neustálené povahy a neprovázanosti členů (každá kolokace je zároveň bigramem, ne každý bigram je ovšem kolokacísrov. nejčastější bigram //jak se//). +Bigramy jsou tak v základu zkoumání [[pojmy:kolokace|kolokací]] (ačkoli i kolokace mohou být více než dvouslovné). Bigram se od kolokace liší především v tom, že jednotlivé členy bigramu nemusí být provázané a celá kombinace nemusí být ustálená. Každá kolokace je tedy vždy zároveň bigramem, kdežto bigram nutně nemusí být kolokací (srov. nejčastější bigram //jak se//).
  
 Trigramy, tetragramy apod. vznikají sřetězením více slov, jejich frekventovaný souvýskyt značí ustálenou jednotku, jejíž význam může vyjadřovat celou propozici (//zdálo se mi, že; jsem si myslel, že; podíval jsem se na; to je v pořádku// apod.).  Trigramy, tetragramy apod. vznikají sřetězením více slov, jejich frekventovaný souvýskyt značí ustálenou jednotku, jejíž význam může vyjadřovat celou propozici (//zdálo se mi, že; jsem si myslel, že; podíval jsem se na; to je v pořádku// apod.). 
 +
 +==== Související odkazy ====
 +
 +<WRAP round box 50%>
 +[[pojmy:kolokace|Kolokace]] • [[pojmy:koligace|Koligace]] • [[manualy:kontext:frekvencni_distribuce|Frekvenční distribuce]] • [[pojmy:bundles|Lexical bundles]]
 +</WRAP>
 +