====== Přehled základních pojmů korpusové lingvistiky ====== Tento oddíl prezentuje základní teoretické pojmy korpusové lingvistiky a také termíny, které se používají specificky pro [[cnk:struktura|korpusy ČNK]]. Při sestavování tohoto stručného slovníčku pojmů jsme vycházeli především z hesel Nového Encyklopedického slovníku češtiny. Slovníček funguje zejména jako doplněk ke [[kurz:uvod|Kurzu práce s ČNK]], k [[manualy:kontext:index|popisu funkcí]] rozhraní KonText a k [[seznamy:index|seznamům]], které jsou užitečné pro práci s našimi korpusy. === A === [[pojmy:agregat|Agregát]] [[pojmy:akvizicni_korpus|Akviziční korpus]] [[pojmy:alignment|Alignment (zarovnání)]] [[pojmy:anonymizace|Anonymizace]] [[pojmy:anotace|Anotace]] [[pojmy:arf|ARF]] [[pojmy:asociacni_miry|Asociační míry]] [[pojmy:atributy_pozicni|Atributy poziční]] [[pojmy:atributy_strukturni|Atributy strukturní]] [[pojmy:autorsky_korpus|Autorský korpus]] === B === [[pojmy:bigram|Bigram]] === C === [[pojmy:case-insensitive|Case-insensitive]] [[pojmy:case-sensitive|Case-sensitive]] ''[[pojmy:containing|containing]]'' [[pojmy:corpus_based|Corpus-based přístup]] [[pojmy:corpus_driven|Corpus-driven přístup]] [[pojmy:cql|CQL]] === D === [[pojmy:data-driven_learning|Data-Driven Learning]] [[pojmy:desambiguace|Desambiguace]] [[pojmy:diachronní|Diachronní korpus]] [[pojmy:dice|Dice]] [[pojmy:din|DIN]] [[Disperze]] ''[[pojmy:doc|]]'' [[pojmy:dotazovaci_jazyk|Dotazovací jazyk]] === F === [[pojmy:frazem|Frazém]] [[pojmy:frekvence|Frekvence]] === G === [[pojmy:genre|Genre]] [[pojmy:genre_group|Genre_group]] [[Good-Turingův odhad]] === H === [[pojmy:hapax|Hapax legomenon]] [[pojmy:heaps|Heapsův zákon]] === Ch === [[pojmy:chi2|Chi kvadrát test]] === I === [[pojmy:idiom|Idiom]] [[pojmy:ipm|ipm]] === K === [[pojmy:keyword|Klíčové slovo (keyword)]] [[pojmy:koligace|Koligace]] [[pojmy:kolokace|Kolokace]] [[pojmy:asociacni_miry|Kolokační míry]] [[pojmy:konfidencni_intervaly|Konfidenční interval]] [[pojmy:konkordance|Konkordance]] [[pojmy:korpus|Korpus]] [[pojmy:korpusove_casopisy|Korpusové časopisy]] [[pojmy:korpusove_organizace|Korpusové organizace a konference]] [[pojmy:korpusovy_manazer|Korpusový manažer]] [[pojmy:nastroje|Korpusové nástroje]] [[pojmy:korpusy|Korpusy u nás a ve světě]] [[pojmy:kwic|KWIC]] [[pojmy:kwords|KWords]] === L === ''[[pojmy:lc|lc]]'' [[pojmy:lemma|Lemma, lemmatizace]] [[pojmy:lexikalni_bohatost|Lexikální diverzita]] [[pojmy:lexical_fixedness|Lexical fixedness]] [[pojmy:lexikalni_hustota|Lexikální hustota]] [[pojmy:bundles|Lexical bundles]] [[pojmy:lockwords|Lockwords]] [[pojmy:logdice|LogDice]] [[pojmy:loglikelihood|Log-likelihood]] === M === [[pojmy:medium|Medium (med)]] ''[[pojmy:meet|meet]]'' [[pojmy:menzerath|Menzerath–Altmannův zákon]] [[pojmy:metadata|Metadata]] [[pojmy:mi-score|MI-score, MI3]] [[pojmy:mluveny|Mluvený korpus]] [[pojmy:monokolokabilita|Monokolokabilita]] [[pojmy:morfio|Morfio]] [[pojmy:morfologicka_analyza|Morfologická analýza]] [[Morfologická bohatost]] === N === [[pojmy:ngram|N-gram]] === O === [[pojmy:citaty|Okřídlené citáty]] ''[[pojmy:opus|]]'' === P === [[pojmy:paradigmaticky|Paradigmatický dotaz]] [[pojmy:paralelní|Paralelní korpus]] [[pojmy:parser|Parser, parsing]] ''[[pojmy:pos|pos]]'' [[pojmy:pozice|Pozice (v textu)]] [[pojmy:ppm|ppm]] [[pojmy:precision|Precision]] [[Produktivita (morfologická)]] [[pojmy:prototypicnost|Prototypičnost]] [[pojmy:psany|Psaný korpus]] === R === [[pojmy:rank|Rank]] [[pojmy:recall|Recall]] [[pojmy:referencni|Referenční korpus]] [[pojmy:register|Register (rejstřík)]] [[pojmy:regularni_vyrazy|Regulární výrazy]] [[pojmy:reprezentativnost|Reprezentativnost korpusu]] === S === ''[[pojmy:s|]]'' [[pojmy:segmentace|Segmentace]] [[pojmy:semanticka_preference|Sémantická preference]] [[pojmy:semanticka_prosodie|Sémantická prosodie]] [[pojmy:word|Slovní tvar]] ''[[pojmy:sp|]]'' [[pojmy:srclang|Srclang (zdrojový jazyk)]] [[pojmy:srovnatelny|Srovnatelný (comparable) korpus]] [[pojmy:struktura_korpusu|Struktura korpusu]] [[pojmy:atributy_strukturni|Strukturní jednotka]] [[pojmy:subkorpus|Subkorpus]] [[pojmy:lemma#Sublemma|Sublemma]] [[pojmy:syd|SyD]] [[pojmy:synchronní|Synchronní korpus]] [[pojmy:syntakticka_analyza|Syntaktická analýza]] [[pojmy:syntakticka_komplexita#syntakticka_komplexita|Syntaktická komplexita]] === T === [[pojmy:t-score|T-score]] [[pojmy:tag|Tag]] [[pojmy:tagset|Tagset]] ''[[pojmy:text|]]'' [[pojmy:trigram|Trigram]] [[pojmy:token|Token]] [[pojmy:ttr|Token-type ratio (TTR)]] [[pojmy:txtype|Txtype (typ textu)]] [[pojmy:txtype_group|Txtype_group]] [[pojmy:typ|Typ/type]] === U === ''[[pojmy:union|union]]'' [[pojmy:ud|Universal Dependencies (UD)]] === V === [[pojmy:verbtag|Verbtag]] [[pojmy:verzovany|Verzovaný korpus]] === W === ''[[pojmy:within|within]]'' [[pojmy:word|Word]] === Y === [[Yuleův koeficient]] === Z === [[pojmy:zipf|Zipfovy zákony]] === Ž === [[pojmy:zakovsky|Žákovský korpus]] [[pojmy:zanr|Žánr (genre)]] ---- [[kurz:uvod|Kurz práce s korpusem]] • [[cnk:uvod|Korpusy ČNK]] • [[manualy:kontext:index|Manuál rozhraní KonText]] • [[seznamy:index|Seznamy a zkratky užívané v ČNK]]