AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Přehled základních pojmů korpusové lingvistiky

Tento oddíl prezentuje základní teoretické pojmy korpusové lingvistiky a také termíny, které se používají specificky pro korpusy ČNK. Při sestavování tohoto stručného slovníčku pojmů jsme vycházeli především z hesel Nového Encyklopedického slovníku češtiny. Slovníček funguje zejména jako doplněk ke Kurzu práce s ČNK, k popisu funkcí rozhraní KonText a k seznamům, které jsou užitečné pro práci s našimi korpusy.

Alignment (zarovnání)

Anonymizace

Anotace

ARF

Asociační míry

Atributy poziční

Atributy strukturní

Bigram

Case-insensitive

Case-sensitive

containing

Corpus-based přístup

Corpus-driven přístup

CQL

Desambiguace

Diachronní (korpus)

Dice

<doc>

Dotazovací jazyk

Frazém

Frekvence

Genre

Hapax legomenon

Heapsův zákon

Chi kvadrát test

Idiom

ipm

Klíčové slovo (keyword)

Koligace

Kolokace

Kolokační míry

Konkordance

Korpus

Korpusový manažer

Korpusové nástroje

Korpusy u nás a ve světě

KWIC

lc

KWords

Lemma, lemmatizace

Lexical fixedness

Lexikální hustota

Lexical bundles

LogDice

Log-likelihood

Medium (med)

meet

Menzerath–Altmannův zákon

Metadata

MI-score, MI3

Mluvený (korpus)

Monokolokabilita

Morfio

Morfologická analýza

N-gram

Okřídlené citáty

<opus>

Paralelní (korpus)

Parser, parsing

pos

Pozice (v textu)

ppm

Precision

Prototypičnost

Psaný (korpus)

Rank

Recall

Referenční (korpus)

Regulární výrazy

Reprezentativnost korpusu

<s>

Segmentace

Sémantická preference

Sémantická prosodie

Slovní tvar

<sp>

Srclang (zdrojový jazyk)

Srovnatelný (comparable) korpus

Struktura korpusu

Subkorpus

SyD

Synchronní (korpus)

T-score

Tag

Tagset

Trigram

Token

Token-type ratio (TTR)

Txtype (typ textu)

Txtype_group

Typ/type

union

within

Word

Zipfovy zákony

Žánr (genre)