This is an old revision of the document!

Corpus of monologues: ORATOR

The corpus ORATOR contains monologues by native Czech speakers.

Transkripční pravidla, způsob propojení se zvukem a většina metadat jsou stejné jako v korpusu ORTOFON, stejným postupem jako korpusy ORAL a ORTOFON je korpus ORATOR i lemmatizován a morfologicky značkován. Není vyvažován podle žádného z kritérií a v roce 2020 se plánuje jeho rozšíření.

Název	ORATOR
Počet positions (tokens)	736 407
Počet positions (tokens) without puctuation, hesitations and interjections	578 398
Počet word forms (word)	60 952
Počet conversations recorded	318
Počet utterances	68 727
Number of unique (different) speakers	332
Length of recordings [hh:mm:ss.ms]	72:07:47.368

Trace: • orator

Corpus of monologues: ORATOR

Search

Navigation

Print/export

Tools

Languages

Licence