QuitaUp

Aplikace QuitaUp byla vytvořena za účelem poskytnout lingvistům i širšímu okruhu zájemců jednoduchý nástroj pro výpočet vybraných stylometrických indikátorů, které kvantitativně vyjadřují některé vlastnosti textu. Patří sem například výpočet slovního bohatství, tematické koncentrace či aktivity textu.

Aplikace je dostupná na adrese: https://www.korpus.cz/quitaup/

Součástí aplikace je podrobný manuál s popisem všech zjišťovaných stylometrických ukazatelů.

Vstupní data

Nahrávané texty musí být ve formátu .txt, .docx, .doc, .odt, .rtf nebo .pdf s kódováním unicode (UTF-8).

Výstupy

QuitaUp nabízí základní funkce předzpracování textu (tokenizace, lemmatizace, tagování slovních druhů, syntaktický parsing). Tyto funkce jsou dostupné pro různé jazyky (viz záložka Jazyk). Toto předzpracování textu je založeno na modelech vytvořených pomocí UDPipe (více na http://ufal.mff.cuni.cz/udpipe).

Implementované indexy:

Tokeny
Typy
TTR
h-point
Hapaxy
Podíl hapaxů k tokenům
Entropie
Verb distance
Activity
Descriptivity
Průměrná délka tokenu v počtu znaků
Tematická koncentrace
Sekundární tematická koncentrace
Klouzavý průměr TTR (MATTR, pro velikost okna L=100)
Klouzavý průměr TTR (MATTR, pro velikost okna L=500)
zTTR: Normalizované TTR
Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=100)
Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=500)

Jak citovat QuitaUp

Cvrček, V. – Čech, R. – Kubát, M. (2020): QuitaUp - nástroj pro kvantitativní stylometrickou analýzu. Czech National Corpus and University of Ostrava. Dostupný z WWW: <https://korpus.cz/quitaup/>

Historie: • verze10 • quitaup

Obsah

QuitaUp

Vstupní data

Výstupy

Jak citovat QuitaUp

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence