Toto je starší verze dokumentu!
QuitaUp
Aplikace QuitaUp byla vytvořena za účelem poskytnout lingvistům i širšímu okruhu zájemců jednoduchý nástroj pro výpočet vybraných stylometrických indikátorů, které kvantitativně vyjadřují některé vlastnosti textu. Patří sem například výpočet slovního bohatství, tematické koncentrace či aktivity textu.
Aplikace je dostupná na adrese: https://www.korpus.cz/quitaup/
Součástí aplikace je podrobný manuál s popisem všech zjišťovaných stylometrických ukazatelů.
Vstupní data
Nahrávané texty musí být ve formátu .txt, .docx, .doc, .odt, .rtf nebo .pdf s kódováním unicode (UTF-8).
Výstupy
QuitaUp nabízí základní funkce předzpracování textu (tokenizace, lemmatizace, tagování slovních druhů, syntaktický parsing). Tyto funkce jsou dostupné pro různé jazyky (viz záložka Jazyk). Toto předzpracování textu je založeno na modelech vytvořených pomocí UDPipe (více na http://ufal.mff.cuni.cz/udpipe).
Implementované indexy:
- Tokeny
- Typy
- TTR
- h-point
- Hapaxy
- Podíl hapaxů k tokenům
- Entropie
- Verb distance
- Activity
- Descriptivity
- Průměrná délka tokenu v počtu znaků
- Tematická koncentrace
- Sekundární tematická koncentrace
- Klouzavý průměr TTR (MATTR, pro velikost okna L=100)
- Klouzavý průměr TTR (MATTR, pro velikost okna L=500)
- zTTR: Normalizované TTR
- Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=100)
- Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=500)
Jak citovat QuitaUp
Cvrček, V. – Čech, R. – Kubát, M. (2020): QuitaUp - Quantitative Index Text Analyzer. Czech National Corpus and University of Ostrava. Available on WWW: <https://korpus.cz/quitaup/>