Toto je starší verze dokumentu!
Obsah
QuitaUp
Aplikace QuitaUp byla vytvořena za účelem poskytnout lingvistům i širšímu okruhu zájemců jednoduchý nástroj pro výpočet vybraných stylometrických indikátorů, které kvantitativně vyjadřují některé vlastnosti textu. Patří sem například výpočet slovního bohatství, tematické koncentrace či aktivity textu.
Aplikace je dostupná na adrese: https://www.korpus.cz/quitaup/
Součástí aplikace je podrobný manuál s popisem všech zjišťovaných stylometrických ukazatelů.
Vstupní data
Nahrávané texty musí být ve formátu .txt, .docx, .doc, .odt, .rtf nebo .pdf s kódováním unicode (UTF-8).
Výstupy
QuitaUp nabízí základní funkce předzpracování textu (tokenizace, lemmatizace, tagování slovních druhů, syntaktický parsing). Tyto funkce jsou dostupné pro různé jazyky (viz záložka Jazyk). Toto předzpracování textu je založeno na modelech vytvořených pomocí UDPipe (více na http://ufal.mff.cuni.cz/udpipe).
Implementované indexy:
- Tokeny
- Typy
- TTR
- h-point
- Hapaxy
- Podíl hapaxů k tokenům
- Entropie
- Verb distance
- Activity
- Descriptivity
- Průměrná délka
- Tematická koncentrace
- Sekundární tematická koncentrace
- Klouzavý průměr TTR (MATTR, pro velikost okna L=100)
- Klouzavý průměr TTR (MATTR, pro velikost okna L=500)
- zTTR: Normalizované TTR
- Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=100)
- Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=500)