Nastavení

QuitaUp

Aplikace QuitaUp byla vytvořena za účelem poskytnout lingvistům i širšímu okruhu zájemců jednoduchý nástroj pro výpočet vybraných stylometrických indikátorů, které kvantitativně vyjadřují některé vlastnosti textu. Patří sem například výpočet slovního bohatství, tematické koncentrace či aktivity textu.

Aplikace je dostupná na adrese: https://www.korpus.cz/quitaup/

Součástí aplikace je podrobný manuál s popisem všech zjišťovaných stylometrických ukazatelů.

Vstupní data

Nahrávané texty musí být ve formátu .txt, .docx, .doc, .odt, .rtf nebo .pdf s kódováním unicode (UTF-8).

Výstupy

QuitaUp nabízí základní funkce předzpracování textu (tokenizace, lemmatizace, tagování slovních druhů, syntaktický parsing). Tyto funkce jsou dostupné pro různé jazyky (viz záložka Jazyk). Toto předzpracování textu je založeno na modelech vytvořených pomocí UDPipe (více na http://ufal.mff.cuni.cz/udpipe).

Implementované indexy:

  • Tokeny
  • Typy
  • TTR
  • h-point
  • Hapaxy
  • Podíl hapaxů k tokenům
  • Entropie
  • Verb distance
  • Activity
  • Descriptivity
  • Průměrná délka tokenu v počtu znaků
  • Tematická koncentrace
  • Sekundární tematická koncentrace
  • Klouzavý průměr TTR (MATTR, pro velikost okna L=100)
  • Klouzavý průměr TTR (MATTR, pro velikost okna L=500)
  • zTTR: Normalizované TTR
  • Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=100)
  • Klouzavý průměr morfologické bohatosti (MAMR, pro velikost okna L=500)

Jak citovat QuitaUp

Cvrček, V. – Čech, R. – Kubát, M. (2020): QuitaUp - nástroj pro kvantitativní stylometrickou analýzu. Czech National Corpus and University of Ostrava. Dostupný z WWW: <https://korpus.cz/quitaup/>