Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | |||
hickok:anotace_v_tabulkovem_procesoru [2024/03/04 10:17] – [Anotační nástroje a formát souboru] jiripergler | hickok:anotace_v_tabulkovem_procesoru [2024/03/04 10:18] (aktuální) – [Anotační nástroje a formát souboru] jiripergler | ||
---|---|---|---|
Řádek 15: | Řádek 15: | ||
* Není možné přidávat ani mazat řádky. Pokud anotátor odhalí chybnou tokenizaci nebo hranici vět, musí tento problém vyznačit dohodnutým způsobem (viz níže) na již existujících řádcích. | * Není možné přidávat ani mazat řádky. Pokud anotátor odhalí chybnou tokenizaci nebo hranici vět, musí tento problém vyznačit dohodnutým způsobem (viz níže) na již existujících řádcích. | ||
* Je možné dočasně řádky seřadit jinak, např. podle slovního tvaru, aby všechny výskyty téhož tvaru byly vidět za sebou. Poté je ale nutné uvést řádky do původního pořadí. Za tím účelem je v prvním sloupci každého souboru číslo řádku, takže stačí Excelu říct, aby řádky seřadil podle hodnot v prvním sloupci. | * Je možné dočasně řádky seřadit jinak, např. podle slovního tvaru, aby všechny výskyty téhož tvaru byly vidět za sebou. Poté je ale nutné uvést řádky do původního pořadí. Za tím účelem je v prvním sloupci každého souboru číslo řádku, takže stačí Excelu říct, aby řádky seřadil podle hodnot v prvním sloupci. | ||
- | * Není možné měnit id věty (sloupec SENTENCE), slova (sloupec ID) **ani tvar slova** (sloupec FORM). Počítá se s tím, že při přebírání dat bude skript podle těchto sloupců kontrolovat, | + | |
===== Jak hlásit změny ve větné segmentaci a v tokenizaci ===== | ===== Jak hlásit změny ve větné segmentaci a v tokenizaci ===== |