Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
| cnk:aranea [2015/06/18 13:08] – [Jak citovat korpusy Aranea] michalkren | cnk:aranea [2026/04/08 13:29] (aktuální) – [Jak citovat korpusy Aranea] michalkren | ||
|---|---|---|---|
| Řádek 1: | Řádek 1: | ||
| ====== Korpusy Aranea ====== | ====== Korpusy Aranea ====== | ||
| - | Rodina nereferenčních srovnatelných webových korpusů sestavených [[http:// | + | Rodina nereferenčních srovnatelných webových korpusů sestavených [[http:// |
| + | |||
| + | Srovnatelnosti korpusů pro jednotlivé jazyky bylo dosaženo shodnou metodikou jejich tvorby, přibližně stejnou velikostí, dobou akvizice dat a použitím shodných nástrojů pro další zpracování (filtrace, deduplikace, | ||
| ===== Jak citovat korpusy Aranea ===== | ===== Jak citovat korpusy Aranea ===== | ||
| <WRAP round tip 70%> | <WRAP round tip 70%> | ||
| Řádek 7: | Řádek 10: | ||
| Benko, V. (2014): Aranea: Yet Another Family of (Comparable) Web Corpora. In: Sojka, P. – Horák, A. – Kopeček, I. – Pala, K. (eds): //TSD 2014//, LNAI 8655, 257–264. Springer International Publishing. | Benko, V. (2014): Aranea: Yet Another Family of (Comparable) Web Corpora. In: Sojka, P. – Horák, A. – Kopeček, I. – Pala, K. (eds): //TSD 2014//, LNAI 8655, 257–264. Springer International Publishing. | ||
| + | |||
| + | Benko, V. (2024): The Aranea Corpora Family: Ten+ Years of Processing Web-Crawled Data. In: Nöth, E. – Horák, A. – Sojka, P. (eds): //Text, Speech, and Dialogue. TSD 2024.// Lecture Notes in Computer Science, vol 15048. Springer, Cham. https:// | ||
| + | |||
| </ | </ | ||