Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:intercorp:verze10 [2018/09/21 16:46] – [Velikost korpusu v tisících slov] úprava čísel adrianzasina | cnk:intercorp:verze10 [2022/08/29 18:18] (aktuální) – BatchEdit: pojmy>seznamy dokumenty IC cvrcek |
---|
^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] | 127 413 531 | 118 069 703 | 311 809 130 | 1 551 411 225 | | ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] | 127 413 531 | 118 069 703 | 311 809 130 | 1 551 411 225 | |
^ ::: ^ Počet [[pojmy:word|slovních tvarů]] | 102 609 763 | 89 841 420 | 258 807 848 | 1 225 034 182 | | ^ ::: ^ Počet [[pojmy:word|slovních tvarů]] | 102 609 763 | 89 841 420 | 258 807 848 | 1 225 034 182 | |
^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] | 1 507 | 6 | 3 232 | 106 | | ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[seznamy:strukturni_atributy_intercorp|dokumentů]] | 1 507 | 6 | 3 232 | 106 | |
^ ::: ^ Počet div | 1 507 | 111 672 | 3 232 | 1 841 341 | | ^ ::: ^ Počet div | 1 507 | 111 672 | 3 232 | 1 841 341 | |
^ ::: ^ Počet vět | 8 803 067 | 13 593 172 | 19 207 592 | 142 734 479 | | ^ ::: ^ Počet vět | 8 803 067 | 13 593 172 | 19 207 592 | 142 734 479 | |
* [[http://www.ling.su.se/english/nlp/tools/stagger/stagger-the-stockholm-tagger-1.98986|Stagger a IceStagger]] pro švédštinu a islandštinu (s poděkováním Robertu Östlingovi) | * [[http://www.ling.su.se/english/nlp/tools/stagger/stagger-the-stockholm-tagger-1.98986|Stagger a IceStagger]] pro švédštinu a islandštinu (s poděkováním Robertu Östlingovi) |
* [[https://github.com/uzh/reldi/tree/master/tools/tagger|RelDI tagger]] pro chorvatštinu a srbštinu (s poděkováním Nikolovi Ljubešićovi) | * [[https://github.com/uzh/reldi/tree/master/tools/tagger|RelDI tagger]] pro chorvatštinu a srbštinu (s poděkováním Nikolovi Ljubešićovi) |
* [[https://peteris.rocks/blog/latvian-part-of-speech-tagging/|LVTagger]] pro lotyštinu (s poděkováním Pēterisu Rocksovi a Michalu Škrabalovi) | * [[https://peteris.rocks/blog/latvian-part-of-speech-tagging/|LVTagger]] pro lotyštinu (s poděkováním Pēterisu Paikensovi a Michalu Škrabalovi) |
| |
---- | ---- |