Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:intercorp:verze9 [2016/07/11 11:04] – [Jak citovat] alexandrrosen | cnk:intercorp:verze9 [2017/09/05 00:01] – [Poděkování] alexandrrosen | ||
---|---|---|---|
Řádek 51: | Řádek 51: | ||
* publistické články a zpravodajství z webových stránek [[http:// | * publistické články a zpravodajství z webových stránek [[http:// | ||
- | * právní texty Evropské unie z korpusu [[http://langtech.jrc.it/JRC-Acquis.html|Acquis Communautaire]] | + | * právní texty Evropské unie z korpusu [[https://ec.europa.eu/jrc/ |
* zápisy jednání Evropského parlamentu z let 2007–2011 z korpusu [[http:// | * zápisy jednání Evropského parlamentu z let 2007–2011 z korpusu [[http:// | ||
* filmové titulky z databáze [[http:// | * filmové titulky z databáze [[http:// | ||
Řádek 88: | Řádek 88: | ||
| ja | japonština | 0 | 0 | 0 | 0 | 0 | 113 | 113 | | | ja | japonština | 0 | 0 | 0 | 0 | 0 | 113 | 113 | | ||
| lt | litevština | 358 | 0 | 0 | 18 392 | 11 212 | 557 | 30 521 | | | lt | litevština | 358 | 0 | 0 | 18 392 | 11 212 | 557 | 30 521 | | ||
- | | lv | lotyština | 1 336 | 0 | 0 | | + | | lv | lotyština | 1 666 | 0 | 0 | |
| mk | makedonština | 4 663 | 0 | 0 | 0 | 0 | 1 877 | 6 540 | | | mk | makedonština | 4 663 | 0 | 0 | 0 | 0 | 1 877 | 6 540 | | ||
| ms | malajština | 0 | 0 | 0 | 0 | 0 | 3 520 | 3 520 | | | ms | malajština | 0 | 0 | 0 | 0 | 0 | 3 520 | 3 520 | | ||
Řádek 130: | Řádek 130: | ||
^ maďarština | ✔ | | ^ maďarština | ✔ | | ||
^ němčina | ✔ | ✔ | [[http:// | ^ němčina | ✔ | ✔ | [[http:// | ||
- | ^ nizozemština | ✔ | | + | ^ nizozemština | ✔ | |
^ norština | ✔ | ✔ | [[http:// | ^ norština | ✔ | ✔ | [[http:// | ||
^ polština | ✔ | ✔ | [[http:// | ^ polština | ✔ | ✔ | [[http:// | ||
Řádek 215: | Řádek 215: | ||
- | * Tabulka uvádí počty textů v jádru korpusu InterCorp. | + | * Tabulka uvádí počty textů v jádru korpusu InterCorp |
* Pro každý jazyk, který má v jádru nějaké texty, jsou v příslušném řádku uvedeny počty textů, zvlášť podle jazyka originálu, uvedeného v záhlaví příslušného sloupce. Takže např. v arabštině jádro obsahuje jeden arabský, jeden český a jeden německý originální text. Celkem jsou tedy v jádru 3 texty v arabštině (viz předposlední sloupec). | * Pro každý jazyk, který má v jádru nějaké texty, jsou v příslušném řádku uvedeny počty textů, zvlášť podle jazyka originálu, uvedeného v záhlaví příslušného sloupce. Takže např. v arabštině jádro obsahuje jeden arabský, jeden český a jeden německý originální text. Celkem jsou tedy v jádru 3 texty v arabštině (viz předposlední sloupec). | ||
* Ve sloupcích lze zjistit, kolik originálních textů v jazyku uvedeném v záhlaví je přeloženo do ostatních jazyků. Kódy těchto jazyků jsou v prvním sloupci. Poslední sloupec udává počet originálních textů v jiných jazycích, které jádro InterCorpu neobsahuje. | * Ve sloupcích lze zjistit, kolik originálních textů v jazyku uvedeném v záhlaví je přeloženo do ostatních jazyků. Kódy těchto jazyků jsou v prvním sloupci. Poslední sloupec udává počet originálních textů v jiných jazycích, které jádro InterCorpu neobsahuje. | ||
Řádek 228: | Řádek 228: | ||
* beletristické texty v řadě slovanských i jiných jazyků z korpusu [[http:// | * beletristické texty v řadě slovanských i jiných jazyků z korpusu [[http:// | ||
* publicistické texty ve více jazycích z webových stránek [[http:// | * publicistické texty ve více jazycích z webových stránek [[http:// | ||
- | * publicistické texty ve více jazycích ze serveru [[http:// | + | * publicistické texty ve více jazycích ze serveru [[http:// |
* právnické texty v jazycích EU z korpusu [[http:// | * právnické texty v jazycích EU z korpusu [[http:// | ||
* jednání Evropského parlamentu z korpusu [[http:// | * jednání Evropského parlamentu z korpusu [[http:// | ||
Řádek 255: | Řádek 255: | ||
* [[http:// | * [[http:// | ||
* [[http:// | * [[http:// | ||
- | * tagger pro litevštinu (s poděkováním | + | * tagger pro litevštinu (s poděkováním |
- | * [[https:// | + | |
* [[http:// | * [[http:// | ||
* [[http:// | * [[http:// | ||
* [[http:// | * [[http:// | ||
- | * [[https://github.com/TurkuNLP/Finnish-dep-parser|OMorFi+HunPOS]] pro finštinu (s poděkováním Filipu Ginterovi) | + | * [[http://www.ling.helsinki.fi/kieliteknologia/tutkimus/ |
* [[http:// | * [[http:// | ||
+ | * | ||
+ | * [[https:// | ||
---- | ---- | ||
- | |||
==== Související odkazy ==== | ==== Související odkazy ==== | ||