Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
cnk:intercorp:verze13ud [2022/08/13 10:01] – alexandrrosen | cnk:intercorp:verze13ud [2023/04/03 15:27] (aktuální) – [Přístup k textům] alexandrrosen | ||
---|---|---|---|
Řádek 4: | Řádek 4: | ||
^ [[pojmy: | ^ [[pojmy: | ||
^ ::: ^ Počet [[pojmy: | ^ ::: ^ Počet [[pojmy: | ||
- | ^ [[pojmy: | + | ^ [[pojmy: |
^ ::: ^ Počet textů | 1 657 | 111 951 | 3 994 | 1 843 528 | | ^ ::: ^ Počet textů | 1 657 | 111 951 | 3 994 | 1 843 528 | | ||
^ ::: ^ Počet vět | 9 782 002 | 13 606 198 | 24 318 736 | 143 196 252 | | ^ ::: ^ Počet vět | 9 782 002 | 13 606 198 | 24 318 736 | 143 196 252 | | ||
Řádek 21: | Řádek 21: | ||
InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy: | InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy: | ||
- | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na [[martin.vavrin@ff.cuni.cz|Martina Vavřína]]. | + | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na [[alexandr.rosen@ff.cuni.cz|Alexandra Rosena]]. |
Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Od verze 6 dál jsou všechny předchozí verze stále dostupné. Verzi 13, označenou 13ud, zveřejňujeme s lingvistickým značkováním podle standardu [[https:// | Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Od verze 6 dál jsou všechny předchozí verze stále dostupné. Verzi 13, označenou 13ud, zveřejňujeme s lingvistickým značkováním podle standardu [[https:// | ||
Řádek 29: | Řádek 29: | ||
* Z celkového počtu 41 jazyků (včetně češtiny) je ve verzi 13ud **lingvisticky anotovaných 36**; všechny takové jazyky jsou navíc vybaveny i **syntaktickou anotací**. | * Z celkového počtu 41 jazyků (včetně češtiny) je ve verzi 13ud **lingvisticky anotovaných 36**; všechny takové jazyky jsou navíc vybaveny i **syntaktickou anotací**. | ||
* Texty jsou ve všech jazycích **anotované stejně**, a to podle standardu UD ([[https:// | * Texty jsou ve všech jazycích **anotované stejně**, a to podle standardu UD ([[https:// | ||
- | * Podrobný popis využití anotace podle UD v korpusu InterCorp najdete pod heslem [[https:// | + | * Podrobný popis využití anotace podle UD v korpusu InterCorp najdete pod heslem [[pojmy: |
* Anotaci provedl u všech jazyků nástroj [[https:// | * Anotaci provedl u všech jazyků nástroj [[https:// | ||
belarusian-hse-ud-2.6-200830, | belarusian-hse-ud-2.6-200830, | ||
Řádek 194: | Řádek 194: | ||
</ | </ | ||
- | ===== Odkazy ===== | ||
- | |||
- | ==== Výběr literatury k UD ==== | ||
- | |||
- | Marie-Catherine de Marneffe, Christopher Manning, Joakim Nivre, Daniel Zeman (2021): [[https:// | ||
- | |||
- | Timothy Baldwin, William Croft, Joakim Nivre, Agata Savary (2021): [[https:// | ||
- | |||
- | Daniel Zeman (2018): [[https:// | ||
- | |||
- | Úplný seznam najdete [[https:// | ||
- | |||
- | ==== Tutoriály a přednášky o UD ==== | ||
- | |||
- | Daniel Zeman: [[https:// | ||
- | |||
- | Joakim Nivre, Daniel Zeman, Filip Ginter, Francis M. Tyers: [[http:// | ||
- | |||
- | Anna Nedoluzhko, Michal Novák, Martin Popel, Zdeněk Žabokrtský, | ||
- | |||
- | Daniel Zeman: [[https:// | ||
- | |||
- | ==== O korpusu InterCorp s anotací podle UD ==== | ||
- | |||
- | Olga Nádvorníková, | ||
- | [[https:// | ||
==== Viz též ==== | ==== Viz též ==== |