Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
kurz:hledani_v_paralelnim_korpusu [2021/04/19 14:35] – [Specifika vyhledávání v paralelním korpusu] michalskrabal | kurz:hledani_v_paralelnim_korpusu [2022/11/25 10:01] – [Srovnávací výzkum na korpusu InterCorp verze 10] michalskrabal | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Specifika vyhledávání v paralelním korpusu ====== | ====== Specifika vyhledávání v paralelním korpusu ====== | ||
- | Z výchozího rozcestníku, | + | Z výchozího rozcestníku, |
- | Takto je možné hledat pouze v českých textech zahrnutých do InterCorpu, primárně nás však budou zajímat paralelní konkordance. K tomu je zapotřebí přidat další jazyk. V sekci **Zarovnané korpusy** si vybereme druhý jazyk (případně jazyky další), který se má zobrazovat v rámci jednoho dotazu, např. **InterCorp | + | Takto je možné hledat pouze v českých textech zahrnutých do InterCorpu, primárně nás však budou zajímat paralelní konkordance. K tomu je zapotřebí přidat další jazyk. V sekci **Zarovnané korpusy** si vybereme druhý jazyk (případně jazyky další), který se má zobrazovat v rámci jednoho dotazu, např. **InterCorp |
První možností je zadat dotaz pouze do prvního jazyka. Budeme-li hledat například všechny překlady slova //pravda//, zadáme do prvního jazyka tento výraz s výchozím atributem **lemma** a dotaz na druhý jazyk necháme prázdný. | První možností je zadat dotaz pouze do prvního jazyka. Budeme-li hledat například všechny překlady slova //pravda//, zadáme do prvního jazyka tento výraz s výchozím atributem **lemma** a dotaz na druhý jazyk necháme prázdný. | ||
Řádek 47: | Řádek 47: | ||
* Ne každý jazyk v korpusu InterCorp je [[pojmy: | * Ne každý jazyk v korpusu InterCorp je [[pojmy: | ||
- | * Způsob tagování je pro různé jazyky odlišný -- může se lišit repertoárem a obsahem morfologických kategorií i způsobem jejich zápisu. | + | * Způsob tagování je pro různé jazyky odlišný -- může se lišit repertoárem a obsahem morfologických kategorií i způsobem jejich zápisu. Výjimkou je verze [[cnk: |
* Korpusy jednotlivých jazyků se výrazně liší co do složení textových typů i žánrů, většinou tedy nejsou mezi sebou snadno srovnatelné. | * Korpusy jednotlivých jazyků se výrazně liší co do složení textových typů i žánrů, většinou tedy nejsou mezi sebou snadno srovnatelné. | ||
* Velikost korpusu nekoreluje s počtem mluvčích daného jazyka (s jeho „velikostí“), | * Velikost korpusu nekoreluje s počtem mluvčích daného jazyka (s jeho „velikostí“), | ||
Řádek 53: | Řádek 53: | ||
* Paralelní korpus InterCorp se liší od korpusů řady [[cnk: | * Paralelní korpus InterCorp se liší od korpusů řady [[cnk: | ||
- | ===== Srovnávací výzkum na korpusu InterCorp verze 10 ===== | + | ===== Srovnávací výzkum na korpusu InterCorp verze 15 ===== |
Primárně jsou paralelní korpusy určeny pro provádění kontrastivního výzkumu. Lze je ovšem využít i pro srovnávání vlivu překladovosti v rámci jednoho jazyka. | Primárně jsou paralelní korpusy určeny pro provádění kontrastivního výzkumu. Lze je ovšem využít i pro srovnávání vlivu překladovosti v rámci jednoho jazyka. |