Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
kurz:hledani_v_paralelnim_korpusu [2016/12/01 14:08] – [Srovnávací výzkum na korpusu Jerome] michalskrabal | kurz:hledani_v_paralelnim_korpusu [2017/08/23 14:42] – jankocek | ||
---|---|---|---|
Řádek 6: | Řádek 6: | ||
===== Paralelní korpusy v rozhraní KonText ===== | ===== Paralelní korpusy v rozhraní KonText ===== | ||
- | Jak začít s hledáním v paralelním korpusu? Z výchozího rozcestníku, | + | Jak začít s hledáním v paralelním korpusu? Z výchozího rozcestníku, |
- | Takto je možné hledat pouze v českých textech zahrnutých do InterCorpu, primárně nás však budou zajímat paralelní konkordance. K tomu je zapotřebí přidat další jazyk. V sekci **Zarovnané korpusy** si vybereme druhý jazyk (případně jazyky další), který se má zobrazovat v rámci jednoho dotazu, např. **InterCorp | + | Takto je možné hledat pouze v českých textech zahrnutých do InterCorpu, primárně nás však budou zajímat paralelní konkordance. K tomu je zapotřebí přidat další jazyk. V sekci **Zarovnané korpusy** si vybereme druhý jazyk (případně jazyky další), který se má zobrazovat v rámci jednoho dotazu, např. **InterCorp |
První možností je zadat dotaz pouze do prvního jazyka. Budeme-li hledat například všechny překlady slova //pravda//, zadáme do prvního jazyka jako [[kurz: | První možností je zadat dotaz pouze do prvního jazyka. Budeme-li hledat například všechny překlady slova //pravda//, zadáme do prvního jazyka jako [[kurz: | ||
Řádek 59: | Řádek 59: | ||
* Velikost korpusu nekoreluje s počtem mluvčích daného jazyka (s jeho „velikostí“), | * Velikost korpusu nekoreluje s počtem mluvčích daného jazyka (s jeho „velikostí“), | ||
* U textů se značkami a lemmaty mohou přímočaře formulované dotazy na spřežková slova zůstat bez odpovědi. To se týká například anglických tvarů //can’t// nebo //I’m//, které tagger rozdělí na dvě slova (//ca n’t// a //I ’m//) s odpovídajícími lemmaty a značkami. Podobně je tomu i s polskými tvary typu //byłam// nebo // | * U textů se značkami a lemmaty mohou přímočaře formulované dotazy na spřežková slova zůstat bez odpovědi. To se týká například anglických tvarů //can’t// nebo //I’m//, které tagger rozdělí na dvě slova (//ca n’t// a //I ’m//) s odpovídajícími lemmaty a značkami. Podobně je tomu i s polskými tvary typu //byłam// nebo // | ||
- | * Paralelní korpus InterCorp se liší od korpusů řady [[cnk: | + | * Paralelní korpus InterCorp se liší od korpusů řady [[cnk: |
===== Srovnávací výzkum na korpusu InterCorp verze 7 ===== | ===== Srovnávací výzkum na korpusu InterCorp verze 7 ===== |