Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | Následující verzeObě strany příští revize | ||
kurz:hledani_v_mluvenych_korpusech [2018/12/17 16:40] – jankocek | kurz:hledani_v_mluvenych_korpusech [2021/01/07 10:07] – [Rozdíly ve značení textu v mluveném a psaném korpuse] michalskrabal | ||
---|---|---|---|
Řádek 13: | Řádek 13: | ||
===== Rozdíly ve značení textu v mluveném a psaném korpuse ===== | ===== Rozdíly ve značení textu v mluveném a psaném korpuse ===== | ||
U psaného korpusu se doplňující informace týkají především díla samotného -- textu, jeho členění, roku vydání atp. U mluveného textu (transkriptu) máme základní informace o jeho autorovi (mluvčím) (viz [[pojmy: | U psaného korpusu se doplňující informace týkají především díla samotného -- textu, jeho členění, roku vydání atp. U mluveného textu (transkriptu) máme základní informace o jeho autorovi (mluvčím) (viz [[pojmy: | ||
- | Transkript je ve všech mluvených korpusech členěn podle replik jednotlivých mluvčích; pouze korpus [[cnk: | + | Transkript je ve všech mluvených korpusech členěn podle replik jednotlivých mluvčích; pouze korpus [[cnk: |
V následujícím textu chceme upozornit na odlišnosti při vyhledávání v psaném a v mluveném jazyce a na [[# | V následujícím textu chceme upozornit na odlišnosti při vyhledávání v psaném a v mluveném jazyce a na [[# | ||
- | Vyhledávání v mluvených korpusech je v hlavních obrysech stejné jako u psaných korpusů série [[cnk: | + | Vyhledávání v mluvených korpusech je v hlavních obrysech stejné jako u psaných korpusů série [[cnk: |
- v mluvených korpusech je **větší variabilita forem** -- existují různé transkripční varianty stejného slova, nářeční varianty (//sme -- zme//) apod., | - v mluvených korpusech je **větší variabilita forem** -- existují různé transkripční varianty stejného slova, nářeční varianty (//sme -- zme//) apod., |