AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
kurz:hledani_v_mluvenych_korpusech [2018/12/17 16:40] jankocekkurz:hledani_v_mluvenych_korpusech [2021/01/07 10:07] – [Rozdíly ve značení textu v mluveném a psaném korpuse] michalskrabal
Řádek 13: Řádek 13:
 ===== Rozdíly ve značení textu v mluveném a psaném korpuse ===== ===== Rozdíly ve značení textu v mluveném a psaném korpuse =====
 U psaného korpusu se doplňující informace týkají především díla samotného -- textu, jeho členění, roku vydání atp. U mluveného textu (transkriptu) máme základní informace o jeho autorovi (mluvčím) (viz [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|strukturu]]). U psaného korpusu se doplňující informace týkají především díla samotného -- textu, jeho členění, roku vydání atp. U mluveného textu (transkriptu) máme základní informace o jeho autorovi (mluvčím) (viz [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|strukturu]]).
-Transkript je ve všech mluvených korpusech členěn podle replik jednotlivých mluvčích; pouze korpus [[cnk:oral2013|ORAL2013]] zachycuje i souběžnou mluvu dvou mluvčích, tzv. "překryvy", a dělí repliky na menší části, tzv. segmenty, které jsou spojeny se zvukem a lze je přehrát.+Transkript je ve všech mluvených korpusech členěn podle replik jednotlivých mluvčích; pouze korpus [[cnk:oral2013|ORAL2013]] zachycuje i souběžnou mluvu dvou mluvčích, tzv. překryvy, a dělí repliky na menší části, tzv. segmenty, které jsou spojeny se zvukem a lze je přehrát.
  
 V následujícím textu chceme upozornit na odlišnosti při vyhledávání v psaném a v mluveném jazyce a na [[#strucna_charakteristika_transkripce_korpusu_rady_oral|odlišnosti transkripce jednotlivých korpusů řady ORAL]], jejichž neznalost by mohla způsobit špatnou interpretaci nalezených výsledků. V následujícím textu chceme upozornit na odlišnosti při vyhledávání v psaném a v mluveném jazyce a na [[#strucna_charakteristika_transkripce_korpusu_rady_oral|odlišnosti transkripce jednotlivých korpusů řady ORAL]], jejichž neznalost by mohla způsobit špatnou interpretaci nalezených výsledků.
  
-Vyhledávání v mluvených korpusech je v hlavních obrysech stejné jako u psaných korpusů série [[cnk:syn|SYN]] (stejné [[kurz:prvni_dotaz#typy_dotazu|základní typy dotazů]], stejný dotazovací jazyk [[kurz:cql|CQL]]); pokud jste v korpusu nikdy nehledali, projděte si tedy prosím nejprve [[kurz:prvni_dotaz|rychlokurz v dotazování]], zbytek textu předpokládá jeho znalost. V některých ohledech se ale způsob vyhledávání liší, a to zejména v těchto:+Vyhledávání v mluvených korpusech je v hlavních obrysech stejné jako u psaných korpusů série [[cnk:syn|SYN]] (stejné základní [[manualy:kontext:novy_dotaz#typy_dotazu|dva typy dotazů]], stejný dotazovací jazyk [[pojmy:dotazovaci_jazyk|CQL]]); pokud jste v korpusu nikdy nehledali, projděte si tedy prosím nejprve [[kurz:prvni_dotaz|rychlokurz v dotazování]], zbytek textu předpokládá jeho znalost. V některých ohledech se ale způsob vyhledávání liší, a to zejména v těchto:
  
   - v mluvených korpusech je **větší variabilita forem** -- existují různé transkripční varianty stejného slova, nářeční varianty (//sme -- zme//) apod.,   - v mluvených korpusech je **větší variabilita forem** -- existují různé transkripční varianty stejného slova, nářeční varianty (//sme -- zme//) apod.,