AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:ortofon [2017/06/07 16:05] – [Složení korpusu a sběr dat] zuzanakomrskovacnk:ortofon [2017/07/06 10:35] – [Rozdíly mezi korpusem ORAL a ORTOFON] veronikapojarova
Řádek 15: Řádek 15:
 ^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] |  332 | ^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] |  332 |
 ^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] |  172 736 | ^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] |  172 736 |
-^ Počet unikátních (různých) mluvčích |  625 |  +^ Počet unikátních (různých) mluvčích |  624 |  
 ^ Délka nahrávek [hh:mm:ss.ms] |  102:41:14.247 |   ^ Délka nahrávek [hh:mm:ss.ms] |  102:41:14.247 |  
 </WRAP> </WRAP>
  
 ===== Složení korpusu a sběr dat ===== ===== Složení korpusu a sběr dat =====
-Korpus ORTOFON se skládá z 332 nahrávek z let 2012–2017 a obsahuje 1 013 565 textových slov, tj. celkem 1 240 147 pozic; v sondách vystupuje celkem 624 různých mluvčích. Nahrávky byly pořizovány v Čechách, na Moravě i ve Slezsku, jejich celková délka je téměř 103 hodin. Více kvantitativních údajů viz na stránce o [[cnk:struktura_ortofon|složení korpusu]].+Korpus ORTOFON se skládá z 332 nahrávek z let 2012–2017 a obsahuje 1 014 786 textových slov, tj. celkem 1 236 508 pozic; v sondách vystupuje celkem 624 různých mluvčích. Nahrávky byly pořizovány v Čechách, na Moravě i ve Slezsku, jejich celková délka je téměř 103 hodin. Více kvantitativních údajů viz na stránce o [[cnk:struktura_ortofon|složení korpusu]].
  
 Materiál byl sbírán v souladu s [[cnk:oral2013#slozeni_korpusu_a_sber_dat|kritérii]] platnými pro korpusy řady ORAL. Vzhledem k fonetické vrstvě přepisu byl kladen vyšší důraz na kvalitu nahrávek. Regionální původ mluvčích zahrnutých v korpusu ukazuje následující mapa. Hranice jednotlivých nářečních oblastí byly pro korpusy ORTOFON i DIALEKT zpřesněny. Materiál byl sbírán v souladu s [[cnk:oral2013#slozeni_korpusu_a_sber_dat|kritérii]] platnými pro korpusy řady ORAL. Vzhledem k fonetické vrstvě přepisu byl kladen vyšší důraz na kvalitu nahrávek. Regionální původ mluvčích zahrnutých v korpusu ukazuje následující mapa. Hranice jednotlivých nářečních oblastí byly pro korpusy ORTOFON i DIALEKT zpřesněny.
Řádek 43: Řádek 43:
   * **Rozšíření segmentu k poslechu**: Segment odděleného transkriptu může být dlouhý až 25 slov, což zlepšuje možnosti poslechu zvukového segmentu.   * **Rozšíření segmentu k poslechu**: Segment odděleného transkriptu může být dlouhý až 25 slov, což zlepšuje možnosti poslechu zvukového segmentu.
   * **Jiný způsob značení překryvů**: Překryvy jsou v traskriptu značeny hranatými závorkami, nejsou oddělovány ve zvuku, aby bylo možné je lépe poslouchat, srov. [[cnk:oral2013|ORAL2013]]. V korpusovém manažeru KonTextu jsou zobrazeny jako [[pojmy:atributy_strukturni#strukturni_atributy_mluvenych_korpusu|strukturní atributy]] (více viz [[kurz:hledani_ortofon| hledání v korpusu ORTOFON]]).   * **Jiný způsob značení překryvů**: Překryvy jsou v traskriptu značeny hranatými závorkami, nejsou oddělovány ve zvuku, aby bylo možné je lépe poslouchat, srov. [[cnk:oral2013|ORAL2013]]. V korpusovém manažeru KonTextu jsou zobrazeny jako [[pojmy:atributy_strukturni#strukturni_atributy_mluvenych_korpusu|strukturní atributy]] (více viz [[kurz:hledani_ortofon| hledání v korpusu ORTOFON]]).
-  * **Dostupnost audia**: Celý korpus ORTOFON je propojen se zvukem, takže je možná si vyhledanou konkordanci poslechnout (u korpusu [[cnk:oral|ORAL]] jenom části ORAL-Z a ORAL2013).+  * **Dostupnost audia**: Celý korpus ORTOFON je propojen se zvukem, takže je možné si vyhledanou konkordanci poslechnout (u korpusu [[cnk:oral|ORAL]] jenom části ORAL-Z a ORAL2013).
   * **Nové metainformace**: Byl rozšířen soubor metainformací sbíraných k celé nahrávce i jednotlivým mluvčím. Více viz [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_ortofon|přehled strukturních atributů]].   * **Nové metainformace**: Byl rozšířen soubor metainformací sbíraných k celé nahrávce i jednotlivým mluvčím. Více viz [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_ortofon|přehled strukturních atributů]].