Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kurz:chvala_korpusu [2015/01/21 16:37]
127.0.0.1 upraveno mimo DokuWiki
kurz:chvala_korpusu [2018/08/13 15:14]
Václav Cvrček [Hledáme veškerou interpunkci v mluveném korpusu (počet pozic obsazených slovy)]
Řádek 30: Řádek 30:
  
  
-Výsledek: ​.... +Výsledek: ​FIXME
  
  
Řádek 36: Řádek 36:
  
   * V korpusech řady SYN je pro zkoumání //čisté češtiny// třeba vyhledávat zkoumaný jev v těch textech, které splňují podmínku within <​srclang=%%""​%%/>​. ​   * V korpusech řady SYN je pro zkoumání //čisté češtiny// třeba vyhledávat zkoumaný jev v těch textech, které splňují podmínku within <​srclang=%%""​%%/>​. ​
-  * V korpusech z paralelní řady zvané InterCorp už atribut [[pojmy:​srclang|srclang="​cs"​]] zanesený je. Všimněte si ale, že u hodnoty atributů záleží i na velikosti písmen:  +  * V korpusech z paralelní řady zvané InterCorp už atribut [[pojmy:​srclang|srclang="​cs"​]] zanesený je. Všimněte si ale, že u hodnoty atributů záleží i na velikosti písmen.
- +
-  * +
  
 ==== Autorský jazyk a sociolingvistické proměnné ==== ==== Autorský jazyk a sociolingvistické proměnné ====
Řádek 172: Řádek 170:
  
 Eliminujeme-li výše uvedená interpunkční znaménka, zbývá nám skutečně 1 064 627 pozic obsazených slovy? Eliminujeme-li výše uvedená interpunkční znaménka, zbývá nám skutečně 1 064 627 pozic obsazených slovy?
-Nikoli. Po bližším pohledu vyjde najevo, že mluvené korpusy obsahují řadu dalších značek, které nelze označit za interpunkční znaménka, ovšem zaujímají strukturní pozice. Jejich přehled lze nalézt v  [[seznamy:pravidlaprepispravidlech ​pro přepis]].+Nikoli. Po bližším pohledu vyjde najevo, že mluvené korpusy obsahují řadu dalších značek, které nelze označit za interpunkční znaménka, ovšem zaujímají strukturní pozice. Jejich přehled lze nalézt v  [[seznamy:index#​pravidla_pro_prepis|Pravidla ​pro přepis ​nahrávek]].
  
 Řešením se zdá být dotaz po všech znacích nealfabetické povahy. ​ Řešením se zdá být dotaz po všech znacích nealfabetické povahy. ​
Řádek 201: Řádek 199:
 Takový výsledek již lze považovat za směrodatný. Takový výsledek již lze považovat za směrodatný.
  
-Ještě poznámka: ačkoliv se různé mluvené korpusy liší, např. [[cnk:​schola2010|SCHOLA2010]] obsahuje interpunkci a rozdílné závorky pro různé typy komentářů ([[seznamy:pravidlaprepis]]), tento dotaz platí i pro něj:+Ještě poznámka: ačkoliv se různé mluvené korpusy liší, např. [[cnk:​schola2010|SCHOLA2010]] obsahuje interpunkci a rozdílné závorky pro různé typy komentářů ([[seznamy:index#​pravidla_pro_prepis|Pravidla pro přepis nahrávek]]), tento dotaz platí i pro něj:
  
 ^ korpus ^ celková velikost ^ počet nealfabetických výskytů ^ zbývající pozice obsazené slovními tvary ^ ^ korpus ^ celková velikost ^ počet nealfabetických výskytů ^ zbývající pozice obsazené slovními tvary ^
Řádek 207: Řádek 205:
  
 Odkaz na tento dotaz [[http://​bit.ly/​14kx4s2|naleznete zde]]. Odkaz na tento dotaz [[http://​bit.ly/​14kx4s2|naleznete zde]].
- 
 ===== 5. kontrastivní výzkum ===== ===== 5. kontrastivní výzkum =====