Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kurz:chvala_korpusu [2015/01/21 15:21]
Václav Cvrček (admin) Page moved from kurz:chvala_korpusu to manual:chvala_korpusu
kurz:chvala_korpusu [2018/08/13 15:14] (aktuální)
Václav Cvrček [Hledáme veškerou interpunkci v mluveném korpusu (počet pozic obsazených slovy)]
Řádek 1: Řádek 1:
 ====== Jak na výzkumné otázky ====== ====== Jak na výzkumné otázky ======
  
-V [[manual:uvod|manuálu]] jsme si postupně v sedmi lekcích ukázali, jak položit [[manual:pokrocile_dotazy|pokročilé dotazy]] pomocí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] a osvojili jsme si principy práce s [[manual:pokrocile_dotazy#regularni_vyrazy|regulárními výrazy]], [[manual:pokrocile_dotazy#kombinace_podminek_v_ramci_jedne_pozice|kombinacemi podmínek]] či třeba [[manual:subkorpusy|subkorpusy]]. Chcete-li se nechat provést všemi zásadními tématy souvisejícími s korpusovým výzkumem, nalistujte si právě [[manual:uvod|manuál]].+V [[kurz:uvod|kurzu]] jsme si postupně v sedmi lekcích ukázali, jak položit [[pokrocile_dotazy|pokročilé dotazy]] pomocí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] a osvojili jsme si principy práce s [[pokrocile_dotazy#regularni_vyrazy|regulárními výrazy]], [[pokrocile_dotazy#kombinace_podminek_v_ramci_jedne_pozice|kombinacemi podmínek]] či třeba [[subkorpusy|subkorpusy]]. Chcete-li se nechat provést všemi zásadními tématy souvisejícími s korpusovým výzkumem, nalistujte si právě náš základní kurz.
  
-Tato stránka pak slouží k nastínění postupů používaných při řešení konkrétních výzkumných problémů na základě korpusových dat. Nečiní si nárok na úplnost, doufáme ale, že zde najdete inspiraci a pokud si s něčím i po prostudování manuálu nebudete vědět rady, [[manual:kontaktujte nás]]!+Tato stránka pak slouží k nastínění postupů používaných při řešení konkrétních výzkumných problémů na základě korpusových dat. Nečiní si nárok na úplnost, doufáme ale, že zde najdete inspiraci a pokud si s něčím i po prostudování [[kurz:uvod|kurzu]] a [[manualy:kontext:index|manuálu]] nebudete vědět rady, [[https://podpora.korpus.cz/projects/poradna/boards|kontaktujte nás]] (pouze pro [[kurz:zaciname|registrované]] uživatele)!
  
 ====== Různé typy výzkumných otázek ====== ====== Různé typy výzkumných otázek ======
Řádek 30: Řádek 30:
  
  
-Výsledek: .... +Výsledek: FIXME
  
  
Řádek 36: Řádek 36:
  
   * V korpusech řady SYN je pro zkoumání //čisté češtiny// třeba vyhledávat zkoumaný jev v těch textech, které splňují podmínku within <srclang=%%""%%/>   * V korpusech řady SYN je pro zkoumání //čisté češtiny// třeba vyhledávat zkoumaný jev v těch textech, které splňují podmínku within <srclang=%%""%%/>
-  * V korpusech z paralelní řady zvané InterCorp už atribut [[manual:srclang="cs"]] zanesený je. Všimněte si ale, že u hodnoty atributů záleží i na velikosti písmen:  +  * V korpusech z paralelní řady zvané InterCorp už atribut [[pojmy:srclang|srclang="cs"]] zanesený je. Všimněte si ale, že u hodnoty atributů záleží i na velikosti písmen.
- +
-  * +
  
 ==== Autorský jazyk a sociolingvistické proměnné ==== ==== Autorský jazyk a sociolingvistické proměnné ====
Řádek 51: Řádek 49:
 ''[tag=%%"I.*"%%]  within <opus preklad=%%"Pellar.*"%% />'' ''[tag=%%"I.*"%%]  within <opus preklad=%%"Pellar.*"%% />''
  
-{{:manual:syn_autorsky_jazyk_pellar.jpg?direct&300|}}+{{syn_autorsky_jazyk_pellar.jpg?direct&300|}}
  
-{{:manual:tag_interjekce.jpg?300|}}+{{tag_interjekce.jpg?300|}}
  
 Frekvenčnímu seznamu dominuje následujících 30 lemmat: Frekvenčnímu seznamu dominuje následujících 30 lemmat:
  
-{{:manual:interjekce_pellar.jpg?300|}}+{{interjekce_pellar.jpg?300|}}
  
 Další srovnávání podobně utvářených a funkčně blízkých výrazů typu //propánakrále// a //prokristapána// ukazuje, že první lexém je používaný především jako charakterizační prostředek jazyka hlavní postavy románu Kdo chytá v žitě. Naopak **//prokristapána//** je mnohem rovnoměrněji zastoupeno ve vyšším počtu děl, konkrétně sedmi. Další srovnávání podobně utvářených a funkčně blízkých výrazů typu //propánakrále// a //prokristapána// ukazuje, že první lexém je používaný především jako charakterizační prostředek jazyka hlavní postavy románu Kdo chytá v žitě. Naopak **//prokristapána//** je mnohem rovnoměrněji zastoupeno ve vyšším počtu děl, konkrétně sedmi.
Řádek 172: Řádek 170:
  
 Eliminujeme-li výše uvedená interpunkční znaménka, zbývá nám skutečně 1 064 627 pozic obsazených slovy? Eliminujeme-li výše uvedená interpunkční znaménka, zbývá nám skutečně 1 064 627 pozic obsazených slovy?
-Nikoli. Po bližším pohledu vyjde najevo, že mluvené korpusy obsahují řadu dalších značek, které nelze označit za interpunkční znaménka, ovšem zaujímají strukturní pozice. Jejich přehled lze nalézt v  [[seznamy:pravidlaprepispravidlech pro přepis]].+Nikoli. Po bližším pohledu vyjde najevo, že mluvené korpusy obsahují řadu dalších značek, které nelze označit za interpunkční znaménka, ovšem zaujímají strukturní pozice. Jejich přehled lze nalézt v  [[seznamy:index#pravidla_pro_prepis|Pravidla pro přepis nahrávek]].
  
 Řešením se zdá být dotaz po všech znacích nealfabetické povahy.  Řešením se zdá být dotaz po všech znacích nealfabetické povahy. 
Řádek 201: Řádek 199:
 Takový výsledek již lze považovat za směrodatný. Takový výsledek již lze považovat za směrodatný.
  
-Ještě poznámka: ačkoliv se různé mluvené korpusy liší, např. [[cnk:schola2010|SCHOLA2010]] obsahuje interpunkci a rozdílné závorky pro různé typy komentářů ([[seznamy:pravidlaprepis]]), tento dotaz platí i pro něj:+Ještě poznámka: ačkoliv se různé mluvené korpusy liší, např. [[cnk:schola2010|SCHOLA2010]] obsahuje interpunkci a rozdílné závorky pro různé typy komentářů ([[seznamy:index#pravidla_pro_prepis|Pravidla pro přepis nahrávek]]), tento dotaz platí i pro něj:
  
 ^ korpus ^ celková velikost ^ počet nealfabetických výskytů ^ zbývající pozice obsazené slovními tvary ^ ^ korpus ^ celková velikost ^ počet nealfabetických výskytů ^ zbývající pozice obsazené slovními tvary ^
Řádek 207: Řádek 205:
  
 Odkaz na tento dotaz [[http://bit.ly/14kx4s2|naleznete zde]]. Odkaz na tento dotaz [[http://bit.ly/14kx4s2|naleznete zde]].
- 
 ===== 5. kontrastivní výzkum ===== ===== 5. kontrastivní výzkum =====
  
Řádek 214: Řádek 211:
 ==== Ekvivalenty v překladech: „Macher“ ==== ==== Ekvivalenty v překladech: „Macher“ ====
 //False friends// jsou výrazy, na něž je klasický slovník často krátký. Patří mezi ně třeba německé //Macher// - není to totiž namyšlený český //machr//, ale docela obyčejný //hybatel dění// či //strůjce//, //původce//. //False friends// jsou výrazy, na něž je klasický slovník často krátký. Patří mezi ně třeba německé //Macher// - není to totiž namyšlený český //machr//, ale docela obyčejný //hybatel dění// či //strůjce//, //původce//.
-Lépe než slovník k nalezení vhodného překladu poslouží [[manual:paralelní rozhraní]]:+Lépe než slovník k nalezení vhodného překladu poslouží [[kurz:hledani_v_paralelnim_korpusu|paralelní rozhraní]]:
  
 ==== Adverbiale na počátku věty v angličtině ==== ==== Adverbiale na počátku věty v angličtině ====
Řádek 224: Řádek 221:
  
  
-{{:manual:intercorp_adverbiale.jpg?300|}}+{{intercorp_adverbiale.jpg?300|}}
  
  
Řádek 234: Řádek 231:
  
  --- //Václav Cvrček//  --- //Václav Cvrček//
 +