AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:reseni_ukolu [2016/08/30 14:10] – [Lekce 7] michalskrabalkurz:reseni_ukolu [2017/04/07 15:26] – [Lekce 3] michalskrabal
Řádek 25: Řádek 25:
 ===== Lekce 3 ===== ===== Lekce 3 =====
  
-  * Podřetězec //pes// se v korpusu [[cnk:syn2015|SYN2015]] vyskytuje celkem 15 581krát, frekvenční distribuce lemmat je následující:+  * Část slova //pes// se v korpusu [[cnk:syn2015|SYN2015]] vyskytuje celkem 15 581krát (typ dotazu: Slovní tvar; zaškrtnuta volba Shoda velikosti). Frekvenční distribuce lemmat je následující:
  
-[{{:kurz:podretezec_pes.png?nolink&600|FIXME}}]+[{{:kurz:podretezec_pes.png}}]
  
 <WRAP clear/> <WRAP clear/>
Řádek 112: Řádek 112:
 V korpusech řady ORAL se toto slovo -- s jedinou výjimkou (//tratoliště drobků// v [[cnk:oral2008|ORAL2008]]) -- nevyskytuje (protože jsou mluvené korpusy nelemmatizované, patrně jste hledali slovní tvar ''tratolišt.*''). Ovšem ruku na srdce, kdy naposledy jste o //tratolišti// hovořili vy sami? V korpusech řady ORAL se toto slovo -- s jedinou výjimkou (//tratoliště drobků// v [[cnk:oral2008|ORAL2008]]) -- nevyskytuje (protože jsou mluvené korpusy nelemmatizované, patrně jste hledali slovní tvar ''tratolišt.*''). Ovšem ruku na srdce, kdy naposledy jste o //tratolišti// hovořili vy sami?
  
-2. Porovnáváme kolokační profily adverbií //teď// a //nyní// a zamyšlíme se nad mírou jejich synonymnosti. Prvním rozdílem je jejich odlišná frekvence v korpusu SYN2015: 85 940 výskytů //teď// oproti 34 570 výskytům //nyní// -- první slovo je tedy téměř dvaapůlkrát častější než druhé. Ještě výmluvněji by tento rozdíl byl znát na mluvených korpusech, např. v ORAL2013 je to 8066 případů proti 4 (sic! a to jsme nezapočetli všechny možné varianty typu //teďkon%%(c)%%//, //teďka// apod., které si lze dohledat [[hledani_v_mluvenych_korpusech#jak_spravne_zadat_hledane_slovo|zde]]). Mimochodem, obdobné výsledky získáte i pomocí [[http://syd.korpus.cz/x0iwEkwx.syn|nástroje SyD]].+2. Porovnáváme kolokační profily adverbií //teď// a //nyní// a zamyšlíme se nad mírou jejich synonymnosti. Prvním rozdílem je jejich odlišná frekvence v korpusu SYN2015: 85 940 výskytů //teď// oproti 34 570 výskytům //nyní// -- první slovo je tedy téměř dvaapůlkrát častější než druhé. Ještě výmluvněji by tento rozdíl byl znát na mluvených korpusech, např. v ORAL2013 je to 8066 případů proti 4 (sic! a to jsme nezapočetli všechny možné varianty typu //teďkon%%(c)%%//, //teďka// apod., které si lze dohledat [[hledani_v_mluvenych_korpusech#jak_spravne_zadat_hledane_„slovo|zde]]). Mimochodem, obdobné výsledky získáte i pomocí [[http://syd.korpus.cz/x0iwEkwx.syn|nástroje SyD]].
  
 Závěrů, které lze z kolokační analýzy odvodit, je celá řada. Vybereme si proto jen ty nejviditelnější. Na první pohled upoutá fakt, že v první desítce kolokátů podle atributu **lc** najdeme jen dva společné: //teprve// a //už//. Synonymní //již// je vyhrazeno skoro výlučně lemmatu //nyní//, což může být důsledek toho, že jak //nyní//, tak //již// mají příznak knižnosti. Závěrů, které lze z kolokační analýzy odvodit, je celá řada. Vybereme si proto jen ty nejviditelnější. Na první pohled upoutá fakt, že v první desítce kolokátů podle atributu **lc** najdeme jen dva společné: //teprve// a //už//. Synonymní //již// je vyhrazeno skoro výlučně lemmatu //nyní//, což může být důsledek toho, že jak //nyní//, tak //již// mají příznak knižnosti.
Řádek 140: Řádek 140:
 Aktualizace lexému //tunel// hledáme pomocí dotazu ''[lemma=%%".*tunel.*"%%] within <opus txtype=%%"PUB" & rokvyd="2001"%% />'', případně v již vytvořeném subkorpusu dotazem na **Lemma** ''.*tunel.*''. V obou případech dostaneme 339 výskytů. Zatímco samotné základové slovo //tunel// si ve většině případů ponechává svůj původní význam, [[https://kontext.korpus.cz/freqs?q=~GDULH4Ir&attr_allpos=kw&attrs=word&corpname=syn2005&ctxattrs=word&pagesize=40&refs=%3Dopus.nazev&usesubcorp=pok01&viewmode=kwic&&fcrit=lemma/e+0~0%3E0&ml=0|jeho odvozeniny]] už mají většinou význam přenesený (až na výjimky typu //podtunelování// -- odborný termín, //Eurotunel// -- jméno firmy apod.).  Aktualizace lexému //tunel// hledáme pomocí dotazu ''[lemma=%%".*tunel.*"%%] within <opus txtype=%%"PUB" & rokvyd="2001"%% />'', případně v již vytvořeném subkorpusu dotazem na **Lemma** ''.*tunel.*''. V obou případech dostaneme 339 výskytů. Zatímco samotné základové slovo //tunel// si ve většině případů ponechává svůj původní význam, [[https://kontext.korpus.cz/freqs?q=~GDULH4Ir&attr_allpos=kw&attrs=word&corpname=syn2005&ctxattrs=word&pagesize=40&refs=%3Dopus.nazev&usesubcorp=pok01&viewmode=kwic&&fcrit=lemma/e+0~0%3E0&ml=0|jeho odvozeniny]] už mají většinou význam přenesený (až na výjimky typu //podtunelování// -- odborný termín, //Eurotunel// -- jméno firmy apod.). 
  
-V subkorpusu publicistiky z r. 2011 najdeme 292 výskytů, frekvenční distribuci lemmat můžeme vzájemně porovnat a shrnout např. do následující tabulky (podtrženy jsou případy, jež nás zajímají):+V subkorpusu publicistiky z r. 2011 najdeme 292 výskytů, frekvenční distribuci lemmat můžeme vzájemně porovnat a shrnout např. do následující tabulky (červeně zvýrazněny jsou případy, jež nás zajímají):
 ^ Lemma ^ 2001pub ^ 2011pub ^  ^ Lemma ^ 2001pub ^ 2011pub ^ 
 ^ tunel |  233  |  245  |  ^ tunel |  233  |  245  |
-__tunelář__ |  29  |  3  | +<fc #ff0000>tunelář</fc> |  29  |  3  | 
-__tunelování__ |  25  |  15  | +<fc #ff0000>tunelování</fc> |  25  |  15  | 
-__vytunelovaný__ |  10  |  6  | +<fc #ff0000>vytunelovaný</fc> |  10  |  6  | 
-__vytunelování__ |  9  |  5  | +<fc #ff0000>vytunelování</fc> |  9  |  5  | 
-__vytunelovat__ |  9  |  1  |  +<fc #ff0000>vytunelovat</fc> |  9  |  1  |  
-__tunelovat__ |  8  |  4  |+<fc #ff0000>tunelovat</fc> |  8  |  4  |
 ^ tunelový |  8  |  10  |  ^ tunelový |  8  |  10  |
-__tunelovaný__ |  1  |  0  |+<fc #ff0000>tunelovaný</fc> |  1  |  0  |
 ^ tunelovitý |  1  |  0  |  ^ tunelovitý |  1  |  0  |
-__tuneláž__ |  0  |  1  |+<fc #ff0000>tuneláž</fc> |  0  |  1  |
 ^ nano-tunel |  0  |  1  | ^ nano-tunel |  0  |  1  |
 ^ Eurotunel |  0  |  1  | ^ Eurotunel |  0  |  1  |
  
-Vidíme, že s jedinou výjimkou (//tunelář//) jsou počty dokladů přibližně stejné, což signalizuje dostatečnou etablovanost daného významu v tuzemské publicistice za posledních 15 let. Zajímavé doklady však najdeme též v jiných typech textů, byť tam převažuje původní význam slova. Vyhledávání stejného slovního základu (možno též typem dotazu **Podřetězec** ''tunel'') v celém korpusu SYN2005, resp. SYN2015 odhalí např. tyto další deriváty:+Vidíme, že s jedinou výjimkou (//tunelář//) jsou počty dokladů přibližně stejné, což signalizuje dostatečnou etablovanost daného významu v tuzemské publicistice za posledních 15 let. Zajímavé doklady však najdeme též v [[pojmy:txtype_group|jiných typech textů]], byť tam převažuje původní význam slova. Vyhledávání stejného slovního základu (možno též typem dotazu **Podřetězec** ''tunel'') v celém korpusu SYN2005, resp. SYN2015 odhalí např. tyto další deriváty:
  
 Veřejnost, která volá po tvrdší odplatě za činy zlosynů, //tunelujících// a plenících naši zem. (SYN2005) Veřejnost, která volá po tvrdší odplatě za činy zlosynů, //tunelujících// a plenících naši zem. (SYN2005)