AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:paradigmaticky [2021/06/21 12:44] – [Související odkazy] michalskrabalpojmy:paradigmaticky [2021/06/22 09:26] (aktuální) – [Související odkazy] vaclavcvrcek
Řádek 1: Řádek 1:
 ====== Paradigmatický dotaz ====== ====== Paradigmatický dotaz ======
  
-Kromě syntagmatického dotazu (hledáme množinu [[pojmy:token|tokenů]], které tvoří [[pojmy:kwic|KWIC]] spolu s okolním kontextem, přičemž výsledek se nám zobrazí v [[pojmy:konkordance|konkordanci]]) lze využít rovněž hledání paradigmatické, jež je vlastně kombinací několika dílčích syntagmatických dotazů a přináší průnik jejich frekvenčních distribucí. Výsledkem je tu tak množina [[pojmy:token|typů]], které odpovídají //všem// jednotlivým syntagmatickým dotazům. +Kromě syntagmatického dotazu (hledáme množinu [[pojmy:token|tokenů]], které tvoří [[pojmy:kwic|KWIC]] spolu s okolním kontextem, přičemž výsledek se nám zobrazí v [[pojmy:konkordance|konkordanci]]) lze využít rovněž hledání paradigmatické, jež je vlastně kombinací několika dílčích syntagmatických dotazů a přináší průnik jejich frekvenčních distribucí. Výsledkem je tu tak množina [[pojmy:token|typů]], které odpovídají //všem// jednotlivým syntagmatickým dotazům.((V. Cvrček: Paradigmatické korpusové dotazy a moderní diachronie. In: M. Stluka - M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha, Nakladatelství Lidové noviny, s. 117--129.)) 
  
 Typickým příkladem využití paradigmatického dotazu může být hledání slov patřících k jednomu morfologickému paradigmatu. Pokud bychom chtěli kupř. identifikovat všechna lemmata, která se skloňují podle vzoru //kuře//, mohli bychom postupovat takto: Typickým příkladem využití paradigmatického dotazu může být hledání slov patřících k jednomu morfologickému paradigmatu. Pokud bychom chtěli kupř. identifikovat všechna lemmata, která se skloňují podle vzoru //kuře//, mohli bychom postupovat takto:
  
    - vytvoříme soupis lemmat, která končí na //-e// a jejichž slovní tvar končí na //-ete// (např. //kuřete//) – v syntaxi CQL pomocí dotazu ''[lemma=%%"%%.+e%%"%% & word=%%"%%.+ete%%"%%]'' a z něj vytvořené frekvenční distribuce;    - vytvoříme soupis lemmat, která končí na //-e// a jejichž slovní tvar končí na //-ete// (např. //kuřete//) – v syntaxi CQL pomocí dotazu ''[lemma=%%"%%.+e%%"%% & word=%%"%%.+ete%%"%%]'' a z něj vytvořené frekvenční distribuce;
-   - vytvoříme soupis lemmat, která končí na //-e// a jejichž slovní tvar končí na //-e//, ale nikoli na  //-ete// (např. //kuře//) – pomocí dotazu ''[lemma=%%"%%.+e%%"%% & word=%%"%%.+(?<!(et))e%%"%%]''((Regulární výraz ''?<!'' označuje řetězec znaků, který //není// součastí hledaného výrazu.)) a z něj vytvořené frekvenční distribuce;+   - vytvoříme soupis lemmat, která končí na //-e// a jejichž slovní tvar končí na //-eti// (např. //kuřeti//) – pomocí dotazu ''[lemma=%%"%%.+e%%"%% & word=%%"%%.+eti%%"%%]'' a z něj vytvořené frekvenční distribuce;
    - vytvoříme soupis lemmat, která končí na //-e// a jejichž slovní tvar končí na //-ata// nebo //-at// (např. //kuřata// nebo //kuřat//) – pomocí dotazu ''[lemma=%%"%%.+e%%"%% & word=%%"%%.+ata?%%"%%]'' a z něj vytvořené frekvenční distribuce.    - vytvoříme soupis lemmat, která končí na //-e// a jejichž slovní tvar končí na //-ata// nebo //-at// (např. //kuřata// nebo //kuřat//) – pomocí dotazu ''[lemma=%%"%%.+e%%"%% & word=%%"%%.+ata?%%"%%]'' a z něj vytvořené frekvenční distribuce.
  
Řádek 15: Řádek 15:
 Pokud bychom se pokusili o zobecnění toho, jakou má paradigmatický dotaz strukturu, musíme ho rozdělit na dvě roviny: Pokud bychom se pokusili o zobecnění toho, jakou má paradigmatický dotaz strukturu, musíme ho rozdělit na dvě roviny:
  
-  *   rovina specifikace, tj. ta úroveň anotace, kterou užíváme ke specifikování paradigmatické jednotky (v příkladu uvedeném výše to byly lemmata a slovní tvary) +  *   rovina //specifikace//, tj. ta úroveň anotace, kterou užíváme ke specifikování paradigmatické jednotky (v příkladu uvedeném výše to byly lemmata a slovní tvary) 
-  *   rovina zobecnění, tj. ta úroveň anotace, jejíž jednotky budou výsledkem dotazu (v příkladu výše jsou to lemmata)+  *   rovina //zobecnění//, tj. ta úroveň anotace, jejíž jednotky budou výsledkem dotazu (v příkladu výše jsou to lemmata)
  
 Ptáme-li se tedy např. na morfologické paradigma, hledáme lexémy (tj. rovina zobecnění = lemmata), které mají určité vlastnosti, jež můžeme zadat např. pomocí tvaru lemmatu, slovního tvaru či podoby tagu (= rovina specifikace). Z toho plyne, že paradigmatické dotazování lze smysluplně realizovat na takových datech, která disponují alespoň dvěma rovinami anotace (lhostejno zda poziční či strukturní anotace).  Ptáme-li se tedy např. na morfologické paradigma, hledáme lexémy (tj. rovina zobecnění = lemmata), které mají určité vlastnosti, jež můžeme zadat např. pomocí tvaru lemmatu, slovního tvaru či podoby tagu (= rovina specifikace). Z toho plyne, že paradigmatické dotazování lze smysluplně realizovat na takových datech, která disponují alespoň dvěma rovinami anotace (lhostejno zda poziční či strukturní anotace). 
  
-Vzhledem k tomu, že výsledkem vyhodnocení paradigmatického dotazu je množina typů daná průnikem jednotlivých syntagmatických dotazů, je zřejmé, že musíme specifikovat minimálně dvě vlastnosti, které výsledná jednotka splňuje. Podstatné je, že mezi dílčími syntagmatickými dotazy nelze najít průnik na úrovni tokenů (např. žádný token nekončí zároveň na //-ete// i na //-ata//), v oblasti typů už však (na vhodně zvolené rovině zobecnění) ano – lemmata, která spojují slovní tvary s oběma koncovkami, v korpusu nalézt lze.+Vzhledem k tomu, že výsledkem vyhodnocení paradigmatického dotazu je množina typů daná průnikem jednotlivých syntagmatických dotazů, je zřejmé, že [[https://wiki.korpus.cz/doku.php/manualy:kontext:novy_dotaz#paradigmaticky_dotaz|musíme specifikovat minimálně dvě vlastnosti]], které výsledná jednotka splňuje. Podstatné je, že mezi dílčími syntagmatickými dotazy nelze najít průnik na úrovni tokenů (např. žádný token nekončí zároveň na //-ete// i na //-ata//), v oblasti typů už však (na vhodně zvolené rovině zobecnění) ano – lemmata, která spojují slovní tvary s oběma koncovkami, v korpusu nalézt lze.
  
-Specifický druh paradigmatického dotazování -- slovotvorný -- umožňuje i program [[https://morfio.korpus.cz/|Morfio]]. Pro další příklady využití paradigmatických dotazů viz Cvrček 2017.((V. Cvrček: Paradigmatické korpusové dotazy a moderní diachronie. In: M. Stluka - M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha, Nakladatelství Lidové noviny, s. 117--129.))+Specifický druh paradigmatického dotazování -- slovotvorný -- umožňuje i program [[https://morfio.korpus.cz/|Morfio]]. Pro další příklady využití paradigmatických dotazů viz Cvrček 2017.((ibid.))
  
 --- //Václav Cvrček// --- //Václav Cvrček//
Řádek 31: Řádek 31:
  
 <WRAP round box 50%> <WRAP round box 50%>
-[[pojmy:typ|Typ (type)]] • [[pojmy:token|Token]] • [[manualy:morfio|Morfio]]+[[pojmy:typ|Typ (type)]] • [[pojmy:token|Token]] • [[manualy:morfio|Morfio]] • [[manualy:kontext:novy_dotaz|KonText: Zadání dotazu]]
 </WRAP> </WRAP>