AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:case-sensitive [2013/08/21 13:23] alzbetavitkovapojmy:case-sensitive [2021/01/18 10:08] (aktuální) vaclavcvrcek
Řádek 4: Řádek 4:
  
 Case-insensitive analýzu si tak můžeme představit jako analýzu, které předchází to, že jsme všechna písmena v textu převedli na minuskule (malá písmena). Vyhodnocení takového textu (např. počet různých jednotek - [[pojmy:typ|typů]], jejich [[pojmy:frekvence|frekvence]], třídění apod.) se samozřejmě bude lišit od situace, kdy velikost písmen může rozlišovat slova (case-sensitive přístup). Case-insensitive analýzu si tak můžeme představit jako analýzu, které předchází to, že jsme všechna písmena v textu převedli na minuskule (malá písmena). Vyhodnocení takového textu (např. počet různých jednotek - [[pojmy:typ|typů]], jejich [[pojmy:frekvence|frekvence]], třídění apod.) se samozřejmě bude lišit od situace, kdy velikost písmen může rozlišovat slova (case-sensitive přístup).
 +
 +===== Vyhledávání =====
 +
 +To, zda vyhledáváme case-sensitive nebo case-insensitive, záleží na [[kurz:prvni_dotaz#nac_je_ktery_typ_dotazu_vhodny|typu dotazu]] i na použitém pozičním [[pojmy:atributy_pozicni|atributu]]. Standardní nastavení jsou tato:
 +
 +==== Typ dotazu ====
 +
 +^ Typ ^ Nastavení ^
 +^ Základní | case-insensitive |
 +^ Lemma | case-insensitive((Platí ovšem, že propriální lemmata mají velké počáteční písmeno, např. //Praha//.)) |
 +^ Fráze | case-sensitive |
 +^ Slovní tvar | case-insensitive((Tuto volbu je možné ve formuláři přepnout.)) |
 +^ Část slova | case-sensitive |
 +^ CQL | case-sensitive |
 +
 +V případě [[pojmy:dotazovaci_jazyk|CQL]] dotazu je možné case-insensitive hledání zadat pomocí speciální struktury ''(?i)''. Pokud tato značka v CQL dotazu předchází hodnotu, bude dotaz vyhodnocen bez ohledu na velikost písmen, např. ''[word=%%"(?i)nový"%%]'' najde jak slovo //nový//, tak podobu //Nový// nebo //NOVÝ//.
 +
 +==== Typ atributu ====
 +
 +^ Typ ^ Nastavení ^
 +^ word | case-sensitive |
 +^ lemma | case-insensitive((Apelativní lemmata se vyhodnocují bez ohledu na malá a velká písmena, propriální lemmata mají první počáteční písmeno velké, např. //Liberec//.)) |
 +^ tag/pos | case-sensitive |
 +^ lc | case-insensitive |
 +
 +Atribut ''[[pojmy:lc|lc]]'' je přímo vyhrazen na hledání bez shody velikosti písmen, vyhledává tedy stejně jako atribut ''[[pojmy:word|word]]'', pouze nedbá na rozdíl ve velikosti písmen. Dotazy ''[word=%%"(?i)les"%%]'' a ''[lc=%%"les"%%]'' je tak možné považovat za ekvivalentní. ''[[pojmy:lemma|Lemma]]'' obvykle vyhledává všechny tvary daného paradigmatu bez ohledu na velikost písmen, tzn. lemma //les// najde //les, Les, lesu, LESU, lesEM// atp. Lemmata, která představují vlastní jména (např. Cheb, Chlumská, Audi atp.), se zadávají s velkým počátečním písmenem, vyhledání je ovšem rovněž case-insensitive (ve výsledku se můžou objevit formy //CHEB, Chebu, CHEBu// apod.). Ostatní atributy jsou case-sensitive.
  
 ===== Příklady ===== ===== Příklady =====
Řádek 12: Řádek 38:
  
 ==== Souvísející odkazy ==== ==== Souvísející odkazy ====
-<WRAP round box 49%> + 
-[[pojmy:lemma|Lemma]] • [[pojmy:word|Word]]+<WRAP round box 48%> 
 +[[pojmy:lemma|Lemma]] • [[pojmy:word|Word (slovní tvar)]] • [[pojmy:dotazovaci_jazyk|Dotazovací jazyk]] • [[pojmy:regularni_vyrazy|Regulární výrazy]]
 </WRAP> </WRAP>