AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
pojmy:case-sensitive [2019/04/24 14:47] – [Typ dotazu] Michal Škrabalpojmy:case-sensitive [2021/01/07 09:54] Michal Škrabal
Řádek 1: Řádek 1:
-====== Case-sensitive versus case-insensitive ======+====== Case-sensitive versus case-insensitive ====== FIXME
  
 Analýza textu může být prováděna vždy buď s ohledem na velikost písmen (case-sensitive), nebo se k velkým a malým písmenům přihlížet nemusí (case-insensitive). V případě case-insensitive analýzy jsou velká a malá písmena brána jako tentýž znak (slova //les, LES, Les// či //leS// jsou chápána jako shodná), v případě case-sensitive analýzy je na písmena lišící se velikostí pohlíženo jako na dvě rozdílné jednotky. Analýza textu může být prováděna vždy buď s ohledem na velikost písmen (case-sensitive), nebo se k velkým a malým písmenům přihlížet nemusí (case-insensitive). V případě case-insensitive analýzy jsou velká a malá písmena brána jako tentýž znak (slova //les, LES, Les// či //leS// jsou chápána jako shodná), v případě case-sensitive analýzy je na písmena lišící se velikostí pohlíženo jako na dvě rozdílné jednotky.
Řádek 13: Řádek 13:
 ^ Typ ^ Nastavení ^ ^ Typ ^ Nastavení ^
 ^ Základní | case-insensitive | ^ Základní | case-insensitive |
-^ Lemma | case-insensitive((platí ovšem, že propriální lemmata mají velké počáteční písmeno, např. //Praha//)) |+^ Lemma | case-insensitive((Platí ovšem, že propriální lemmata mají velké počáteční písmeno, např. //Praha//.)) |
 ^ Fráze | case-sensitive | ^ Fráze | case-sensitive |
-^ Slovní tvar | case-insensitive((tuto volbu je možné ve formuláři přepnout)) |+^ Slovní tvar | case-insensitive((Tuto volbu je možné ve formuláři přepnout.)) |
 ^ Část slova | case-sensitive | ^ Část slova | case-sensitive |
 ^ CQL | case-sensitive | ^ CQL | case-sensitive |
  
-V případě [[pojmy:dotazovaci_jazyk|CQL]] dotazu je možné case-insensitive hledání zadat pomocí speciální struktury ''(?i)''. Pokud tato značka v CQL dotazu předchází hodnotu, bude dotaz vyhodnocen bez ohledu na velikost písmen, např. %%''[word="(?i)nový"]%%'' najde jak slovo //nový//, tak podobu //Nový// nebo //NOVÝ//.+V případě [[pojmy:dotazovaci_jazyk|CQL]] dotazu je možné case-insensitive hledání zadat pomocí speciální struktury ''(?i)''. Pokud tato značka v CQL dotazu předchází hodnotu, bude dotaz vyhodnocen bez ohledu na velikost písmen, např. ''[word=%%"(?i)nový"%%]'' najde jak slovo //nový//, tak podobu //Nový// nebo //NOVÝ//.
  
 ==== Typ atributu ==== ==== Typ atributu ====
Řádek 25: Řádek 25:
 ^ Typ ^ Nastavení ^ ^ Typ ^ Nastavení ^
 ^ word | case-sensitive | ^ word | case-sensitive |
-^ lemma | case-insensitive((apelativní lemmata se vyhodnocují bez ohledu na malá a velká písmena, propriální lemmata mají první počáteční písmeno velké, např. //Liberec//)) |+^ lemma | case-insensitive((Apelativní lemmata se vyhodnocují bez ohledu na malá a velká písmena, propriální lemmata mají první počáteční písmeno velké, např. //Liberec//.)) |
 ^ tag/pos | case-sensitive | ^ tag/pos | case-sensitive |
 ^ lc | case-insensitive | ^ lc | case-insensitive |
  
-Atribut ''[[pojmy:lc|lc]]'' je přímo vyhrazen na hledání bez shody velikosti písmen, vyhledává tedy stejně jako atribut ''[[pojmy:word|word]]'', pouze nedbá na rozdíl ve velikosti písmen. Dotazy ''[word="(?i)les"]'' a ''[lc="les"]'' je tak možné považovat za ekvivalentní. ''[[pojmy:lemma|Lemma]]'' obvykle vyhledává všechny tvary daného paradigmatu bez ohledu na velikost písmen, tzn. lemma //les// najde //les, Les, lesu, LESU, lesEM// atp. Lemmata, která představují vlastní jména (např. Cheb, Chlumská, Audi atp.), se zadávají s velkým počátečním písmenem, vyhledání je ovšem rovněž case-insensitive (ve výsledku se můžou objevit formy //CHEB, Chebu, CHEBu// apod.). Ostatní atributy jsou case-sensitive.+Atribut ''[[pojmy:lc|lc]]'' je přímo vyhrazen na hledání bez shody velikosti písmen, vyhledává tedy stejně jako atribut ''[[pojmy:word|word]]'', pouze nedbá na rozdíl ve velikosti písmen. Dotazy ''[word=%%"(?i)les"%%]'' a ''[lc=%%"les"%%]'' je tak možné považovat za ekvivalentní. ''[[pojmy:lemma|Lemma]]'' obvykle vyhledává všechny tvary daného paradigmatu bez ohledu na velikost písmen, tzn. lemma //les// najde //les, Les, lesu, LESU, lesEM// atp. Lemmata, která představují vlastní jména (např. Cheb, Chlumská, Audi atp.), se zadávají s velkým počátečním písmenem, vyhledání je ovšem rovněž case-insensitive (ve výsledku se můžou objevit formy //CHEB, Chebu, CHEBu// apod.). Ostatní atributy jsou case-sensitive.
  
 ===== Příklady ===== ===== Příklady =====