Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
pojmy:pozice [2013/09/26 17:00]
Václav Cvrček [Pozice v konkordanci]
pojmy:pozice [2021/01/16 21:45]
Jan Křivan [Textová pozice]
Řádek 10: Řádek 10:
 a obsahuje tak 6 samostatných pozic. a obsahuje tak 6 samostatných pozic.
  
-V různých korpusech se také může lišit přístup k slovům spojeným a zkratkám. Někdy jsou proto slova jako ''např.'', ''apod.'', ''ekonomicko-sociologický'',  jednou pozicí, v jiných korpusech jsou to pozice dvě. +V různých korpusech se také může lišit přístup k slovům spojeným a zkratkám. Někdy jsou proto slova jako ''např.'', ''apod.'', ''Rakousko-Uhersko'',  jednou pozicí, v jiných korpusech jsou rozdělena na více pozic (dvě pozice v případě ''např .'', ''apod .'', tři pozice v případě ''Rakousko - Uhersko''). Tokenizace numerických a interpunkčních znaků je podrobně popsána na příkladu korpusu SYN2020 [[cnk:syn2020:tokenizace|na této stránce]].
  
 ===== Pozice v konkordanci ===== ===== Pozice v konkordanci =====
Řádek 29: Řádek 29:
  
 V případě, že je třeba specifikovat KWIC jako pozici, používá se 0. Chceme-li naznačit, který okraj víceslovného KWICu považujeme za rozhodný, můžeme použít notaci <0 pro počítání zleva a 0> pro počítání zprava. V případě, že je třeba specifikovat KWIC jako pozici, používá se 0. Chceme-li naznačit, který okraj víceslovného KWICu považujeme za rozhodný, můžeme použít notaci <0 pro počítání zleva a 0> pro počítání zprava.
 +
 ==== Související odkazy ==== ==== Související odkazy ====
  
-<WRAP round box 50%>+<WRAP round box 49%>
 [[pojmy:struktura_korpusu|Struktura korpusu]] • [[pojmy:token|Token]] • [[pojmy:typ|Typ/Type]] [[pojmy:struktura_korpusu|Struktura korpusu]] • [[pojmy:token|Token]] • [[pojmy:typ|Typ/Type]]
 </WRAP> </WRAP>