Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:online:gen2 [2022/12/22 15:30] – [media_type] vaclavcvrcek | cnk:online:gen2 [2022/12/22 16:09] (aktuální) – [duplicate] vaclavcvrcek |
---|
==== duplicate ==== | ==== duplicate ==== |
| |
Atribut ''text.duplicate'' (dostupný pouze v 2. generaci) udává, zda je text duplikátem jiného textu v korpusu. Taková situace se u dat tohoto typu stává poměrně často v důsledku přejímání zpráv mezi tiskovými agenturami a jednotlivými tituly. Pokud se chceme vyhnout zkreslení, které je dáno takovýmito textovými duplicitami, můžeme použít dotaz s podmínkou [[pojmy:within|within]], která zaručí, že se ve výsledku objeví duplicitní texty jenom v jednou. | Atribut ''text.duplicate'' (dostupný pouze v korpusech 2. generace) udává, zda je text duplikátem jiného textu v korpusu. Taková situace se u dat z online médií může stát poměrně často v důsledku přejímání zpráv mezi tiskovými agenturami a jednotlivými tituly/portály. Pokud se chceme vyhnout zkreslení, které je dáno takovýmito textovými duplicitami, můžeme použít dotaz s podmínkou [[pojmy:within|within]] (např. ''%%[word="kolo"] within <text duplicate!="no" />%%''), která zaručí, že se ve výsledku objeví duplicitní texty pouze v jednom excempláři. |
| |
===== Anotace ===== | ===== Anotace ===== |