Přehled entit použitých v korpusech ČNK
Entity se používají v situacích, kdy je třeba ve zdrojovém textu nahradit nějaký speciální znak, symbol nebo celý úsek textu. Vedle standardizovaných html entit se v korpusech ČNK (zejm. u těch předcházejících korpusu SYN2015) používají i entity specifické (označeny v tabulce). Zavedená konvence psaní entit počítá s tím, že entita začíná znakem ampersandu (&) a končí středníkem (;).
Entita | Realizace |
---|---|
à | à |
α | řecké písmeno alfa: α |
& | ampersand: & |
å | å |
ã | ã |
β | řecké písmeno beta: β |
© | copyright: © |
† | křížek: † |
δ | řecké písmeno delta: δ |
ê | ê |
è | è |
∅ | průměr nebo prázdná množina: ∅ |
ε | řecké písmeno epsilon: ε |
η | řecké písmeno éta: η |
€ | euro: € |
&figure; | označuje místo, kde byl v textu vypuštěný obrázek (ČNK) |
&formula; | označuje místo, kde byl v textu vypuštěný vzorec (ČNK) |
γ | řecké písmeno gama: γ |
≥ | větší než nebo rovno: ≥ |
¡ | převrácený vykřičník: ¡ |
∞ | nekonečno: ∞ |
∫ | integrál: ∫ |
¿ | převrácený otazník: ¿ |
ï | ï |
κ | řecké písmeno kapa: κ |
≤ | menší než nebo rovno: ≤ |
&let; | neznámé písmeno (ČNK) |
µ | mikro: µ |
· | tečka uprostřed: · |
μ | řecké písmeno mý: μ |
&name; | anonymizované jméno (ČNK) |
ñ | ñ |
ν | řecké písmeno ný: ν |
# | number sign # |
œ | œ |
ò | ò |
ω | řecké písmeno omega: ω |
ø | ø |
õ | õ |
‰ | promile: ‰ |
π | řecké písmeno pí: π |
± | plus minus: ± |
£ | libra: £ |
ψ | řecké písmeno psí: ψ |
→ | šipka vpravo: → |
® | registered sign: ® |
ρ | řecké písmeno ró: ρ |
&symbol; | neznámý symbol (ČNK) |
&table; | označuje místo, kde byla v textu vypuštěná tabulka (ČNK) |
&text; | označuje místo, kde byla vypuštěná část nečeského textu (ČNK) |
™ | trademark: ™ |
û | û |
ù | ù |
ÿ | ÿ |