Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
pojmy:anonymizace [2013/06/19 21:13] – vaclavcvrcek | pojmy:anonymizace [2013/11/10 18:26] – [Anonymizace dat] lukasjanicik | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Anonymizace dat ====== | ====== Anonymizace dat ====== | ||
- | Anonymizace je odstranění osobních údajů z korpusových dat. Týká se především [[cnk: | + | Anonymizace je odstranění osobních údajů z korpusových dat. Týká se především [[cnk: |
- | V mluvených korpusech řady Oral se používají pro anonymizaci následující značky: | + | V mluvených korpusech řady ORAL se používají pro anonymizaci následující značky: |
* NP = příjmení | * NP = příjmení | ||
* NN = přezdívka | * NN = přezdívka | ||
Řádek 9: | Řádek 9: | ||
* NM = název místa | * NM = název místa | ||
* NO = ostatní vlastní jména | * NO = ostatní vlastní jména | ||
+ | ===== Ukázka z korpusu ORAL2008 ===== | ||
- | ===== Ukázka z korpusu | + | Dotaz, kterým najdeme všechny anonymizační značky v tomto korpusu, má tuto podobu: '' |
- | Dotaz, kterým najdeme | + | | byli v hospodě s tima , s bohemistama , jak | <fc # |
+ | | náš pes je fakt dobytek . hele , počkej , | <fc # | ||
+ | | tak sme šli chrápat , ty vole , a | <fc # | ||
+ | | sou příjemný náhodou | ||
+ | | jít na sociálku . ale volala , že jedou z | <fc # | ||
- | < | + | --- //M. Kopřivová, V. Cvrček// |
- | \begin{tabular}{rcl} | + | |
- | byli v hospodě s tima , s bohemistama , jak & NJ & s nima vždycky chodí \dots hmm . \dots a to\\ | + | |
- | náš pes je fakt dobytek . hele , počkej , & NN & , tak teda jak zejtra ? to já nevim eště\\ | + | |
- | tak sme šli chrápat , ty vole , a & NN & eště hrozně | + | |
- | sou příjemný náhodou | + | |
- | jít na sociálku . ale volala , že jedou z & NM & , jesli sem doma , že za chvíli sou tam\\ | + | |
- | \end{tabular} | + | |
- | </latex> | + | |
- | ===== Související odkazy | + | ==== Související odkazy ==== |
- | + | <WRAP round box 49%> | |
- | Korpusy mluvené češtiny | + | [[cnk: |
- | + | </WRAP> | |
- | [[pojmy: | + | |
- | + | ||
- | + | ||
- | --- //M. Kopřivová, | + |