Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
cnk:lemtag_mluv [2017/06/01 11:03] – [Lemmatizace a tagování mluvených korpusů] petrapoukarova | cnk:lemtag_mluv [2017/07/10 08:29] (aktuální) – [Literatura] zuzanakomrskova | ||
---|---|---|---|
Řádek 17: | Řádek 17: | ||
===== Úpravy morfologického slovníku ===== | ===== Úpravy morfologického slovníku ===== | ||
- | Výchozí morfologický slovník MorfFlex CZ (Hajič | + | Výchozí morfologický slovník MorfFlex CZ (Hajič–Hlaváčová, |
Příklady některých úprav: | Příklady některých úprav: | ||
**Poloautomatické** doplňování: | **Poloautomatické** doplňování: | ||
- | * **nářeční koncovky** jako např. ak. sg. fem. na -u (//nedělu, chvilu//), slovesné tvary minulého aktivního příčeští (//dělale, chodile//) | + | * **nářeční koncovky** jako např. |
* varianty lišící se **kvantitou samohlásek** (//myslim, vim, makem, polivka//), **palatalizací** (// | * varianty lišící se **kvantitou samohlásek** (//myslim, vim, makem, polivka//), **palatalizací** (// | ||
- | * " | + | * " |
**Manuální doplňování**: | **Manuální doplňování**: | ||
Řádek 31: | Řádek 31: | ||
**Odstranění některých interpretací**: | **Odstranění některých interpretací**: | ||
- | * odstranění interpretace jako adverbium: // | + | * odstranění interpretace |
- | * odstranění interpretace jako imperativ //viď// | + | * odstranění interpretace |
- | * odstranění interpretace jako vokativu | + | * odstranění interpretace |
**Doplnění některých interpretací** | **Doplnění některých interpretací** | ||
Řádek 40: | Řádek 40: | ||
===== Podoba lemmatu ===== | ===== Podoba lemmatu ===== | ||
- | * většinu slov má lemma v podobě **spisovného lemmatu**, tedy stejnou jako v psaném jazyce, a to i v případech, | + | * většina slov má lemma v podobě **spisovného lemmatu**, tedy stejnou jako v psaném jazyce, a to i v případech, |
- | * slova s** dvojí spisovnou podobou** mají dvojité | + | * slova s** dvojí spisovnou podobou** mají vícenásobné |
- | * slova, u nichž **nelze jednoznačně přiřadit jednotlivé tvary** mají také dvojité | + | * slova, u nichž **nelze jednoznačně přiřadit jednotlivé tvary**, mají také vícenásobné |
- | * **zkratky** mají dvojIté | + | * **zkratky** mají vícenásobné |
+ | |||
+ | Vícenásobné lemma funguje jako multihodnota, | ||
- | Dvojité lemma funguje jako multihodnota, | ||
===== Podoba tagu ===== | ===== Podoba tagu ===== | ||
Řádek 53: | Řádek 54: | ||
* **F** pro nedořečená slova (např. // | * **F** pro nedořečená slova (např. // | ||
- | * **H** pro neverbální zvuky (hezitační zvuky označené @, responzní //hmm, emm//) | + | * **H** pro neverbální zvuky (hezitační zvuky, označené @, responzní //hmm, emm//) |
* **M** pro komentáře (vždy uvedené v kulatých závorkách) | * **M** pro komentáře (vždy uvedené v kulatých závorkách) | ||
+ | |||
+ | ===== Poděkování ===== | ||
+ | Rádi bychom poděkovali za konzultace doc. Kláře Osolsobě a Mgr. Daně Hlaváčkové, | ||
===== Literatura ===== | ===== Literatura ===== | ||
Řádek 60: | Řádek 64: | ||
<WRAP round tip 70%> | <WRAP round tip 70%> | ||
- | Kopřivová, | + | Kopřivová, |
Lukeš. D. - Klimešová, | Lukeš. D. - Klimešová, |