AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:jazyky-v-migraci [2023/07/10 15:02] – [Popis korpusu] lukescnk:jazyky-v-migraci [2023/07/10 15:24] (aktuální) – [Značkování] lukes
Řádek 50: Řádek 50:
 ===== Značkování ===== ===== Značkování =====
  
-Korpus je lemmatizován a morfologicky označkován. V českojazyčné části používá stejný typ morfologických značek jako současné mluvené korpusy (viz https://wiki.korpus.cz/doku.php/cnk:lemtag_mluv). V německojazyčné části je využit //Stuttgart-Tübingen-Tagset// (viz http://www.sfs.uni-tuebingen.de/resources/stts-1999.pdf nebo https://homepage.ruhr-uni-bochum.de/stephen.berman/Korpuslinguistik/Tagsets-STTS.html). Z tohoto důvodu nelze pomocí morfologických značek (tagů) prohledávat celý korpus najednou, ale vždy cíleně českojazyčnou (''lemma_**cs**'', ''tag_**cs**''), nebo německojazyčnou část (''lemma_**de**'', ''tag_**de**''). Značky pro shodné mluvnické kategorie se z tohoto důvodu od sebe liší podle užité sady.+Korpus je lemmatizován a morfologicky označkován. V českojazyčné části používá [[cnk:lemtag_mluv|stejný typ morfologických značek jako současné mluvené korpusy]]. V německojazyčné části je využit //Stuttgart-Tübingen-Tagset// (viz http://www.sfs.uni-tuebingen.de/resources/stts-1999.pdf nebo https://homepage.ruhr-uni-bochum.de/stephen.berman/Korpuslinguistik/Tagsets-STTS.html). Z tohoto důvodu nelze pomocí morfologických značek (tagů) prohledávat celý korpus najednou, ale vždy cíleně českojazyčnou (''lemma_**cs**'', ''tag_**cs**''), nebo německojazyčnou část (''lemma_**de**'', ''tag_**de**''). Značky pro shodné mluvnické kategorie se z tohoto důvodu od sebe liší podle užité sady.
  
 V přepisech jsou nadto identifikovány a označeny jazykové fenomény, jež jsou interpretovány jako výsledky jazykového kontaktu a jazykové izolace v oblasti morfosyntaxe (pomocí hodnot [[seznamy:strukturni_atributy_mluvene#strukturni_atributy_korpusu_jazyky_v_migraci|strukturního atributu]] ''sp.langgener_category''): V přepisech jsou nadto identifikovány a označeny jazykové fenomény, jež jsou interpretovány jako výsledky jazykového kontaktu a jazykové izolace v oblasti morfosyntaxe (pomocí hodnot [[seznamy:strukturni_atributy_mluvene#strukturni_atributy_korpusu_jazyky_v_migraci|strukturního atributu]] ''sp.langgener_category''):
Řádek 70: Řádek 70:
 |věta             |S   | |věta             |S   |
  
-V korpusu je tak přes funkci //Omezit hledání// možné cíleně vyhledat například přepínání z češtiny do němčiny na úrovni předložkové fráze. Zaklikáme-li v rozbalovacím menu //Omezit hledání// u atributů ''sp.langgener_category'' a ''sp.syntactic_phrase'' všechny položky, které obsahují hodnoty ''CS'' ''PP'', najdeme např. následující výskyt: //in Juli gabs dann in in Prag in in **ve Fučíkárně**//.+V korpusu je tak přes funkci //Omezit hledání// možné cíleně vyhledat například přepínání z češtiny do němčiny na úrovni předložkové fráze. Zaklikáme-li v rozbalovacím menu //Omezit hledání// u atributů ''sp.langgener_category'' a ''sp.syntactic_phrase'' všechny položky, které obsahují hodnoty CS a PP, najdeme např. následující výskyt: //in Juli gabs dann in in Prag in in **ve Fučíkárně**//.
  
 ===== Tipy k vyhledávání v korpusu ===== ===== Tipy k vyhledávání v korpusu =====