Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:struktura [2017/05/25 12:29] – [Korpusy mluvené] martinawaclawicova | cnk:struktura [2018/07/30 14:55] – [Struktura Českého národního korpusu] michalskrabal |
---|
====== Struktura Českého národního korpusu ====== | ====== Struktura Českého národního korpusu ====== |
| |
Korpusy ČNK [[pojmy:reprezentativnost|reprezentují]] buď [[pojmy:psany|psanou češtinu]], a to z pohledu [[pojmy:synchronni|synchronního]] nebo [[pojmy:diachronni|diachronního]], nebo češtinu [[cnk:struktura#korpusy_mluvene|mluvenou]], v níž máme k dispozici především data [[pojmy:synchronni|současná]]. Paralelní korpusy, které jsou rovněž součástí ČNK, umožňují analyzovat [[cnk:intercorp|jazyk překladů]]. Mimo tuto základní klasifikaci pak leží korpusy [[cnk:struktura#specializované|specializované]]. | Korpusy ČNK [[pojmy:reprezentativnost|reprezentují]] buď [[pojmy:psany|psanou češtinu]] -- a to z pohledu [[pojmy:synchronni|synchronního]], nebo [[pojmy:diachronni|diachronního]] --, anebo češtinu [[cnk:struktura#korpusy_mluvene|mluvenou]], v níž máme k dispozici především data [[pojmy:synchronni|současná]]. Paralelní korpusy, které jsou rovněž součástí ČNK, umožňují analyzovat [[cnk:intercorp|jazyk překladů]]. Mimo tuto základní klasifikaci pak leží korpusy [[cnk:struktura#specializované|specializované]]. |
| |
Ke korpusům lze přes různá [[pojmy:korpusovy_manazer|rozhraní]] (zvaná též korpusové manažery) -- v současnosti zejména [[manualy:kontext:index|KonText]]. | Ke korpusům lze přes různá [[pojmy:korpusovy_manazer|rozhraní]] (zvaná též korpusové manažery) -- v současnosti zejména [[manualy:kontext:index|KonText]]. |
Specializovaný korpus vyučovacích hodin **[[SCHOLA2010|SCHOLA2010]]** obsahuje 790 000 slov pronesených o školních hodinách učiteli i žáky - mluva dětí a mládeže jinak v mluvených korpusech řady Oral zachycena není. | Specializovaný korpus vyučovacích hodin **[[SCHOLA2010|SCHOLA2010]]** obsahuje 790 000 slov pronesených o školních hodinách učiteli i žáky - mluva dětí a mládeže jinak v mluvených korpusech řady Oral zachycena není. |
| |
Korpus **[[cnk:dialekt|DIALEKT]]** prezentuje tradiční teritoriální dialekty zachycené na území celé České republiky. Ve své první verzi obsahuje cca 100 000 slov a bude se postupně rozšiřovat. Nahrávky pocházejí ze dvou období, starší zahrnuje dobu od konce 50. let do 80. let 20. století, do nové vrstvy jsou zařazeny nahrávky z období od 90. let 20. století až do současnosti. Nářeční materiál je zpracováván tak, že má dvě úrovně přepisu – dialektologickou a ortografickou. | Korpus **[[cnk:dialekt|DIALEKT]]** prezentuje tradiční teritoriální dialekty zachycené na území celé České republiky. Ve své první verzi obsahuje cca 100 000 slov a bude se postupně rozšiřovat. Nahrávky pocházejí ze dvou období, starší zahrnuje dobu od konce 50. let do 80. let 20. století, do nové vrstvy jsou zařazeny nahrávky z období od 90. let 20. století až do současnosti. Nářeční materiál je zpracováván tak, že má dvě úrovně přepisu: dialektologickou a ortografickou. |
| |
===== Diachronní korpus ===== | ===== Diachronní korpus ===== |