Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:struktura [2018/07/30 15:00] – [Jednojazyčné] Michal Škrabal | cnk:struktura [2021/01/17 18:43] – [Obecné] Jan Křivan |
---|
==== Obecné ==== | ==== Obecné ==== |
| |
Do řady [[SYN]] – tedy mezi **syn**chronní korpusy -- řadíme stomilionové žánrově vyvážené korpusy vytvářené s odstupem pěti let **[[SYN2015|SYN2015]]**, [[SYN2010|SYN2010]], [[SYN2005|SYN2005]], [[SYN2000|SYN2000]], i obsáhlejší (avšak žánrově nevyvážené) korpusy složené pouze z publicistických textů **[[SYN2013PUB|SYN2013PUB]]**, [[SYN2009PUB|SYN2009PUB]], [[SYN2006PUB|SYN2006PUB]]. Spojení všech těchto nezměnitelných, [[pojmy:lemma|lemmatizovaných]] a [[pojmy:anotace|anotovaných]] korpusů představuje největší korpus **[[SYN|SYN]]**. | Do řady [[SYN]] – tedy mezi **syn**chronní korpusy -- řadíme stomilionové žánrově vyvážené korpusy vytvářené s odstupem pěti let **[[SYN2020|SYN2020]]**, [[SYN2015|SYN2015]], [[SYN2010|SYN2010]], [[SYN2005|SYN2005]], [[SYN2000|SYN2000]], i obsáhlejší (avšak žánrově nevyvážené) korpusy složené pouze z publicistických textů **[[SYN2013PUB|SYN2013PUB]]**, [[SYN2009PUB|SYN2009PUB]], [[SYN2006PUB|SYN2006PUB]]. Spojení všech těchto nezměnitelných, [[pojmy:lemma|lemmatizovaných]] a [[pojmy:anotace|anotovaných]] korpusů představuje největší korpus **[[SYN|SYN]]**. |
| |
Všechny korpusy řady SYN jsou od roku 2014 plně [[pojmy:referencni|referenční]], tj. neměnné. Korpus SYN je verzovaný, což znamená, že je referenční v jednotlivých verzích, které se vydávají každý rok. | Všechny korpusy řady SYN jsou od roku 2014 plně [[pojmy:referencni|referenční]], tj. neměnné. Korpus SYN je verzovaný, což znamená, že je referenční v jednotlivých verzích, které se vydávají každý rok. |
Paralelní vícejazyčný korpus [[cnk:intercorp|InterCorp]] slouží ke kontrastivnímu a translatologickému zkoumání. Obsahuje texty v několika jazykových mutacích (vždy je přítomna česká verze), které jsou k sobě vzájemně zarovnané po větách. InterCorp je verzovaný korpus, tj. zpětně plně dostupný v jednotlivých verzích, které přibývají zhruba jednou ročně. | Paralelní vícejazyčný korpus [[cnk:intercorp|InterCorp]] slouží ke kontrastivnímu a translatologickému zkoumání. Obsahuje texty v několika jazykových mutacích (vždy je přítomna česká verze), které jsou k sobě vzájemně zarovnané po větách. InterCorp je verzovaný korpus, tj. zpětně plně dostupný v jednotlivých verzích, které přibývají zhruba jednou ročně. |
| |
InterCorp se skládá ze dvou částí, a to jádra (core) a kolekce (collection). Jádrem korpusu InterCorp jsou převážně beletristické texty s ručními korekturami zarovnání. Kolekce jsou texty získané ve více jazycích, zpracované a zarovnané automaticky. | InterCorp se skládá ze dvou částí: jádra (//core//) a kolekcí (//collections//). Jádro korpusu InterCorp tvoří převážně beletristické texty s ručními korekturami zarovnání. Kolekce jsou tvořeny texty získanými ve více jazycích, zpracovanými a zarovnanými automaticky. |
| |
| |