<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="FeedCreator 1.8" -->
<?xml-stylesheet href="http://wiki.korpus.cz/lib/exe/css.php?s=feed" type="text/css"?>
<rdf:RDF
    xmlns="http://purl.org/rss/1.0/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
    xmlns:dc="http://purl.org/dc/elements/1.1/">
    <channel rdf:about="http://wiki.korpus.cz/feed.php">
        <title>Příručka ČNK - cnk</title>
        <description>Báze znalostí z korpusové lingvistiky</description>
        <link>http://wiki.korpus.cz/</link>
        <image rdf:resource="http://wiki.korpus.cz/lib/exe/fetch.php/wiki:dokuwiki.svg" />
       <dc:date>2026-04-30T09:57:53+00:00</dc:date>
        <items>
            <rdf:Seq>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:aibrown?rev=1760357456&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:aikoditex?rev=1760357339&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:anotacni_standard_cnk?rev=1768472528&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:aranea?rev=1775647788&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:baltischebriefe?rev=1731064786&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:bmk?rev=1661786718&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:capek?rev=1576760063&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:cep?rev=1576491851&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:citace?rev=1697209964&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:codit?rev=1617020160&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:czesl-man?rev=1605620083&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:czesl-plain?rev=1533638229&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:czesl-sgt-basic?rev=1572548008&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:czesl-sgt?rev=1572548113&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:dewac?rev=1722594900&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:diakorp?rev=1706800436&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:dialekt?rev=1661786718&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:dotko?rev=1695813995&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:eebo?rev=1748435767&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:etalon?rev=1622654025&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:fictree?rev=1513621502&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:frwac?rev=1722594842&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:fsc2000?rev=1632215176&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:hotko?rev=1752752208&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:intercorp?rev=1749073796&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:itwac?rev=1722595018&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:jazyky-v-migraci?rev=1688995475&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:jerome?rev=1438699415&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:kh-dopisy?rev=1623742719&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:kh-noviny?rev=1623742704&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:klasifikace_textu_syn2015?rev=1768483500&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:klaus?rev=1732194558&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:koditex?rev=1637236380&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:ksk-dopisy?rev=1677071806&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:ksk-prepis?rev=1428917591&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:ksp?rev=1761118978&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:lemtag_mluv?rev=1748337715&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:lestrepublicain?rev=1460457219&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:lindsei_cz?rev=1493299554&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:link?rev=1428918328&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:mda?rev=1561370137&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:net?rev=1661786602&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:nkjp?rev=1541496328&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:obc?rev=1612968928&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:oddil_statistiky_ke_korpusu_schola2010?rev=1395848866&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:online?rev=1671718996&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:onomos?rev=1752587714&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:oral?rev=1759994323&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:oral2006?rev=1661786719&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:oral2008?rev=1661786719&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:oral2013?rev=1661786719&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:orator?rev=1769094524&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:ortofon?rev=1769094466&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:orwell?rev=1428918514&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:parlcorp?rev=1622898246&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:pmk?rev=1661786719&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:psalm77?rev=1675266355&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:registrova_klasifikace?rev=1613137803&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:schola_vyhledavani_a_subkorpusy?rev=1610020370&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:schola2010?rev=1661786719&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:skript_vyhledavani_a_subkorpusy?rev=1610020438&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:skript2012_znacky?rev=1431439120&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:skript2012-prepis?rev=1397638655&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010?rev=1431439260&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:speeches?rev=1443694178&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:statistiky_ke_korpusu_skript2012?rev=1401384150&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:struktura_oral?rev=1496380891&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:struktura_ortofon?rev=1717494495&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:struktura-capek?rev=1576590291&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:struktura-oral13?rev=1429117942&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:struktura?rev=1613589024&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn?rev=1769159291&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2000?rev=1661789278&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2005?rev=1661789278&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2006pub?rev=1661789279&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2009pub?rev=1661789279&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2010?rev=1661789279&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2013pub?rev=1661789279&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2015?rev=1661786602&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2020?rev=1697209338&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:syn2025?rev=1768813882&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:totalita?rev=1677160468&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:ukwac?rev=1722595097&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:uvod?rev=1769159919&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:veda?rev=1708889948&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:vespa_cz?rev=1671651541&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/cnk:zasady_pro_prepis_vyucovacich_hodin?rev=1431439321&amp;do=diff"/>
            </rdf:Seq>
        </items>
    </channel>
    <image rdf:about="http://wiki.korpus.cz/lib/exe/fetch.php/wiki:dokuwiki.svg">
        <title>Příručka ČNK</title>
        <link>http://wiki.korpus.cz/</link>
        <url>http://wiki.korpus.cz/lib/exe/fetch.php/wiki:dokuwiki.svg</url>
    </image>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:aibrown?rev=1760357456&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-10-13T12:10:56+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>aibrown</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:aibrown?rev=1760357456&amp;do=diff</link>
        <description>AI-Brown

AI-Brown is a generated, annotated, multi-genre corpus of English texts produced by large language models (LLMs). 
     Positions  Number of positions (tokens)   27 661 454  Number of positions (excl. punctuation)   23 975 982  Number of word forms (excl. punctuation)</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:aikoditex?rev=1760357339&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-10-13T12:08:59+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>aikoditex</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:aikoditex?rev=1760357339&amp;do=diff</link>
        <description>AI-Koditex

AI-Koditex is a generated, annotated, multi-genre corpus of Czech texts produced by large language models (LLMs). 
     Positions  Number of positions (tokens)   24 030 795  Number of positions (excl. punctuation)   20 180 737  Number of word forms (excl. punctuation)</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:anotacni_standard_cnk?rev=1768472528&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-15T10:22:08+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>anotacni_standard_cnk</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:anotacni_standard_cnk?rev=1768472528&amp;do=diff</link>
        <description>Anotační standard ČNK pro morfologii a lemmatizaci

ČNK používá v synchronních psaných korpusech (počínaje korpusy SYN2020 a SYN_v9, dále např. korpusy NET a ONLINE) i v mluvených korpusech (Ortofon_v3) jednotný anotační standard pro morfologické značkování a lemmatizaci. Anotační standard zahrnuje tokenizaci (vymezení tokenů v textu), lemmatizaci (základní, slovníkové tvary tokenů) a morfologické značkování včetně speciálních značek pro slovesné tvary.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:aranea?rev=1775647788&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-04-08T11:29:48+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>aranea</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:aranea?rev=1775647788&amp;do=diff</link>
        <description>Korpusy Aranea

Rodina nereferenčních srovnatelných webových korpusů sestavených Vladimírem Benkem. V současné době pokrývá celkem 14 jazyků (cs, de, en, es, fi, fr, hu, it, nl, pl, pt, ru, sk, zh), pro některé jazyky jsou dále k dispozici specifické korpusy obsahující pouze některou z variet (vedle globální angličtiny také angličtina africká a asijská, vedle celku ruštiny také ruština z ruských a neruských domén). Pro každý jazyk či varietu jsou k dispozici vždy dva korpusy: základní větší (…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:baltischebriefe?rev=1731064786&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-11-08T11:19:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>baltischebriefe</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:baltischebriefe?rev=1731064786&amp;do=diff</link>
        <description>Baltische Briefe

„Baltische Briefe“ (Baltské listy) jsou historické noviny, které sloužily jako důležitá platforma pro baltskou německou komunitu, zejména po jejím přesídlení během druhé světové války a po ní. Noviny dokumentovaly zkušenosti, kulturu a dědictví pobaltských Němců a zprostředkovávaly spojení s jejich rodnou zemí v Estonsku, Lotyšsku a Litvě. Staly se důležitým médiem pro zachování kulturní identity, historie a tradic v diaspoře. Dodnes jsou noviny zdrojem informací pro pochopení …</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:bmk?rev=1661786718&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:18+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>bmk</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:bmk?rev=1661786718&amp;do=diff</link>
        <description>Brněnský mluvený korpus

Brněnský mluvený korpus (BMK) je v rámci ČNK prvním korpusem mluvené češtiny z oblasti Moravy. Zaznamenává autentickou tematicky nespecializovanou mluvu města Brna. BMK je elektronickým přepisem dvou set padesáti anonymních magnetofonových nahrávek z let 1994</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:capek?rev=1576760063&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2019-12-19T12:54:23+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>capek</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:capek?rev=1576760063&amp;do=diff</link>
        <description>Korpusy textů Karla Čapka

Korpusy &#039;capek&#039; a &#039;capek_uplny&#039; jsou autorskými korpusy Karla Čapka, které vznikly jako datový podklad Slovníku Karla Čapka. Korpus &#039;capek&#039; obsahuje všechny texty, které napsal Karel Čapek nesporně sám, a to jak z hlediska spoluautorství, tak i ovlivněnosti partnerem nebo překládaným originálem, zatímco korpus &#039;capek_uplny&#039; je úplným souborem všech textů, na nichž se Karel Čapek jakkoli autorsky podílel (např. tedy včetně textů, které napsal spolu s bratrem Josefem). Z…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:cep?rev=1576491851&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2019-12-16T10:24:11+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>cep</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:cep?rev=1576491851&amp;do=diff</link>
        <description>Korpus textů Jana Čepa

Korpus &#039;cep&#039; je autorským korpusem prozaických textů Jana Čepa, který vznikl jako datový podklad monografie Richarda Změlíka Kvantitativně-korpusová analýza a literární věda. Ke knize vznikl také samostatný web, kde je možné s některými kvantitativními údaji pracovat.

Korpus je lemmatizován a morfologicky označkován, verze anotace odpovídá knize. Podrobný popis a uspořádání korpusu Čepových textů lze najít zejména na str. 80</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:citace?rev=1697209964&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-10-13T15:12:44+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>citace</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:citace?rev=1697209964&amp;do=diff</link>
        <description>Jak citovat korpusy zpřístupňované ČNK

Způsoby citování korpusů

Existují v zásadě dva způsoby, jakým korpusy při vědecké práci citovat:

	*  uvedení korpusu jako pramene či zdroje dat;
	*  uvedení odkazu na konkrétní článek, který popisuje vznik korpusu a jeho složení.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:codit?rev=1617020160&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-03-29T12:16:00+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>codit</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:codit?rev=1617020160&amp;do=diff</link>
        <description>Korpus CODIT

Corpus diacronico dell’italiano -- ‘Diachronní korpus italštiny’



CODIT je vyvážený diachronní korpus psané italštiny o celkové velikosti přibližně 33 mil. tokenů. Korpus je v ČNK hostován díky Marii Silvii Micheli, která ho sestavila. CODIT pokrývá celé období vývoje italštiny od 13. století do roku 1947, jeho struktura je analogická ke korpusu</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:czesl-man?rev=1605620083&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2020-11-17T13:34:43+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>czesl-man</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:czesl-man?rev=1605620083&amp;do=diff</link>
        <description>CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu

Pod názvem CzeSL-man je ve vyhledávacím rozhraní KonText přístupný korpus CzeSL-man v1 searchable, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:czesl-plain?rev=1533638229&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2018-08-07T10:37:09+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>czesl-plain</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:czesl-plain?rev=1533638229&amp;do=diff</link>
        <description>Korpus CzeSL-plain

Žákovský korpus CzeSL-plain (Czech as a Second Language, plain = bez anotace) je jedním z výstupů projektu Inovace vzdělávání v oboru čeština jako druhý jazyk v rámci operačního programu Vzdělávání pro konkurenceschopnost s finanční podporou Strukturálních fondů EU (ESF) a státní rozpočtu České republiky.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:czesl-sgt-basic?rev=1572548008&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2019-10-31T18:53:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>czesl-sgt-basic</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:czesl-sgt-basic?rev=1572548008&amp;do=diff</link>
        <description>CzeSL-SGT – korpus češtiny nerodilých mluvčích se zjednodušenými možnostmi vyhledávání

Korpus CzeSL-SGT-basic vychází z korpusu CzeSL-SGT (Czech as a Second Language with Spelling, Grammar and Tags), který obsahuje přepisy písemných prací nerodilých mluvčích češtiny a navazuje na část CIZ korpusu</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:czesl-sgt?rev=1572548113&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2019-10-31T18:55:13+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>czesl-sgt</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:czesl-sgt?rev=1572548113&amp;do=diff</link>
        <description>CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací

Žákovský korpus CzeSL-SGT (Czech as a Second Language with Spelling, Grammar and Tags) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:dewac?rev=1722594900&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-08-02T10:35:00+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>dewac</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:dewac?rev=1722594900&amp;do=diff</link>
        <description>Korpus deWaC

Korpus webových textů stažených z domény .de, jeho celkový rozsah je 1,35 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem TreeTagger, podrobnější informace o vzniku korpusu najdete zde. 

Jak citovat

M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209-226. (</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:diakorp?rev=1706800436&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-02-01T15:13:56+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>diakorp</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:diakorp?rev=1706800436&amp;do=diff</link>
        <description>Korpus Diakorp

Korpus Diakorp reprezentuje diachronní složku ČNK. Zahrnuje texty celkem ze sedmi století vývoje češtiny a je koncipován tak, aby postupně umožnil zkoumání jazykového úzu v jeho historických proměnách. Jedná se o korpus referenční, průběžně rostoucí ve verzích. První verze (přibližně 700 000 slovních tvarů) byla zpřístupněna veřejnosti v září roku 2005 a je nadále průběžně rozšiřována (textová základna korpusu narůstá tempem přibližně 250 000 slovních tvarů ročně). V současné dob…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:dialekt?rev=1661786718&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:18+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>dialekt</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:dialekt?rev=1661786718&amp;do=diff</link>
        <description>Dialekt_dial•v2 Dialekt_ort•v2 Počet pozic (tokenů)   310 200  298 539 Počet pozic (tokenů) bez interpunkce a dalších značek   223 281  223 327 Počet  slovních tvarů (wordů)   33 715  25 360 Počet nahrávek   972 Počet promluv   43 628 Počet mluvčích   291 Délka nahrávek (hh:mm:ss.ms)   27:43:21.423</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:dotko?rev=1695813995&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-09-27T11:26:35+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>dotko</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:dotko?rev=1695813995&amp;do=diff</link>
        <description>Korpus DOTKO

DOTKO v2 (DOlnoserbski Tekstowy KOrpus) je rozšířená verze diachronního korpusu dolní lužické srbštiny připravovaného v chotěbuzské pobočce Lužickosrbského institutu. Zahrnuje největší část historických dolnolužickosrbských tisků od počátku 18. století do úplného zákazu veřejného užívání lužické srbštiny v roce 1937. Nejstarší text korpusu v tuto chvíli pochází z roku 1706, nejnovější z roku 1936. Podstatnou část tvoří texty Bramborského Casniku (dolnolužických novin) z let 1848 – …</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:eebo?rev=1748435767&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-05-28T12:36:07+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>eebo</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:eebo?rev=1748435767&amp;do=diff</link>
        <description>EEBO (Early English Books Online)

Korpus EEBO verze 1 obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem Text Creation Partnership v rámci projektu Early English Books Online; proces digitalizace je podrobně popsán zde. Celkový rozsah korpusu je přibližně</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:etalon?rev=1622654025&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-06-02T17:13:45+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>etalon</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:etalon?rev=1622654025&amp;do=diff</link>
        <description>Korpus Etalon: ručně anotovaný korpus českých textů

Korpus Etalon je synchronní korpus psané češtiny, který byl manuálně morfologicky označkován podle stejných zásad jako SYN2020. 
     Pozice  Počet pozic (tokenů)     Počet pozic bez interpunkce   1 885 621  Struktury  Počet dokumentů &lt;doc&gt;   94  Počet vět &lt;s&gt;</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:fictree?rev=1513621502&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2017-12-18T18:25:02+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>fictree</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:fictree?rev=1513621502&amp;do=diff</link>
        <description>Korpus FicTree: manuálně syntakticky anotovaný korpus české beletrie

Korpus FicTree je syntakticky anotovaný korpus současné české beletrie, obsahující 135 000 slov (166 000 tokenů). Syntaktická anotace textu byla provedena manuálně. Korpus je také manuálně lemmatizovaný a</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:frwac?rev=1722594842&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-08-02T10:34:02+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>frwac</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:frwac?rev=1722594842&amp;do=diff</link>
        <description>Korpus frWaC

Korpus webových textů stažených z domény .fr, jeho celkový rozsah je 1,35 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem TreeTagger, podrobnější informace o vzniku korpusu najdete zde. 

Jak citovat

A. Ferraresi, S. Bernardini, G. Picci and M. Baroni (2010) “Web Corpora for Bilingual Lexicography: A Pilot Study of English/French Collocation Extraction and Translation”. In Xiao, R. (ed.) Using Corpora in Contrastive and Translation Studies. Newcastle: Ca…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:fsc2000?rev=1632215176&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-09-21T09:06:16+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>fsc2000</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:fsc2000?rev=1632215176&amp;do=diff</link>
        <description>Korpus FSC2000

Korpus FSC2000 je referenčním zdrojem a doplňkem Frekvenčního slovníku češtiny (FSČ), který vyšel koncem roku 2004 v NLN. Korpus FSC2000 vychází z korpusu SYN2000, postup jeho vzniku je popsán níže. Jedním z důsledků tohoto postupu je, že texty obsažené v korpusu FSC2000 jsou vlastně podmnožinou textů obsažených v korpusu SYN2000. Přesná velikost korpusu FSC2000 činí bez započtení interpunkce 95 854 929 slovních tvarů; velikost 114 363 813 pozic, udávaná korpusovým manažerem, je …</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:hotko?rev=1752752208&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-07-17T11:36:48+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>hotko</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:hotko?rev=1752752208&amp;do=diff</link>
        <description>Korpus HOTKO

HOTKO (HOrnjoserbski Tekstowy KOrpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenová…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:intercorp?rev=1749073796&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-06-04T21:49:56+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>intercorp</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:intercorp?rev=1749073796&amp;do=diff</link>
        <description>Korpus InterCorp

Korpus InterCorp je hlavním výstupem stejnojmenného projektu, jehož cílem je vybudovat rozsáhlý paralelní synchronní korpus pokrývající co největší počet jazyků. Na jeho tvorbě se významnou měrou podílejí pedagogové a studenti FF UK v Praze a další spolupracovníci ÚČNK. Korpus slouží jako zdroj dat pro teoretické studie, lexikografii, studentské práce, výuku, zejména výuku cizích jazyků, počítačové zpracování přirozeného jazyka, překladatele i veřejnost.…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:itwac?rev=1722595018&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-08-02T10:36:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>itwac</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:itwac?rev=1722595018&amp;do=diff</link>
        <description>Korpus itWaC

Korpus webových textů stažených z domény .it, jeho celkový rozsah je 1,6 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem TreeTagger, podrobnější informace o vzniku korpusu a použitém lexikonu Morph-it! najdete zde.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:jazyky-v-migraci?rev=1688995475&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-07-10T13:24:35+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>jazyky-v-migraci</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:jazyky-v-migraci?rev=1688995475&amp;do=diff</link>
        <description>Jazyky v migraci

Popis korpusu

Korpus Jazyky v migraci tvoří záznam spontánní jazykové produkce mluvčích užívajících neformální mluvenou češtinu a němčinu. Mluvčí, s nimiž byly vedeny rozhovory v letech 2018, 2019 a 2020, se ve svých vyprávěních ohlížejí za svou jazykovou biografií v Československu, respektive v jeho českojazyčné části, a ve Spolkové republice Německo. Ta část rozhovoru, která je vztažena k Československu, je z důvodu elicitace morfosyntaktických jevů spojených s jazykovým kon…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:jerome?rev=1438699415&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-08-04T14:43:35+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>jerome</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:jerome?rev=1438699415&amp;do=diff</link>
        <description>Korpus JEROME

Korpus Jerome je jednojazyčný srovnatelný korpus (monolingual comparable corpus) speciálně sestavený pro zkoumání překladové češtiny (tedy textů přeložených do češtiny z jiných jazyků) v porovnání s češtinou nepřekladovou (původní česky psanou). Pozor, nejedná se o korpus paralelní, jenž obsahuje překlady a k nim zarovnané originály neboli zdrojové texty; nepřekladová čeština zde tedy hraje roli referenčního korpusu. Korpus je primárně určen translatologům a lingvistům, kteří se c…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:kh-dopisy?rev=1623742719&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-06-15T07:38:39+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>kh-dopisy</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:kh-dopisy?rev=1623742719&amp;do=diff</link>
        <description>Korpus korespondence Karla Havlíčka

Korpus korespondence Karla Havlíčka (kh-dopisy) obsahuje kompletní soubor dopisů, které souvisejí s osobou Karla Havlíčka (1821–1856). Spisovatel je vždy buď autorem, nebo přímým či nepřímým adresátem dopisů: zařazeny jsou i listy adresované redakci novin a časopisů, které Havlíček řídil. Dopisy jsou psány různými jazyky (česky, německy, polsky, francouzsky aj.). Celý soubor zahrnuje 1 203 dokumentů z let 1831–1856. Celkový rozsah korpusu je přibližně 500 tis…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:kh-noviny?rev=1623742704&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-06-15T07:38:24+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>kh-noviny</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:kh-noviny?rev=1623742704&amp;do=diff</link>
        <description>Korpus publicistiky Karla Havlíčka

Korpus publicistiky Karla Havlíčka (KH-noviny) obsahuje veškeré publicistické texty Karla Havlíčka (1821–1856) otištěné v jím redigovaných periodikách Pražské noviny (1846–1848, včetně přílohy Česká včela) a Národní noviny (1848–1850). Celkový rozsah korpusu je 1 182 159 pozic.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:klasifikace_textu_syn2015?rev=1768483500&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-15T13:25:00+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>klasifikace_textu_syn2015</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:klasifikace_textu_syn2015?rev=1768483500&amp;do=diff</link>
        <description>Přehled klasifikace textů v korpusech řady SYN (od SYN2015)

Texty v novějších korpusech řady SYN jsou (počínaje korpusem SYN2015) rozděleny do tří hlavních skupin (txtype_group):

	*  FIC: beletrie
	*  NFC: oborová literatura
	*  NMG: publicistika

Každá z těchto skupin tvoří v korpusu jednu třetinu textů.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:klaus?rev=1732194558&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-11-21T13:09:18+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>klaus</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:klaus?rev=1732194558&amp;do=diff</link>
        <description>Korpus textů Václava Klause

Korpus textů Václava Klause (&#039;VK&#039;) je autorským korpusem Václava Klause staršího, který vznikl jako datový podklad diplomové práce Idiolekt Václava Klause: korpusová analýza. Zdrojem dat pro vytvoření korpusu byly Klausovy oficiální webové stránky. Tento web obsahuje jak texty určené primárně pro tyto stránky, tak i texty původně publikované jinde (např. články v novinách či rozhovory v časopisech), respektive vytvořené k určitým konkrétním událostem (např. prezident…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:koditex?rev=1637236380&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-11-18T11:53:00+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>koditex</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:koditex?rev=1637236380&amp;do=diff</link>
        <description>Korpus Koditex

Koditex je synchronní, reprezentativní a referenční korpus, obsahující 9 milionů textových slov (tedy vyjma interpunkce), který byl vytvořen za účelem multidimenzionální analýzy (MDA) registrové variability češtiny.
     Pozice  Počet pozic (tokenů)   10 880 550  Počet pozic bez interpunkce</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:ksk-dopisy?rev=1677071806&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-02-22T13:16:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>ksk-dopisy</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:ksk-dopisy?rev=1677071806&amp;do=diff</link>
        <description>Korpus soukromé korespondence

Korpus soukromé korespondence (KSK-dopisy) umožňuje nahlédnout do jazyka a stylu současných epistolárních textů soukromého charakteru. Jde o korpus zachycující možná v posledním existenčním stadiu tradiční ručně psanou korespondenci.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:ksk-prepis?rev=1428917591&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-04-13T09:33:11+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>ksk-prepis</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:ksk-prepis?rev=1428917591&amp;do=diff</link>
        <description>Sběr a přepis dopisů

Sběr soukromé korespondence pro korpus KSK-dopisy probíhal v ÚČJ FF MU od konce 90. let 20. století. V současné době archiv shromážděných textů obsahuje zhruba 3000 elektronických přepisů ručně psaných dopisů, 1500 e-mailů a cca 2500 SMS.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:ksp?rev=1761118978&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-10-22T07:42:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>ksp</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:ksp?rev=1761118978&amp;do=diff</link>
        <description>Korpus současné poezie

KSP vzniká od roku 2015 ve spolupráci Ústavu pro českou literaturu AV ČR, v. v. i. a ÚČNK. Jedná se, jak už název napovídá, o korpus současných básnických textů české provenience (vymezené lety 1990 a 2020), tj. reprezentativní vzorek tuzemského básnictví za poslední tři dekády. Co je podstatné, tento vzorek zahrnuje nejen texty oficiálně knižně vydané, a tedy i prošlé klasickým edičním procesem, ale i tvorbu amatérskou, koncentrovanou především na tzv. literární servery.…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:lemtag_mluv?rev=1748337715&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-05-27T09:21:55+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>lemtag_mluv</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:lemtag_mluv?rev=1748337715&amp;do=diff</link>
        <description>Lemmatizace a tagování mluvených korpusů ORAL (verze 1), ORTOFON (verze 1 a 2), DIALEKT (verze 1 a 2), ORATOR (verze 2)

Lemmatizace a tagování transkriptu mluveného projevu je mnohem náročnější než u jazyka psaného. Přibývá zde neznámých tvarů (zachycované redukce výslovnosti, nářeční tvary, nová slova), jež mohou být homonymní s tvary zastoupenými v morfologickém slovníku pro psaný jazyk (např.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:lestrepublicain?rev=1460457219&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2016-04-12T10:33:39+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>lestrepublicain</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:lestrepublicain?rev=1460457219&amp;do=diff</link>
        <description>Korpus lEstRepublicain

Korpus je složený ze 3 ročníků (1999, 2002 a 2003; ne všechny jsou kompletní) francouzského regionálního deníku L&#039;Est Républicain. Ve verzi 2 obsahuje po deduplikaci téměř 73 milionů slov (verze 1 měla téměř 120 milionů slov) a byl vytvořen z dat CNRTL dostupných na adrese</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:lindsei_cz?rev=1493299554&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2017-04-27T13:25:54+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>lindsei_cz</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:lindsei_cz?rev=1493299554&amp;do=diff</link>
        <description>LINDSEI_CZ

Žákovský korpus spontánní mluvené angličtiny pokročilých mluvčích s češtinou jako L1.

Historie a současnost

Žákovský korpus LINDSEI_CZ vznikl jako součást mezinárodního projektu LINDSEI organizovaného Centrem pro anglickou korpusovou lingvistiku při Katolické univerzitě v Lovani  (</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:link?rev=1428918328&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-04-13T09:45:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>link</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:link?rev=1428918328&amp;do=diff</link>
        <description>Korpus LINK

LINK (původně LIngvistův Narozeniový Korpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů. Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie, jazyk lingvistiky apod.).</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:mda?rev=1561370137&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2019-06-24T09:55:37+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>mda</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:mda?rev=1561370137&amp;do=diff</link>
        <description>Multidimenzionální analýza češtiny

Multidimenzionální analýza češtiny (MDA) je metoda vyvinutá Douglasem Biberem
pro empirický výzkum textové variability. MDA je založená na předpokladu, že variabilita textů se manifestuje ve využití jazykových rysů z různých rovin (od fonologie a morfologie přes lexikon až po syntax a pragmatiku). Při koncipování textu je přitom využití jedněch rysů často podmíněno či podpořeno použitím rysů jiných, což vede k domněnce, že pro popis variability je optimální ry…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:net?rev=1661786602&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:23:22+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>net</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:net?rev=1661786602&amp;do=diff</link>
        <description>Korpus NET
       Pozice  Počet pozic (tokenů)   51 733 873   176 365 880  Počet slovních tvarů (wordů)   1 245 717   2 637 707  Počet lemmat   750 650   1 744 001  Struktury  Počet dokumentů &lt;doc&gt;   1 279   12 738  Počet textů &lt;text&gt;   267 026   1 817 088  Počet odstavců &lt;p&gt;   267 026   1 817 088  Počet vět &lt;s&gt;</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:nkjp?rev=1541496328&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2018-11-06T09:25:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>nkjp</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:nkjp?rev=1541496328&amp;do=diff</link>
        <description>Korpus NKJP_1M

Korpus NKJP_1M je ručně označkovaný milionový subkorpus Národního korpusu polského jazyka (NKJP – Narodowy Korpus Języka Polskiego) složený ze vzorků různorodých textů (viz níže) a obsahující 1 milion textových slov. Jde o korpus současné polštiny s texty vydanými po roce 1945, zahrnující komunikaci psanou, mluvenou a webovou. Korpus je</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:obc?rev=1612968928&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-02-10T14:55:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>obc</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:obc?rev=1612968928&amp;do=diff</link>
        <description>OBC: The Old Bailey Corpus 2.0

Old Bailey Corpus je sociolingvisticky, pragmaticky a textově anotovaný korpus obsahující výběr z Proceedings of Old Bailey. Korpus se skládá z 637 textů zaznamenávajících soudní procesy, které se konaly v letech 1720 až 1913 v Old Bailey v Londýně. Celkový rozsah korpusu přesahuje 24 mil. slov, jeho celková velikost pak 35 mil. tokenů (včetně interpunkce). Podrobnější informace o korpusu jsou k dispozici</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:oddil_statistiky_ke_korpusu_schola2010?rev=1395848866&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-03-26T15:47:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>oddil_statistiky_ke_korpusu_schola2010</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:oddil_statistiky_ke_korpusu_schola2010?rev=1395848866&amp;do=diff</link>
        <description>Statistiky ke korpusu SCHOLA2010 (výběrově)

I. SONDA
Celkový počet sond  204Celková délka zvukových záznamů  143 h 25 minCelkový počet slov  792 764Průměrný počet slov na 1 sondu  3 886 Rok pořízení sondy  Počet sond  Počet slov</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:online?rev=1671718996&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-12-22T14:23:16+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>online</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:online?rev=1671718996&amp;do=diff</link>
        <description>Korpusy ONLINE

Korpusy ONLINE dohromady tvoří monitorovací korpus, který se snaží mapovat dynamický obsah českého internetu, tj. primárně internetovou žurnalistiku, v menším měřítku a bez nároku na kontinuálnost pokrytí pak také diskuse a sociální sítě, od roku 2017 do současnosti.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:onomos?rev=1752587714&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-07-15T13:55:14+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>onomos</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:onomos?rev=1752587714&amp;do=diff</link>
        <description>Korpusy OnomOs v1 a OnomOs v2

Korpusy OnomOs v1 a OnomOs v2 jsou lingvisticky zpracované databáze textů z periodik Rudé právo (vycházelo 1920–1995) a Právo (1995–dosud). Korpus OnomOs v1 obsahuje vždy jedno náhodně vybrané číslo z každé dekády, v níž (Rudé) Právo vycházelo. Složení korpusu je podrobněji představeno na obrázku č. 1; celkem korpus obsahuje 255 149 tokenů.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:oral?rev=1759994323&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-10-09T07:18:43+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>oral</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:oral?rev=1759994323&amp;do=diff</link>
        <description>Korpus ORAL

Korpus ORAL představuje korpus transkriptů nahrávek převážně neformálních rozhovorů rodilých mluvčích češtiny z celého území ČR. Mluvčí se vzájemně dobře znali (jednalo se o přátele nebo rodinné příslušníky) a byli nahráváni ve svém přirozeném prostředí. Nahrávky byly pořizovány v průběhu deseti let, v letech 2002–2011. Korpus není vyvážený, převažují data z české části České republiky (více viz</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:oral2006?rev=1661786719&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:19+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>oral2006</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:oral2006?rev=1661786719&amp;do=diff</link>
        <description>Český mluvený korpus ORAL2006

Mluvený korpus ORAL2006 je v pořadí třetím mluveným korpusem, který je dostupný v rámci projektu Český národní korpus. Zachycuje mluvenou češtinu z celé oblasti českých nářečí v užším slova smyslu (tj. pouze z Čech, ne z Moravy a Slezska</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:oral2008?rev=1661786719&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:19+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>oral2008</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:oral2008?rev=1661786719&amp;do=diff</link>
        <description>Korpus mluvené češtiny ORAL2008

Korpus mluvené češtiny ORAL2008 zachycuje stejně jako ORAL2006 mluvu ve výhradně neformálních, dialogických situacích. Jde však o první mluvený korpus ČNK, který je plně vyvážený v základních sociolingvistických kategoriích mluvčích (pohlaví, věková skupina, výše dosaženého vzdělání a oblast pobytu v dětství). Korpus ORAL2008 vychází ze stejné materiálové základny jako ORAL2006, avšak žádný z přepisů zařazených do korpusu ORAL2008 nebyl použitý v korpusu ORAL2006…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:oral2013?rev=1661786719&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:19+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>oral2013</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:oral2013?rev=1661786719&amp;do=diff</link>
        <description>Korpus neformální mluvené češtiny ORAL2013

Korpus mluvené spontánní češtiny ORAL2013 je dalším mluveným korpusem projektu Český národní korpus. Svou koncepcí navazuje na korpusy neformální mluvené češtiny ORAL2006 a ORAL2008, v mnoha podstatných ohledech ale doznal změn a vylepšení. Stejně jako stávající korpusy řady ORAL i tento korpus zachycuje spontánní konverzaci výhradně v neformálních komunikačních situacích. Nejzásadnějšími změnami je propojení přepisu se zvukovou stopou, zavedení pauzov…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:orator?rev=1769094524&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-22T15:08:44+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>orator</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:orator?rev=1769094524&amp;do=diff</link>
        <description>Korpus monologů: ORATOR

Korpus ORATOR obsahuje monologické projevy pronesené rodilými mluvčími češtiny při příležitostech, o kterých jsou předem informováni a na něž se mohou připravit. Mluvčí má předem daný časově vymezený prostor, ve kterém může a musí vytvářet svůj projev. S tím souvisí větší formálnost, až oficiálnost těchto situací. Data tohoto typu v mluvených korpusech češtiny dosud chyběla.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:ortofon?rev=1769094466&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-22T15:07:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>ortofon</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:ortofon?rev=1769094466&amp;do=diff</link>
        <description>Korpus neformální mluvené češtiny s víceúrovňovým přepisem: ORTOFON

Korpus ORTOFON zachycuje spontánní mluvený jazyk používaný v neformálních situacích mezi mluvčími, kteří se znají. Navazuje svou koncepcí sběru dat na korpusy neformální mluvené češtiny řady</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:orwell?rev=1428918514&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-04-13T09:48:34+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>orwell</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:orwell?rev=1428918514&amp;do=diff</link>
        <description>Korpus ORWELL

Tento korpus vznikl v rámci projektu EU Multext-East a tvoří jej text románu George Orwella 1984 (z angl. orig. přel. Eva Šimečková; Praha: Naše vojsko, 1991).  Korpus obsahuje cca 80 tisíc slov a 20 tisíc interpunkčních znamének, tj. cca 100 tisíc korpusových pozic, a je morfologicky</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:parlcorp?rev=1622898246&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-06-05T13:04:06+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>parlcorp</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:parlcorp?rev=1622898246&amp;do=diff</link>
        <description>ParlCorp: Korpus českých parlamentní projevů

Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:pmk?rev=1661786719&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:19+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>pmk</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:pmk?rev=1661786719&amp;do=diff</link>
        <description>Pražský mluvený korpus

Pražský mluvený korpus (PMK) je prvním korpusem mluvené češtiny a zachycuje autentickou mluvenou češtinu, hlavně obecnou a tematicky nespecializovanou, resp. neomezovanou, z oblasti Prahy a jejího okolí. Vzhledem k centrálnímu a jedinečnému postavení Prahy v rámci celé země tu jazykově dochází k velkému míšení lidí ze všech oblastí ČR a obraz jejího jazyka má tudíž do značné míry celonárodní povahu; z Prahy vychází také nejvýznamnější mediální ovlivnění celé země. Více ne…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:psalm77?rev=1675266355&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-02-01T15:45:55+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>psalm77</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:psalm77?rev=1675266355&amp;do=diff</link>
        <description>Žalm 77

Paralelní korpus starších překladů žalmu 77 se zaměřením na starou rumunštinu

Korpus Žalm 77 je výsledkem projektu uskutečněného na podzim 2022, jehož cílem bylo zpracovat všechny starší rumunské verze žalmu 77 a zarovnat je s verzemi v řečtině a v církevní slovanštině. Korpus vytvořila Constanța Burlacu v rámci programu</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:registrova_klasifikace?rev=1613137803&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-02-12T13:50:03+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>registrova_klasifikace</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:registrova_klasifikace?rev=1613137803&amp;do=diff</link>
        <description>Registrová klasifikace

Registrová klasifikace v korpusech ČNK slouží k zachycení pohledu na textovou variabilitu, který je komplementární ke kategoriím txtype či genre. Zatímco tyto atributy zachycují vnětextovou perspektivu (tedy to, jak je text konvenčně vnímán na základě formálních znaků, např. román, dopis či odborný článek), atribut</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:schola_vyhledavani_a_subkorpusy?rev=1610020370&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-01-07T11:52:50+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>schola_vyhledavani_a_subkorpusy</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:schola_vyhledavani_a_subkorpusy?rev=1610020370&amp;do=diff</link>
        <description>Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů

Dotazy v korpusu SCHOLA2010 můžeme zadávat pomocí přístupu do korpusu přes webové rozhraní KonText.

Vytváření subkorpusů (pro přihlášené uživatele)

Jazykový materiál v korpusu SCHOLA2010 lze omezit podle toho, jaký cíl má naše vyhledávání. Uživatel si může podle různých kritérií (i podle jejich kombinací) vytvořit subkorpus, se kterým bude dále pracovat (subkorpus může zůstat uživateli po přihlášení nastaven v seznamu ostatních korpusů n…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:schola2010?rev=1661786719&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:25:19+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>schola2010</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:schola2010?rev=1661786719&amp;do=diff</link>
        <description>Korpus vyučovacích hodin SCHOLA2010

Korpus SCHOLA2010 je sociologicky i didakticky jedinečný korpus, protože vychází ze školního prostředí a zaznamenává mluvený jazyk vyučovacích hodin (především standardních vyučovacích hodin s délkou cca 45 min.). Uživatelům se tak nabízí jazykový materiál, v němž je zachycena mluva učitelů i žáků během vyučování. Zatím je to jediný veřejně přístupný korpus tohoto typu. Uvedený korpus se od ostatních mluvených korpusů zveřejněných v Českém národním korpusu li…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:skript_vyhledavani_a_subkorpusy?rev=1610020438&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-01-07T11:53:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>skript_vyhledavani_a_subkorpusy</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:skript_vyhledavani_a_subkorpusy?rev=1610020438&amp;do=diff</link>
        <description>Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů

Dotazy v korpusu SKRIPT2012 můžeme zadávat pomocí přístupu do korpusu přes webové rozhraní KonText.

Inspirací nám může být také korpus SCHOLA2010, viz Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů.

Vytváření subkorpusů (pro přihlášené uživatele)</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:skript2012_znacky?rev=1431439120&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-05-12T13:58:40+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>skript2012_znacky</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:skript2012_znacky?rev=1431439120&amp;do=diff</link>
        <description>Sociolingvistické a didaktické značky v korpusu SKRIPT2012

V korpusu SKRIPT2012 se nacházejí sociolingvistické a didaktické charakteristiky, které byly vytvořeny na základě korpusu SCHOLA2010; jsou to informace o dokumentu, o škole, o třídě, o žáku a o učiteli, viz přehled značek uvedených níže v tabulce. Kromě toho korpus</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:skript2012-prepis?rev=1397638655&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-04-16T08:57:35+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>skript2012-prepis</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:skript2012-prepis?rev=1397638655&amp;do=diff</link>
        <description>Zásady pro přepis korpusu SKRIPT2012

Přepis je koncipován tak, aby v přepsaném textu zůstalo zachováno maximum informací obsažených v původním rukopisu, zpracovatelé tedy v žádném případě text neopravovali ani neupravovali. Přepsán byl pouze text žáka a případné učitelem zadané úseky textu, sloužící žákovi jako vodítko (např. začátek práce, osnova atp.). Nebyly přepisovány komentáře a poznámky učitele, ani jeho opravy.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010?rev=1431439260&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-05-12T14:01:00+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010?rev=1431439260&amp;do=diff</link>
        <description>Sociolingvistické značky a charakteristiky v korpusu SCHOLA2010

V korpusu SCHOLA2010 se nacházejí specifické sociolingvistické charakteristiky nevyskytující  se v ostatních mluvených korpusech: informace o sondě (navíc -- region, místo pořízení sondy, velikost sídla), o škole, o třídě, o vyučovacím předmětu, o vyučovací hodině a doplňující údaje o mluvčím (jedinečný kód mluvčího; věkové skupiny platné pro učitele, cizí dospělé osoby, žáky a cizí žáky; aprobace pro učitele a cizí dospělé osoby; …</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:speeches?rev=1443694178&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-10-01T10:09:38+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>speeches</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:speeches?rev=1443694178&amp;do=diff</link>
        <description>Korpus prezidentských projevů Speeches

Korpus oficiálních prezidentských projevů Speeches byl vytvořen na základě spolupráce ČNK s Universitou v Oslo. Svým zaměřením na připravené written to be spoken texty, v nichž funkčně převažuje psaná čeština a které se k mluveným textům často dají řadit pouze na základě použitého akustického média, se zařazuje do prostoru mezi řadou</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:statistiky_ke_korpusu_skript2012?rev=1401384150&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-05-29T17:22:30+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>statistiky_ke_korpusu_skript2012</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:statistiky_ke_korpusu_skript2012?rev=1401384150&amp;do=diff</link>
        <description>Statistiky ke korpusu Skript2012

I. Údaje o sondě / dokumentu

Základní informace o písemné práci
Celkový počet písemných prací
  1694
Celkový počet slov
  587 857Průměrný počet slov na 1 písemnou práci  347 Rok pořízení
písemné práce</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:struktura_oral?rev=1496380891&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2017-06-02T05:21:31+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>struktura_oral</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:struktura_oral?rev=1496380891&amp;do=diff</link>
        <description>Struktura spojeného korpusu ORAL

Počet nahrávek podle roku pořízení

Tab. 1: Počet nahrávek podle počtu mluvčích
 Počet mluvčích  Počet nahrávek 2    6313    4084    2585    1406    717    148    139    6
Tab. 2: Počet mluvčích a slov podle vzdělání</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:struktura_ortofon?rev=1717494495&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-06-04T09:48:15+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>struktura_ortofon</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:struktura_ortofon?rev=1717494495&amp;do=diff</link>
        <description>Struktura korpusu ORTOFON v1

Následující přehled se týká pouze 1. verze korpusu ORTOFON z roku 2017.

Počet nahrávek podle roku pořízení

Regionální původ mluvčích

Absolutní počty mluvčích podle místa narození i s údaji o zeměpisné šířce a délce jsou k dispozici</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:struktura-capek?rev=1576590291&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2019-12-17T13:44:51+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>struktura-capek</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:struktura-capek?rev=1576590291&amp;do=diff</link>
        <description>Popis strukturních atributů korpusů Čapek a Čapek-úplný:</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:struktura-oral13?rev=1429117942&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-04-15T17:12:22+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>struktura-oral13</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:struktura-oral13?rev=1429117942&amp;do=diff</link>
        <description>Struktura korpusu ORAL2013

Tab. 1: Počet nahrávek podle roků
 Rok 	 Počet nahrávek  2008   147 2009   301 2010   236 2011   151
Tab. 2: Počet nahrávek podle počtu mluvčích
Počet mluvčíchPočet nahrávek 2   380 3  204 4  139 5  76 6  28</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:struktura?rev=1613589024&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2021-02-17T19:10:24+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>struktura</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:struktura?rev=1613589024&amp;do=diff</link>
        <description>Struktura Českého národního korpusu

Korpusy ČNK reprezentují buď psanou češtinu -- a to z pohledu synchronního, nebo diachronního --, anebo češtinu mluvenou, v níž máme k dispozici především data současná. Paralelní korpusy, které jsou rovněž součástí ČNK, umožňují analyzovat jazyk překladů. Mimo tuto základní klasifikaci pak leží korpusy</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn?rev=1769159291&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-23T09:08:11+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn?rev=1769159291&amp;do=diff</link>
        <description>Korpus SYN

SYN je souhrnné označení pro korpus, který obsahuje vždy všechny synchronní psané korpusy řady SYN zveřejněné do doby vzniku dané verze korpusu SYN (například SYN verze 3 z roku 2014 tedy zahrnuje korpusy SYN2000, SYN2005, SYN2006PUB, SYN2009PUB, SYN2010 a SYN2013PUB, viz následující tabulka) a který je přitom zpracován nejnovějšími verzemi všech nástrojů (</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2000?rev=1661789278&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T16:07:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2000</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2000?rev=1661789278&amp;do=diff</link>
        <description>Korpus SYN2000
   SYN2000  Pozice  Počet pozic (tokenů)  120 908 724  Počet pozic (tokenů) bez interpunkce   100 061 381  Počet slovních tvarů (wordů)  1 763 813  Počet lemmat  891 713  Struktury  Počet dokumentů (nikoli opusů)  233 797  Počet vět  7 639 321  Další informace  Referenční  ANO   Reprezentativní  ANO (různé textové typy)  Rok zveřejnění  2000  
Korpus SYN2000 obsahuje 100 milionů textových slov a veřejnosti byl představen v říjnu roku 2000, tedy v době, kdy korpusový přístup k jazy…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2005?rev=1661789278&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T16:07:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2005</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2005?rev=1661789278&amp;do=diff</link>
        <description>Korpus SYN2005

Korpus SYN2005 je synchronní reprezentativní korpus psané češtiny obsahující 100 milionů textových slov (tokenů). V těchto základních charakteristikách se tedy shodne se svým předchůdcem, korpusem SYN2000, i následovníkem, korpusem SYN2010. Především mezi korpusy</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2006pub?rev=1661789279&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T16:07:59+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2006pub</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2006pub?rev=1661789279&amp;do=diff</link>
        <description>Korpus SYN2006PUB

Korpus SYN2006PUB je synchronní korpus psané publicistiky o rozsahu 300 milionů textových slov (tokenů). Obsahuje výhradně publicistiku od listopadu 1989 do konce roku 2004, tedy z období, jež pokrývají též korpusy SYN2000 a SYN2005. Všechny korpusy řady SYN jsou však co se zařazených textů týče</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2009pub?rev=1661789279&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T16:07:59+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2009pub</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2009pub?rev=1661789279&amp;do=diff</link>
        <description>Korpus SYN2009PUB

Korpus SYN2009PUB je podobně jako korpus SYN2006PUB synchronní korpus psané publicistiky. Obsahuje výhradně publicistiku od roku 1995 do roku 2007, celková velikost korpusu je 700 milionů textových slov (tokenů). Všechny korpusy řady SYN jsou disjunktní</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2010?rev=1661789279&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T16:07:59+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2010</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2010?rev=1661789279&amp;do=diff</link>
        <description>Korpus SYN2010

Korpus SYN2010 je synchronní reprezentativní korpus současné psané češtiny obsahující 100 milionů textových slov (tokenů). Navazuje tak na korpusy SYN2000 a SYN2005 a tvoří s nimi řadu synchronních reprezentativních korpusů pokrývajících tři po sobě jdoucí časová období. Všechny korpusy obsahují rozdílné texty, tedy jsou disjunktní</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2013pub?rev=1661789279&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T16:07:59+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2013pub</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2013pub?rev=1661789279&amp;do=diff</link>
        <description>Korpus SYN2013PUB

Korpus SYN2013PUB je podobně jako korpusy SYN2006PUB a SYN2009PUB synchronní korpus psané publicistiky. Obsahuje výhradně publicistiku z let 2005 až 2009 ve 44 různých titulech, celková velikost korpusu je 935 milionů textových slov (tokenů). Všechny korpusy řady</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2015?rev=1661786602&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-08-29T15:23:22+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2015</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2015?rev=1661786602&amp;do=diff</link>
        <description>Korpus SYN2015

Korpus SYN2015 je synchronní reprezentativní a referenční korpus současné psané češtiny, obsahující 100 milionů textových slov, tedy včetně interpunkce (tokenů). Navazuje na předchozí korpusy řady SYN (SYN2000, SYN2005 a SYN2010), vydávané v pětiletých intervalech, a pokrývá spolu s nimi časové období od roku 1989. Každý z korpusů řady SYN zachycuje především jazyk posledních pěti let, které předcházely jeho zveřejnění; SYN2015 je tak zaměřen na období 2010–2014. Žádný z textů v …</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2020?rev=1697209338&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-10-13T15:02:18+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2020</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2020?rev=1697209338&amp;do=diff</link>
        <description>Korpus SYN2020

Korpus SYN2020 je synchronní reprezentativní a referenční korpus současné psané češtiny, obsahující 100 milionů textových slov, tedy včetně interpunkce (tokenů). Navazuje na předchozí korpusy řady SYN (SYN2000, SYN2005, SYN2010 a SYN2015), vydávané v pětiletých intervalech, a pokrývá spolu s nimi časové období od roku 1989. Každý z korpusů řady SYN zachycuje především jazyk posledních pěti let, která předcházela jeho zveřejnění; SYN2020 je tak zaměřen na období 2015–2019. Žádný z…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:syn2025?rev=1768813882&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-19T09:11:22+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>syn2025</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:syn2025?rev=1768813882&amp;do=diff</link>
        <description>Korpus SYN2025

Korpus SYN2025 je synchronní reprezentativní a referenční korpus současné psané češtiny, obsahující 100 milionů textových slov, tedy včetně interpunkce (tokenů). Navazuje na předchozí korpusy řady SYN (SYN2000, SYN2005, SYN2010, SYN2015 a SYN2020), vydávané v pětiletých intervalech, a pokrývá spolu s nimi časové období od roku 1989. Každý z korpusů řady SYN zachycuje především jazyk posledních pěti let, která předcházela jeho zveřejnění; SYN2025 je tak zaměřen na období 2020–2024…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:totalita?rev=1677160468&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-02-23T13:54:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>totalita</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:totalita?rev=1677160468&amp;do=diff</link>
        <description>Totalita: korpus jazyka totality

Korpus Totalita je diachronní korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro Slovník komunistické totality.

Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:ukwac?rev=1722595097&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-08-02T10:38:17+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>ukwac</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:ukwac?rev=1722595097&amp;do=diff</link>
        <description>Korpus ukWaC

Korpus webových textů stažených z domény .uk, jeho celkový rozsah je 1,9 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem TreeTagger, podrobnější informace o vzniku korpusu a použitém tagsetu najdete zde. 

Jak citovat</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:uvod?rev=1769159919&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-23T09:18:39+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>uvod</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:uvod?rev=1769159919&amp;do=diff</link>
        <description>Jaké korpusy zpřístupňuje Český národní korpus?

Projekt Český národní korpus zpřístupňuje řadu různých korpusů, jejich okomentovaný přehled najdete v sekci týkající se jeho složení. Celkový rozsah textů, který ČNK v korpusech zpracoval a zpřístupnil, přesahuje 4,5 miliardy slov v českých jednojazyčných a 1,5 miliardy slov v cizojazyčných</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:veda?rev=1708889948&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-02-25T19:39:08+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>veda</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:veda?rev=1708889948&amp;do=diff</link>
        <description>Korpus akademické češtiny

Korpus akademické češtiny je komplementem Frázové banky akademické češtiny a zahrnuje pouze česky psané nepřekladové texty vydané po roce 2010 ve vědeckých časopisech indexovaných v databázích Web of Science nebo Scopus, případně EBSCO. Dalším kritériem je žánr textu: do korpusu jsou zařazeny jen studie a přehledové články, nikoli tedy například recenze nebo zprávy z konferencí. Texty jsou ve většině případů v prefinální úpravě, tj. neprošly závěrečnou redakční úpravou…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:vespa_cz?rev=1671651541&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2022-12-21T19:39:01+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>vespa_cz</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:vespa_cz?rev=1671651541&amp;do=diff</link>
        <description>VESPA_CZ

Žákovský korpus psané akademické angličtiny pokročilých mluvčích s češtinou jako L1.

Žákovský korpus VESPA_CZ vznikl jako součást mezinárodního projektu VESPA (The Varieties of English for Specific Purposes dAtabase
) organizovaného Centrem pro anglickou korpusovou lingvistiku při Katolické univerzitě v Lovani (</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/cnk:zasady_pro_prepis_vyucovacich_hodin?rev=1431439321&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2015-05-12T14:02:01+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>zasady_pro_prepis_vyucovacich_hodin</title>
        <link>http://wiki.korpus.cz/doku.php/cnk:zasady_pro_prepis_vyucovacich_hodin?rev=1431439321&amp;do=diff</link>
        <description>Sběr nahrávek vyučovacích hodin

Pořizování nahrávek vyučovacích hodin probíhalo v letech 2005–2008.
Na získávání sond se podíleli především pedagogové. Učitelé nám velmi pomohli se zpracováním nahrávek vyučovacích hodin, zejména s identifikací jednotlivých mluvčích.</description>
    </item>
</rdf:RDF>
