<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="FeedCreator 1.8" -->
<?xml-stylesheet href="http://wiki.korpus.cz/lib/exe/css.php?s=feed" type="text/css"?>
<rdf:RDF
    xmlns="http://purl.org/rss/1.0/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
    xmlns:dc="http://purl.org/dc/elements/1.1/">
    <channel rdf:about="http://wiki.korpus.cz/feed.php">
        <title>Příručka ČNK - hickok</title>
        <description>Báze znalostí z korpusové lingvistiky</description>
        <link>http://wiki.korpus.cz/</link>
        <image rdf:resource="http://wiki.korpus.cz/lib/exe/fetch.php/wiki:dokuwiki.svg" />
       <dc:date>2026-04-21T12:27:19+00:00</dc:date>
        <items>
            <rdf:Seq>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:anotace_v_tabulkovem_procesoru?rev=1709543893&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:kondicional?rev=1710144824&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:poskozene_texty?rev=1720361086&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:problemy_lemmatizace?rev=1754466311&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:problemy_morfologie?rev=1768558000&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:problemy_tokenizace?rev=1771253950&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:stc_strdc_ud?rev=1772540225&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:uvod?rev=1706526203&amp;do=diff"/>
                <rdf:li rdf:resource="http://wiki.korpus.cz/doku.php/hickok:zivotnost?rev=1715802200&amp;do=diff"/>
            </rdf:Seq>
        </items>
    </channel>
    <image rdf:about="http://wiki.korpus.cz/lib/exe/fetch.php/wiki:dokuwiki.svg">
        <title>Příručka ČNK</title>
        <link>http://wiki.korpus.cz/</link>
        <url>http://wiki.korpus.cz/lib/exe/fetch.php/wiki:dokuwiki.svg</url>
    </image>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:anotace_v_tabulkovem_procesoru?rev=1709543893&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-03-04T09:18:13+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>anotace_v_tabulkovem_procesoru</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:anotace_v_tabulkovem_procesoru?rev=1709543893&amp;do=diff</link>
        <description>Anotační nástroje a formát souboru

Základním formátem pro anotovaná data v UD je formát CoNLL-U, což je v podstatě textový formát, ve kterém každý token má svůj řádek a na tomto řádku je deset tabulátorem oddělených sloupců s předepsanými hodnotami. Nebýt toho, že na začátku a konci věty jsou řádky, které neodpovídají žádnému tokenu a vypadají jinak, šlo by vlastně o velkou tabulku.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:kondicional?rev=1710144824&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-03-11T08:13:44+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>kondicional</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:kondicional?rev=1710144824&amp;do=diff</link>
        <description>Kondicionál

Segmentace na slova v (novo)českých UD rozděluje tvary abych, abys, ..., kdybych, kdybys, ... na dvě slova: spojku a kondicionálové bych, bys, by, bychom, byste. Podobně jsou rozděleny agregáty zájmena a pomocného jsi, např.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:poskozene_texty?rev=1720361086&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-07-07T14:04:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>poskozene_texty</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:poskozene_texty?rev=1720361086&amp;do=diff</link>
        <description>Pravidla pro anotaci poškozených textů

Pokud je zdrojový rukopis poškozený, projevuje se to dvěma pro nás relevantními typy jevů (pro ilustraci viz např. edici RadaOtcR, verše 49 a dál). Zaprvé se nám tam objevují torzovitá slova, v nichž je jen dochovaná část znaků, zatímco zbytek je reprezentován trojtečkou (např.</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:problemy_lemmatizace?rev=1754466311&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2025-08-06T07:45:11+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>problemy_lemmatizace</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:problemy_lemmatizace?rev=1754466311&amp;do=diff</link>
        <description>Problémy lemmatizace

Zde evidujeme problematické/nejasné případy lemmatizace tvarů ve staročeském a středněčeském etalonu. (Základní dokumentace zde.)

Nové problémy pište prosím červeně, ať máme odlišeno, co je ještě nedořešené.

Lemmatizace slov nedochovaných do současné češtiny</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:problemy_morfologie?rev=1768558000&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-01-16T10:06:40+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>problemy_morfologie</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:problemy_morfologie?rev=1768558000&amp;do=diff</link>
        <description>Problémy anotace morfologie (POS, features)

Tabulka slouží k zapisování, diskusi a řešení nejasností/problémů při anotaci slovních druhů (POS) a morfologických rysů (features) v staročeském a středněčeském UD etalonu. Vyřešené problémy budou průběžně doplňovány do</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:problemy_tokenizace?rev=1771253950&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-02-16T14:59:10+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>problemy_tokenizace</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:problemy_tokenizace?rev=1771253950&amp;do=diff</link>
        <description>Tokenizace a slovní segmentace

UD se od jiných anotačních schémat odlišuje tím, že má dvě roviny segmentace věty na menší jednotky. Nižší z obou rovin odpovídá klasické tokenizaci, kde token je buď ohraničen mezerami, nebo předělem mezi písmeny a jinými znaky, zejména interpunkcí. Druhé z obou rovin se někdy říká slovní segmentace (word segmentation) a uplatňuje se v případech, kdy je důvod rozdělit token složený z písmen. V terminologii UD jde o víceslovný token (multiword token) a části, na k…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:stc_strdc_ud?rev=1772540225&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2026-03-03T12:17:05+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>stc_strdc_ud</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:stc_strdc_ud?rev=1772540225&amp;do=diff</link>
        <description>UD anotace staročeského a středněčeského etalonu

Vychází se jednak z anotačních pravidel UD (a to jak obecných, tak těch specifických pro slovanské jazyky a češtinu), jednak ze zkušeností z pilotního projektu v roce 2022 (anotace Matoušova evangelia z Bible drážďanské a olomoucké). K tomu externí odkazy:</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:uvod?rev=1706526203&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-01-29T11:03:23+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>uvod</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:uvod?rev=1706526203&amp;do=diff</link>
        <description>Interní stránky projektu HiČKoK

Celý namespace hickok v rámci této wiki je vyhrazen pro interní potřeby projektu HiČKoK.

UD anotace staročeského a středněčeského etalonu: stránka pro dokumentaci

O projektu HiČKoK

Cílem projektu HiČKoK je vytvořit datové, softwarové a znalostní zázemí pro studium češtiny v celém jejím historickém kontinuu (od 13. do 21. století). Projekt je unikátní tím, že se vůbec poprvé pokouší propojit jednotlivá centra, v nichž se nezávisle budovaly textové korpusy pro r…</description>
    </item>
    <item rdf:about="http://wiki.korpus.cz/doku.php/hickok:zivotnost?rev=1715802200&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2024-05-15T19:43:20+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>zivotnost</title>
        <link>http://wiki.korpus.cz/doku.php/hickok:zivotnost?rev=1715802200&amp;do=diff</link>
        <description>Životnost

DZ: Toto je zatím (27.2.2024) otevřený problém a níže je pouze nástin možného řešení.

Rozlišování životnosti u mužských jmen dává smysl a běžně se děje v novočeských korpusech, ale u staročeských není jasné, jak by se s ní mělo zacházet, protože neživotná jména běžně mívají i životné tvary a platí to i opačně. Pokud bychom se rozhodli anotovat staročeská data bez životnosti, tak zase máme jiné problémy: 1) UDPipe, který se natrénuje na novočeských nebo smíšených datech, v tom bude mí…</description>
    </item>
</rdf:RDF>
