AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
cnk:codit [2021/03/29 14:14] michalkrencnk:codit [2021/03/29 14:16] (aktuální) – [Korpus CODIT] michalkren
Řádek 5: Řádek 5:
 {{ :en:cnk:codit-logo.png?direct&180|}} {{ :en:cnk:codit-logo.png?direct&180|}}
  
-CODIT je vyvážený diachronní korpus psané italštiny o celkové velikosti přibližně 33 mil. tokenů. Korpus je v ČNK hostován, sestavila ho [[https://www.unimib.it/maria-silvia-micheli|Maria Silvia Micheli]]. CODIT pokrývá celé období vývoje italštiny od 13. století do roku 1947, jeho struktura je analogická ke korpusu [[http://www.corpusmidia.unito.it/|MIDIA]] (//Morfologia Italiana in Diacronia//), který dosahuje velikosti 7,5 mil. tokenů. Korpus CODIT není prozatím anotován, v budoucnu však počítáme s doplněním morfologického značkování a lemmatizace. Korpus je rozdělen do 5 hlavních částí podle období, které pokrývají. Periodizace vychází z korpusu MIDIA a je založena na důležitých historických a literárních událostech:+CODIT je vyvážený diachronní korpus psané italštiny o celkové velikosti přibližně 33 mil. tokenů. Korpus je v ČNK hostován díky [[https://www.unimib.it/maria-silvia-micheli|Marii Silvii Micheli]], která ho sestavila. CODIT pokrývá celé období vývoje italštiny od 13. století do roku 1947, jeho struktura je analogická ke korpusu [[http://www.corpusmidia.unito.it/|MIDIA]] (//Morfologia Italiana in Diacronia//), který dosahuje velikosti 7,5 mil. tokenů. Korpus CODIT není prozatím anotován, v budoucnu však počítáme s doplněním morfologického značkování a lemmatizace. Korpus je rozdělen do 5 hlavních částí podle období, které pokrývají. Periodizace vychází z korpusu MIDIA a je založena na důležitých historických a literárních událostech:
  
   - 13. století -- 1375: období končí Boccacciovou smrtí.   - 13. století -- 1375: období končí Boccacciovou smrtí.