Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | |
cnk:codit [2021/03/29 14:14] – michalkren | cnk:codit [2021/03/29 14:16] (aktuální) – [Korpus CODIT] michalkren |
---|
{{ :en:cnk:codit-logo.png?direct&180|}} | {{ :en:cnk:codit-logo.png?direct&180|}} |
| |
CODIT je vyvážený diachronní korpus psané italštiny o celkové velikosti přibližně 33 mil. tokenů. Korpus je v ČNK hostován, sestavila ho [[https://www.unimib.it/maria-silvia-micheli|Maria Silvia Micheli]]. CODIT pokrývá celé období vývoje italštiny od 13. století do roku 1947, jeho struktura je analogická ke korpusu [[http://www.corpusmidia.unito.it/|MIDIA]] (//Morfologia Italiana in Diacronia//), který dosahuje velikosti 7,5 mil. tokenů. Korpus CODIT není prozatím anotován, v budoucnu však počítáme s doplněním morfologického značkování a lemmatizace. Korpus je rozdělen do 5 hlavních částí podle období, které pokrývají. Periodizace vychází z korpusu MIDIA a je založena na důležitých historických a literárních událostech: | CODIT je vyvážený diachronní korpus psané italštiny o celkové velikosti přibližně 33 mil. tokenů. Korpus je v ČNK hostován díky [[https://www.unimib.it/maria-silvia-micheli|Marii Silvii Micheli]], která ho sestavila. CODIT pokrývá celé období vývoje italštiny od 13. století do roku 1947, jeho struktura je analogická ke korpusu [[http://www.corpusmidia.unito.it/|MIDIA]] (//Morfologia Italiana in Diacronia//), který dosahuje velikosti 7,5 mil. tokenů. Korpus CODIT není prozatím anotován, v budoucnu však počítáme s doplněním morfologického značkování a lemmatizace. Korpus je rozdělen do 5 hlavních částí podle období, které pokrývají. Periodizace vychází z korpusu MIDIA a je založena na důležitých historických a literárních událostech: |
| |
- 13. století -- 1375: období končí Boccacciovou smrtí. | - 13. století -- 1375: období končí Boccacciovou smrtí. |