Diachronie, diachronní korpus
Na rozdíl od korpusu synchronního, který je vždy vytvářen pro určité omezené období, se diachronní korpus snaží zachycovat proměny jazykového úzu v čase. V rámci ČNK se pokrýváním diachronie zabývá nereferenční korpus DIAKORP, který zahrnuje texty celkem ze sedmi století vývoje českého jazyka. První dokončená část (přibližně 700 000 slovních tvarů) byla zpřístupněna veřejnosti v září roku 2005.
Otázka hranice synchronie a diachronie je v korpusové lingvistice stále nedořešená. Obecně se z pohledu současnosti za diachronní považuje takový text, který už nemá živou recepci u žijících mluvčích, resp. čtenářů. Z tohoto pohledu do diachronního korpusu spadají všechna díla od 13. století. Pro konkrétní textové typy platí následující kritéria:
- beletrie – vydáno před rokem 1945
- odborná, publicistika – vydáno před rokem 1989
Rok zveřejnění díla (u nezveřejněných děl rok vytvoření) je u každého textu dostupný v podobě strukturního atributu rokvyd
.
Kromě psaného diachronního korpusu se připravuje i diachronní korpus mluvený, jde o nářeční Korpus DIALEKT.