Diachronie, diachronní korpus

Na rozdíl od korpusu synchronního, který je vždy vytvářen pro určité omezené období, se diachronní korpus snaží zachycovat proměny jazykového úzu v čase. V rámci ČNK se pokrýváním diachronie zabývá nereferenční korpus DIAKORP, který zahrnuje texty celkem ze sedmi století vývoje českého jazyka. První dokončená část (přibližně 700 000 slovních tvarů) byla zpřístupněna veřejnosti v září roku 2005.

Otázka hranice synchronie a diachronie je v korpusové lingvistice stále nedořešená. Obecně se z pohledu současnosti za diachronní považuje takový text, který už nemá živou recepci u žijících mluvčích, resp. čtenářů. Z tohoto pohledu do diachronního korpusu spadají všechna díla od 13. století. Pro konkrétní textové typy platí následující kritéria:

Rok zveřejnění díla (u nezveřejněných děl rok vytvoření) je u každého textu dostupný v podobě strukturního atributu rokvyd.

Kromě psaného diachronního korpusu se připravuje i diachronní korpus mluvený, jde o nářeční Korpus DIALEKT.

Související odkazy