Nastavení

Synchronie, synchronní korpus

Synchronní korpus usiluje o záznam jazykového úzu v jednom (většinou v relativně úzce vymezeném období). Na rozdíl od korpusů diachronních tedy neposkytuje možnosti zkoumání jazykového vývoje, příp. jen ve velmi omezené míře. Z pohledu současného jazyka se jako synchronní jeví korpus, který zachycuje jazyk živý, tj. takový, který je užíván žijícími mluvčími.

Pro psaný text platí, že synchronní je takový text, který se stále čte. Protože současnost a živost jazyka (a tedy i korpusu) je teoreticky vázána vždy jen na své uživatele, není žádný korpus svou povahou synchronní navždycky a mění se v čase souběžně se změnou jazyka, především pozvolným přechodem do diachronie a do diachronního korpusu (v tomto smyslu např. čeština kolem poloviny 19. stol. byla pro takového současníka jako Jan Neruda pochopitelně synchronní, jakkoliv pro člověka z 21. století je to už čeština diachronní apod.). Všechny dnešní české korpusy v rámci ČNK tudíž po čase přestanou být synchronní a stanou se součástí diachronie.

Zásadní rozdíl mezi synchronním a diachronním korpusem je v jeho jinak nesnadno uchopitelné „živosti“, kterou nejlépe vyjádřil F. de Saussure tak, že za živé v jazyce lze považovat to, co je uživateli jako živé „vyciťováno“. Vzhledem k současné koexistenci mluvčích několika generací zároveň, z nichž každá zná, resp. vyciťuje jako živé něco trochu jiného, se však za synchronii považuje širší časové údobí společné několika generacím, jakkoliv se to přesně měřit nedá, není tu ani jasný konsensus.

Je zřejmé, že většina našich informačních potřeb je uložena v současném jazyku, a proto se také jak jeho výstavbě, tak vytěžování věnuje zdaleka největší pozornost, jakkoliv poznání jazyka minulosti je předpokladem k plnému pochopení současného stavu jazyka. I proto je třeba jazyk studovat skrze korpusy jak diachronní, tak i synchronní.

Za zásadní indikátory větších změn jazyka, posouvajících jeho část do diachronie a přispívajících na druhé straně vyšší mírou neologismů, se obvykle považují vnější společenské faktory, jako jsou války (první a druhá světová), revoluce (sametová) aj. Jde ale jen o kritérium pomocné a nespolehlivé. Proto každý synchronní korpus, složený ze skutečných textů, v důsledku těchto faktorů obsahuje i malé procento prvků diachronních, z nichž některé udržují při životě např. někteří archaizující spisovatelé, školní četba aj. Řada slov však prochází jednotlivými jazykovými stavy v zásadě beze změny, srov. strom, spát, že aj. I synchronní korpus je tedy podobně jako reálné texty, z nichž je budovaný, striktně řečeno smíšený jakkoliv se to explicitně nezdůrazňuje a odhlíží se od toho.

Kritéria synchronie pro psané korpusy

Pro korpusy řady SYN vydané po roce 2015 (počínaje korpusem SYN2015) byla stanovena následující kritéria:

  • pro beletrii platí strategie 25 + 75, tj. doba od prvního vydání nepřesahuje 75 let (přibližně tři žijící generace) a konkrétní vydání díla zařazovaného do korpusu není starší 25 let (zajištění současné recepce),
  • u odborných textů platí požadavek prvního vydání v posledních 25 letech,
  • hranice synchronie publicistických titulů zůstává nezměněna, tj. text musí být vydán v období mapovaném daným korpusem (v případě SYN2015 je to období let 2010 až 2014).

Korpusy psané současné češtiny řady SYN vydané před rokem 2015 byly tvořeny pouze z textů, které splňovaly následující předpoklady:

  • beletristické texty - autor narozen po roce 1880, dílo bylo vydáno po roce 1945 a je neustále čteno a vydáváno
  • odborné texty - dílo bylo vydáno po roce 1989 (platí méně striktně pro korpus SYN2000, který měl za cíl mapovat širší období)
  • publicistika - není starší než 5 let (platí méně striktně pro korpus SYN2000, který měl za cíl mapovat širší období)

Související odkazy