Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:korpus [2013/09/19 09:58] – Schvaleno pro 1. verzi vaclavcvrcek | pojmy:korpus [2013/09/24 11:00] – Schvaleno pro 1. verzi vaclavcvrcek |
---|
| |
Pro usnadnění práce s korpusy jsou texty v nich obsažené často [[pojmy:anotace|anotovány]]. Jde jednak o doplňování [[pojmy:metadata|metainformací]] o textech (jejich původ, autorství atp.) a jednak o doplňování informací k jednotlivým jevům. Příkladem takové anotace je [[pojmy:lemma|lemmatizace]], tj. přiřazení slovníkové podoby každému tvaru ([[pojmy:token|tokenu]]), nebo [[pojmy:tag|tagování]], tj. přiřazení speciální značky (tagu), která popisuje gramatické nebo sémantické vlastnosti slov. V rámci [[cnk:uvod|ČNK]] jsou všechny korpusy opatřeny [[pojmy:atributy_strukturni|strukturními značkami]] zachycujícími metainformace o textech, pouze [[pojmy:psany|korpusy psané češtiny]] jsou však lemmatizovány a morfologicky tagovány. | Pro usnadnění práce s korpusy jsou texty v nich obsažené často [[pojmy:anotace|anotovány]]. Jde jednak o doplňování [[pojmy:metadata|metainformací]] o textech (jejich původ, autorství atp.) a jednak o doplňování informací k jednotlivým jevům. Příkladem takové anotace je [[pojmy:lemma|lemmatizace]], tj. přiřazení slovníkové podoby každému tvaru ([[pojmy:token|tokenu]]), nebo [[pojmy:tag|tagování]], tj. přiřazení speciální značky (tagu), která popisuje gramatické nebo sémantické vlastnosti slov. V rámci [[cnk:uvod|ČNK]] jsou všechny korpusy opatřeny [[pojmy:atributy_strukturni|strukturními značkami]] zachycujícími metainformace o textech, pouze [[pojmy:psany|korpusy psané češtiny]] jsou však lemmatizovány a morfologicky tagovány. |
| |
| ==== Využití v lingvistice ==== |
| |
| Korpusový přístup se v dnešní lingvistice uplatňuje téměř na všech rovinách popisu jazyka. Kvantitativním analýzám nejmenších jednotek (fonémů a grafémů) se na angličtině věnoval už H. Kučera v rámci vytěžování prvního moderního korpusu ([[wp>Brown_Corpus|Brown corpus]]). V současnosti vznikají za účelem výzkumu fonetické databáze, které poskytují rozsáhlé možnosti kvantifikace a zkoumání segmentálních i suprasegmentálních jevů mluveného jazyka. Rovina grafémiky je vytěžována s pomocí [[pojmy:psany|korpusů psané češtiny]], a to jak v perspektivě [[pojmy:synchronni|synchronní]], tak [[pojmy:diachronni|diachronní]]. V oblasti gramatiky najdeme dnes pro češtinu celou paletu studií z morfologie a syntaxe (ovlivněné [[pojmy:corpus_based|corpus-based]] i [[pojmy:corpus_driven|corpus-driven]] přístupem), stejně tak jako první souborná gramatická díla. |
| |
| V lexikologii a lexikografii, což jsou oblasti, pro něž byly korpusy budovány především, je korpusový přístup dnes převládající metodologií; vedle tradičních výkladových a překladových slovníků umožnil příchod korpusů i vytváření slovníků specializovaných (frekvenční, kolokační). V současné době se stále více analýz zaměřuje na vyšší roviny, //CADS// = corpus assisted discourse studies (studium diskurzu založené na korpusu) je jak synchronní, tak diachronní. Jejich hlavní odlišnost oproti kvalitativním metodám studia diskurzu (jako je CDA = critical discourse analysis) spočívá v kvantitativním rozsahu empirické báze, kterou korpusy poskytují, což umožňuje redukovat badatelův subjektivní vliv na analýzu. Korpusový přístup se vedle lexikografie a cizojazyčné pedagogiky (tvorba učebnic) uplatňuje také v dialektologii, sociolingvistice, psycholingvistice, forenzní lingvistice, při studiu [[pojmy:syd|jazykové variability]], v jazykové didaktice a studiu akvizice jazyka ad. |
| |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
<WRAP round box 60%> | <WRAP round box 50%> |
[[cnk:uvod|Korpusy ČNK]] • [[pojmy:prehled_pojmu|Přehled základních pojmů korpusové lingvistiky]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]] • [[pojmy:struktura_korpusu|Struktura korpusu]] | [[cnk:uvod|Korpusy ČNK]] • [[pojmy:prehled_pojmu|Přehled základních pojmů korpusové lingvistiky]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]] • [[pojmy:struktura_korpusu|Struktura korpusu]] |
</WRAP> | </WRAP> |