AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:strukturni_atributy_diakorp [2022/08/31 23:01] jankrivanseznamy:strukturni_atributy_diakorp [2022/08/31 23:27] (aktuální) – [Struktury korpusu Diakorp (verze 6)] jankrivan
Řádek 3: Řádek 3:
 ==== Struktury korpusu Diakorp (verze 6) ==== ==== Struktury korpusu Diakorp (verze 6) ====
  
-V [[pojmy:diachronni|diachronním]] korpusu Diakorp nacházíme tyto hierarchické strukturní jednotky:+V [[pojmy:diachronni|diachronním]] korpusu [[cnk:diakorp|Diakorp]] nacházíme tyto hierarchické strukturní jednotky:
  
   * **doc** - text nebo ucelený soubor textů   * **doc** - text nebo ucelený soubor textů
Řádek 10: Řádek 10:
 Strukturní jednotky se obvykle zapisují pomocí špičatých závorek, kde ''<doc>'' značí začátek jednotky, ''</doc>'' její konec a ''<doc />'' její obsah. Pomocí značek strukturních jednotek je možné v korpusu hledat jevy, které se nějakým způsobem vztahují k hranicím různých celků. Strukturní jednotky se obvykle zapisují pomocí špičatých závorek, kde ''<doc>'' značí začátek jednotky, ''</doc>'' její konec a ''<doc />'' její obsah. Pomocí značek strukturních jednotek je možné v korpusu hledat jevy, které se nějakým způsobem vztahují k hranicím různých celků.
  
-Ve strukturách korpusu [[cnk:diakorp|Diakorp]] se vedle různých informací o jednotlivých textech a jejich [[pojmy:atributy_strukturni|strukturaci]] zachovává i podstatná část lingvistických informací, k jejichž ztrátě obvykle dochází při transkripci:+Ve strukturách korpusu [[cnk:diakorp|Diakorp]] se vedle různých informací o jednotlivých textech a jejich [[pojmy:atributy_strukturni|strukturaci]] zachovává i podstatná část lingvistických informací, k jejichž ztrátě obvykle dochází při transkripci, a to za pomoci nehierarchických strukturních jednotek:
  
 ^  Struktura  ^  Popis  ^ ^  Struktura  ^  Popis  ^
Řádek 21: Řádek 21:
 ^ **<nowiki><m> </m></nowiki>** | naznačují **začátek a konec marginálie**; text marginálie se přitom umisťuje před začátek odstavce nebo věty (tj. na místo v textu, kam podle smyslu patří); např.: //Příklady toho některé vizme. <nowiki><m>Příklad na Adamovi v ráji</m></nowiki> První člověk Adam rady u sebe nevěda, začal ji krom sebe hledati...// | ^ **<nowiki><m> </m></nowiki>** | naznačují **začátek a konec marginálie**; text marginálie se přitom umisťuje před začátek odstavce nebo věty (tj. na místo v textu, kam podle smyslu patří); např.: //Příklady toho některé vizme. <nowiki><m>Příklad na Adamovi v ráji</m></nowiki> První člověk Adam rady u sebe nevěda, začal ji krom sebe hledati...// |
  
-Další informace týkající se transkripce jsou uvedeny ve zvláštním pozičním atributu **e** (emendace). Viz informace o [[cnk:diakorp#znackovani|značkování]] korpusu Diakorp+Další informace týkající se transkripce jsou navíc uvedeny ve zvláštním pozičním atributu **e** (emendace). Viz informace o [[cnk:diakorp#znackovani|značkování]] korpusu Diakorp.
- +
-Výše uvedeným strukturním jednotkám (strukturám) mohou být přiřazeny další údaje (tzv. [[pojmy:metadata|metadata]]), a to prostřednictvím strukturních atributů. Přehled těchto atributů a jejich možné hodnoty u korpusu Diakorp v6 uvádíme níže.+
  
 +Strukturním jednotkám (strukturám) mohou být přiřazeny další údaje (tzv. [[pojmy:metadata|metadata]]), a to prostřednictvím strukturních atributů. Přehled těchto atributů a jejich možné hodnoty u korpusu Diakorp v6 uvádíme níže.
  
 ==== Strukturní atributy korpusu Diakorp (verze 6) ==== ==== Strukturní atributy korpusu Diakorp (verze 6) ====
  
 ^ Struktura ^ Atribut ^ Popis ^ Hodnoty atributu ^ ^ Struktura ^ Atribut ^ Popis ^ Hodnoty atributu ^
-| doc | year | rok vydání | např. //1400// | +| doc | year | rok vydání | např. //1492// | 
-| ::: | biblio | bibliografický údaj | např. //xxx// | +| ::: | biblio | bibliografický údaj | např. //Kabátník, Martin: Cesta z Čech do Jeruzaléma a Egypta (KapPraž O 35) (R) (1492)// | 
-| ::: | txtype_group | skupina textových typů | seznam hodnot níže | +| ::: | txtype_group | skupina textových typů | např. //próza//, viz popis níže | 
-| ::: | txtype | textový typ | seznam hodnot níže | +| ::: | txtype | textový typ | např. //cestopis//, viz popis níže | 
-| page    | id | jednoznačný identifikátor stránky | např. //xxx// |+| page    | id | jednoznačný identifikátor stránky | např. //182b// |
  
 Podle hodnot, jichž jednotlivé strukturní atributy nabývají, je možné upřesňovat hledání v korpusech, omezovat výsledky pouze na určitou skupinu struktur, příp. i vytvářet subkorpusy. Podle hodnot, jichž jednotlivé strukturní atributy nabývají, je možné upřesňovat hledání v korpusech, omezovat výsledky pouze na určitou skupinu struktur, příp. i vytvářet subkorpusy.
  
-==== Hodnoty strukturních atributů txtype_group a txtype ====+=== Hodnoty strukturních atributů txtype_group a txtype ===
  
 V Diakorpu verze 6 byla zavedena dvouúrovňová klasifikace textů. Označení úrovní je stejné jako v korpusech řady SYN (1. [[pojmy:txtype_group|txtype_group]], textová skupina; 2. [[pojmy:txtype|txtype]], textový typ), avšak vymezení jednotlivých skupin a typů (tj. [[seznamy:txtype|hodnoty]] strukturních atributů ''txtype_group'' a ''txtype'') se liší.  V Diakorpu verze 6 byla zavedena dvouúrovňová klasifikace textů. Označení úrovní je stejné jako v korpusech řady SYN (1. [[pojmy:txtype_group|txtype_group]], textová skupina; 2. [[pojmy:txtype|txtype]], textový typ), avšak vymezení jednotlivých skupin a typů (tj. [[seznamy:txtype|hodnoty]] strukturních atributů ''txtype_group'' a ''txtype'') se liší.