AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:atributy_strukturni [2019/12/17 13:28] zuzanakomrskovapojmy:atributy_strukturni [2020/12/10 10:18] – [Strukturní atributy korpusu InterCorp] adrianzasina
Řádek 248: Řádek 248:
 |     | year              | rok pořízení nahrávky           | | |     | year              | rok pořízení nahrávky           | |
 |     | location          | místo nahrávky                  | obce ČR | |     | location          | místo nahrávky                  | obce ČR |
-|     | situation         | typ situace | ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení | +|     | situation         | typ situace | ''ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení'' 
-|     | framing           | zaměření projevu                | oficiální, popularizační, politické, profesní, vědecké | +|     | framing           | zaměření projevu                | ''oficiální, popularizační, politické, profesní, vědecké'' 
-|     | genre             | žánr projevu                    | hodnoty shodné s genderem u psaných korpusů | +|     | genre             | žánr projevu                    | hodnoty shodné s atributem [[cnk:klasifikace_textu_syn2015?s[]=genre|genre]] u psaných korpusů | 
-|     | audience_present  | přítomnost publika              | ano, ne | +|     | audience_present  | přítomnost publika              | ''ano, ne'' 
-|     | intended_audience | jakému publiku je projev určen  | skupina, veřejnost | +|     | intended_audience | jakému publiku je projev určen ''skupina, veřejnost'' 
-|     | special                                           | | +|     | special           speciální příznak projevu       ''čtené, pro děti, Y'' (pro projevy bez příznaku) 
-|     | source            | zdroj                           | vlastní sběr, volně dostupná nahrávka | +|     | source            | zdroj                           ''vlastní sběr, volně dostupná nahrávka'' 
-|     | speakers          | počet mluvčích                  | |+|     | speakers          | počet mluvčích v nahrávce       | |
 |     | length            | délka nahrávky v minutách       | | |     | length            | délka nahrávky v minutách       | |
 |     | tokens            | počet všech tokenů v nahrávce   | | |     | tokens            | počet všech tokenů v nahrávce   | |
  
 **Atributy pro korpus [[cnk:orator|ORATOR]]: údaje k mluvčímu** **Atributy pro korpus [[cnk:orator|ORATOR]]: údaje k mluvčímu**
-Strukturní atribut Příklad Vysvětlení ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^ Poznámka +Struktura Atribut Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^ 
-| sp | id            2533                  +| sp | id          identifikátor segmentu                                      unikátní číslo pro každý segment 
-|    | nickname      | |  | +|    | nickname    přezdívka mluvčího                                          náhodně přidělená příjmení | 
-|    | gender        | pohlaví              |  | +|    | speaker_id  | číslo doplňující přezdívku mluvčího                         | stejně jako příjmení bude toto číslo stejné u každé promluvy od stejného mluvčího
-|    | proportion    ano                  |  | +|    | gender      | pohlaví                                                     |  | 
-|    | soundfile     1877                 |  |+|    | proportion  procentuální zastoupení řeči mluvčího v rámci celé nahrávky |  | 
 +|    | soundfile   číslo a formát nahrávky                                     |  |
  
  
Řádek 274: Řádek 275:
  
   * ''doc'' -- dokument nebo ucelený soubor textů (povídková kniha, jeden zdroj dat)   * ''doc'' -- dokument nebo ucelený soubor textů (povídková kniha, jeden zdroj dat)
-  * ''div'' -- text v rámci dokumentů, má-li nějakou vnitřní strukturaci (viz např. výše zmíněný soubor povídek); každý dokument se skládá z minimálně jednoho textu+  * ''text'' -- text v rámci dokumentů (od verze 11) 
 +  * ''div'' -- text v rámci dokumentů, má-li nějakou vnitřní strukturaci (viz např. výše zmíněný soubor povídek); každý dokument se skládá z minimálně jednoho textu; identifikátor oddílu Bible (od verze 11)
   * ''p'' -- odstavec; každý dokument se dále dělí na jednotlivé (taktéž identifikačními čísly opatřené) odstavce   * ''p'' -- odstavec; každý dokument se dále dělí na jednotlivé (taktéž identifikačními čísly opatřené) odstavce
   * ''s'' -- věta (sentence); dále je každý odstavec dělen na věty   * ''s'' -- věta (sentence); dále je každý odstavec dělen na věty
 +  * ''hi'' -- řez písma 
 +  * ''lb'' -- identifikátor verše (Bible)
 Vždy přitom platí, že hranice hierarchicky vyšší jednotky neprochází středem jednotky hierarchicky nižší (např. konec dokumentu se nenachází uprostřed věty).  Vždy přitom platí, že hranice hierarchicky vyšší jednotky neprochází středem jednotky hierarchicky nižší (např. konec dokumentu se nenachází uprostřed věty). 
  
-Atributy jednotlivých struktur se mírně liší v různých verzích (detailní popis [[cnk:intercorp:verze6?&#strukturni_atributy|verze 6]], [[cnk:intercorp:verze7?&#strukturni_atributy|verze 7]], [[cnk:intercorp:verze8?&#strukturni_atributy|verze 8]], [[cnk:intercorp:verze9?&#strukturni_atributy|verze 9]])+Atributy jednotlivých struktur se mírně liší v různých verzích (detailní popis [[cnk:intercorp:verze9?&#strukturni_atributy|verze 9]], [[cnk:intercorp:verze10?&#strukturni_atributy|verze 10]], [[cnk:intercorp:verze11?&#strukturni_atributy|verze 11]], [[cnk:intercorp:verze12?&#strukturni_atributy|verze 12]], [[cnk:intercorp:verze13?&#strukturni_atributy|verze 13]])
  
 ==== Související odkazy ==== ==== Související odkazy ====