AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:atributy_strukturni [2019/12/17 13:45] zuzanakomrskovapojmy:atributy_strukturni [2020/12/10 10:18] – [Strukturní atributy korpusu InterCorp] adrianzasina
Řádek 250: Řádek 250:
 |     | situation         | typ situace | ''ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení'' | |     | situation         | typ situace | ''ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení'' |
 |     | framing           | zaměření projevu                | ''oficiální, popularizační, politické, profesní, vědecké'' | |     | framing           | zaměření projevu                | ''oficiální, popularizační, politické, profesní, vědecké'' |
-|     | genre             | žánr projevu                    | hodnoty shodné s [[cnk:klasifikace_textu_syn2015?s[]=genre|genderem]] u psaných korpusů |+|     | genre             | žánr projevu                    | hodnoty shodné s atributem [[cnk:klasifikace_textu_syn2015?s[]=genre|genre]] u psaných korpusů |
 |     | audience_present  | přítomnost publika              | ''ano, ne'' | |     | audience_present  | přítomnost publika              | ''ano, ne'' |
 |     | intended_audience | jakému publiku je projev určen  | ''skupina, veřejnost'' | |     | intended_audience | jakému publiku je projev určen  | ''skupina, veřejnost'' |
Řádek 261: Řádek 261:
 **Atributy pro korpus [[cnk:orator|ORATOR]]: údaje k mluvčímu** **Atributy pro korpus [[cnk:orator|ORATOR]]: údaje k mluvčímu**
 ^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^ ^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^
-| sp | id          | identifikátor segmentu                                      |  |+| sp | id          | identifikátor segmentu                                      | unikátní číslo pro každý segment |
 |    | nickname    | přezdívka mluvčího                                          | náhodně přidělená příjmení | |    | nickname    | přezdívka mluvčího                                          | náhodně přidělená příjmení |
 +|    | speaker_id  | číslo doplňující přezdívku mluvčího                         | stejně jako příjmení bude toto číslo stejné u každé promluvy od stejného mluvčího|
 |    | gender      | pohlaví                                                      | |    | gender      | pohlaví                                                      |
 |    | proportion  | procentuální zastoupení řeči mluvčího v rámci celé nahrávky |  | |    | proportion  | procentuální zastoupení řeči mluvčího v rámci celé nahrávky |  |
Řádek 274: Řádek 275:
  
   * ''doc'' -- dokument nebo ucelený soubor textů (povídková kniha, jeden zdroj dat)   * ''doc'' -- dokument nebo ucelený soubor textů (povídková kniha, jeden zdroj dat)
-  * ''div'' -- text v rámci dokumentů, má-li nějakou vnitřní strukturaci (viz např. výše zmíněný soubor povídek); každý dokument se skládá z minimálně jednoho textu+  * ''text'' -- text v rámci dokumentů (od verze 11) 
 +  * ''div'' -- text v rámci dokumentů, má-li nějakou vnitřní strukturaci (viz např. výše zmíněný soubor povídek); každý dokument se skládá z minimálně jednoho textu; identifikátor oddílu Bible (od verze 11)
   * ''p'' -- odstavec; každý dokument se dále dělí na jednotlivé (taktéž identifikačními čísly opatřené) odstavce   * ''p'' -- odstavec; každý dokument se dále dělí na jednotlivé (taktéž identifikačními čísly opatřené) odstavce
   * ''s'' -- věta (sentence); dále je každý odstavec dělen na věty   * ''s'' -- věta (sentence); dále je každý odstavec dělen na věty
 +  * ''hi'' -- řez písma 
 +  * ''lb'' -- identifikátor verše (Bible)
 Vždy přitom platí, že hranice hierarchicky vyšší jednotky neprochází středem jednotky hierarchicky nižší (např. konec dokumentu se nenachází uprostřed věty).  Vždy přitom platí, že hranice hierarchicky vyšší jednotky neprochází středem jednotky hierarchicky nižší (např. konec dokumentu se nenachází uprostřed věty). 
  
-Atributy jednotlivých struktur se mírně liší v různých verzích (detailní popis [[cnk:intercorp:verze6?&#strukturni_atributy|verze 6]], [[cnk:intercorp:verze7?&#strukturni_atributy|verze 7]], [[cnk:intercorp:verze8?&#strukturni_atributy|verze 8]], [[cnk:intercorp:verze9?&#strukturni_atributy|verze 9]])+Atributy jednotlivých struktur se mírně liší v různých verzích (detailní popis [[cnk:intercorp:verze9?&#strukturni_atributy|verze 9]], [[cnk:intercorp:verze10?&#strukturni_atributy|verze 10]], [[cnk:intercorp:verze11?&#strukturni_atributy|verze 11]], [[cnk:intercorp:verze12?&#strukturni_atributy|verze 12]], [[cnk:intercorp:verze13?&#strukturni_atributy|verze 13]])
  
 ==== Související odkazy ==== ==== Související odkazy ====