Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:atributy_strukturni [2019/12/17 13:28] – zuzanakomrskova | pojmy:atributy_strukturni [2020/12/10 10:18] – [Strukturní atributy korpusu InterCorp] adrianzasina |
---|
| | year | rok pořízení nahrávky | | | | | year | rok pořízení nahrávky | | |
| | location | místo nahrávky | obce ČR | | | | location | místo nahrávky | obce ČR | |
| | situation | typ situace | ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení | | | | situation | typ situace | ''ceremoniál, instruktáž, jednání, kázání, prohlídka, přednáška, slavnostní projev, školení, uvedení uměleckého díla, veřejné shromáždění, zahájení, zakončení'' | |
| | framing | zaměření projevu | oficiální, popularizační, politické, profesní, vědecké | | | | framing | zaměření projevu | ''oficiální, popularizační, politické, profesní, vědecké'' | |
| | genre | žánr projevu | hodnoty shodné s genderem u psaných korpusů | | | | genre | žánr projevu | hodnoty shodné s atributem [[cnk:klasifikace_textu_syn2015?s[]=genre|genre]] u psaných korpusů | |
| | audience_present | přítomnost publika | ano, ne | | | | audience_present | přítomnost publika | ''ano, ne'' | |
| | intended_audience | jakému publiku je projev určen | skupina, veřejnost | | | | intended_audience | jakému publiku je projev určen | ''skupina, veřejnost'' | |
| | special | | | | | | special | speciální příznak projevu | ''čtené, pro děti, Y'' (pro projevy bez příznaku) | |
| | source | zdroj | vlastní sběr, volně dostupná nahrávka | | | | source | zdroj | ''vlastní sběr, volně dostupná nahrávka'' | |
| | speakers | počet mluvčích | | | | | speakers | počet mluvčích v nahrávce | | |
| | length | délka nahrávky v minutách | | | | | length | délka nahrávky v minutách | | |
| | tokens | počet všech tokenů v nahrávce | | | | | tokens | počet všech tokenů v nahrávce | | |
| |
**Atributy pro korpus [[cnk:orator|ORATOR]]: údaje k mluvčímu** | **Atributy pro korpus [[cnk:orator|ORATOR]]: údaje k mluvčímu** |
^ Strukturní atribut ^ Příklad ^ Vysvětlení ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^ Poznámka ^ | ^ Struktura ^ Atribut ^ Popis ^ Možné hodnoty (položky jsou řazeny podle abecedy) ^ |
| sp | id | 2533 | | | | sp | id | identifikátor segmentu | unikátní číslo pro každý segment | |
| | nickname | | | | | | nickname | přezdívka mluvčího | náhodně přidělená příjmení | |
| | gender | pohlaví | | | | | speaker_id | číslo doplňující přezdívku mluvčího | stejně jako příjmení bude toto číslo stejné u každé promluvy od stejného mluvčího| |
| | proportion | ano | | | | | gender | pohlaví | | |
| | soundfile | 1877 | | | | | proportion | procentuální zastoupení řeči mluvčího v rámci celé nahrávky | | |
| | | soundfile | číslo a formát nahrávky | | |
| |
| |
| |
* ''doc'' -- dokument nebo ucelený soubor textů (povídková kniha, jeden zdroj dat) | * ''doc'' -- dokument nebo ucelený soubor textů (povídková kniha, jeden zdroj dat) |
* ''div'' -- text v rámci dokumentů, má-li nějakou vnitřní strukturaci (viz např. výše zmíněný soubor povídek); každý dokument se skládá z minimálně jednoho textu | * ''text'' -- text v rámci dokumentů (od verze 11) |
| * ''div'' -- text v rámci dokumentů, má-li nějakou vnitřní strukturaci (viz např. výše zmíněný soubor povídek); každý dokument se skládá z minimálně jednoho textu; identifikátor oddílu Bible (od verze 11) |
* ''p'' -- odstavec; každý dokument se dále dělí na jednotlivé (taktéž identifikačními čísly opatřené) odstavce | * ''p'' -- odstavec; každý dokument se dále dělí na jednotlivé (taktéž identifikačními čísly opatřené) odstavce |
* ''s'' -- věta (sentence); dále je každý odstavec dělen na věty | * ''s'' -- věta (sentence); dále je každý odstavec dělen na věty |
| * ''hi'' -- řez písma |
| * ''lb'' -- identifikátor verše (Bible) |
Vždy přitom platí, že hranice hierarchicky vyšší jednotky neprochází středem jednotky hierarchicky nižší (např. konec dokumentu se nenachází uprostřed věty). | Vždy přitom platí, že hranice hierarchicky vyšší jednotky neprochází středem jednotky hierarchicky nižší (např. konec dokumentu se nenachází uprostřed věty). |
| |
Atributy jednotlivých struktur se mírně liší v různých verzích (detailní popis [[cnk:intercorp:verze6?&#strukturni_atributy|verze 6]], [[cnk:intercorp:verze7?&#strukturni_atributy|verze 7]], [[cnk:intercorp:verze8?&#strukturni_atributy|verze 8]], [[cnk:intercorp:verze9?&#strukturni_atributy|verze 9]]) | Atributy jednotlivých struktur se mírně liší v různých verzích (detailní popis [[cnk:intercorp:verze9?&#strukturni_atributy|verze 9]], [[cnk:intercorp:verze10?&#strukturni_atributy|verze 10]], [[cnk:intercorp:verze11?&#strukturni_atributy|verze 11]], [[cnk:intercorp:verze12?&#strukturni_atributy|verze 12]], [[cnk:intercorp:verze13?&#strukturni_atributy|verze 13]]) |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |