Obě strany předchozí revizePředchozí verze | |
manualy:kontext:frekvence [2023/04/02 21:44] – upraveno mimo DokuWiki 127.0.0.1 | manualy:kontext:frekvence [2023/04/05 17:27] (aktuální) – stará verze byla obnovena (2023/04/02 20:35) michalkren |
---|
Při vlastním nastavení frekvenční distribuce se nemusíme omezovat pouze na KWIC (jako je tomu v případě rychlých voleb). Může být počítána z kterékoli kontextové pozice v pravém nebo levém okolí od hledaného slova. Položka **Pozice** ve formuláři umožňuje vybrat jak pozice v levém (předcházejícím) kontextu (6L--1L), samotný KWIC, tak pozice v pravém (následujícím) kontextu (1R--6R). Číslování pozic (podle současné i starší notace) shrnuje následující tabulka: | Při vlastním nastavení frekvenční distribuce se nemusíme omezovat pouze na KWIC (jako je tomu v případě rychlých voleb). Může být počítána z kterékoli kontextové pozice v pravém nebo levém okolí od hledaného slova. Položka **Pozice** ve formuláři umožňuje vybrat jak pozice v levém (předcházejícím) kontextu (6L--1L), samotný KWIC, tak pozice v pravém (následujícím) kontextu (1R--6R). Číslování pozic (podle současné i starší notace) shrnuje následující tabulka: |
| |
^ konkordance | místnosti | . | Byly | z | těžkého | tmavého | **dřeva** | a | zlověstně | zaskřípaly | . | Poslepu | jsem | | ^ konkordance | místnosti | . | Byly | z | těžkého | tmavého | **<fc #FF0000>dřeva</fc>** | a | zlověstně | zaskřípaly | . | Poslepu | jsem | |
^ pozice | 6L | 5L | 4L | 3L | 2L | 1L | KWIC | 1R | 2R | 3R | 4R | 5R | 6R | | ^ pozice | 6L | 5L | 4L | 3L | 2L | 1L | <fc #FF0000>KWIC</fc> | 1R | 2R | 3R | 4R | 5R | 6R | |
^ pozice (starší notace) | -6 | -5 | -4 | -3 | -2 | -1 | KWIC | 1 | 2 | 3 | 4 | 5 | 6 | | ^ pozice (starší notace) | -6 | -5 | -4 | -3 | -2 | -1 | <fc #FF0000>KWIC</fc> | 1 | 2 | 3 | 4 | 5 | 6 | |
| |
S určováním pozice toho, co má být předmětem výpočtu frekvenční distribuce, může nastat problém v případě, že hledaný KWIC je víceslovný (např. při hledání fráze //dřevo a uhlí//). Pak je třeba specifikovat, kterou hranici KWICu považujeme za výchozí pro výpočet (zda pravou, nebo levou), což umožňuje položka **(Node) začít od**. Tabulka shrnuje, jak se změní označení kontextových pozic podle toho, který z konců víceslovného KWICu určíme za rozhodující. | S určováním pozice toho, co má být předmětem výpočtu frekvenční distribuce, může nastat problém v případě, že hledaný KWIC je víceslovný (např. při hledání fráze //dřevo a uhlí//). Pak je třeba specifikovat, kterou hranici KWICu považujeme za výchozí pro výpočet (zda pravou, nebo levou), což umožňuje položka **(Node) začít od**. Tabulka shrnuje, jak se změní označení kontextových pozic podle toho, který z konců víceslovného KWICu určíme za rozhodující. |
| |
^ konkordance | znečišťování | ovzduší | . | Moderní | kotle | na | **dřevo** | **a** | **uhlí** | splňují | dnes | všechny | požadavky | z | hlediska | | ^ konkordance | znečišťování | ovzduší | . | Moderní | kotle | na | **<fc #FF0000>dřevo</fc>** | **<fc #FF0000>a</fc>** | **<fc #FF0000>uhlí</fc>** | splňují | dnes | všechny | požadavky | z | hlediska | |
^ pozice (počítáno zleva) | 6L | 5L | 4L | 3L | 2L | 1L | **KWIC** | **1R** | **2R** | 3R | 4R | 5R | 6R | 7R | 8R | | ^ pozice (počítáno zleva) | 6L | 5L | 4L | 3L | 2L | 1L | <fc #FF0000>KWIC</fc> | <fc #FF0000>1R</fc> | <fc #FF0000>2R</fc> | 3R | 4R | 5R | 6R | 7R | 8R | |
^ pozice (počítáno zprava) | 8L | 7L | 6L | 5L | 4L | 3L | **2L** | **1L** | **KWIC** | 1R | 2R | 3R | 4R | 5R | 6R | | ^ pozice (počítáno zprava) | 8L | 7L | 6L | 5L | 4L | 3L | <fc #FF0000>2L</fc> | <fc #FF0000>1L</fc> | <fc #FF0000>KWIC</fc> | 1R | 2R | 3R | 4R | 5R | 6R | |
| |
Pokud chceme vytvořit frekvenční distribuci nikoli pouze jednotek, ale například dvojic slov ([[pojmy:bigram|bigramů]]) nebo rozsáhlejších celků, musíme přidat další úroveň frekvenční distribuce. Ve formuláři přibude další řádek se shodnými možnostmi nastavení. Jednodušší variantu představuje rychlá volba frekvenční distribuce nazvaná **Slovní tvary** - pokud ji aplikujeme na víceslovný KWIC (např. po vyhledání dvou po sobě jdoucích adverbií typu //pomalu a opatrně// [''tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>][word=<nowiki>"</nowiki>a<nowiki>"</nowiki>][tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>]''), ukáže nám vyhledané víceslovné výrazy seřazené podle frekvence bez složitého nastavování. | Pokud chceme vytvořit frekvenční distribuci nikoli pouze jednotek, ale například dvojic slov ([[pojmy:bigram|bigramů]]) nebo rozsáhlejších celků, musíme přidat další úroveň frekvenční distribuce. Ve formuláři přibude další řádek se shodnými možnostmi nastavení. Jednodušší variantu představuje rychlá volba frekvenční distribuce nazvaná **Slovní tvary** - pokud ji aplikujeme na víceslovný KWIC (např. po vyhledání dvou po sobě jdoucích adverbií typu //pomalu a opatrně// [''tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>][word=<nowiki>"</nowiki>a<nowiki>"</nowiki>][tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>]''), ukáže nám vyhledané víceslovné výrazy seřazené podle frekvence bez složitého nastavování. |