Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Následující verze | Předchozí verze | ||
| pojmy:segmentace [2013/06/20 14:17] – vytvořeno vaclavcvrcek | pojmy:segmentace [2014/11/24 12:55] (aktuální) – vaclavcvrcek | ||
|---|---|---|---|
| Řádek 1: | Řádek 1: | ||
| ====== Segmentace ====== | ====== Segmentace ====== | ||
| - | Z pohledu korpusové lingvistiky je segmentace členění textu či obvykle jeho větších částí (popř. celého korpusu) | + | Z pohledu korpusové lingvistiky je segmentace členění textu na menší úseky určitého typu či stejné povahy pro účely bližší analýzy. Provádí se zpravidla automatickými metodami. Nejběžnější je segmentace větná; obecně se však segmentace textů provádí i na morfémy či grafémy. Segmentace na slova se obvykle nazývá [[pojmy: |
| ===== Segmentace větná ===== | ===== Segmentace větná ===== | ||
| - | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný segmenter/ | + | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný |
| - | Větná segmentace je obecně netriviální, | + | Větná segmentace je obecně netriviální, |
| //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | ||
| - | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečka za // | + | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečky za //př.// a //Kr.// jsou totiž víceznačné, zvláště když následující slovo začíná velkým písmenem |
| - | ''< | + | ''< |
| - | < | + | '' |
| ==== Související odkazy ==== | ==== Související odkazy ==== | ||
| - | [[pojmy: | + | <WRAP round box 50%> |
| - | + | [[pojmy: | |
| - | [[pojmy: | + | </ |
| - | + | ||
| - | [[pojmy: | + | |