Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
| pojmy:segmentace [2013/09/13 15:33] – Schvaleno pro 1. verzi vaclavcvrcek | pojmy:segmentace [2014/11/24 12:55] (aktuální) – vaclavcvrcek | ||
|---|---|---|---|
| Řádek 1: | Řádek 1: | ||
| ====== Segmentace ====== | ====== Segmentace ====== | ||
| - | Z pohledu korpusové lingvistiky je segmentace členění textu či obvykle jeho větších částí (popř. celého korpusu) | + | Z pohledu korpusové lingvistiky je segmentace členění textu na menší úseky určitého typu či stejné povahy pro účely bližší analýzy. Provádí se zpravidla automatickými metodami. Nejběžnější je segmentace větná; obecně se však segmentace textů provádí i na morfémy či grafémy. Segmentace na slova se obvykle nazývá [[pojmy: |
| ===== Segmentace větná ===== | ===== Segmentace větná ===== | ||
| - | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný // | + | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný // |
| - | Větná segmentace je obecně netriviální, | + | Větná segmentace je obecně netriviální, |
| //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | ||
| - | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečka za // | + | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečky za //př.// a //Kr.// jsou totiž víceznačné, zvláště když následující slovo začíná velkým písmenem |
| - | ''< | + | ''< |
| ''< | ''< | ||
| Řádek 19: | Řádek 19: | ||
| ==== Související odkazy ==== | ==== Související odkazy ==== | ||
| - | <WRAP round box 49%> | + | <WRAP round box 50%> |
| [[pojmy: | [[pojmy: | ||
| </ | </ | ||