Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Následující verze | Předchozí verze | ||
pojmy:segmentace [2013/06/20 14:17] – vytvořeno vaclavcvrcek | pojmy:segmentace [2014/11/24 12:55] (aktuální) – vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Segmentace ====== | ====== Segmentace ====== | ||
- | Z pohledu korpusové lingvistiky je segmentace členění textu či obvykle jeho větších částí (popř. celého korpusu) | + | Z pohledu korpusové lingvistiky je segmentace členění textu na menší úseky určitého typu či stejné povahy pro účely bližší analýzy. Provádí se zpravidla automatickými metodami. Nejběžnější je segmentace větná; obecně se však segmentace textů provádí i na morfémy či grafémy. Segmentace na slova se obvykle nazývá [[pojmy: |
===== Segmentace větná ===== | ===== Segmentace větná ===== | ||
- | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný segmenter/ | + | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný |
- | Větná segmentace je obecně netriviální, | + | Větná segmentace je obecně netriviální, |
//Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | ||
- | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečka za // | + | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečky za //př.// a //Kr.// jsou totiž víceznačné, zvláště když následující slovo začíná velkým písmenem |
- | ''< | + | ''< |
- | < | + | '' |
==== Související odkazy ==== | ==== Související odkazy ==== | ||
- | [[pojmy: | + | <WRAP round box 50%> |
- | + | [[pojmy: | |
- | [[pojmy: | + | </ |
- | + | ||
- | [[pojmy: | + |