Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
pojmy:segmentace [2013/09/13 15:33] – Schvaleno pro 1. verzi vaclavcvrcek | pojmy:segmentace [2014/11/24 12:55] (aktuální) – vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Segmentace ====== | ====== Segmentace ====== | ||
- | Z pohledu korpusové lingvistiky je segmentace členění textu či obvykle jeho větších částí (popř. celého korpusu) | + | Z pohledu korpusové lingvistiky je segmentace členění textu na menší úseky určitého typu či stejné povahy pro účely bližší analýzy. Provádí se zpravidla automatickými metodami. Nejběžnější je segmentace větná; obecně se však segmentace textů provádí i na morfémy či grafémy. Segmentace na slova se obvykle nazývá [[pojmy: |
===== Segmentace větná ===== | ===== Segmentace větná ===== | ||
- | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný // | + | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný // |
- | Větná segmentace je obecně netriviální, | + | Větná segmentace je obecně netriviální, |
//Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | ||
- | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečka za // | + | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečky za //př.// a //Kr.// jsou totiž víceznačné, zvláště když následující slovo začíná velkým písmenem |
- | ''< | + | ''< |
''< | ''< | ||
Řádek 19: | Řádek 19: | ||
==== Související odkazy ==== | ==== Související odkazy ==== | ||
- | <WRAP round box 49%> | + | <WRAP round box 50%> |
[[pojmy: | [[pojmy: | ||
</ | </ |