Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize | ||
pojmy:segmentace [2013/08/22 15:42] – alzbetavitkova | pojmy:segmentace [2013/09/26 22:30] – [Segmentace větná] pavelvondricka | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Segmentace ====== | ====== Segmentace ====== | ||
- | Z pohledu korpusové lingvistiky je segmentace členění textu či obvykle jeho větších částí (popř. celého korpusu) | + | Z pohledu korpusové lingvistiky je segmentace členění textu na menší úseky určitého typu či stejné povahy pro účely bližší analýzy. Provádí se zpravidla automatickými metodami. Nejběžnější je segmentace větná; obecně se však segmentace textů provádí i na morfémy či grafémy. Segmentace na slova se obvykle nazývá [[pojmy: |
===== Segmentace větná ===== | ===== Segmentace větná ===== | ||
- | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný // | + | Automatický proces, při němž se text dělí na věty. Větnou segmentaci provádí počítačový program zvaný // |
- | Větná segmentace je obecně netriviální, | + | Větná segmentace je obecně netriviální, |
//Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | //Caesar byl zavražděn r. 43 př. Kr. Řím byl tehdy na pokraji převratu.// | ||
- | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečka za // | + | obsahující dvě věty (nikoli jednu!) by se při netriviální segmentaci (tečky za //př.// a //Kr.// jsou totiž víceznačné, zvláště když následující slovo začíná velkým písmenem |
- | ''< | + | ''< |
''< | ''< | ||
==== Související odkazy ==== | ==== Související odkazy ==== | ||
+ | |||
<WRAP round box 49%> | <WRAP round box 49%> | ||
[[pojmy: | [[pojmy: | ||
</ | </ |