AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:korpusovy_manazer [2013/09/26 21:11] – [Korpusový manažer] pavelvondrickapojmy:korpusovy_manazer [2015/01/21 21:34] vaclavcvrcek
Řádek 19: Řádek 19:
 ==== Manatee ==== ==== Manatee ====
  
-Manatee je modernější reimplementací korpusového manažeru inspirovanou CWB, využívající jen mírně upravenou verzi dotazovacího jazyka CQP. Jedná se pouze o serverovou část korpusového manažeru. Jejím autorem je Pavel Rychlý. Slouží k vyhodnocování dotazů zadaných pomocí klientské části, jako je např. starší Bonito, nověji komerčně nabízený Sketch Engine nebo jeho otevřená alternativa NoSketch Engine. +Manatee je modernější reimplementací korpusového manažeru inspirovanou CWB, využívající jen mírně upravenou verzi dotazovacího jazyka CQL. Jedná se pouze o serverovou část korpusového manažeru. Jejím autorem je Pavel Rychlý. Slouží k vyhodnocování dotazů zadaných pomocí klientské části, jako je např. starší Bonito, nověji komerčně nabízený Sketch Engine nebo jeho otevřená alternativa NoSketch Engine. 
  
 ===== Klientské aplikace ===== ===== Klientské aplikace =====
Řádek 27: Řádek 27:
 [{{ :pojmy:bonito_popis.gif?direct&300|Rozhraní Bonito s popiskami}}] [{{ :pojmy:bonito_popis.gif?direct&300|Rozhraní Bonito s popiskami}}]
  
-Bonito je uživatelské rozhraní ke korpusovému manažeru Manatee, kterou si uživatel lokálně instaluje. Autorem je Pavel Rychlý. Bonito může běžet na různých operačních systémech bez větších nároků na výkon počítače. Tento korpusový klient byl používán pro vyhledávání v korpusech Českého národního korpusu i pro vyhledávání v korpusech jiných jazyků, v současné době již není dál vyvíjen a je vzhledem ke své technické zastaralosti nahrazován novějšími rozhraními. +Bonito je uživatelské rozhraní ke korpusovému manažeru Manatee, kterou si uživatel lokálně instaluje. Bonito může běžet na různých operačních systémech bez větších nároků na výkon počítače. Jeho autorem je Pavel Rychlý. Tento korpusový klient byl používán pro vyhledávání v korpusech Českého národního korpusu i pro vyhledávání v korpusech jiných jazyků, v současné době již není dál vyvíjen a je vzhledem ke své technické zastaralosti nahrazován novějšími rozhraními.
 ==== Sketch Engine ==== ==== Sketch Engine ====
  
-Sketch Engine je novější verze uživatelského rozhraní k serveru Manatee. Sketch Engine má podobu webové aplikace, která umožňuje kromě běžných funkcí (viz NoSketch Engine) navíc také zobrazovat tzv. //Word Sketches//, tedy kolokační profily hledaného výrazu, a dále srovnávat rozdíly mezi kolokačními profily dvou různých výrazů. Word Sketches jsou jednou z populárních technik vyhledávání [[pojmy:kolokace|kolokací]]. Sketch Engine také umožňuje vytváření vlastních webových korpusů a další práci s nimi [FIXME: opravdu??]. Vlastníkem programu je společnost Lexical Computing Ltd. založená Adamem Kilgarriffem. Sketch Engine vyvíjí od roku 2003 Pavel Rychlý se svým týmem spolu s novou, komerční verzí Manatee podporující Word sketches.+[[https://www.sketchengine.co.uk|Sketch Engine]] je novější verze uživatelského rozhraní k serveru Manatee. Sketch Engine má podobu webové aplikace, která umožňuje kromě běžných funkcí (viz NoSketch Engine) navíc také zobrazovat tzv. //Word Sketches//, tedy kolokační profily hledaného výrazu, a dále srovnávat rozdíly mezi kolokačními profily dvou různých výrazů. Word Sketches jsou jednou z populárních technik vyhledávání [[pojmy:kolokace|kolokací]]. Sketch Engine také integruje nástroje umožňující vytváření vlastních webových korpusů. Vlastníkem aplikace je společnost Lexical Computing Ltd. založená Adamem Kilgarriffem. Sketch Engine vyvíjí od roku 2003 Pavel Rychlý se svým týmem spolu s novou, komerční verzí Manatee podporující Word sketches.
  
-**Word sketches** jsou představovány seznamem kolokací pro jednotlivé gramatické vztahy, který je pro hledaný výraz vytvořen automaticky na základě příslušného korpusu a předem daných pravidel. Tato pravidla jsou předem definována na základě morfologické kategorizace a přípustných slovosledných omezení pro daný jazyk v tzv. //sketch grammar// (např. pro sloveso v češtině jsou v seznamu uvedeny nejčastější kolokáty pro subjekt, objekt atd., založené na vyhledávání substantivních kolokátů v odpovídajícím pádu). //Word sketches// byly poprvé systematicky použity pro Macmillan English Dictionary for Advanced Learners (2002).+[{{ :pojmy:skeconc.png?300|Rozhraní Sketch Engine}}] 
 + 
 +**Word sketches** jsou představovány seznamem kolokací pro jednotlivé gramatické vztahy, který je pro hledaný výraz vytvořen automaticky na základě příslušného korpusu a souboru jazykově závislých pravidel. Tato pravidla jsou předem definována na základě morfologické kategorizace a přípustných slovosledných omezení daného jazyka v tzv. //sketch grammar//, vycházející z dotazovacího jazyka CQL (např. pro sloveso v češtině jsou v seznamu uvedeny nejčastější kolokáty pro subjekt, objekt atd., založené na vyhledávání substantivních kolokátů v odpovídajícím pádu). //Word sketches// byly poprvé systematicky použity pro Macmillan English Dictionary for Advanced Learners (2002).
  
-Doplnit screenshot FIXME 
  
 ==== NoSketch Engine ==== ==== NoSketch Engine ====
  
 NoSketch Engine je omezená, nekomerční a otevřená verze rozhraní SketchEngine, která nepodporuje Word sketches. Vznikla pod vedením P. Rychlého a v současné době je využívána pro korpusy ČNK. Jako otevřený projekt (open-source software) umožňující další modifikace je tato část korpusového manažeru v ÚČNK dále upravována a doplňována (např. zpřístupnění zvukových nahrávek pro mluvené korpusy).  NoSketch Engine je omezená, nekomerční a otevřená verze rozhraní SketchEngine, která nepodporuje Word sketches. Vznikla pod vedením P. Rychlého a v současné době je využívána pro korpusy ČNK. Jako otevřený projekt (open-source software) umožňující další modifikace je tato část korpusového manažeru v ÚČNK dále upravována a doplňována (např. zpřístupnění zvukových nahrávek pro mluvené korpusy). 
- 
-Doplnit screenshot FIXME 
  
 ==== Park ==== ==== Park ====
  
-Doplnit screenshot FIXME+Park je uživatelské rozhraní s nadstavbou nad serverem Manatee, umožňující vyhledávání v paralelních korpusech. Bylo vyvinuto Michalem Štouračem pro projekt InterCorp v době, kdy Manatee nepodporovalo paralelní korpusy přímo. Od integrace této podpory do novějších verzí Manatee se Park dále nevyvíjí, neboť nativní podpora paralelních korpusů v Manatee je nepoměrně efektivnější a rychlejší a vyhledávání v paralelních korpusech bylo současně integrováno i do rozhraní //noSketch Engine//.
  
-==== Rozhraní XX ====+==== Rozhraní KonText ====
  
-Doplnit screenshot FIXME+Rozhraní [[manualy:kontext:index|KonText]] je rozšířenou a graficky upravenou verzí původního rozhraní //NoSketch Engine//, vyvíjenou v ÚČNK Tomášem Machálkem. Doplňuje řadu nových funkcí (např. podporu mluvených korpusů) a usiluje také o větší uživatelskou přívětivost (např. integrací podpory pro snazší vyhledávání pomocí morfologických kategorií).
  
-===== Další specializované nástroje =====+[{{:manualy:kontext:kontext-rozhrani-usporny.png?400|Konkordance v rozhraní KonText}}]
  
-Vedle těchto více méně univerzálních nástrojů existuje a stále vzniká řada nástrojů specializovaných. Pro účely vytěžování korpusů ČNK tak vznikly nástroje [[pojmy:syd|SyD]], Morfio, KWords. 
  
 +===== Další specializované nástroje =====
 +
 +Vedle těchto více méně univerzálních nástrojů existuje a stále vzniká řada nástrojů specializovaných. Pro účely vytěžování korpusů ČNK tak vznikly nástroje [[manualy:syd|SyD]], [[manualy:morfio|Morfio]], [[manualy:kwords|KWords]]. [[pojmy:nastroje|Na této stránce naleznete]] přehled dalších specializovaných nástrojů.
 ==== Související odkazy ==== ==== Související odkazy ====
  
-<WRAP round box 49%> +<WRAP round box 55%> 
-[[http://nlp.fi.muni.cz/projekty/bonito/bonito.html.cz|Bonito]] • [[http://cwb.sourceforge.net|CWB]] • [[http://www.sketchengine.co.uk|Lexical Computing]] • [[http://nlp.fi.muni.cz/trac/noske|NoSketch Engine]] • [[http://www.textforge.cz|TextForge - systém Manatee/Bonito]]+[[http://nlp.fi.muni.cz/projekty/bonito/bonito.html.cz|Bonito]] • [[http://cwb.sourceforge.net|CWB]] • [[http://www.sketchengine.co.uk|Lexical Computing]] • [[http://nlp.fi.muni.cz/trac/noske|NoSketch Engine]] • [[http://www.textforge.cz|TextForge (Manatee/Bonito)]]
 </WRAP> </WRAP>
 +