SHALLOW DISCOURSE PARSING FOR GERMAN
V posledních několika desetiletích došlo k působivému zlepšení v několika oblastech zpracování přirozeného jazyka. Přesto je stále náročné přimět počítač, aby porozuměl diskurzu výroků v textu.
Existuje několik různých teorií, jejichž cílem je popsat a analyzovat koherentní strukturu dobře napsaného textu, avšak s různou mírou použitelnosti a proveditelnosti pro praktické využití. Tato kniha se zabývá mělkým rozborem diskurzu podle paradigmatu Penn Discourse TreeBank, korpusu obsahujícího více než 1 milion slov anotovaných pro vztahy diskurzu. Pokud jde o zpracování diskurzu, je třeba jakýkoli jiný jazyk než angličtinu považovat za jazyk s nízkým zdrojem.
Tato kniha se zabývá zpracováním diskurzu v němčině. Omezená dostupnost anotovaných dat pro němčinu znamená, že potenciál moderních metod založených na hluboké analýze, které se o taková data opírají, je také omezený.
Tato kniha zkoumá, do jaké míry lze strojové učení a novější metody založené na hloubkovém učení kombinovat s tradičním lingvistickým inženýrstvím příznaků, aby se zlepšil výkon pro úlohu rozboru diskurzu. Pro účely této knihy byl vyvinut povrchový parser diskurzu pro němčinu s otevřeným zdrojovým kódem, který je k dispozici online. Práce byla provedena také na několika spojovacích lexikonech v různých jazycích.
Jsou diskutovány strategie pro vytvoření nebo další rozvoj takových lexikonů pro daný jazyk a návrhy, jak dále zvýšit jejich užitečnost pro povrchový rozbor diskurzu. Kniha bude zajímavá pro všechny, kteří se zabývají zpracováním přirozeného jazyka, zejména v jiných jazycích než v angličtině.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)