Hodnocení:
Kniha se setkala se smíšenými ohlasy, někteří čtenáři ji považují za velmi cennou pro pochopení a implementaci textové analýzy v datových skladech, zatímco jiní ji kritizují za zastaralost a nedostatečnou hloubku.
Klady:⬤ Poskytuje jasné vysvětlení konceptů textové analýzy, což usnadňuje komunikaci s vedením.
⬤ Nabízí nové poznatky o strategiích ukládání a indexování, které jsou přínosné pro týmy datových skladů.
⬤ Obsahuje cenné myšlenky, které mohou zlepšit postupy zpracování a správy dat.
⬤ Někteří čtenáři ji považovali za předraženou a postrádající dostatek užitečných informací.
⬤ Kritika opakujícího se obsahu a spoléhání se na zastaralé koncepty tradičního datového skladu.
⬤ Jiní upozorňovali na autorovu neschopnost účinně se zabývat nestrukturovanými daty a označovali knihu za plnou žargonu a žvanění.
(na základě 6 hodnocení čtenářů)
Building the Unstructured Data Warehouse: Architecture, Analysis, and Design
Naučte se základní techniky od legendy datových skladů Billa Inmona, jak vytvořit prostředí pro reporting, které vaše firma potřebuje nyní
V textu se skrývají odpovědi na mnoho cenných obchodních otázek. Jak dobře dokáže vaše stávající prostředí pro reporting extrahovat potřebný text z e-mailů, tabulek a dokumentů a dát jej do formátu užitečného pro analýzu a reporting? Transformace tradičního datového skladu na efektivní nestrukturovaný datový sklad vyžaduje další dovednosti analytika, architekta, návrháře a vývojáře. Tato kniha vás připraví na úspěšnou implementaci nestrukturovaného datového skladu a prostřednictvím srozumitelných vysvětlení, příkladů a případových studií se naučíte nové techniky a tipy pro úspěšné získávání a analýzu textu.
Zvládněte těchto deset cílů:
⬤ Vybudovat nestrukturovaný datový sklad pomocí přístupu o 11 krocích.
⬤ Integrovat text a popsat jej z hlediska homogenity, relevance, prostředku, objemu a struktury.
⬤ Překonat výzvy včetně blábolů, babylonské věže a nedostatku přirozených vztahů.
⬤ Vyhněte se datovému smetišti a bojujte s "pavučinou".
⬤ Znovupoužití technik zdokonalených v tradičním datovém skladu a Datovém skladu 2. 0, včetně iterativního vývoje.
⬤ Používejte základní techniky pro extrakci, transformaci a načítání textů (ETL), jako je rozpoznávání frází, filtrování zastavených slov a nahrazování synonym.
⬤ Navrhněte systém evidence dokumentů a propojte nestrukturovaný text se strukturovanými daty.
⬤ Využívat indexy pro efektivní analýzu textu a taxonomie pro užitečnou externí kategorizaci.
⬤ Spravovat velké objemy dat pomocí pokročilých technik, jako jsou zpětné ukazatele.
⬤ Vyhodnoťte výběr technologií vhodných pro zpracování nestrukturovaných dat, například zařízení datového skladu.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)