Hodnocení:
Někteří knihu hodnotí kladně jako příjemný a praktický úvod do Hadoopu a Sparku, jiní ji kritizují za to, že je povrchní a neposkytuje hluboké znalosti o těchto tématech.
Klady:⬤ Dobře napsané
⬤ příjemné čtení
⬤ poskytuje dobrý úvod do Hadoop/Spark
⬤ pokrývá praktické případy použití v datové vědě
⬤ vhodné pro ty, kteří mají nějaké předchozí zkušenosti.
⬤ Postrádá hloubku a významné pokrytí Hadoop/Spark
⬤ považováno za příliš povrchní a obecné
⬤ zavádějící název
⬤ drahé na poskytovaný obsah
⬤ nevhodné pro začátečníky hledající komplexní znalosti.
(na základě 8 hodnocení čtenářů)
Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale
Kompletní průvodce datovou vědou s Hadoopem - pro technické profesionály, podnikatele a studenty
Poptávka po odbornících, kteří umí řešit skutečné problémy datové vědy s Hadoopem a Sparkem, prudce roste. Practical Data Science with Hadoop(R) and Spark je váš kompletní průvodce, který vám to umožní. Tři přední odborníci, kteří čerpají z obrovských zkušeností s Hadoopem a velkými daty, přinášejí vše, co potřebujete: koncepty na vysoké úrovni, hluboké techniky, reálné případy použití, praktické aplikace a praktické návody.
Autoři představují základy datové vědy a moderní ekosystém Hadoop a vysvětlují, jak se Hadoop a Spark vyvinuly v efektivní platformu pro řešení problémů datové vědy ve velkém měřítku. Kromě komplexního pokrytí aplikací poskytují autoři také užitečné pokyny k důležitým krokům při přijímání dat, jejich mungování a vizualizaci.
Jakmile jsou základy připraveny, autoři se zaměřují na konkrétní aplikace, včetně strojového učení, prediktivního modelování pro analýzu sentimentu, shlukování pro analýzu dokumentů, detekci anomálií a zpracování přirozeného jazyka (NLP).
Tato příručka poskytuje silný technický základ pro ty, kteří chtějí dělat praktickou datovou vědu, a také představuje obchodně orientované pokyny, jak používat Hadoop a Spark k optimalizaci návratnosti investic do iniciativ datové vědy.
Naučte se.
⬤ Co je to datová věda, jak se vyvíjí a jak plánovat kariéru v oblasti datové vědy.
⬤ Jak objem, rozmanitost a rychlost dat formují případy použití datové vědy.
⬤ Hadoop a jeho ekosystém, včetně HDFS, MapReduce, YARN a Spark.
⬤ import dat pomocí Hive a Spark.
⬤ Kvalita dat, předzpracování, příprava a modelování.
⬤ Vizualizace: vynášení poznatků z obrovských datových souborů.
⬤ Strojové učení: klasifikace, regrese, shlukování a detekce anomálií.
⬤ Algoritmy a nástroje Hadoop pro prediktivní modelování.
⬤ Klastrová analýza a funkce podobnosti.
⬤ Detekce anomálií ve velkém měřítku.
⬤ NLP: aplikace datové vědy na lidský jazyk.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)