Hodnocení:
Kniha poskytuje solidní úvod do Apache Spark, zejména pro ty, kteří již mají zkušenosti s vývojem softwaru. Je dobře strukturovaná, pokrývá základní až pokročilá témata, především v jazyce Python a zabývá se příslušnými funkcemi Sparku. Někteří uživatelé však zaznamenali zastaralé informace, zejména týkající se instalací, a nedostatek pokročilých případů použití nebo hloubkového pokrytí některých oblastí.
Klady:⬤ Poskytuje dobře strukturovaný a metodický přístup pro rychlé učení.
⬤ Vhodné pro začátečníky a nadšence do Pythonu.
⬤ Pokrývá širokou škálu funkcí Sparku, včetně Spark-SQL a MLlib.
⬤ Přístupná a snadno stravitelná, takže je vhodná pro rychlý náběh na Spark.
⬤ Obsahuje odkazy na výzkumné práce pro hlubší pochopení.
⬤ Některé informace jsou zastaralé, zejména pokud jde o instalace a binární soubory Hadoop.
⬤ Chybí pokročilé případy použití a tipy pro ladění výkonu.
⬤ Zaměřuje se především na Python, menší důraz klade na Scalu nebo pokročilá témata.
⬤ Zaznamenáno několik pravopisných chyb, což naznačuje potřebu lepší korektury.
⬤ Některé kapitoly, například Spark Streaming, nejsou dostatečně hluboké.
(na základě 23 hodnocení čtenářů)
Apache Spark in 24 Hours, Sams Teach Yourself
Apache Spark je rychlý, škálovatelný a flexibilní open source engine pro distribuované zpracování velkých dat a je jedním z nejaktivnějších open source projektů pro zpracování velkých dat. Kniha Sams Teach Yourself Apache Spark in 24 Hours vám v pouhých 24 lekcích trvajících maximálně jednu hodinu pomůže vytvořit praktická řešení pro zpracování velkých objemů dat, která využívají úžasnou rychlost, škálovatelnost, jednoduchost a všestrannost technologie Spark.
Přímočarý přístup této knihy vám krok za krokem ukáže, jak Spark nasadit, naprogramovat, optimalizovat, spravovat, integrovat a rozšiřovat - nyní i v následujících letech. Zjistíte, jak vytvářet výkonná řešení zahrnující cloud computing, zpracování datových toků v reálném čase, strojové učení a další. Každá lekce navazuje na to, co jste se již naučili, a poskytuje vám pevný základ pro úspěch v reálném světě.
Ať už jste datový analytik, datový inženýr, datový vědec nebo správce dat, studium Sparku vám pomůže postoupit v kariéře nebo zahájit novou kariéru v rychle se rozvíjející oblasti Big Data.
Naučte se, jak.
- Zjistit, co Apache Spark umí a jak zapadá do prostředí Big Data.
- Nasadit a provozovat Spark lokálně nebo v cloudu.
- Pracovat se Sparkem z prostředí shellu.
- Využívat co nejlépe architekturu Spark Cluster.
- Vývoj aplikací Spark v jazyce Scala a funkčním Pythonu.
- Programování s rozhraním Spark API, včetně transformací a akcí.
- Používat praktické přístupy datového inženýrství/analýzy určené pro Spark.
- Používat odolné distribuované datové soubory (RDD) pro ukládání do mezipaměti, perzistenci a výstup.
- Optimalizovat výkon řešení Spark.
- Používat Spark s SQL (prostřednictvím Spark SQL) a s NoSQL (prostřednictvím Cassandry).
- Využívejte nejmodernější techniky funkcionálního programování.
- Rozšiřte Spark o streaming, R a Sparkling Water.
- Začněte vytvářet aplikace pro strojové učení a zpracování grafů založené na technologii Spark.
- Prozkoumejte pokročilé technologie zasílání zpráv, včetně Kafky.
- Prohlédněte si a připravte se na další generaci inovací Sparku.
Návody vás provedou běžnými otázkami, problémy a úkoly.
Otázky a odpovědi, kvízy a cvičení prohlubují a testují vaše znalosti.
Tipy Víte, že? nabízejí zasvěcené rady a zkratky.
A upozornění Pozor, pomůže vám vyhnout se nástrahám. Až knihu dokončíte, budete umět pohodlně používat Apache Spark k řešení širokého spektra problémů s velkými objemy dat.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)