Hodnocení:
Kniha „High Performance Spark“ nabízí podrobný výklad o psaní efektivního kódu Sparku, který je vhodný pro profesionály s předchozími znalostmi jazyka Scala a Spark. Zaměřuje se na optimalizaci výkonu a poskytuje důkladné příklady kódu, především v jazyce Scala. Zatímco někteří uživatelé ji považovali za dobře strukturovaný a informativní zdroj, jiní kritizovali její přístupnost pro začátečníky a velkou závislost na jazyce Scala.
Klady:⬤ Komplexní průvodce psaním vysoce výkonného kódu Sparku.
⬤ Podrobné vysvětlení pokročilých konceptů a optimalizačních technik.
⬤ Dobře strukturovaný výklad s vyváženým poměrem teorie a praktických aplikací.
⬤ Bohatý na příklady kódu, které zlepšují porozumění, zejména pro ty, kteří znají jazyk Scala.
⬤ Přehledná prezentace, jednoduchost a užitečné diagramy.
⬤ Nevhodné pro začátečníky; vyžaduje předchozí znalosti Sparku a jazyka Scala.
⬤ Velké zaměření na jazyk Scala může odradit uživatele, kteří tento jazyk neznají.
⬤ Někteří uživatelé měli pocit, že je příliš hutná a náročná bez praktického prostředí Sparku.
⬤ Omezené pokrytí některých témat, například streamování Sparku.
⬤ Někteří ji považovali za nudnou kvůli nadměrnému množství příkladů kódování.
(na základě 27 hodnocení čtenářů)
High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Apache Spark je úžasný, když všechno klapne. Pokud jste však nezaznamenali očekávané zlepšení výkonu nebo se stále necítíte dostatečně jistí, abyste mohli Spark používat v produkčním provozu, je tato praktická kniha určena právě vám. Autoři Holden Karau a Rachel Warrenová vám předvedou výkonnostní optimalizace, které pomohou vašim dotazům ve Sparku běžet rychleji, zvládnout větší objemy dat a přitom využívat méně zdrojů.
Tato kniha je ideální pro softwarové inženýry, datové inženýry, vývojáře a správce systémů pracující s rozsáhlými datovými aplikacemi a popisuje techniky, které mohou snížit náklady na datovou infrastrukturu a snížit počet hodin strávených vývojáři. Nejenže získáte ucelenější představu o technologii Spark, ale také se naučíte, jak ji rozezpívat.
S touto knihou prozkoumáte:
⬤ Jak nová rozhraní Spark SQL zlepšují výkon oproti datové struktuře RDD jazyka SQL.
⬤ Výběr mezi spojováním dat v jádře Spark a Spark SQL.
⬤ Techniky pro maximální využití standardních transformací RDD.
⬤ Jak obejít výkonnostní problémy v paradigmatu dvojic klíč/hodnota ve Sparku.
⬤ Psaní vysoce výkonného kódu Sparku bez jazyka Scala nebo JVM.
⬤ Jak testovat funkčnost a výkon při použití navrhovaných vylepšení.
⬤ Používání knihoven Spark MLlib a Spark ML pro strojové učení.
⬤ Sparkovské komponenty Streaming a externí komunitní balíčky.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)