Vysoce výkonná jiskra: Nejlepší postupy pro škálování a optimalizaci Apache Spark

Hodnocení:   (4,2 z 5)

Vysoce výkonná jiskra: Nejlepší postupy pro škálování a optimalizaci Apache Spark (Holden Karau)

Recenze čtenářů

Shrnutí:

Kniha „High Performance Spark“ nabízí podrobný výklad o psaní efektivního kódu Sparku, který je vhodný pro profesionály s předchozími znalostmi jazyka Scala a Spark. Zaměřuje se na optimalizaci výkonu a poskytuje důkladné příklady kódu, především v jazyce Scala. Zatímco někteří uživatelé ji považovali za dobře strukturovaný a informativní zdroj, jiní kritizovali její přístupnost pro začátečníky a velkou závislost na jazyce Scala.

Klady:

Komplexní průvodce psaním vysoce výkonného kódu Sparku.
Podrobné vysvětlení pokročilých konceptů a optimalizačních technik.
Dobře strukturovaný výklad s vyváženým poměrem teorie a praktických aplikací.
Bohatý na příklady kódu, které zlepšují porozumění, zejména pro ty, kteří znají jazyk Scala.
Přehledná prezentace, jednoduchost a užitečné diagramy.

Zápory:

Nevhodné pro začátečníky; vyžaduje předchozí znalosti Sparku a jazyka Scala.
Velké zaměření na jazyk Scala může odradit uživatele, kteří tento jazyk neznají.
Někteří uživatelé měli pocit, že je příliš hutná a náročná bez praktického prostředí Sparku.
Omezené pokrytí některých témat, například streamování Sparku.
Někteří ji považovali za nudnou kvůli nadměrnému množství příkladů kódování.

(na základě 27 hodnocení čtenářů)

Původní název:

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Obsah knihy:

Apache Spark je úžasný, když všechno klapne. Pokud jste však nezaznamenali očekávané zlepšení výkonu nebo se stále necítíte dostatečně jistí, abyste mohli Spark používat v produkčním provozu, je tato praktická kniha určena právě vám. Autoři Holden Karau a Rachel Warrenová vám předvedou výkonnostní optimalizace, které pomohou vašim dotazům ve Sparku běžet rychleji, zvládnout větší objemy dat a přitom využívat méně zdrojů.

Tato kniha je ideální pro softwarové inženýry, datové inženýry, vývojáře a správce systémů pracující s rozsáhlými datovými aplikacemi a popisuje techniky, které mohou snížit náklady na datovou infrastrukturu a snížit počet hodin strávených vývojáři. Nejenže získáte ucelenější představu o technologii Spark, ale také se naučíte, jak ji rozezpívat.

S touto knihou prozkoumáte:

⬤ Jak nová rozhraní Spark SQL zlepšují výkon oproti datové struktuře RDD jazyka SQL.

⬤ Výběr mezi spojováním dat v jádře Spark a Spark SQL.

⬤ Techniky pro maximální využití standardních transformací RDD.

⬤ Jak obejít výkonnostní problémy v paradigmatu dvojic klíč/hodnota ve Sparku.

⬤ Psaní vysoce výkonného kódu Sparku bez jazyka Scala nebo JVM.

⬤ Jak testovat funkčnost a výkon při použití navrhovaných vylepšení.

⬤ Používání knihoven Spark MLlib a Spark ML pro strojové učení.

⬤ Sparkovské komponenty Streaming a externí komunitní balíčky.

Další údaje o knize:

ISBN:9781491943205
Autor:
Vydavatel:
Vazba:Měkká vazba
Rok vydání:2017
Počet stran:358

Nákup:

Nyní dostupné, na skladě.

Další knihy od autora:

Vysoce výkonná jiskra: Nejlepší postupy pro škálování a optimalizaci Apache Spark - High Performance...
Apache Spark je úžasný, když všechno klapne. Pokud...
Vysoce výkonná jiskra: Nejlepší postupy pro škálování a optimalizaci Apache Spark - High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Škálování Pythonu s Rayem: Dobrodružství v oblasti cloudových a bezserverových vzorů - Scaling...
Bezserverové výpočty umožňují vývojářům soustředit...
Škálování Pythonu s Rayem: Dobrodružství v oblasti cloudových a bezserverových vzorů - Scaling Python with Ray: Adventures in Cloud and Serverless Patterns
Škálování Pythonu s Daskem: Od datové vědy ke strojovému učení - Scaling Python with Dask: From Data...
Moderní systémy obsahují vícejádrové CPU a GPU,...
Škálování Pythonu s Daskem: Od datové vědy ke strojovému učení - Scaling Python with Dask: From Data Science to Machine Learning

Díla autora vydali tito vydavatelé:

© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)