Learning Spark: Spark: bleskurychlá analýza dat - zvládněte zpracování dat ve velkém měřítku

Učební jiskra: Spark: bleskurychlá analýza dat (S. Damji Jules)

Recenze čtenářů

Shrnutí:

Tato kniha slouží jako komplexní zdroj informací o Apache Spark a nabízí podrobné teoretické i praktické poznatky. Je přehledně uspořádaná, zaměřuje se na různé součásti Sparku a obsahuje užitečné vizualizace a ukázky kódu. Pro zkušené uživatele však může být příliš základní a vyžaduje určité předchozí znalosti programování.

Klady:

⬤ Pokrývá teoretické i praktické aspekty Sparku do velké hloubky
⬤ dobře organizovaná a přehledná
⬤ poskytuje jasné pokyny, užitečné vizualizace a ukázky kódu
⬤ poskytuje dobrý úvod do Sparku
⬤ obsahuje kapitoly o Delta Lake a MLlib
⬤ vhodná jak pro začátečníky, tak pro zkušenější uživatele, kteří si chtějí osvěžit znalosti.

Zápory:

⬤ Některá témata mohou být pokryta příliš povrchně
⬤ vyžaduje základní až středně pokročilé znalosti programování a analýzy dat
⬤ není ideální pro uživatele s předchozími zkušenostmi se Sparkem
⬤ nastavení může být náročné, zejména pro uživatele Mac a Windows
⬤ nemusí být vhodné pro úplné technologické nováčky.

(na základě 33 hodnocení čtenářů)

Původní název:

Learning Spark: Lightning-Fast Data Analytics

Obsah knihy:

Data jsou větší, přicházejí rychleji a v různých formátech - a všechna je třeba zpracovávat ve velkém měřítku pro účely analýzy nebo strojového učení. Jak ale takovou různorodou zátěž efektivně zpracovat? Přichází Apache Spark.

Aktualizováno o Spark 3. 0, toto druhé vydání ukazuje datovým inženýrům a datovým vědcům, proč je struktura a sjednocení ve Sparku důležité. Konkrétně tato kniha vysvětluje, jak provádět jednoduchou i složitou analýzu dat a používat algoritmy strojového učení. Prostřednictvím postupných kroků, ukázek kódu a sešitů budete schopni:

⬤ Užívat vysokoúrovňové strukturované rozhraní API v jazycích Python, SQL, Scala nebo Java.

⬤ Pochopit operace Sparku a SQL Engine.

⬤ Prohlížet, ladit a ladit operace Sparku pomocí konfigurací Sparku a uživatelského rozhraní Sparku.

⬤ Připojit se ke zdrojům dat: JSON, Parquet, CSV, Avro, ORC, Hive, S3 nebo Kafka.

⬤ Provádění analýz na dávkových a proudových datech pomocí Structured Streaming.

⬤ Vytvářejte spolehlivé datové pipelines pomocí open source Delta Lake a Spark.

⬤ Vyvíjet pipelines strojového učení pomocí MLlib a produkovat modely pomocí MLflow.

Další údaje o knize:

ISBN:	9781492050049
Autor:	S. Damji Jules
Vydavatel:	Oreilly Media
Vazba:	Měkká vazba
Rok vydání:	2020
Počet stran:	300

Nákup:

Nyní dostupné, na skladě.

Učební jiskra: Spark: bleskurychlá analýza dat

Recenze čtenářů

Původní název:

Obsah knihy:

Další údaje o knize:

Nákup:

Další knihy od autora:

Díla autora vydali tito vydavatelé: