Hodnocení:
Recenze knihy se setkávají se smíšeným přijetím, přičemž někteří uživatelé oceňují pokrytí PySparku, zejména prvních několika kapitol, a snadný přechod pro uživatele Pythonu. Několik kritik však zmiňuje nedostatečnou hloubku, nízkou kvalitu psaní a nedostatečné detaily, což vede k frustraci z jejího celkového provedení.
Klady:⬤ Dobře pokrývá PySpark, zejména v úvodních kapitolách
⬤ užitečné pro samouky a přechod z Pythonu na PySpark
⬤ dobré příklady, které jsou uvedeny
⬤ užitečné pro začátečníky a středně pokročilé studenty datové vědy.
⬤ Špatně napsaná s mnoha chybami
⬤ postrádá podrobné technické informace a přehlednost
⬤ triviální příklady a nedostatečné vysvětlení možností
⬤ celkové provedení považuji za neuspokojivé
⬤ značná nespokojenost s úpravou a kvalitou obsahu.
(na základě 5 hodnocení čtenářů)
Applied Data Science Using Pyspark: Learn the End-To-End Predictive Model-Building Cycle
Objevte možnosti PySparku a jeho využití v oblasti datové vědy. Tento komplexní průvodce s ručně vybranými příklady každodenního použití vás provede celým cyklem tvorby prediktivních modelů s nejnovějšími technikami a triky z oboru.
Aplikovaná datová věda s využitím PySparku je rozdělena do šesti částí, které vás provedou celou knihou. V části 1 se seznámíte se základy PySparku a zaměříte se na manipulaci s daty. Seznámíme vás s jazykem a na jeho základě vás pak seznámíme s matematickými funkcemi, které jsou k dispozici z police. V oddíle 2 se ponoříte do umění výběru proměnných, kde si ukážeme různé techniky výběru dostupné v PySparku. V oddíle 3 vás vezmeme na cestu algoritmy strojového učení, jejich implementací a technikami jemného dolaďování. Budeme také hovořit o různých validačních metrikách a o tom, jak je použít pro výběr nejlepších modelů. V oddílech 4 a 5 projdeme pipeline strojového učení a různé dostupné metody operacionalizace modelu a jeho obsluhy prostřednictvím Dockeru / API. V závěrečné části se budete zabývat opakovaně použitelnými objekty pro snadné experimentování a naučíte se některé triky, které vám mohou pomoci optimalizovat vaše programy a pipeline strojového učení.
Na konci této knihy se přesvědčíte o flexibilitě a výhodách PySparku v aplikacích datové vědy. Tuto knihu doporučujeme těm, kteří chtějí využít sílu paralelních výpočtů při současné práci s velkými soubory dat.
Co se dozvíte
⬤ Vytvořit komplexní prediktivní model.
⬤ Zavedete techniky výběru více proměnných.
⬤ Provozovat modely.
⬤ Zvládnout více algoritmů a implementací.
Pro koho je tato kniha určena
Datovým vědcům a inženýrům zabývajícím se strojovým učením a hlubokým učením, kteří se chtějí naučit a používat PySpark pro analýzu proudových dat v reálném čase.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)