Hodnocení:
Kniha slouží jako úvod do systému Dask a jeho možností, ale má smíšené hodnocení, pokud jde o cílovou skupinu a hloubku informací. Nabízí sice dobrý přehled a srovnání s Pandas, ale často se pouští do elementárních konceptů, které nemusí být pro čtenáře, kterým je určena, relevantní.
Klady:⬤ Dobrý úvod pro začátečníky
⬤ důkladné vysvětlení datových struktur Dasku
⬤ efektivní srovnání s Pandasem
⬤ cenný zdroj pro pochopení konceptů datové vědy
⬤ přehledná syntaxe a případy použití.
⬤ Příliš základní pro středně pokročilé uživatele
⬤ obsahuje nerelevantní elementární pojmy
⬤ rozvržení a struktura by mohly být vylepšeny
⬤ zaznamenány některé technické problémy
⬤ obsah může být pro zamýšlené publikum příliš podrobný.
(na základě 6 hodnocení čtenářů)
Data Science with Python and Dask
Shrnutí
Dask je nativní paralelní analytický nástroj navržený tak, aby se hladce integroval s knihovnami, které již používáte, včetně Pandas, NumPy a Scikit-Learn. S Daskem můžete zpracovávat a pracovat s obrovskými soubory dat pomocí nástrojů, které již máte. Kniha Data Science with Python and Dask je vaším průvodcem, jak používat Dask pro své datové projekty, aniž byste museli měnit způsob práce.
Zakoupení tištěné knihy zahrnuje bezplatnou elektronickou knihu ve formátech PDF, Kindle a ePub od Manning Publications. Pokyny k registraci najdete uvnitř tištěné knihy.
O technologii
Efektivní datový kanál znamená pro úspěch projektu datové vědy vše. Dask je flexibilní knihovna pro paralelní výpočty v jazyce Python, která usnadňuje vytváření intuitivních pracovních postupů pro příjem a analýzu velkých distribuovaných datových souborů. Dask poskytuje dynamické plánování úloh a paralelní kolekce, které rozšiřují funkčnost NumPy, Pandas a Scikit-learn a umožňují uživatelům snadno škálovat kód z jednoho notebooku na cluster stovek strojů.
O knize
Datová věda s Pythonem a Daskem vás naučí vytvářet škálovatelné projekty, které zvládnou zpracovávat obrovské datové soubory. Po seznámení s frameworkem Dask budete analyzovat data v databázi newyorských parkovacích lístků a používat DataFrames k zefektivnění procesu. Poté budete vytvářet modely strojového učení pomocí Dask-ML, vytvářet interaktivní vizualizace a budovat clustery pomocí AWS a Dockeru.
Co je uvnitř
⬤ Práce s velkými strukturovanými i nestrukturovanými datovými sadami.
⬤ Vizualizace pomocí Seaborn a Datashader.
⬤ Implementace vlastních algoritmů.
⬤ Vytváření distribuovaných aplikací pomocí Dask Distributed.
⬤ Balení a nasazování aplikací Dask.
O čtenáři
Pro datové vědce a vývojáře se zkušenostmi s používáním jazyka Python a zásobníku PyData.
O autorovi
Jesse Daniel je zkušený vývojář v jazyce Python. Vyučoval Python pro datovou vědu na Denverské univerzitě a vede tým datových vědců v denverské společnosti zabývající se mediálními technologiemi.
Obsah
ČÁST 1 - Stavební kameny škálovatelných výpočtů.
⬤ Proč je škálovatelná výpočetní technika důležitá.
⬤ Představení Dasku.
ČÁST 2 - Práce se strukturovanými daty pomocí Dask DataFrames.
⬤ Představení Dask DataFrames.
⬤ Vkládání dat do DataFrames.
⬤ Čištění a transformace DataFrames.
⬤ Shrnutí a analýza DataFrames.
⬤ Vizualizace DataFrames pomocí Seabornu.
⬤ Vizualizace dat o poloze pomocí nástroje Datashader.
ČÁST 3 - Rozšíření a nasazení Dasku.
⬤ Práce se sáčky a poli.
⬤ Strojové učení s Dask-ML.
⬤ Škálování a nasazení Dasku.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)