Hodnocení:
Celkově je kniha považována za vynikající zdroj informací o čištění dat pomocí jazyka Python, který nabízí praktické rady, jasná vysvětlení a četné příklady kódování. Ačkoli slouží jako komplexní úvod pro začátečníky i jako užitečná příručka pro zkušené datové vědce, někteří recenzenti upozornili na oblasti, které je třeba zlepšit, zejména pokud jde o formátování kódu a zahrnutí grafiky.
Klady:Kniha je vysoce praktická, poskytuje jasná a strukturovaná vysvětlení, četné příklady a množství technik čištění, manipulace a vizualizace dat. Slouží jako vynikající učebnice pro ty, kdo s datovou vědou nebo umělou inteligencí začínají, a je ceněna zejména pro své postřehy, uspořádání a použitelnost jako rychlá referenční příručka. Recenzenti ocenili důraz na pochopení zdůvodnění úloh zpracování dat, což zlepšuje učení.
Zápory:Někteří recenzenti poukázali na problémy, jako jsou špatně formátované příklady kódu, které se špatně čtou, minimální využití grafiky v rozporu s typickou průzkumnou analýzou dat a potřeba komplexnějších témat, jako je čištění časových řad dat. Několik z nich poznamenalo, že kniha sice slouží jako solidní výchozí bod, ale nemusí do hloubky pokrývat všechna pokročilá témata.
(na základě 28 hodnocení čtenářů)
Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights
Zjistěte, jak podrobně popsat svá data, identifikovat problémy s daty a zjistit, jak je řešit pomocí běžně používaných technik a tipů a triků
Klíčové vlastnosti
⬤ Zorientujte se v různých technikách čištění dat, které vám pomohou odhalit klíčové poznatky.
⬤ Manipulujte s daty různé složitosti a tvarujte je do správné podoby podle potřeb vašeho podnikání.
⬤ Čištění, monitorování a ověřování velkých objemů dat za účelem diagnostiky problémů před přechodem k analýze dat.
Popis knihy
Získání čistých dat pro odhalení poznatků je zásadní, protože přímý skok do analýzy dat bez řádného vyčištění dat může vést k nesprávným výsledkům. Tato kniha vám ukáže nástroje a techniky, které můžete použít k čištění a zpracování dat pomocí jazyka Python. Začnete tím, že se seznámíte s tvarem dat pomocí postupů, které lze rutinně nasadit u většiny zdrojů dat. Poté vás kniha naučí, jak s daty manipulovat, abyste je dostali do užitečné podoby. Naučíte se také filtrovat a sumarizovat data, abyste získali přehled a lépe pochopili, co má smysl a co ne, spolu s objevem, jak s daty pracovat, abyste řešili zjištěné problémy. Dále budete provádět klíčové úkoly, jako je zpracování chybějících hodnot, ověřování chyb, odstraňování duplicitních dat, sledování velkých objemů dat a zpracování odlehlých hodnot a neplatných dat. Dále se budete věnovat receptům na používání učení pod dohledem a analýzy Naive Bayes k identifikaci neočekávaných hodnot a chyb klasifikace a vytváření vizualizací pro průzkumnou analýzu dat (EDA) k vizualizaci neočekávaných hodnot. Nakonec vytvoříte funkce a třídy, které můžete bez úprav znovu použít, když máte k dispozici nová data.
Na konci této knihy o Pythonu budete mít všechny klíčové dovednosti, které potřebujete k čištění dat a diagnostice problémů v nich.
Co se naučíte
⬤ Zjistíte, jak číst a analyzovat data z různých zdrojů.
⬤ Vytvářet souhrny atributů datových rámců, sloupců a řádků.
⬤ Filtrovat data a vybírat sloupce zájmu, které splňují daná kritéria.
⬤ Řešit problémy s nepřehlednými daty, včetně práce s daty a chybějícími hodnotami.
⬤ Zvýšit produktivitu práce v Pythonu pandas pomocí řetězení metod.
⬤ Používejte vizualizace k získání dalších informací a identifikaci potenciálních problémů s daty.
⬤ Zlepšete svou schopnost zjistit, co se děje v datech.
⬤ Vytvářejte uživatelsky definované funkce a třídy pro automatizaci čištění dat.
Pro koho je tato kniha určena
Tato kniha je určena všem, kteří hledají způsoby, jak zpracovávat nepřehledná, duplicitní a nekvalitní data pomocí různých nástrojů a technik jazyka Python. Kniha využívá přístup založený na receptech, které vám pomohou naučit se čistit a spravovat data. K tomu, abyste z knihy vytěžili co nejvíce, vám postačí praktická znalost programování v jazyce Python.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)