Hodnocení:
Tato kniha je komplexním a pro začátečníky přívětivým průvodcem zaměřeným na čištění dat a jejich přípravu pro strojové učení. Nabízí praktická cvičení, cenné poznatky a praktické techniky, které v jiných zdrojích často chybí. Přestože je vysoce hodnocena pro svá jasná vysvětlení a užitečné příklady, existují náznaky, že v některých pokročilých tématech může postrádat hloubku.
Klady:⬤ Komplexní a jasné vysvětlení technik čištění a přípravy dat.
⬤ Praktická cvičení a příklady kódu dostupné na GitHubu.
⬤ Skvělé pro začátečníky a slouží jako solidní reference pro zkušené uživatele.
⬤ Poutavý a přístupný styl psaní; působí konverzačně.
⬤ Zaměřuje se na nejcennější techniky, které vedou k výsledkům ve strojovém učení.
⬤ Chybí hloubka v pokročilých tématech, jako je hluboké učení a analýza chyb.
⬤ Někteří čtenáři si přejí širší soubor nástrojů pro komplexní modelování.
⬤ Zaměřuje se spíše na obsah pro začátečníky, což nemusí uspokojit zkušenější datové vědce, kteří hledají pokročilé poznatky.
(na základě 7 hodnocení čtenářů)
Data Cleaning and Exploration with Machine Learning: Get to grips with machine learning techniques to achieve sparkling-clean data quickly
Prozkoumejte superrychlé techniky strojového učení, které se postarají o vaši zátěž v podobě praní dat
Klíčové funkce:
⬤ Naučte se, jak připravit data pro procesy strojového učení.
⬤ Pochopte, které algoritmy vycházejí z cílů predikce a vlastností dat.
⬤ Prozkoumejte, jak interpretovat a vyhodnocovat výsledky strojového učení.
Popis knihy:
Mnoho jedinců, kteří umí spouštět algoritmy strojového učení, nemá dobrou představu o tom, jaké statistické předpoklady se v nich používají a jak sladit vlastnosti dat s algoritmem pro dosažení nejlepších výsledků.
Když začínáte s touto knihou, jsou modely pečlivě vybrány tak, aby vám pomohly pochopit základní data, včetně důležitosti a korelace mezi jednotlivými funkcemi a rozložení funkcí a cílů. První dvě části knihy vás seznámí s technikami přípravy dat pro ML algoritmy, přičemž se neostýchají použít některé ML techniky pro čištění dat, včetně detekce anomálií a výběru příznaků. Kniha vám pak pomůže tyto znalosti aplikovat na nejrůznější úlohy ML. Získáte přehled o populárních kontrolovaných i nekontrolovaných algoritmech, o tom, jak pro ně připravit data a jak je vyhodnocovat. Dále budete vytvářet modely a porozumíte vztahům v datech a budete s nimi provádět úlohy čištění a průzkumu. Rychle pokročíte ve studiu rozložení proměnných, identifikaci anomálií a zkoumání dvourozměrných vztahů, protože v této knize se více zaměříte na přesnost předpovědí.
Na konci této knihy budete schopni řešit složité problémy s daty pomocí neřízených algoritmů ML, jako je analýza hlavních komponent a shlukování k-means.
Co se naučíte:
⬤ Prozkoumejte základní techniky čištění a zkoumání dat, které je třeba použít před spuštěním nejoblíbenějších algoritmů strojového učení.
⬤ Poznejte, jak provádět předzpracování a výběr příznaků a jak nastavit data pro testování a validaci.
⬤ Modelovat průběžné cíle pomocí algoritmů učení s dohledem.
⬤ Modelovat binární a vícetřídní cíle pomocí algoritmů učení s dohledem.
⬤ Provádět shlukování a redukci dimenze pomocí algoritmů učení bez dohledu.
⬤ Pochopit, jak používat regresní stromy k modelování spojitého cíle.
Pro koho je tato kniha určena:
Tato kniha je určena profesionálním datovým vědcům, zejména těm, kteří jsou v prvních letech své kariéry, nebo zkušenějším analytikům, kteří se strojovým učením relativně začínají. Čtenáři by měli mít předchozí znalosti pojmů ze statistiky, které se obvykle vyučují v úvodním kurzu na bakalářském stupni, a také začátečnické zkušenosti s programovou manipulací s daty.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)