Hodnocení:
Aktuálně nejsou k dispozici žádné recenze čtenářů. Hodnocení je založeno na 3 hlasů.
Practical Data Science with Python 3: Synthesizing Actionable Insights from Data
Kapitola 1. Úvod do datové vědyPočet stran: Tato kapitola seznamuje čtenáře s vědou o datech a popisuje hlavní fáze práce s daty (shromažďování, zkoumání, předběžné zpracování, vizualizace, předvídání a odvozování znalostí). Stanovuje společná očekávání, co tvoří oblast datové vědy. V této kapitole je podrobněji popsáno prostředí Anaconda IDE, které bude v knize použito.
Kapitola 2. Získávání datPočet stran: 1: Tato kapitola čtenáře seznámí s tím, jak získávat a ukládat data z/do různých zdrojů dat: textové soubory (včetně různých formátů, jako jsou CSV, XML a JSON), binární soubory (včetně Apache Avro), data dostupná na webu, relační databáze, databáze NoSQL, Apache Arrow (jako efektivní a nový systém sloupcového ukládání dat), multimodální databáze a síťové databáze. V této kapitole bude také představen BeautifulSoup pro práci s XML a HTML.
Kapitola 3. Základní zpracování datPočet stran: 1: Jedná se o standardní knihovny jazyka Python pro vědecké výpočty a zpracování dat. NumPy zahrnuje všechny druhy datových struktur potřebných při analýze dat. Uvedeme zde příklady, které osvětlí význam sofistikovaných frameworků a softwarového inženýrství založeného na opakovaném použití v oblasti datové vědy.
Kapitola 4. Dokumentace prácePočet stran: 20Tato kapitola představuje nejoblíbenější výpočetní prostředí pro analýzu dat. Umožňuje sdílení výsledků mezi datovými vědci snadno reprodukovatelným způsobem.
Kapitola 5. Transformace a balení datPočet stran: 30Tato kapitola osvětluje kritický rámec datové vědy, který je postaven na NumPy. Poskytuje vynikající datové struktury pro práci s datovými rámci a řadami.
Kapitola 6. VizualizacePočet stran: 1: Tato kapitola představuje různé způsoby vizualizace dat; souhrnné statistiky nebo tabulková zobrazení mají při zkoumání dat omezenou hodnotu. Tématem této kapitoly budou následující rámce: matplotlib, glueviz, Bokeh a orange3. Vizualizace je důležitá jak při provádění průzkumné analýzy, tak při vytváření efektivních zpráv.
Kapitola 7. Predikce a odvozováníPočet stran: Tato kapitola pojednává o všech technikách a technologiích pro správné škálování datové vědy. Naučí čtenáře, jak vytvářet systémy, které mohou formulovat odpovědi na nezobrazená data nebo nacházet skryté vzory v datech. Podrobně se bude zabývat metodami učení pod dohledem, bez dohledu, hlubokého učení a posilování. Kromě toho představí Apache Spark s MLib (v dávkovém i proudovém režimu) a také TensorFlow. Tématem této kapitoly budou také následující frameworky: XGBoost, sci-kit learn a Keras s PyTorch.
Kapitola 8. Síťová analýzaPočet stran: Tato kapitola se zabývá způsoby analýzy složitých sítí a grafů. V této kapitole budou představeny aplikace Apache Spark GraphX, Apache Giraph a NetworkX. Tato kapitola také představí spektrální analýzu grafů, což je zajímavá přibližná, nelineární a neparametrická metoda strojového učení.
Kapitola 9. Procesní inženýrství datové vědyPočet stran: 1: V této kapitole bude popsáno, jak sdílet a přizpůsobovat postupy/metody datové vědy používané týmy prostřednictvím OMG Essence.
Kapitola 10. Víceagentové systémy, teorie her a strojové učeníPočet stran: Tato kapitola se zabývá pokročilými datově orientovanými aplikacemi, kde jsou data vytvářena a spotřebovávána samosprávnými inteligentními agenty. Kapitola seznamuje čtenáře s konceptem multiagentních systémů, metodami a modely teorie her a souvisejícími algoritmy učení.
Kapitola 11. Pravděpodobnostní grafické modelyNumbe.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)