Hodnocení:
Aktuálně nejsou k dispozici žádné recenze čtenářů. Hodnocení je založeno na 2 hlasů.
Data Science Revealed: With Feature Engineering, Data Visualization, Pipeline Development, and Hyperparameter Tuning
Oddíl 1: Parametrické metodyKapitola 1: Úvod do jednoduché lineární regreseCíl kapitoly: Seznamuje čtenáře s parametrickými metodami a pochopením základních předpokladů regrese. Dílčí témata- Předpoklady regrese. - Zjišťování chybějících hodnot. - Popisná analýza. - Pochopení korelace. o Sestavení Pearsonovy korelační matice. - Určení kovariance. o Vykreslete kovarianční matici. - Vytvořit a přetvořit pole. - Rozdělit data na tréninková a testovací. - Normalizovat data. - Najít nejlepší hyperparametry pro model. - Sestavte si vlastní model. - Zkontrolujte výkonnost modelu. o Střední absolutní chyba. o Střední kvadratická chyba. o Kořenová střední kvadratická chyba. o R-kvadrát. o Vykreslení skutečných hodnot oproti předpovídaným hodnotám. - Diagnostika reziduí. o Normální Q-Q graf. o Cookův D graf vlivu. o Vykreslení předpovídaných hodnot vs. reziduálních hodnot. o Vykreslení fitovaných hodnot vs. reziduálních hodnot. o Vykreslení pákových hodnot vs. reziduálních hodnot. o Vykreslení fitovaných hodnot vs. studovaných reziduálních hodnot. o Vykreslení pákových hodnot vs. studovaných reziduálních hodnot.
Kapitola 2: Pokročilé parametrické metodyCíl kapitoly: Zdůrazňuje metody řešení problému nedostatečného a nadměrného přizpůsobení. Dílčí témata- Problematika multikolinearity. - Prozkoumejte metody řešení problému nedostatečného a nadměrného přizpůsobení. - Pochopení regresních modelů Ridge, RidgeCV a Lasso. - Nalezení nejlepších hyperparametrů modelu. - Sestavení regularizovaných modelů. - Porovnat výkonnost různých regresních metod. o Střední absolutní chyba. o Střední kvadratická chyba. o Kořenová střední kvadratická chyba. o R-kvadrát. o Vykreslení skutečných hodnot oproti předpovídaným hodnotám.
Kapitola 3: Analýza časových řadCíl kapitoly: Zahrnuje model pro identifikaci trendů a vzorců v sekvenčních datech a způsob předpovědi řady. - Co je to analýza časových řad? - Základní předpoklady analýzy časových řad. - Různé typy modelů analýzy časových řad. - Model ARIMA. - Test stacionarity. o Provedení ADF Fullerova testu. - Test bílého šumu. - Test korelace. o Sestavte graf zpoždění. o Sestavte graf zpoždění vs. autokorelace. o Sestavte graf ACF. o Sestavte graf PACF. - Pochopení trendů, sezónnosti a trendů. o Vykreslete sezónní složky. - Vyhladit časovou řadu pomocí technik klouzavého průměru, směrodatné odchylky a exponenciály. o Vykreslit vyhlazenou časovou řadu. - Určit míru výnosnosti a klouzavou míru výnosnosti. - Určit parametry modelu ARIMA. - Sestavte model ARIMA. - Prognóza ARIMA. o Vykreslete prognózu. - Diagnostika reziduí.
Kapitola 4: Vysoce kvalitní časové řadyCíl kapitoly: Zkoumá Proroka pro lepší předpověď řad. - Rozdíl mezi statsmodelem a Prophetem. - Pochopení komponent v Prophet. - Předzpracování dat. - Vyvinout model pomocí programu Prophet. - Předpovídat řadu. o Vykreslit předpověď. o Vykreslit sezónní složky. - Vyhodnocení výkonnosti modelu pomocí programu Prophet. Kapitola 4: Logistická regreseCíl kapitoly: Seznámit čtenáře s logistickou regresí - výkonným klasifikačním modelem. Dílčí témata- Zjištění chybějících hodnot.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)