Hodnocení:
Aktuálně nejsou k dispozici žádné recenze čtenářů. Hodnocení je založeno na 12 hlasů.
Deep Reinforcement Learning with Python: With Pytorch, Tensorflow and Openai Gym
Hluboké posilovací učení je rychle se rozvíjející disciplína, která má významný dopad na oblasti autonomních vozidel, robotiky, zdravotnictví, financí a mnoho dalších. Tato kniha se zabývá hlubokým posilovacím učením pomocí modelů deep-q learning a policy gradient s cvičením kódování.
Na začátku se seznámíte s Markovovými rozhodovacími procesy, Bellmanovými rovnicemi a dynamickým programováním, které tvoří základní pojmy a základy hlubokého posilovacího učení. Dále budete studovat učení bez modelu a následně aproximaci funkcí pomocí neuronových sítí a hlubokého učení. Poté následují různé algoritmy hlubokého posilovacího učení, jako jsou hluboké q-sítě, různé varianty metod kritiky aktérů a další metody založené na zásadách.
Podíváte se také na dilema zkoumání vs. využívání, které je klíčovým faktorem v algoritmech posilování učení, spolu s vyhledáváním stromů Monte Carlo (MCTS), které hrálo klíčovou roli v úspěchu AlphaGo. Závěrečné kapitoly jsou věnovány implementaci hlubokého posilovacího učení pomocí populárních frameworků pro hluboké učení, jako jsou TensorFlow a PyTorch. V závěru porozumíte hlubokému posilovacímu učení spolu s implementací hlubokých q sítí a modelů s gradientní politikou pomocí TensorFlow, PyTorch a Open AI Gym.
Co se naučíte
⬤ Prozkoumat hluboké posilovací učení.
⬤ Implementovat algoritmy hlubokého učení pomocí prostředí OpenAI Gym.
⬤ Kódovat vlastní herní agenty pro Atari pomocí algoritmů actor-critic.
⬤ Použijte osvědčené postupy pro tvorbu modelů a trénování algoritmů.
Pro koho je tato kniha určena
Vývojářům a architektům strojového učení, kteří chtějí mít náskok v oblasti umělé inteligence a hlubokého učení.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)