Hodnocení:
Kniha je oceňována pro své jasné vysvětlení a praktický přístup k hlubokému posilování učení (deep reinforcement learning, DRL) a nabízí solidní zdroj informací pro čtenáře, kteří chtějí implementovat algoritmy. Kritika však upozorňuje na špatnou kvalitu papíru, problémy s vydáním pro Kindle a závislost na vlastním frameworku, která může některé čtenáře odradit.
Klady:⬤ Jasné a dobře strukturované vysvětlení konceptů a algoritmů DRL.
⬤ Praktické zdroje včetně příkladového kódu a repozitáře GitHub pro implementaci.
⬤ Vhodné pro čtenáře s různou úrovní zkušeností.
⬤ Stručné pokrytí témat, díky němuž se lze učit.
⬤ Pomáhá propojit teorii s praxí a usnadňuje praktické učení.
⬤ Hlášena špatná kvalita papíru a problémy s tiskem, včetně špatného zápachu a tenkých stránek.
⬤ Vydání pro Kindle má problémy s formátováním vzorců, které ovlivňují použitelnost.
⬤ Silné spoléhání na vlastní framework autorů (SLM Lab), což se nemusí líbit těm, kteří dávají přednost univerzálnějším příkladům kódování.
⬤ Některé příklady jsou zastaralé a vyžadují, aby čtenáři upravili kód tak, aby fungoval s aktualizovanými knihovnami.
(na základě 27 hodnocení čtenářů)
Foundations of Deep Reinforcement Learning: Theory and Practice in Python
Současný úvod do hlubokého posilovacího učení, který spojuje teorii a praxi
Hluboké učení s posilováním (deep reinforcement learning, deep RL) kombinuje hluboké učení a učení s posilováním, při kterém se umělí agenti učí řešit sekvenční rozhodovací problémy. V posledním desetiletí dosáhlo hluboké RL pozoruhodných výsledků v celé řadě problémů, od her pro jednoho a více hráčů - jako jsou Go, hry Atari a DotA 2-až po robotiku.
Kniha Základy hlubokého posilovacího učení je úvodem do hlubokého posilovacího učení, který jedinečným způsobem kombinuje teorii i implementaci. Začíná intuicí, pak pečlivě vysvětluje teorii algoritmů hlubokého RL, probírá implementace v doprovodné softwarové knihovně SLM Lab a končí praktickými detaily zprovoznění hlubokého RL.
Tato příručka je ideální jak pro studenty informatiky, tak pro softwarové inženýry, kteří jsou obeznámeni se základními koncepty strojového učení a mají praktické znalosti jazyka Python.
⬤ Poznejte jednotlivé klíčové aspekty problému hlubokého RL.
⬤ Prozkoumejte algoritmy založené na zásadách a hodnotách, včetně algoritmů REINFORCE, SARSA, DQN, Double DQN a Prioritized Experience Replay (PER).
⬤ Podívejte se na kombinované algoritmy, včetně algoritmu Actor-Critic a algoritmu Proximal Policy Optimization (PPO).
⬤ Pochopit, jak lze algoritmy paralelizovat synchronně a asynchronně.
⬤ Spustit algoritmy v laboratoři SLM a naučit se praktické implementační detaily pro zprovoznění hlubokého RL.
⬤ Prozkoumejte výsledky benchmarků algoritmů s vyladěnými hyperparametry.
⬤ Pochopte, jak jsou navržena prostředí hluboké RL.
Zaregistrujte si knihu a získejte pohodlný přístup ke stažení, aktualizacím a/nebo opravám, jakmile budou k dispozici. Podrobnosti naleznete uvnitř knihy.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)