Ši knyga – išsamus naujausių giluminio mokymosi su sustiprinimu įrankių ir jų apribojimų vadovas. Mes įgyvendinsime ir praktiškai patikrinsime kross-entropijos ir vertės iteracijos (Q-learning) metodus, taip pat strategijų gradientus. Eksperimentams naudojamos įvairios mokymosi su sustiprinimu (RL) aplinkos, pradedant klasikiniu CartPole... ir GridWorld ir baigiant Atari emulatoriais ir tęstinio valdymo aplinkomis (pagal PyBullet ir RoboSchool). Daugelis pavyzdžių pagrįsta nestandartinėmis aplinkomis, kuriose mes nuo nulio sukursime aplinkos modelį. Šioje knygoje - sužinosite, kokią vietą giluminio mokymosi kontekste užima RL metodai, įgyvendinsite sudėtingus giluminio mokymosi modelius. - Išstudijuokite RL pagrindą: Markovo sprendimų procesus. - Pasižiūrėkite į RL metodų įgyvendinimo pavyzdžius: kross-entropijos metodas, DQN, A3C, TRPO, PPO, DDPG, D4PG ir kt. - Sužinosite, kaip dirbti su diskretinėmis ir tęstinėmis veiksmų erdvėmis įvairiose aplinkose. - Pamatysite, kaip sukurti sistemą, besimokančią žaisti Atari žaidimus, naudojant sustiprinimo mokymą. - Sukurite savo aplinką pagal OpenAI Gym modelį, kad apmokytumėte biržos agentą. - Įgyvendinsite AlphaGo Zero metodą žaidimui Connect4. - Susipažinsite su RL taikymu kalbos apdorojime: sužinosite, kaip apmokyti dialoginį robotą iš kino filmų frazių.
Autorius: Maksim Lapan
Leidykla: piter
Serija: Profesionalams
Amžiaus ribos: 16+
Išleidimo metai: 2020
ISBN: 9785446110797
Puslapių skaičius: 496
Dydis: 233x164x22 mm
Viršelio tipas: Soft
Svoris: 634 g
ID: 861751
21 rugpjūčio (Ke)
nemokamai
20 rugpjūčio (Tr)
€ 9.99
nemokamai nuo € 80.00
21 rugpjūčio (Ke)
nemokamai
20 rugpjūčio (Tr)
€ 9.99
nemokamai nuo € 80.00