-40%

Gilus mokymasis su sustiprinimu. AlphaGo ir kitos technologijos

Gilus mokymasis su sustiprinimu. AlphaGo ir kitos technologijos

Ši knyga – išsamus naujausių giluminio mokymosi su sustiprinimu įrankių ir jų apribojimų vadovas. Mes įgyvendinsime ir praktiškai patikrinsime kross-entropijos ir vertės iteracijos (Q-learning) metodus, taip pat strategijų gradientus. Eksperimentams naudojamos įvairios mokymosi su sustiprinimu (RL) aplinkos, pradedant klasikiniu CartPole... ir GridWorld ir baigiant Atari emulatoriais ir tęstinio valdymo aplinkomis (pagal PyBullet ir RoboSchool). Daugelis pavyzdžių pagrįsta nestandartinėmis aplinkomis, kuriose mes nuo nulio sukursime aplinkos modelį. Šioje knygoje - sužinosite, kokią vietą giluminio mokymosi kontekste užima RL metodai, įgyvendinsite sudėtingus giluminio mokymosi modelius. - Išstudijuokite RL pagrindą: Markovo sprendimų procesus. - Pasižiūrėkite į RL metodų įgyvendinimo pavyzdžius: kross-entropijos metodas, DQN, A3C, TRPO, PPO, DDPG, D4PG ir kt. - Sužinosite, kaip dirbti su diskretinėmis ir tęstinėmis veiksmų erdvėmis įvairiose aplinkose. - Pamatysite, kaip sukurti sistemą, besimokančią žaisti Atari žaidimus, naudojant sustiprinimo mokymą. - Sukurite savo aplinką pagal OpenAI Gym modelį, kad apmokytumėte biržos agentą. - Įgyvendinsite AlphaGo Zero metodą žaidimui Connect4. - Susipažinsite su RL taikymu kalbos apdorojime: sužinosite, kaip apmokyti dialoginį robotą iš kino filmų frazių.

Skaityti daugiau

Autorius: Maksim Lapan

Publisher: piter

Serija: Profesionalams

Amžiaus ribos: 16+

Išleidimo metai: 2020

ISBN: 9785446110797

Puslapių skaičius: 496

Dydis: 233x164x22 mm

Viršelio tipas: Soft

Svoris: 634 g

ID: 861751

Ši knyga – išsamus naujausių giluminio mokymosi su sustiprinimu įrankių ir jų apribojimų vadovas. Mes įgyvendinsime ir praktiškai patikrinsime kross-entropijos ir vertės iteracijos (Q-learning) metodus, taip pat strategijų gradientus. Eksperimentams naudojamos įvairios mokymosi su sustiprinimu (RL) aplinkos, pradedant klasikiniu CartPole ir GridWorld ir baigiant Atari emulatoriais ir tęstinio valdymo aplinkomis (pagal PyBullet ir RoboSchool). Daugelis pavyzdžių pagrįsta nestandartinėmis aplinkomis, kuriose mes nuo nulio sukursime aplinkos modelį. Šioje knygoje - sužinosite, kokią vietą giluminio mokymosi kontekste užima RL metodai, įgyvendinsite sudėtingus giluminio mokymosi modelius. - Išstudijuokite RL pagrindą: Markovo sprendimų procesus. - Pasižiūrėkite į RL metodų įgyvendinimo pavyzdžius: kross-entropijos metodas, DQN, A3C, TRPO, PPO, DDPG, D4PG ir kt. - Sužinosite, kaip dirbti su diskretinėmis ir tęstinėmis veiksmų erdvėmis įvairiose aplinkose. - Pamatysite, kaip sukurti sistemą, besimokančią žaisti Atari žaidimus, naudojant sustiprinimo mokymą. - Sukurite savo aplinką pagal OpenAI Gym modelį, kad apmokytumėte biržos agentą. - Įgyvendinsite AlphaGo Zero metodą žaidimui Connect4. - Susipažinsite su RL taikymu kalbos apdorojime: sužinosite, kaip apmokyti dialoginį robotą iš kino filmų frazių.

Yra sandėlyje

€ 14.39 € 23.99

Pristatysime į Jungtines Amerikos Valstijas 28 liepos (An):

Kurjeriu

nuo € 38.94

Yra sandėlyje

€ 14.39 € 23.99