Gilus mokymasis su sustiprinimu. AlphaGo ir kitos technologijos
Ši knyga – išsamus naujausių giluminio mokymosi su sustiprinimu įrankių ir jų apribojimų vadovas. Mes įgyvendinsime ir praktiškai patikrinsime kross-entropijos ir vertės iteracijos (Q-learning) metodus, taip pat strategijų gradientus. Eksperimentams naudojamos įvairios mokymosi su sustiprinimu (RL) aplinkos, pradedant klasikiniu CartPole...
ir GridWorld ir baigiant Atari emulatoriais ir tęstinio valdymo aplinkomis (pagal PyBullet ir RoboSchool). Daugelis pavyzdžių pagrįsta nestandartinėmis aplinkomis, kuriose mes nuo nulio sukursime aplinkos modelį. Šioje knygoje - sužinosite, kokią vietą giluminio mokymosi kontekste užima RL metodai, įgyvendinsite sudėtingus giluminio mokymosi modelius. - Išstudijuokite RL pagrindą: Markovo sprendimų procesus. - Pasižiūrėkite į RL metodų įgyvendinimo pavyzdžius: kross-entropijos metodas, DQN, A3C, TRPO, PPO, DDPG, D4PG ir kt. - Sužinosite, kaip dirbti su diskretinėmis ir tęstinėmis veiksmų erdvėmis įvairiose aplinkose. - Pamatysite, kaip sukurti sistemą, besimokančią žaisti Atari žaidimus, naudojant sustiprinimo mokymą. - Sukurite savo aplinką pagal OpenAI Gym modelį, kad apmokytumėte biržos agentą. - Įgyvendinsite AlphaGo Zero metodą žaidimui Connect4. - Susipažinsite su RL taikymu kalbos apdorojime: sužinosite, kaip apmokyti dialoginį robotą iš kino filmų frazių.
Ši knyga – išsamus naujausių giluminio mokymosi su sustiprinimu įrankių ir jų apribojimų vadovas. Mes įgyvendinsime ir praktiškai patikrinsime kross-entropijos ir vertės iteracijos (Q-learning) metodus, taip pat strategijų gradientus. Eksperimentams naudojamos įvairios mokymosi su sustiprinimu (RL) aplinkos, pradedant klasikiniu CartPole ir GridWorld ir baigiant Atari emulatoriais ir tęstinio valdymo aplinkomis (pagal PyBullet ir RoboSchool). Daugelis pavyzdžių pagrįsta nestandartinėmis aplinkomis, kuriose mes nuo nulio sukursime aplinkos modelį. Šioje knygoje - sužinosite, kokią vietą giluminio mokymosi kontekste užima RL metodai, įgyvendinsite sudėtingus giluminio mokymosi modelius. - Išstudijuokite RL pagrindą: Markovo sprendimų procesus. - Pasižiūrėkite į RL metodų įgyvendinimo pavyzdžius: kross-entropijos metodas, DQN, A3C, TRPO, PPO, DDPG, D4PG ir kt. - Sužinosite, kaip dirbti su diskretinėmis ir tęstinėmis veiksmų erdvėmis įvairiose aplinkose. - Pamatysite, kaip sukurti sistemą, besimokančią žaisti Atari žaidimus, naudojant sustiprinimo mokymą. - Sukurite savo aplinką pagal OpenAI Gym modelį, kad apmokytumėte biržos agentą. - Įgyvendinsite AlphaGo Zero metodą žaidimui Connect4. - Susipažinsite su RL taikymu kalbos apdorojime: sužinosite, kaip apmokyti dialoginį robotą iš kino filmų frazių.
Pirmieji sužinokite apie mūsų taikomas nuolaidas, pasiūlymus ir naujus produktus!
Check icon
Jūs pridėjote į savo krepšelį
Check icon
Įtraukėte į mėgstamiausius
Išparduota
Šiuo metu nėra sandėlyje
Yra sandėlyje
Turima sandėlyje Rygoje. Tikslų pristatymo laiką nurodys operatorius po užsakymo patvirtinimo.
Užsisakyti
Prekė tiekiami tiesiogiai iš leidyklos. Užsakymo įvykdymo terminas – iki 14 dienų, tikslią pristatymo datą gausite iš operatoriaus po užsakymo patvirtinimo.