Dziļā mācīšanās ar pastiprinājumu. AlphaGo un citas tehnoloģijas
Šī grāmata — detalizēts ceļvedis jaunākajiem dziļās mācīšanās ar pastiprinājumu rīkiem un to ierobežojumiem. Mēs īstenosim un pārbaudīsim praksē krusts-entrropijas un vērtību iterācijas (Q-mācīšanās) metodes, kā arī stratēģiju gradientus. Eksperimentiem tiks izmantotas visdažādākās pastiprināšanas mācīšanās (RL) vides, sākot no klasiskajiem...
CartPole un GridWorld un beidzot ar Atari emulatoriem un nepārtrauktas vadības vidēm (balstoties uz PyBullet un RoboSchool). Daudzi piemēri balstīti uz nestandarta vidēm, kurās mēs no nulles izstrādāsim apkārtni. Šajā grāmatā - Jūs uzzināsiet, kādu vietu dziļās mācīšanās kontekstā ieņem RL metodes, īstenosiet sarežģītas dziļās mācīšanās modeļus. - Izpētīsiet RL pamatus: Markova lēmumu pieņemšanas procesus. - Apskatīsiet RL metožu īstenošanas piemērus: krusts-entrropijas metode, DQN, A3C, TRPO, PPO, DDPG, D4PG un citas. - Uzzināsiet, kā strādāt ar diskretām un nepārtrauktām darbību telpām dažādās vidēs. - Redzēsiet, kā izstrādāt sistēmu, kas mācās spēlēt Atari spēles, izmantojot pastiprināšanas mācīšanos. - Izveidosiet savu vidi pēc OpenAI Gym modeļa, lai apmācītu biržas aģentu. - Īstenosiet AlphaGo Zero metodi spēlē Connect4. - Iepazīsieties ar RL pielietojumu runas apstrādē: uzzināsiet, kā apmācīt dialoga robotu, izmantojot frāzes no filmām.
Šī grāmata — detalizēts ceļvedis jaunākajiem dziļās mācīšanās ar pastiprinājumu rīkiem un to ierobežojumiem. Mēs īstenosim un pārbaudīsim praksē krusts-entrropijas un vērtību iterācijas (Q-mācīšanās) metodes, kā arī stratēģiju gradientus. Eksperimentiem tiks izmantotas visdažādākās pastiprināšanas mācīšanās (RL) vides, sākot no klasiskajiem CartPole un GridWorld un beidzot ar Atari emulatoriem un nepārtrauktas vadības vidēm (balstoties uz PyBullet un RoboSchool). Daudzi piemēri balstīti uz nestandarta vidēm, kurās mēs no nulles izstrādāsim apkārtni. Šajā grāmatā - Jūs uzzināsiet, kādu vietu dziļās mācīšanās kontekstā ieņem RL metodes, īstenosiet sarežģītas dziļās mācīšanās modeļus. - Izpētīsiet RL pamatus: Markova lēmumu pieņemšanas procesus. - Apskatīsiet RL metožu īstenošanas piemērus: krusts-entrropijas metode, DQN, A3C, TRPO, PPO, DDPG, D4PG un citas. - Uzzināsiet, kā strādāt ar diskretām un nepārtrauktām darbību telpām dažādās vidēs. - Redzēsiet, kā izstrādāt sistēmu, kas mācās spēlēt Atari spēles, izmantojot pastiprināšanas mācīšanos. - Izveidosiet savu vidi pēc OpenAI Gym modeļa, lai apmācītu biržas aģentu. - Īstenosiet AlphaGo Zero metodi spēlē Connect4. - Iepazīsieties ar RL pielietojumu runas apstrādē: uzzināsiet, kā apmācīt dialoga robotu, izmantojot frāzes no filmām.
Esi pirmais, kas uzzina par mūsu aktuālajām atlaidēm, piedāvājumiem un jauniem produktiem!
Check icon
Jūs esat pievienojis savam grozam
Check icon
Pievienots vēlmju sarakstam
Nav noliktavā
Pašlaik prece ir izbeigusies noliktavā
Ir uz vietas
Pieejams noliktavā Rīgā. Precīzu piegādes termiņu saņemsiet no operatora pēc pasūtījuma apstiprināšanas
Pēc pasūtījuma
Prece tiek piegādāta tieši no izdevniecības. Pasūtījuma izpildei nepieciešamas līdz 14 dienām, precīzu piegādes termiņu saņemsiet no operatora pēc pasūtījuma apstiprināšanas.