-40%

Dziļā mācīšanās ar pastiprinājumu. AlphaGo un citas tehnoloģijas

Dziļā mācīšanās ar pastiprinājumu. AlphaGo un citas tehnoloģijas

Šī grāmata — detalizēts ceļvedis jaunākajiem dziļās mācīšanās ar pastiprinājumu rīkiem un to ierobežojumiem. Mēs īstenosim un pārbaudīsim praksē krusts-entrropijas un vērtību iterācijas (Q-mācīšanās) metodes, kā arī stratēģiju gradientus. Eksperimentiem tiks izmantotas visdažādākās pastiprināšanas mācīšanās (RL) vides, sākot no klasiskajiem... CartPole un GridWorld un beidzot ar Atari emulatoriem un nepārtrauktas vadības vidēm (balstoties uz PyBullet un RoboSchool). Daudzi piemēri balstīti uz nestandarta vidēm, kurās mēs no nulles izstrādāsim apkārtni. Šajā grāmatā - Jūs uzzināsiet, kādu vietu dziļās mācīšanās kontekstā ieņem RL metodes, īstenosiet sarežģītas dziļās mācīšanās modeļus. - Izpētīsiet RL pamatus: Markova lēmumu pieņemšanas procesus. - Apskatīsiet RL metožu īstenošanas piemērus: krusts-entrropijas metode, DQN, A3C, TRPO, PPO, DDPG, D4PG un citas. - Uzzināsiet, kā strādāt ar diskretām un nepārtrauktām darbību telpām dažādās vidēs. - Redzēsiet, kā izstrādāt sistēmu, kas mācās spēlēt Atari spēles, izmantojot pastiprināšanas mācīšanos. - Izveidosiet savu vidi pēc OpenAI Gym modeļa, lai apmācītu biržas aģentu. - Īstenosiet AlphaGo Zero metodi spēlē Connect4. - Iepazīsieties ar RL pielietojumu runas apstrādē: uzzināsiet, kā apmācīt dialoga robotu, izmantojot frāzes no filmām.

Lasīt tālāk

Autors: Maksim Lapan

Izdevniecība: piter

Sērija: Profesionaliem

Vecuma ierobežojumi: 16+

Izdošanas gads: 2020

ISBN: 9785446110797

Lappušu skaits: 496

Izmērs: 233x164x22 mm

Vāka tips: mīksts vāks

Svars: 634 g

ID: 861751

Šī grāmata — detalizēts ceļvedis jaunākajiem dziļās mācīšanās ar pastiprinājumu rīkiem un to ierobežojumiem. Mēs īstenosim un pārbaudīsim praksē krusts-entrropijas un vērtību iterācijas (Q-mācīšanās) metodes, kā arī stratēģiju gradientus. Eksperimentiem tiks izmantotas visdažādākās pastiprināšanas mācīšanās (RL) vides, sākot no klasiskajiem CartPole un GridWorld un beidzot ar Atari emulatoriem un nepārtrauktas vadības vidēm (balstoties uz PyBullet un RoboSchool). Daudzi piemēri balstīti uz nestandarta vidēm, kurās mēs no nulles izstrādāsim apkārtni. Šajā grāmatā - Jūs uzzināsiet, kādu vietu dziļās mācīšanās kontekstā ieņem RL metodes, īstenosiet sarežģītas dziļās mācīšanās modeļus. - Izpētīsiet RL pamatus: Markova lēmumu pieņemšanas procesus. - Apskatīsiet RL metožu īstenošanas piemērus: krusts-entrropijas metode, DQN, A3C, TRPO, PPO, DDPG, D4PG un citas. - Uzzināsiet, kā strādāt ar diskretām un nepārtrauktām darbību telpām dažādās vidēs. - Redzēsiet, kā izstrādāt sistēmu, kas mācās spēlēt Atari spēles, izmantojot pastiprināšanas mācīšanos. - Izveidosiet savu vidi pēc OpenAI Gym modeļa, lai apmācītu biržas aģentu. - Īstenosiet AlphaGo Zero metodi spēlē Connect4. - Iepazīsieties ar RL pielietojumu runas apstrādē: uzzināsiet, kā apmācīt dialoga robotu, izmantojot frāzes no filmām.

Ir uz vietas

€ 14.39 € 23.99

Piegādāsim uz Amerikas Savienotās Valstis 28 jūlijs (O.):

Izbraucēja

no € 38.94

Ir uz vietas

€ 14.39 € 23.99