Ta książka jest szczegółowym przewodnikiem po najnowszych narzędziach głębokiego uczenia ze wzmocnieniem oraz ich ograniczeniach. Wdrożymy i przetestujemy w praktyce metody entropii krzyżowej i iteracji wartości (Q-learning), a także gradienty strategii. Do eksperymentów wykorzystane zostaną różnorodne środowiska uczenia ze wzmocnieniem... (RL), począwszy od klasycznych CartPole i GridWorld, aż po emulatory Atari i środowiska ciągłego sterowania (oparte na PyBullet i RoboSchool). Wiele przykładów opiera się na niestandardowych środowiskach, w których od podstaw opracujemy model otoczenia. W tej książce - Dowiesz się, jakie miejsce w kontekście głębokiego uczenia zajmują metody RL, wdrożysz złożone modele głębokiego uczenia. - Poznasz podstawy RL: markowiewskie procesy decyzyjne. - Przeanalizujesz przykłady wdrożenia metod RL: metoda entropii krzyżowej, DQN, A3C, TRPO, PPO, DDPG, D4PG i inne. - Dowiesz się, jak pracować z dyskretnymi i ciągłymi przestrzeniami akcji w różnych środowiskach. - Zobaczysz, jak opracować system uczący się grać w Atari, wykorzystując uczenie ze wzmocnieniem. - Stworzysz własne środowisko zgodnie z modelem OpenAI Gym do nauki agenta giełdowego. - Wdrożysz metodę AlphaGo Zero do gry w Connect4. - Zapoznasz się z zastosowaniem RL w przetwarzaniu mowy: dowiesz się, jak wytrenować bota dialogowego na frazach z filmów.
Autor: Максим Лапань
Wydawnictwo: piter
Seria: Для профессионалов
Ograniczenia wiekowe: 16+
Rok wydania: 2020
ISBN: 9785446110797
Liczba stron: 496
Rozmiar: 233x164x22 mm
Typ osłony: Soft
Waga: 634 g
ID: 861751
Metody dostawy
Wybierz odpowiednią metodę dostawy
Odbierz samodzielnie ze sklepu
0.00 €
Dostawa kurierem