Tiefes Lernen mit Verstärkung. AlphaGo und andere Technologien
Dieses Buch ist ein ausführlicher Leitfaden zu den neuesten Werkzeugen des tiefen Lernens mit Verstärkung und deren Einschränkungen. Wir implementieren und testen in der Praxis Methoden der Kreuzentropie und der Wertiteration (Q-Learning), sowie Gradienten über Strategien. Für Experimente werden die...
unterschiedlichsten Umgebungen des verstärkenden Lernens (RL) verwendet, beginnend mit klassischen CartPole und GridWorld bis hin zu Atari-Simulatoren und kontinuierlichen Steuerungsumgebungen (basierend auf PyBullet und RoboSchool). Viele Beispiele basieren auf unkonventionellen Umgebungen, in denen wir von Grund auf ein Modell der Umgebung entwickeln. In diesem Buch werden Sie erfahren, welchen Platz die RL-Methoden im Kontext des tiefen Lernens einnehmen, und komplexe Modelle des tiefen Lernens umsetzen. - Lernen Sie die Grundlagen des RL: Markov-Entscheidungsprozesse. - Betrachten Sie Beispiele zur Umsetzung von RL-Methoden: Kreuzentropiemethode, DQN, A3C, TRPO, PPO, DDPG, D4PG und andere. - Erfahren Sie, wie man mit diskreten und kontinuierlichen Aktionsräumen in verschiedenen Umgebungen arbeitet. - Sehen Sie, wie man ein System entwickelt, das Atari-Spiele lernt, indem es verstärkendes Lernen verwendet. - Erstellen Sie Ihre eigene Umgebung im Modell von OpenAI Gym zur Ausbildung eines Börsenagenten. - Implementieren Sie die Methode AlphaGo Zero für das Spiel Connect4. - Machen Sie sich mit der Anwendung von RL in der Sprachverarbeitung vertraut: Erfahren Sie, wie man einen Dialogbot mit Sätzen aus Filmen trainiert.
Dieses Buch ist ein ausführlicher Leitfaden zu den neuesten Werkzeugen des tiefen Lernens mit Verstärkung und deren Einschränkungen. Wir implementieren und testen in der Praxis Methoden der Kreuzentropie und der Wertiteration (Q-Learning), sowie Gradienten über Strategien. Für Experimente werden die unterschiedlichsten Umgebungen des verstärkenden Lernens (RL) verwendet, beginnend mit klassischen CartPole und GridWorld bis hin zu Atari-Simulatoren und kontinuierlichen Steuerungsumgebungen (basierend auf PyBullet und RoboSchool). Viele Beispiele basieren auf unkonventionellen Umgebungen, in denen wir von Grund auf ein Modell der Umgebung entwickeln. In diesem Buch werden Sie erfahren, welchen Platz die RL-Methoden im Kontext des tiefen Lernens einnehmen, und komplexe Modelle des tiefen Lernens umsetzen. - Lernen Sie die Grundlagen des RL: Markov-Entscheidungsprozesse. - Betrachten Sie Beispiele zur Umsetzung von RL-Methoden: Kreuzentropiemethode, DQN, A3C, TRPO, PPO, DDPG, D4PG und andere. - Erfahren Sie, wie man mit diskreten und kontinuierlichen Aktionsräumen in verschiedenen Umgebungen arbeitet. - Sehen Sie, wie man ein System entwickelt, das Atari-Spiele lernt, indem es verstärkendes Lernen verwendet. - Erstellen Sie Ihre eigene Umgebung im Modell von OpenAI Gym zur Ausbildung eines Börsenagenten. - Implementieren Sie die Methode AlphaGo Zero für das Spiel Connect4. - Machen Sie sich mit der Anwendung von RL in der Sprachverarbeitung vertraut: Erfahren Sie, wie man einen Dialogbot mit Sätzen aus Filmen trainiert.
Seien Sie der Erste, der über unsere aktuellen Rabatte, Angebote und neuen Produkte informiert wird!
Check icon
Sie haben dem Warenkorb hinzugefügt
Check icon
Sie haben zu den Favoriten hinzugefügt
Ausverkauft
Es ist seit langem bekannt, dass ein Leser vom lesbaren Inhalt einer Seite abgelenkt wird, wenn er das Layout betrachtet. Der Sinn der Verwendung von Lorem Ipsum besteht darin, dass es eine mehr oder weniger normale Verteilung der Buchstaben hat
verfügbar
Es ist seit langem bekannt, dass der Leser vom lesbaren Inhalt einer Seite abgelenkt wird, wenn er sich das Layout ansieht. Der Sinn der Verwendung von Lorem Ipsum ist, dass es eine mehr oder weniger normale Verteilung der Buchstaben hat
Auf Bestellung
Das Produkt wird direkt vom Verlag geliefert. Die Bearbeitungszeit für die Bestellung beträgt bis zu 14 Tage, den genauen Liefertermin erhalten Sie vom Betreiber nach der Bestätigung der Bestellung.