Усиленное обучение
sku: 70772995
490.00 руб.
Shipping from: Russia
Description
Данное руководство по усиленному обучению (Reinforcement Learning, RL), охватывает теоретические основы, практические применения и современные достижения. В начале дается определение RL, его исторический контекст и ключевые отличия от других видов машинного обучения. Примеры применения RL охватывают игры, робототехнику, финансовые рынки и управление ресурсами. Математические основы включают марковские процессы принятия решений, состояния, действия, награды и политики, а также Беллмановские уравнения и итерацию ценности.Основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента политики, REINFORCE и Actor-Critic, рассматриваются вместе с моделями на основе планирования и глубокого усиленного обучения (DQN, DDPG, A3C). Практическая часть книги включает использование OpenAI Gym и других сред, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.
Technical Details
age: | 12 |
author: | Джеймс Девис |
genres_list: | 5272,5316,6334,6487,53415,91555,104299,112154,185312,239688 |
lang: | ru |
litres_isbn: | 978-5-04-647602-6 |
publisher: | Автор |
Type: | book |
year: | 2024 |
Форматы: | FB2.ZIP,FB3,EPUB,IOS.EPUB,TXT.ZIP,RTF.ZIP,A4.PDF,A6.PDF,MOBI.PRC,TXT |
Price history chart & currency exchange rate