第一章 强化学习介绍_env.step-CSDN博客

网站介绍:文章浏览阅读2.9k次,点赞3次,收藏7次。Reinforement LearningReinforcement Learning强化学习讨论的问题是一个 智能体(agent) 怎么在一个复杂不确定的环境(environment)里面去极大化它能获得的奖励。示意图由两部分组成:agent 和 environment。在强化学习过程中,agent 跟 environment 一直在交互。Agent 在环境里面获取到状态,agent 会利用这个状态输出一个 action,一个决策。然后这个决策会放到环境之中去,环境会通过这个 agent 采取的决_env.step