强化学习精要(笔记)-CSDN博客网友收藏

强化学习精要(笔记)-CSDN博客

强化学习是一种基于试错的机器学习方法,通过与环境的交互来学习最优策略。文章介绍了强化学习的概念和重要性,以及优化方法和基本算法。其中值得关注的算法包括Q-Learning、Deep Q升算法、TRPO和PPO等。此外,还介绍了Off-Pol......
阅读全文
强化学习精要第一二章-CSDN博客网友收藏

强化学习精要第一二章-CSDN博客

1、np.dot的用法,用于向量的时候是点积,用于矩阵的时候是矩阵的乘法,一个向量只有一行的时候,它的shape是(列数, )2、matplot画图,更改图中的字体,mpl.rcParams['font.sans-serif'] = ['WenQuanYi Micro Hei'] #指定默认字体WenQuanYi Micro Hei......
阅读全文