什么是加强学习
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方**之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的常见模型是标准的马尔可夫决策过程(Markov Decision Process, MDP)。
按给定条件,强化学习可分为基于模式的强化学习(model-based RL)和无模式强化学习(model-free RL),以及主动强化学习(active RL)和被动强化学习(passive RL)。
强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数(value function)算法两类。
深度学习模型可以在强化学习中得到使用,形成深度强化学习。强化学习理论受到行为主义心理学启发,侧重在线学习并试图在探索-利用(exploration-exploitation)间保持平衡。
不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。强化学习问题在信息论、博弈论、自动控制等领域有得到讨论,被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能,可以在围棋和电子游戏中达到人类水平。
其他文章
- 张国荣感情语录
- 乌当中学怎么样
- 黄家驹的AMANI是什么意思
- yu是声母韵母还是整体认读
- 什么是农业示范园
- 嘉睿的意思 佳睿的意思 晟睿的意思
- 雄姿英发是什么意思
- 怎么仿写诗歌
- 短时评怎么写
- 厕所里的搞笑诗
- 陌上初熏 是什么意思
- 什么叫戏歌
- 成语成语什么化雨
- 青岛大学胶州校区介绍
- or的中文是什么意思
- 关于童年的诗
- Hanson或Hansen做英文名怎样
- 引吭高歌读音
- 饺子的来历和由来
- 相的组词有哪些词语
- 乌衣巷的解释
- 用 勤 组成的词语有哪些
- 阜阳市城郊中学怎么样
- 去海边穿什么鞋儿童
- 十九繁体
- 硫酸雾化学式
- 你们知道味字可以组什么词吗
- 美人鱼怎么画
- 艾子教孙 文言文翻译
- 黑龙江财经大学怎么样