您的位置: 首页 >> 农业技术 >> 信息技术 >> 详细内容
深度学习——强化学习
日期:2019年12月29日
作者:牛曼丽

强化学习是机器学习的一个重要分支,主要用来解决连续决策的问题,可以在复杂的、不确定的环境中学习如何实现我们设定的目标。

强化学习主要由智能体(Agent)、环境(Environment)、状态(State)、动作(Action)、奖励(Reward)组成。智能体执行了某个动作后,环境将会转换到一个新的状态,对于该新的状态环境会给出奖励信号(正奖励或者负奖励)。随后,智能体根据新的状态和环境反馈的奖励,按照一定的策略执行新的动作。上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。强化学习就是不断地根据环境的反馈信息进行试错学习,进而调整优化自身的状态信息,其目的是为了找到最优策略、或者找到最大奖励的过程。

强化学习的应用场景非常广,几乎包括了所有需要做一系列决策的问题,如控制机器人,自动化及自动驾驶等。

工厂化生产技术科 提供