首页 > 电脑常识 > 人工智能

电脑常识强化学习建模之前必须思考的问题

admin 人工智能 2021-05-25 09:19:50
后台-系统设置-扩展变量-手机广告位-内容正文底部

强化学习是智能体与环境的交互,通过交互信息来感知环境,从而调整自己的行为,选择出最好的结果。
【相当于人做了多次的探索,把最后的劳动成果以状态值函数、动作状态对值函数等方式表达出来。对人学习过程的简单模拟】

需要思考的问题:
研究什么问题,与环境中的什么东西相关?
哪些行为可以影响到环境,是不是可选的动作?
与环境的交互是为了什么?要达成什么目标?对每个状态的奖励如何设置?

分别对应 环境状态、状态下对应的动作、动作与状态转移的关系、对目标的设定及衡量

在目前你考虑的问题中是否对一些情况作了理想化处理?如果不做理想化处理应该选择什么方式来解决这个问题?

【个人理解:强化学习很像自己指定规则来探索环境,根据规则尝试很多次,把最后收敛的结果输出来指导决策】

文章来源:https://www.cnblogs.com/yuyuanliu/p/14780189.html

后台-系统设置-扩展变量-手机广告位-内容正文底部
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:https://www.jcdi.cn/rengongzhineng/30565.html

留言与评论(共有 0 条评论)
   
验证码:
后台-系统设置-扩展变量-手机广告位-评论底部广告位

教程弟

https://www.jcdi.cn/

统计代码 | 京ICP1234567-2号

Powered By 教程弟 教程弟

使用手机软件扫描微信二维码