智能体与其环境进行交互以获取状态信息,并在每个时间步长从动作集合中选择一个动作,然后接收当前时间步长的奖励、环境进入下个状态,该类学习方法为()。(难度:★)

发布于 2021-04-23 13:38:08
【单选题】
A 强化学习
B 集成学习
C 回归算法
D 个体学习

查看更多

关注者
0
被浏览
58
  • 体验AI问答!更聪明、超智能!
  • 一款基于GPT的超级AI助手,可以对话、创作、写文案!
1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

手机
浏览

扫码手机浏览

分享
好友

在线
客服