Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的回报()。(难度:★★)

发布于 2021-04-23 14:00:19
【单选题】
A 总和
B 最大值
C 最小值
D 期望值

查看更多

关注者
0
被浏览
84
  • 体验AI问答!更聪明、超智能!
  • 一款基于GPT的超级AI助手,可以对话、创作、写文案!
1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

手机
浏览

扫码手机浏览

分享
好友

在线
客服