状态动作函数直接决定主体该采取什么决策。
第1题:
Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。
第2题:
()表示当过程处于某阶段的某个确定状态时,可以作出的选择或决定
第3题:
动态规划中,决策变量是状态变量的函数。
第4题:
状态转移方程为状态变量和决策变量的函数关系。
第5题:
操作顺序图表示何种作业顺序组成()。
第6题:
决策和决定的区别不包括()
第7题:
下列叙述中不具状态函数特征的是:()
第8题:
状态
决策
状态转移
指标函数
第9题:
期望值
最大值
最小值
总和
第10题:
状态
决策
状态转移
指标函数
第11题:
客观环境的可能状态集
决策者的可行行动集
表示决策行动结果的收益函数或损失函数
决策的目标
第12题:
第13题:
在Q-Learning中,所谓的Q函数是指()。
第14题:
什么是状态函数?
第15题:
当体系的状态被改变时,状态函数的变化只决定于(),而与()无关
第16题:
统计决策的要素不包括()
第17题:
决策和决定的区别是()。
第18题:
当动作监听器激发时,会调用什么函数?()
第19题:
第20题:
状态动作函数
状态值函数
动作值函数
策略函数
第21题:
对
错
第22题:
对
错
第23题:
决策是一个过程
决定是一个动作
决定包含决策
决策的过程中包括决定