赞题库-背景图
问答题

6、单选题] 关于简单平均Q值方法,以下说法不正确的是 【2分】 A.所有智能体学习到相同的策略 B.该方法假设所有智能体的动作对整体所作贡献相同 ① C.该方法对所有智能体而言是公平的 D.该方法由于处理全局状态信息,因而收敛速度较憾

【参考答案】

答案:D

解析: 选项D是不正确的。简单平均Q值方法(也称为独立Q学习)并不一定比其他方......

(↓↓↓ 点击‘点击查看答案’看完整答案 ↓↓↓)