在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。A、探索;开发B、开发;探索C、探索;输出D、开发;输出

题目

在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

  • A、探索;开发
  • B、开发;探索
  • C、探索;输出
  • D、开发;输出
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

现代系统论以整体性、模型化和___三种原则来探索系统的现象。

A、最优化

B、个别化

C、普遍化

D、直观化


参考答案:A

第2题:

强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。

  • A、探索
  • B、开发
  • C、输入
  • D、输出

正确答案:A

第3题:

简述输出式开发采取的办法。


参考答案:

1.组织被改造人员复苏心灵演唱团或汇报组,走出监所,进入社会,进行演出、汇报,或者组织他们外出参观和开展社会服务活动。
2.实行归假制度。
3.实行“三试”使帮教改造工作社会化。


第4题:

根据游戏动作的不同性质,可以把游戏动作分为探索、象征和嬉戏三种。


正确答案:正确

第5题:

“与客户共同探索需求和期望”是属于以客户为中心的物流战略开发中的()战略。

  • A、评价当前的服务和服务能力
  • B、理解客户需求
  • C、在客户要求的基础上创造服务
  • D、评估与跟踪执行和改进

正确答案:B

第6题:

在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

  • A、大;小
  • B、大;大
  • C、小;小
  • D、小;大

正确答案:A

第7题:

婴儿在婴儿床上伸手碰触床顶上的响铃时发出声音,他会不断地碰触响铃,说明婴儿()。

  • A、开始出现某一目的高行驶动作
  • B、客体永久性的出现
  • C、开始不同动作的探索
  • D、预先构想的探索出现

正确答案:A

第8题:

儿童在游戏中的动作包括:()。

A.探索动作

B.剪贴动作

C.象征动作

D.嬉戏动作


正确答案:ACD

第9题:

儿童在游戏中的动作包括()

  • A、探索动作
  • B、剪贴动作
  • C、象征动作
  • D、嬉戏动作

正确答案:A,C,D

第10题:

探索动作是指故意做“坏事”或用某种动作来取乐,带有幽默、逗乐、玩笑的性质。


正确答案:错误

更多相关问题