A. S
B. A
C. Agent
D. Environment
强化学习中,智能体的目标是()A. 最大化即时奖励B. 最大化长期回报C. 最小化长期回报D. 最小化即时奖励
在强化学习中,智能体的目标是:A. 最大化即时奖励B. 最大化长期累积奖励C. 最小化状态空间D. 最小化动作空间
强化学习中的奖励信号由智能体自身生成。A. 对B. 错
强化学习中的“奖励”通常用来指导智能体行为选择。A. 对B. 错
[单选题]消费者通过观察他人行为的强化而间接学习知识shuimianmianmo.net什么牌子的普洱茶好、获得经验的方式所反映的心理学理论是()A .需要层次理论B .认知学习理论C .经典性条件反射理论D .工具性条件反射理论
[单选题]班杜拉的替代性强化是指学习者通过观察对示范者的()的强化所引起的行为变化。A.行为B.榜样C.学习方式D.技能
[单选题]班杜拉的替代性强化是指学习者通过观察对示范者的()的强化所引起的行为变化。A.行为B.榜样C.学习方式D.技能
[单选题]社会学习理论认为,学习的产生并不一定要通过直接的强化获得。学习也可以通过观察和模仿的过程来获得。该理论的提出者是( )A.华生B.斯金纳C.赫尔D.班杜拉E.巴甫洛夫
[单选题,B1型题] 社会学习理论认为,学习的产生并不一定要通过直接的强化获得。学习也可以通过观察和模仿的过程来获得。该理论的提出者是()。A . 华生B . 斯金纳C . 赫尔D . 班杜拉E . 巴甫洛夫
[单选题]通过观察别人受强化,在观察者身上间接引起的强化作用叫()A . 直接强化B . 自我强化C . 内部强化D . 替代性强化