强化学习(Reinforcement Learning,RL ),又称再励学习、评价学习或增强学习,是机器学习的范式-|||-和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大-|||-化或实现特定目标的问题。()-|||-A.对-|||-B.错

参考答案与解析:

相关试题

在强化学习中,智能体的目标是:

在强化学习中,智能体的目标是:A. 最大化即时奖励B. 最大化长期累积奖励C. 最小化状态空间D. 最小化动作空间

  • 查看答案
  • 强化学习中,智能体的目标是()

    强化学习中,智能体的目标是()A. 最大化即时奖励B. 最大化长期回报C. 最小化长期回报D. 最小化即时奖励

  • 查看答案
  • 哪一个是机器学习中“半监督学习”范式的正确描述?

    哪一个是机器学习中“半监督学习”范式的正确描述?A. 旨在从一个、或仅有的几个训练样本中学习一些信息。B. 旨在采用有限数量的训练样本来学习一些信息。C. 属于

  • 查看答案
  • 哪一个是机器学习中“一次性学习”范式的正确描述?

    哪一个是机器学习中“一次性学习”范式的正确描述?A. 旨在从一个、或仅有的几个训练样本中学习一些信息。B. 旨在采用有限数量的训练样本来学习一些信息。C. 属于

  • 查看答案
  • 强化学习与监督学习的区别是 ()

    强化学习与监督学习的区别是 ()强化学习与监督学习的区别是 ()。A. 学习依据是奖励和惩罚B. 反馈有延时性C. 更适合于行为智能的学习D. 有教师指导

  • 查看答案
  • 化学学习的学习观和学习方法是()。

    [单选题]化学学习的学习观和学习方法是()。A . 以实验为基础B . 在分子和超分子的微观层次上研究物质C . 化学知识再生产过程D . 由简到繁、不断深化、螺旋式上升

  • 查看答案
  • 化学学习的学习观和学习方法是()。

    [单选题]化学学习的学习观和学习方法是()。A.以实验为基础B.在分子和超分子的微观层次上研究物质C.化学知识再生产过程D.由简到繁,不断深化。螺旋式上升

  • 查看答案
  • 强化学习中的奖励信号由智能体自身生成。

    强化学习中的奖励信号由智能体自身生成。A. 对B. 错

  • 查看答案
  • 下面对强化学习,监督学习和深度卷积神经网络学习的描述正确的是()

    下面对强化学习,监督学习和深度卷积神经网络学习的描述正确的是()A. 无标注学习,有标注信息学习方式,端到端学习方式B. 评估学习方式,有标注信息学习方式,端到

  • 查看答案
  • 哪一个是机器学习中'有监督学习'范式的正确描述

    哪一个是机器学习中有监督学习范式的正确描述A. 旨在从一个,或仅有的几个训练样本中学习一些信息。B. 旨在采用有限数量的训练样本来学习一些信息。C. 属于有监督

  • 查看答案