A. 基于策略的算法
B. 基于价值的算法
C. 基于模型的算法
D. 基于模拟的算法
[单选题]汉字、英语单词的学习属于知识学习的哪种类型()A.符号学习B.概念学习C.命题学习D.规则学习
以下哪种机器学习算法属于无监督学习算法()。A. 决策树B. 支持向量机C. k-k均值聚类D. 逻辑回归
在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A. 动态规划B. Bellman方程C. 贪心策略D. 蒙特卡洛采样
在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A. 蒙特卡洛采样B. Bellman方程C. 贪心策略D. 动态规划
在强化学习中,智能体的目标是:A. 最大化即时奖励B. 最大化长期累积奖励C. 最小化状态空间D. 最小化动作空间
强化学习的学习依据是什么()A. 基于评价B. 基于监督信息C. 基于对数据结构的假设D. 基于人工反馈
强化学习的学习依据是什么()A. 基于监督信息B. 基于对数据结构的假设C. 基于评价D. 基于人工反馈
以下哪种算法不属于监督学习算法A. 隐马尔科夫链B. 支持向量机C. 聚类D. 决策树
[单选题]音频比较适合与哪种类型学习风格的学习者?()A . 视觉和活跃B . 沉思和综合C . 感觉与直觉D . 言语和序列
[单选题]运用人的多种感官参与学习的“强化学习”是()的强化。A . 形式B . 内容C . 过程D . 结果