A. 每次更新参数使用全部样本
B. 每次更新参数使用单个样本
C. 每次更新参数使用部分样本
D. 不依赖样本直接计算
小批量随机梯度下降的优点是()A. 平均损失小B. 计算开销大C. 学习率高D. 并行计算能力
梯度下降法的核心是什么?A. 测量所在位置最陡峭的方向,即偏导数(梯度)B. 频繁测量下降方向C. 测量下降所需时间D. 找到一个合适的测量方向的频率,即学习的
最速下降法和共轭梯度法不能用于求函数极值问题。A. 正确B. 错误
以下关于梯度下降和随机梯度下降的说明,哪些描述是正确的()A. 梯度下降是遗传算法的一种参数优化算法B. 在每次迭代中,随机梯度下降需要计算训练集所有样本的误差
以下关于梯度下降和随机梯度下降的说明,哪些描述是正确的()A. 在每次迭代中,随机梯度下降需要计算训练集所有样本的误差和,用于更新模型参数;B. 梯度下降是遗传
以下关于梯度下降和随机梯度下降的说明,哪些描述是正确的()。A. 梯度下降是遗传算法的一种参数优化算法B. 在每次迭代中,随机梯度下降需要计算训练集所有样本的误
[判断题] 与JIT配合的订货批量是小批量供货。A . 正确B . 错误
[判断题] 冲压的制造一般是单件小批量,因此冲压件也是小批量生产。()A . 正确B . 错误
下列哪项不属于梯度下降算法。()A. 反向传播算法B. 随机梯度下降算法C. 小批量梯度下降算法D. 批量梯度下降算法