DeepSeek的“模型压缩”常用技术是?

A. 增加模型层数

B. 使用更高精度浮点数

C. 完全重新训练小模型

D. 知识蒸馏与参数剪枝

参考答案与解析:

相关试题

5.判断题Deepseek RI中采用了蒸馏技术,将大模型推理解能力蒸馏到小模型。

5.判断题Deepseek RI中采用了蒸馏技术,将大模型推理解能力蒸馏到小模型。A. 对B. 错

  • 查看答案
  • DeepSeek的“基础模型(V3)”适用于哪种任务?(单选题)

    DeepSeek的“基础模型(V3)”适用于哪种任务?(单选题)A. 复杂数学推理B. 规范性任务(如会议纪要)C. 医疗诊断D. 创意写作

  • 查看答案
  • 压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。

    [单选题]压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。A.应用层B.表示层C.会话层D.运输层

  • 查看答案
  • 压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。

    [单选题]压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。A.应用层B.表示层C.会话层D.运输层

  • 查看答案
  • 压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。

    [单选题]压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。A.应用层B.表示层C.会话层D.运输层

  • 查看答案
  • 压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。

    [单选题]压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。A.应用层B.表示层C.会话层D.运输层

  • 查看答案
  • 压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。

    [单选题]压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。A.应用层B.表示层C.会话层D.运输层

  • 查看答案
  • 压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。

    [单选题]压缩通常用于提高网络速度。下列OSI模型的( )负责数据的压缩和解压缩。A.应用层B.表示层C.会话层D.运输层

  • 查看答案
  • 目前常用的风险价值模型技术有(  )。

    [多选题]目前常用的风险价值模型技术有(  )。A.蒙特卡洛模拟法B.最小二乘法C.方差—协方差法D.历史模拟法E.敏感性分析法

  • 查看答案
  • ChatGPT或DeepSeek的本质是?

    ChatGPT或DeepSeek的本质是?A. 简单函数模型B. 具备大规模参数的函数表达式C. 传统规则引擎D. 单一模态处理工具

  • 查看答案