searchusermenu
  • 发布文章
  • 消息中心
模型轻量化
2 文章45 阅读1 订阅
全部 AI 2
模型轻量化
2 文章45 阅读1 订阅
全部
  • 《R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning》提出了一种新的半结构化剪枝框架R-TOSS,它克服了最先进的模型剪枝技术的缺点。在JetsonTX2上的实验结果表明,R-TOSS在YOLOv5目标探测器上的压缩率为4.4×,推理时间加速了2.15×,能耗降低了57.01%。R-TOSS还可以在RetinaNet网络上进行2.89×的压缩,推理时间加速了1.86×,能耗降低了56.31%。还展示了与各种最先进的剪枝技术相比的显著改进。
    pandame
    2024-03-14
    31
    2
  • 本文主要介绍关于深度学习中的几种模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT。首先介绍模型压缩原理、方法分类,然后重点介绍模型蒸馏中的四类算法。
    pandame
    2023-10-26
    14
    0
全部
  • 《R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning》提出了一种新的半结构化剪枝框架R-TOSS,它克服了最先进的模型剪枝技术的缺点。在JetsonTX2上的实验结果表明,R-TOSS在YOLOv5目标探测器上的压缩率为4.4×,推理时间加速了2.15×,能耗降低了57.01%。R-TOSS还可以在RetinaNet网络上进行2.89×的压缩,推理时间加速了1.86×,能耗降低了56.31%。还展示了与各种最先进的剪枝技术相比的显著改进。
  • 本文主要介绍关于深度学习中的几种模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT。首先介绍模型压缩原理、方法分类,然后重点介绍模型蒸馏中的四类算法。
  • 没有更多了