开发者
天翼云开发者社区
关键词:

CV大模型进展的调研报告-下

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

CV大模型进展的调研报告-上

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

基于半结构化的R-TOSS剪枝框架

《R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning》提出了一种新的半结构化剪枝框架R-TOSS,它克服了最先进的模型剪枝技术的缺点。在JetsonTX2上的实验结果表明,R-TOSS在YOLOv5目标探测器上的压缩率为4.4×,推理时间加速了2.15×,能耗降低了57.01%。R-TOSS还可以在RetinaNet网络上进行2.89×的压缩,推理时间加速了1.86×,能耗降低了56.31%。还展示了与各种最先进的剪枝技术相比的显著改进。

深度学习模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyB

本文主要介绍关于深度学习中的几种模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT。首先介绍模型压缩原理、方法分类,然后重点介绍模型蒸馏中的四类算法。

共 4 条
  • 1
前往
没有更多了

天翼云科技有限公司

暂未填写个人简介

暂未填写技能专长

暂未填写毕业院校和专业

共发表过 4 篇文章

文章获得 6 次赞同

文章被浏览 84 次

获得 0 人关注

暂未获得荣誉

共发表过 4 篇文章
文章获得 6 次赞同
获得 0 人关注
文章被浏览 84 次
全部文章(0)
关键词:

CV大模型进展的调研报告-下

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

CV大模型进展的调研报告-上

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

基于半结构化的R-TOSS剪枝框架

《R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning》提出了一种新的半结构化剪枝框架R-TOSS,它克服了最先进的模型剪枝技术的缺点。在JetsonTX2上的实验结果表明,R-TOSS在YOLOv5目标探测器上的压缩率为4.4×,推理时间加速了2.15×,能耗降低了57.01%。R-TOSS还可以在RetinaNet网络上进行2.89×的压缩,推理时间加速了1.86×,能耗降低了56.31%。还展示了与各种最先进的剪枝技术相比的显著改进。

深度学习模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyB

本文主要介绍关于深度学习中的几种模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT。首先介绍模型压缩原理、方法分类,然后重点介绍模型蒸馏中的四类算法。

共 4 条
  • 1
前往
没有更多了