开发者
天翼云开发者社区
共 364 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 37
前往

CV大模型进展的调研报告-下

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

具有选择状态空间的线性时间序列建模Mamba模型在多模态文本视频检索的应用

Mamba模型融合了CNN的并行处理优势和RNN的长期记忆功能,有效改善了Transformer在长序列处理上的不足。与Transformer相比,Mamba更擅长提取视频特征和构建帧间的全局联系。虽然Mamba模型较新,在多模态视频检索领域的应用仍处于初步探索阶段,但将其应用于文本和视频的多模态检索具有显著的科研潜力。本研究基于文本视频检索的大模型CLIP4clip,探索使用Mamba模型替换CLIP模型中的Transformer架构,目的是对输入向量进行更有效的信息建模。这一尝试不仅展示了Mamba模型的实用性,也为未来的研究方向提供了新的视角。

CV大模型进展的调研报告-上

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

云主机安全性再升级:保障企业数据安全新举措

综上所述,云主机的发展规划是一个多维度、全方位的过程。通过技术创新、服务优化、市场拓展、安全保障以及可持续发展等方面的努力,云主机将不断提升自身竞争力,为企业和个人提供更加高效、便捷、安全的计算服务。

云电脑加速迭代,场景多元,引领办公新浪潮

云电脑作为近年来的新兴行业,与云计算、算力、IT技术的发展有着密切关系。总体而言,云电脑由云终端、传输协议与云端资源组成,是一种基于云计算的新型服务。它将传统个人电脑的硬件资源和软件环境迁移到云端,并通过虚拟化技术提供远程访问功能,使用户可以通过互联网连接到云端服务器上运行的虚拟机,从而实现跨平台的随时随地使用。

2024年UI设计的演变:导航空间界面、人工智能挑战和现代拟物主义的复兴

当我们站在2024年设计演变的十字路口上时,设计系统领域正在见证前沿技术和经典设计原则的迷人交互

groundingDINO lora微调和adapter微调

实验分析groundingDINO微调后繁华行降低的问题,以及采用lora微调和adapter微调的实验结果

服务器部署ChatGLM3-6B模型

本文介绍了使用NVIDIA CUDA 11.8版本进行ChatGLM3-6B模型部署的过程

一种FPGA在“云”中的算力调度平台实现方法

现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。

基于半结构化的R-TOSS剪枝框架

《R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning》提出了一种新的半结构化剪枝框架R-TOSS,它克服了最先进的模型剪枝技术的缺点。在JetsonTX2上的实验结果表明,R-TOSS在YOLOv5目标探测器上的压缩率为4.4×,推理时间加速了2.15×,能耗降低了57.01%。R-TOSS还可以在RetinaNet网络上进行2.89×的压缩,推理时间加速了1.86×,能耗降低了56.31%。还展示了与各种最先进的剪枝技术相比的显著改进。

点击加载更多...
共 364 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 37
前往

CV大模型进展的调研报告-下

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

具有选择状态空间的线性时间序列建模Mamba模型在多模态文本视频检索的应用

Mamba模型融合了CNN的并行处理优势和RNN的长期记忆功能,有效改善了Transformer在长序列处理上的不足。与Transformer相比,Mamba更擅长提取视频特征和构建帧间的全局联系。虽然Mamba模型较新,在多模态视频检索领域的应用仍处于初步探索阶段,但将其应用于文本和视频的多模态检索具有显著的科研潜力。本研究基于文本视频检索的大模型CLIP4clip,探索使用Mamba模型替换CLIP模型中的Transformer架构,目的是对输入向量进行更有效的信息建模。这一尝试不仅展示了Mamba模型的实用性,也为未来的研究方向提供了新的视角。

CV大模型进展的调研报告-上

用于视觉识别的视觉语言模型(VLM)能够有效地使用网络数据,并允许零样本预测,而无需特定于任务的微调,在广泛的识别任务中取得了巨大的成功。本报告从VLM的研究背景、研究意义、理论框架、技术方法、商业化大模型和未来的研究方向等几个方面对VLM进行了调研,并将不同的算法进行了比较总结。

云主机安全性再升级:保障企业数据安全新举措

综上所述,云主机的发展规划是一个多维度、全方位的过程。通过技术创新、服务优化、市场拓展、安全保障以及可持续发展等方面的努力,云主机将不断提升自身竞争力,为企业和个人提供更加高效、便捷、安全的计算服务。

云电脑加速迭代,场景多元,引领办公新浪潮

云电脑作为近年来的新兴行业,与云计算、算力、IT技术的发展有着密切关系。总体而言,云电脑由云终端、传输协议与云端资源组成,是一种基于云计算的新型服务。它将传统个人电脑的硬件资源和软件环境迁移到云端,并通过虚拟化技术提供远程访问功能,使用户可以通过互联网连接到云端服务器上运行的虚拟机,从而实现跨平台的随时随地使用。

2024年UI设计的演变:导航空间界面、人工智能挑战和现代拟物主义的复兴

当我们站在2024年设计演变的十字路口上时,设计系统领域正在见证前沿技术和经典设计原则的迷人交互

groundingDINO lora微调和adapter微调

实验分析groundingDINO微调后繁华行降低的问题,以及采用lora微调和adapter微调的实验结果

服务器部署ChatGLM3-6B模型

本文介绍了使用NVIDIA CUDA 11.8版本进行ChatGLM3-6B模型部署的过程

一种FPGA在“云”中的算力调度平台实现方法

现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。

基于半结构化的R-TOSS剪枝框架

《R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning》提出了一种新的半结构化剪枝框架R-TOSS,它克服了最先进的模型剪枝技术的缺点。在JetsonTX2上的实验结果表明,R-TOSS在YOLOv5目标探测器上的压缩率为4.4×,推理时间加速了2.15×,能耗降低了57.01%。R-TOSS还可以在RetinaNet网络上进行2.89×的压缩,推理时间加速了1.86×,能耗降低了56.31%。还展示了与各种最先进的剪枝技术相比的显著改进。

点击加载更多...