模型适配与性能加速 平台通过多种算子迁移适配、算子调优能力和工具链,实现国产化硬件下模型在预训练、微调、推理下的性能对齐NV80%及以上。 平台针对国产化硬件910B进行主流模型的迁移适配和性能优化,多数训练性能达到A800的90%及以上,推理性能达到A10或A100的80%及以上。 目前模型广场所有模型均达到国产化适配的性能标准。 主流模型适配结果示例: 多数模型基于昇腾的训练可达A800的90%以上,举例如下: Llama38Binstruct、ChatGLM36B 性能对标可达90% Qwen272BInstruct 性能对标可达100% 部分模型基于昇腾910B的推理可达A800的80%以上,举例如下: Qwen1.8BChat 性能对标可达110.32% Llama213BChat 性能对标可达91.28% 主流适配模型清单参考如下: 大语言: DeepSeek:DeepSeekR1系列、DeepSeekV3系列 Llama:Llama系列、Llama2系列、Llama3系列 通义千问:Qwen系列、Qwen1.5系列、Qwen2系列、Qwen2.5系列、Qwen3系列 智谱:ChatGLM2系列、ChatGLM3、GLM4系列 书生浦语:InternLM系列、InternLM2系列 百川:Baichuan系列、Baichuan2系列、BaichuanTurbo 电信星辰:TeleChat系列、TeleChat2系列 其他:AquilaChat7B、Gemma29BChat等 多模态: OpenClip ChineseCliP Blip2 VisualGLM6B StableDiffusionV1.5 StableDiffusionV2.1 QwenVLChat InternVLChatV1.5