基于昇腾通用推理镜像的自定义部署BGE模型 1. 在我的模型列表中找到对应的模型点击部署 2. 选择对应版本,点击确定 3. 选择对应的自定义镜像,和对应的代码包 4. 配置环境变量 plaintext MODELPATH/work/mount/model 改地址于模型的挂载地址是同一地址 5. 配置运行命令,指定端口:8899 plaintext rm rf /app/;cp r 代码包挂载地址/app/ /app;cd /app;python teleservice.py 6. 选择资源类型:标准型,点击开始部署 7.服务授权,未授权可以先去创建服务授权后再选择 8.查看部署状态 9. 调用验证bge模型(需要用到服务授权的) plaintext curl location ' header 'ContentType: application/json' header 'Authorization: Bearer 服务授权的appkey' data '{ "input": ["embedding 内容"], "model": "bge模型id", "encodingformat": "float" }' 四、总结 昇腾通用推理镜像的自定义部署最佳实践,是一套融合了模型准备与部署流程规范的综合性解决方案。未来,随着 AI 平台生态的持续完善与推理场景的不断丰富,自定义部署的最佳实践还将进一步迭代,实现更智能、更高效的推理部署体系,为企业 AI 规模化应用注入更强动力。