基于Serverless集群快速部署FastChat应用
更新时间 2025-05-27 17:18:35
最近更新时间: 2025-05-27 17:18:35
本文介绍如何基于Serverless集群快速部署FastChat应用。
在这篇文章中,我们将介绍如何在Serverless集群上快速部署FastChat应用。您可以选择使用控制台或kubectl来完成应用部署,随后即可通过外部端点访问FastChat。
前提条件
已开通Serverless集群,并且能通过公网访问集群。
背景信息
Serverless集群兼容原生Kubernetes语义和API,您可以在Serverless集群中轻松创建Deployment、StatefulSet、Service、Ingress、PersistentVolume、ConfigMap或CRD等资源。此外,您也可以使用Helm部部署和管理复杂的Kubernetes应用程序的生命周期。
FastChat介绍
FastChat是一个用于训练、部署和评估基于大型语言模型的聊天机器人的开放平台。其核心功能包括:最先进模型的权重、训练代码和评估代码(例如Vicuna、FastChat-T5);基于分布式多模型的服务系统,具有Web界面和与OpenAI兼容的RESTful API。
注意
天翼云不对第三方模型“FastChat”的合法性、安全性、准确性进行任何保证,天翼云不对由此引发的任何损害承担责任。
您应自觉遵守第三方模型“FastChat”的用户协议、使用规范和相关法律法规,并就使用第三方模型的合法性、合规性自行承担相关责任。
操作步骤
创建FastChat应用
您可以通过控制台部署FastChat应用,也可以通过kubectl工具连接Serverless集群来创建FastChat应用。
- 登录管理控制台,在左侧菜单栏选择“集群”。
- 在集群列表页面,选择目标集群名称,然后在左侧菜单栏,选择“工作负载 ”下的“无状态”,选择“创建Deployment”。
- 在创建Deployment页面,填写负载类型、负载名称、命名空间、实例数量等。
- 在容器配置的基本信息中填写容器名称、镜像、镜像版本、CPU/内存配额限制等。
注意FastChat镜像要提前上传到容器镜像服务的镜像仓库中,点击选择镜像选择FastChat镜像即可。
- 在容器配置的生命周期中点击“启动命令”,添加启动执行命令。
- 在容器配置的健康检查中点击“就绪探针”并开启,按需进行相应配置。
- 在访问设置项,点击“开启Service”,设置服务相关参数,通过该服务公开FastChat应用。
注意需要提前手工创建ELB。
- 点击“提交”,返回到如下页面表示创建成功,等待Deployment的副本Pod运行起来即可。
访问服务
- 登录管理控制台,在左侧菜单栏选择“集群”。
- 在集群列表页面,选择目标集群名称,然后在左侧菜单栏,选择“网络”下的服务“服务”。
- 在访问方式看到可以通过集群内访问或者集群外访问。