背景:大模型(LLM)和生成式 AI 技术迅猛发展,从普通的开发者到各行各业的企业纷将 AI 功能融入应用, AI调用需求激增,大模型爆发导致 API 调用量指数增长,AI 时代下诞生了一些场景化的问题,阿里、cloudflare、网宿等厂商均推出 AI 网关产品。
产品定义:CDN产品体系下独立产品,复用CDN资源进行模型统一接入,集成多家LLM服务商,具备模型统一接口,流量智能路由,监控告警,故障重试与降级服务,日志与审计,提示词修饰,语义缓存等功能。

AI网关功能规划
- 统一模型接口
-
- 身份统一:一个账号,是您操作全域模型的唯一凭证。
- 访问统一:一把API密钥,享有调度所有模型服务的最高权限。
- 规范统一:原生兼容业界主流协议,确保您的代码与业务无缝继承。
- 全景监控,保障业务连续性
- 统一监控看板:实时洞察所有模型的健康状态、性能指标与调用数据。
- 智能预警机制:基于性能阈值设定,即时发现服务异常,防患于未然。
- 深度性能分析:定位延迟与错误根源,为系统优化提供数据支撑。
- 精细化成本管控
- 通过智能路由算法与多模型资源池,自动选择最优性价比方案
- 结合集中采购的规模效应,实现成本结构的根本性优化