配置弹性实例
更新时间 2026-05-11 18:20:23
最近更新时间: 2026-05-11 18:20:23
配置弹性策略
本文介绍agent智能体的弹性策略配置。
在agent智能体调用高峰期间,为了能够快速响应请求,避免因实例冷启动导致的延迟问题,配置实例的弹性策略是一种有效的解决方案。同时,通过配置定时伸缩的弹性预留实例策略,可以提升实例的使用效率,减少资源浪费。
弹性策略预留实例数配置
弹性预留实例策略可以通过以下入口创建:
弹性与实例 - 弹性配置 - +弹性策略
进入弹性预留实例策略配置页面后,操作如图所示。
| 字段 | 功能含义 | 规则限制 |
|---|---|---|
| Endpoint | 指定当前预留实例指向agent智能体的endpoint | 只能选择已经创建好的endpoint |
| 预留实例数 | 需要拉起的预留实例数量 | 正整数 不能超过用户能配置的单函数最大实例数限制 |
| 闲置模式 | 闲置模式下的预留实例,在没有请求达到时,不消耗vCPU(在创建预留实例时开启闲置模式则延迟20s暂停vCPU) | 可选 |
| 定时伸缩 | 根据定时器规则策略,决定预留实例数 | 可选 具体配置规则见下文 |
预留实例定时伸缩策略
预留实例的定时伸缩策略允许以下三种定时触发方式:
指定时间触发
单次触发
自定义cron表达式触发
下面分别介绍这三种定时触发的配置方式
指定时间触发
| 字段 | 功能含义 | 规则限制 |
|---|---|---|
| 预留实例数 | 达到定时触发条件时,预留实例数将调整到设定值 | 正整数 不能超过用户能配置的单函数最大实例数限制 |
| 时区 | 指定配置的时间为选定时区的当地时间 | 时区格式为IANA格式 |
| 指定时间 | 定时触发条件的时间配置 | 指定时/分/秒格式 |
| 指定日期 | 指定该定时触发条件在每月的何日触发 | 可选 指定1号 - 31号,留空代表每日都触发 |
| 指定星期 | 指定该定时触发条件在每周的周几触发 | 可选 指定周一 - 周日,留空代表周几都触发 |
| 生效时间 | 指定该定时触发条件的生效时段 | 可选 |
说明1: 当前定时策略默认周期触发。即:若没有配置生效时间,则认为该定时策略“在上一个时间点已经满足触发条件”,因此会立即拉起配置的预留实例数。
说明2: 若需要配置“到达指定的时间后再触发”的效果,需要配置生效时间来限定该定时策略的触发起始时间点。
单次触发
| 字段 | 功能含义 | 规则限制 |
|---|---|---|
| 预留实例数 | 达到定时触发条件时,预留实例数将调整到设定值 | 正整数 不能超过用户能配置的单函数最大实例数限制 |
| 时区 | 指定配置的时间为选定时区的当地时间 | 时区格式为IANA格式 |
| 触发时间 | 定时触发条件的单次触发时间点 | 指定年/月/日/时/分/秒格式 |
| 生效时间 | 指定该定时触发条件的生效时段 | 可选 |
自定义CRON表达式触发
| 字段 | 功能含义 | 规则限制 |
|---|---|---|
| 预留实例数 | 达到定时触发条件时,预留实例数将调整到设定值 | 正整数 不能超过用户能配置的单函数最大实例数限制 |
| 时区 | 指定配置的时间为选定时区的当地时间 | 时区格式为IANA格式 |
| 定时表达式 | 定时触发条件的CRON表达式 | CRON表达式说明见下文 |
| 生效时间 | 指定该定时触发条件的生效时段 | 可选 |
CRON表达式说明
CRON(Seconds Minutes Hours Day-of-month Month Day-of-week)字段说明如下。
| 字段名 | 取值范围 | 允许的特殊字符 |
|---|---|---|
| 秒(Seconds) | 0~59 | 无 |
| 分(Minutes) | 0~59 | , - * / |
| 时(Hours) | 0~23 | , - * / |
| 天(Day-of-month) | 1~31 | , - * ?/ |
| 月(Month) | 1~12 | , - * / |
| 周(Day-of-week) | 1~7 | , - * ? |
CRON表达式中特殊字符说明如下。
| 字符名 | 定义 | 示例 |
|---|---|---|
| * | 表示每一,任一 | 在Minutes字段中:*表示每分钟的对应秒都执行。 |
| , | 表示列表值 | 在Day-of-week字段中:2,4,5表示星期二、星期四和星期五。 |
| - | 表示一个范围 | 在Hours字段中:1-7表示UTC时间从1点到7点。 |
| ? | 表示不确定的值 | 与其他指定值一起使用。例如,如果用户指定一个特定的日期,但不在乎它是周几,那么在Day-of-week字段中就可以使用。 |
| / | 表示一个值的增加幅度,n/m表示从n开始,每次增加m。 | 在minute字段中:5/5表示从第5分开始,每隔5分钟执行一次。 |
修改或删除弹性策略预留实例配置
预留实例策略列表可以配置不止一个。如需修改或删除弹性策略预留实例配置,可以在弹性策略配置页中找到预留实例策略列表。可以点击对应操作列中的编辑或删除按钮,进行相应的操作。