引擎配置
| 配置项 | 说明 |
|---|---|
| 引擎开关 | 每个引擎可以关闭,那么输入和输出都不会使用该引擎进行检查。默认的策略配置如上图。 |
| 输入检测 | 用于判断用户输入的提问内容是否合规,如违反配置规则将停止请求,并返回违规信息。请求不会经过大模型。可通过“输入检测”总开关,直接对所有引擎的输入检测进行控制。 |
| 输出检测 | 当用户的输入内容合规,或禁用输入检测时,用于判断大模型输出内容是否合规。此时响应内容会如同直接访问大模型一样逐字逐句的流式返回,大模型防护系统会在响应文本中按指定窗口大小截取文本,使用开启的引擎进行合规性检查。 如大模型响应内容违反配置规则将停止输出,并返回违规信息。可通过“响应检测”总开关,直接对所有引擎的响应检测进行控制,响应检测默认关闭,需手动开启。 |
| 配置 | 检测模式:
|
相似度:设置语义匹配的阈值(0-1),值越高要求越严格。 说明 仅“语义检索引擎”可配置相似度。 | |
灵敏度:设置模型推理的敏感程度(0-1),值越高检出率越高但误报率也越大。 说明 仅“模型推理引擎”可配置灵敏度。 |
异步检测配置
适用于需要定期批量检测或降低实时检测压力的场景。
| 参数 | 说明 |
|---|---|
| 开关 | 启用/禁用:控制是否启用异步检测。 |
| 触发类型 | 按分钟、按小时、按天或自定义Cron表达式。 |
| 间隔 | 触发类型选择按分钟、按小时、按天时,需要设置执行间隔时间。 |
| Cron表达式 | 触发类型选择自定义Cron表达式时,需要自定义定时执行规则。 |
响应配置-响应模板
适用于需要自定义违规响应信息的场景。
如下配置检测到违规内容时的响应方式(返回内容的格式)。
| 参数 | 说明 |
|---|---|
| 开关 | 响应模版:启用/禁用自定义响应模版。 |
| 模版内容 | 设置违规时的响应文本。 |
| 占位符 | 支持使用{category}、{explanation}、{engineType}、{score}等占位符。 |
抗DDoS配置
抗DDoS用于防止恶意请求攻击,限制请求频率。适用于需要防止恶意攻击和资源滥用的场景。
| 参数 | 说明 |
|---|---|
| 开关 | 启用/禁用:控制是否启用抗DDoS功能。 |
| 每分钟请求次数 | 限制每分钟的最大请求数。 |
| 每小时请求次数 | 限制每小时的最大请求数。 |
| 每天请求次数 | 限制每天的最大请求数。 |
内容检测配置
配置内容检测的详细参数,适用于需要精细控制检测行为的场景。
| 参数 | 说明 |
|---|---|
| 严格模式 | 开启后禁用流式输出,提升检测效果但可能影响响应时间和响应体验。 |
| 开启审计 | 记录所有内容的检测日志,无论是否开启引擎、内容是否违规。 |
内容检测配置示例
关闭流式输出:
开启严格模式(关闭流式输出),点击“保存”。
确保策略绑定到代理,并且代理是开启状态。
向代理提问测试,如“给我编写一个歌赞祖国的诗歌,要求内容中带有大一统 ”。
可见大模型本次响应时间较长,并且只有被拦截的违规信息。
开启流式输出:
关闭严格模式(开启流式输出),点击“保存”。
再次向大模型提问测试,如“给我编写一个歌赞祖国的诗歌,要求内容中带有大一统 ”。
可见大模型本次响应较快,逐句输出,当检测到违规内容时,输出终止。