风险类型说明
更新时间 2026-04-29 10:25:50
最近更新时间: 2026-04-29 10:25:50
文本输入检测、文本输出检测、图片检测所支持的风险类型如下:
| 风险类型(中文) | 英文编码 | 说明 |
|---|---|---|
| 政治敏感 | Political Sensitivity | 涉及政治敏感的表述与内容 |
| 宣扬暴力 | Violence | 涉及暴力、恐怖主义等危险内容 |
| 宣扬淫秽色情 | Pornography | 色情、低俗等不适宜内容 |
| 违反社会主义核心价值观 | Value Violation | 违背社会主义核心价值观的不良信息 |
| 歧视性内容 | Discrimination | 涉及种族、宗教、性别等歧视性表述 |
| 商业违法违规 | Business Misconduct | 欺诈、虚假广告、违法营销等内容 |
| 侵犯他人合法权益 | Rights Infringement | 涉及隐私权、名誉权等侵权内容 |
| 危险行为 | Dangerous Behaviors | 涉及危险行为引导相关内容 |
| 提示注入攻击 | Prompt Injection | 通过构造特殊指令试图绕过大模型安全限制或篡改模型行为 |
| 黑名单 | Blacklist | 命中用户自定义黑名单词库中的词条 |
说明
图片检测不支持识别“提示注入攻击”和“黑名单”类型,其余风险类型均适用。