风险类型说明-智算安全专区-用户指南-大模型安全护栏 - 天翼云

文档中心

智算安全专区

智算安全专区

无相关产品

风险类型说明

更新时间 2026-04-29 10:25:50

最近更新时间: 2026-04-29 10:25:50

文本输入检测、文本输出检测、图片检测所支持的风险类型如下：

风险类型（中文）	英文编码	说明
政治敏感	Political Sensitivity	涉及政治敏感的表述与内容
宣扬暴力	Violence	涉及暴力、恐怖主义等危险内容
宣扬淫秽色情	Pornography	色情、低俗等不适宜内容
违反社会主义核心价值观	Value Violation	违背社会主义核心价值观的不良信息
歧视性内容	Discrimination	涉及种族、宗教、性别等歧视性表述
商业违法违规	Business Misconduct	欺诈、虚假广告、违法营销等内容
侵犯他人合法权益	Rights Infringement	涉及隐私权、名誉权等侵权内容
危险行为	Dangerous Behaviors	涉及危险行为引导相关内容
提示注入攻击	Prompt Injection	通过构造特殊指令试图绕过大模型安全限制或篡改模型行为
黑名单	Blacklist	命中用户自定义黑名单词库中的词条

说明

图片检测不支持识别“提示注入攻击”和“黑名单”类型，其余风险类型均适用。

©2026天翼云科技有限公司版权所有

京ICP备 2021034386号

京公网安备11010802043424号

增值电信业务经营许可证A2.B1.B2-20090001