新增规则 本节介绍如何新增内容规则。 当规则库不满足使用场景时,需要根据实际情况动态调整规则。 大模型安全卫士支持以下三种规则: 关键词:检测包含特定敏感且直接的词汇,适用于需要快速精确匹配的场景。 语义话题:检测语义相关的敏感话题,适用于需要识别变体表达和同义词的场景,可以识别出轻微的变种。 模型推理:检测需要上下文理解和复杂语义判断的内容,适用于需要推理分析的场景。如多语言、引导、误导、诱导大模型回答的非法答案。 新增规则 1. 登录大模型安全卫士实例。 2. 在菜单栏选择“内容安全 > 内容规则库 > 规则列表”。 3. 在“规则列表”右上方,单击“新增”。 4. 在弹窗中按需选择规则类型、分类,并根据所选类型配置规则内容后,单击“确定”。 配置示例:新增提示词 以下模拟一下新增提示词的流程。 防护前:用客户的代理模型先测试输入含有不合规内容的检测。 新增提示词:点击 ,规则类型选择“关键词”,并选择对应的分类,输入关键词内容。 防护后:访问客户代理模型,对话中输入包含已添加的关键词或语义。 客户代理模型中的对话被拦截。
来自: