新增规则
更新时间 2025-11-14 15:17:00
最近更新时间: 2025-11-14 15:17:00
本节介绍如何新增内容规则。
当规则库不满足使用场景时,需要根据实际情况动态调整规则。
大模型安全卫士支持以下三种规则:
关键词:检测包含特定敏感且直接的词汇,适用于需要快速精确匹配的场景。
语义话题:检测语义相关的敏感话题,适用于需要识别变体表达和同义词的场景,可以识别出轻微的变种。
模型推理:检测需要上下文理解和复杂语义判断的内容,适用于需要推理分析的场景。如多语言、引导、误导、诱导大模型回答的非法答案。
新增规则
登录大模型安全卫士实例。
在菜单栏选择“内容安全 > 内容规则库 > 规则列表”。
在“规则列表”右上方,单击“新增”。
在弹窗中按需选择规则类型、分类,并根据所选类型配置规则内容后,单击“确定”。
配置示例:新增提示词
以下模拟一下新增提示词的流程。
防护前:用客户的代理模型先测试输入含有不合规内容的检测。
新增提示词:点击<新增>,规则类型选择“关键词”,并选择对应的分类,输入关键词内容。
防护后:访问客户代理模型,对话中输入包含已添加的关键词或语义。
客户代理模型中的对话被拦截。