配置关键字
关键字分为简单关键字和关键字对。其中简单关键字可以是一个语句或者多个语句,多个语句之间为或的关系;而关键字对,则是检测指定间隔长度内是否同时存在某两个关键字。
登录大模型安全卫士实例。
在菜单栏选择“内容安全 > 语料安全 > 检测因子”,选择“关键词”页签。
点击“新增”。
完成内容的填写,点击“确定”完成新增操作。
部分参数如下表所示:
信息 说明 名称 关键字规则名称。 备注 关键字规则注解说明。 类别 关键字分为简单关键字和关键字对:
简单关键字可以是一个语句或者多个语句,多个语句之间为或的关系。
关键字对,则是检测指定间隔长度内是否同时存在某两个关键字。
简单关键字 仅类别为简单关键字。
多个关键字之间用“|”隔开,例如:规划|制度。
关键字对 适用于两个关键字存在额外字符。
支持配置间隔字符数量(0-500)
配置正则表达式
系统内置了MAC地址、日期、时间、中国姓名、身份证号等常见的格式化数据的正则表达式检测因子,同时也支持手动新增正则表达式检测因子。
内置规则无法删除与编辑。
登录大模型安全卫士实例。
在菜单栏选择“内容安全 > 语料安全 > 检测因子”,选择“正则表达式”页签。
点击“新增”。
完成内容的填写,点击“确定”完成新增操作。
参数如下表所示:
信息 说明 名称 正则表达式规则名称。 备注 正则表达式规则的注解说明。 正则表达式 描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
其中表达式()中为匹配后提取的内容。
后处理脚本 针对正则表达式匹配的内容进行二次处理。
配置字典
字典是一个或多个关键字或者正则表达式的合集,一般情况会将某一类具有相同特征的关键字或者正则表达式放在同一个字典里面。
登录大模型安全卫士实例。
在菜单栏选择“内容安全 > 语料安全 > 检测因子”,选择“字典”页签。
点击“新增”。
完成内容的填写,点击“确定”完成新增操作。
参数如下表所示:
信息 说明 名称 字典规则名称 备注 字典规则的注解说明 字典项 类型支持关键字、正则表达式。
- 关键字:自定义内容
正则表达式:内容来源于正则表达式
配置文件类型
系统内置了音频、邮件、文本、图片、视频等常见的文件类型检测因子,同时也支持手动新增文件类型检测因子。
内置规则不支持删除和编辑。
登录大模型安全卫士实例。
在菜单栏选择“内容安全 > 语料安全 > 检测因子”,选择“文件类型”页签。
点击“导入”,选择要上传的文件。
文件约束限制如下:
限制 说明 文件格式 仅支持上传json格式的文件。 文件大小 仅支持上传100kb以内的文件。 名称(name、enName) 长度小于40字符。 备注(desc、enDesc) 长度小于200字符。 文件示例:
{ "fileType": [ { "name": "测试", "enName": "test", "desc": "测试txt", "enDesc": "txt", "id": [], "feature": [ ], "suffix": "txt" } ], "version": "version_5d79218ec3da" }