任务配置管理 算法名称 说明 仿真算法 根据所选的参数(若有)生成格式、语义等属性与原数据相同且符合校验规则(若有)的仿真数据。 可逆算法 根据所选的参数(若有)生成格式类似、符合校验规则(若有)且支持可逆计算的数据。 遮蔽算法 根据所选的参数(若有)对指定区域的数据内容进行替换。 水印算法 根据所选的水印信息,对数据添加水印标记,可实现数据所有权声明和数据泄漏追溯。 取整算法 根据所选的参数(若有)对数据进行取整计算。 分割算法 根据所选的参数(若有)对数据进行分割,保留指定区域的数据。 保留算法 保留原数据不做脱敏。 替换算法 使用固定值替换,注意替换的值应与原数据所在列声明的数据结构保持一致,否则会出现因数据结构不符而造成脱敏失败的情况。 置空算法 使用空值替换,注意需确认若原数据所在列要求为非空,则使用本算法会出现失败的情况。 乱序算法 打乱数据元组的顺序。 哈希算法 对数据进行哈希编码,支持输入盐值。 密码学算法 根据所选参数指定的密码学加密算法对数据进行加密。支持的加密算法有:RSA/AES/SM2/SM4。 编码算法 根据所选参数指定的编码方式对数据进行编码。支持的编码方式有:UTF8/GBK。 平均算法 对数据进行均值填充。 区间算法 根据步长对数据进行规整。 保留频次算法 对类别属性的数据(取值数目有限)进行编码,去除字段内容含义,仅保留类别区分性。适用于机器学习等数据分析中需保留标签区分性的场景。 标准化算法 对数值类型的数据进行标准化缩放,使得数据均值归为0,方差归为1。本算法脱敏后的数据基本保留数据分布类型,可后续用于常见的分类、聚类等数据分析任务。注意本算法不适合用于大量数据(建议行数为2w以下),因平台在该种情况下会批量计算,由此造成结果不准确。 归一化算法 对数值类型的数据进行归一化缩放,将数据线性缩放至[0,1]区间。本算法脱敏后的数据可限定数据范围,保留数据相对大小,剔除量纲影响,可根据分析模型和分析需求选用本算法。注意本算法不适合用于大量数据(建议行数为2w以下),因平台在该种情况下会批量计算,由此造成结果不准确。 分布重建算法 根据指定的直方图的数量对原数据分布进行估计和采样重建。本算法可以使得脱敏后的数据保留原数据的高阶统计特征,适用于对数据质量有较高要求的分析场景。注意本算法不适合用于过少量数据(建议行数为100以上),因在此种情况下会造成分布估计不准确。 添加噪声算法 根据指定的均值和标准差,对原数据添加加性高斯噪声。本算法可以使得(在参数合理配置情况下)脱敏后的数据仍满足常见信号估计和趋势分析的噪声假设,适用于序列数据,可后续用于回归拟合和预测任务。 一致性算法 根据所选的参数(若有)生成格式类似、符合校验规则(若有)且支持相同的数据在指定的表、列中在脱敏后仍保持一致。 计算关系保留算法 指定的列在脱敏后保留减法运算关系。可指定减数或被减数是否保留原值,否则会按照仿真算法重新生成。 乱序关联保留算法 指定的2个或多个列(支持至多5列)在乱序前后保留对应关系。 身份信息关联保留算法 出生日期/性别/身份证互相之间关系(根据需要)保持一致。