一、备案介绍
大模型备案是指利用生成式人工智能技术,向中国境内公众提供具有舆论属性或社会动员能力的生成文本、图片、音频、视频等内容服务的模型,依据《生成式人工智能服务管理暂行办法》等法律法规履行的备案手续。其核心特征在于“主动监管”,要求服务提供者对模型的安全性、数据合法性和内容可控性进行全面评估。
政策链接:https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm
二、大模型备案流程与材料
第一步:向属地网信办申请备案
申请单位需向属地网信办提交备案申请,领取并填写《生成式人工智能(大语言模型)备案信息采集表》。
第二步:材料准备与安全自评估
《生成式人工智能上线备案表》:正式提交模型上线备案的申请文件,明确模型基本信息、备案主体及合规承诺。
《安全评估报告》:全面评估模型在数据安全、内容合规、算法偏见及系统防护等方面的风险控制能力。
《模型服务协议》:界定用户与开发者之间的权利义务,明确数据使用范围、服务条款及法律责任划分。
《语料标注规则》:规范训练数据的标注流程与标准,确保数据质量并避免伦理偏见。
《拦截关键词列表》:列出需过滤的违法、敏感及虚假信息关键词,作为内容安全的基础拦截规则。
《评估测试题》:通过设计合规性、边界及性能测试场景,验证模型的实际表现与风险抵御能力。
其他备案必需材料。
第三步:提交属地网信办初审测试
申请单位将材料附件及5个实名认证测试账号提交给属地网信办进行初审。审核过程中,属地网信办会对材料的完整性、准确性进行核查,并对大模型进行技术测试。申请单位应配合属地网信办完成多轮审核,根据审核意见修改完善材料。
第四步:等待中央网信办复审
属地网信办将初审通过的材料上报给中央网信办,由中央网信办进行材料复审和大模型技术评审。
第五步:获取备案编号
中央网信办复审通过后,申请单位将获得备案号和官方网站公示,若未通过,则需要根据反馈进行整改,并重新提交审核。
三、注意事项
在大模型备案过程中,存在一些重点和难点问题,需要申请单位和开发者特别注意:
语料标注的规范性:语料标注是构建和训练大模型的关键环节。为了确保语料的合法性和标注的规范性,企业需要明确标注团队的资质、质量控制机制以及数据来源的合法性等。同时,还需要对标注结果进行定期的评估和优化,以确保标注质量。
拦截关键词列表的全面性:拦截关键词列表是大模型内容安全过滤机制的重要组成部分。为了确保内容的安全性和合规性,企业需要准备一份全面且精确的拦截关键词列表。这份列表应覆盖可能涉及的风险领域,如政治敏感、色情、暴力等,并定期进行更新和优化。
安全评估报告的编制:安全评估报告是大模型备案过程中的关键材料之一。这份报告需要由具备相应资质的专业机构或团队负责编制,全面评估大模型在各个关键环节的安全性。报告内容应包括数据隐私保护、算法偏见识别与纠正、有害信息过滤机制等方面。
模型服务协议的制定:模型服务协议是确保用户权益和企业利益得到充分保护的关键法律文件。企业需要制定一份详细且公平的模型服务协议,明确服务范围、双方权利义务、数据使用与保护等内容。这份协议需要经过法务团队的审阅和确认,以确保其合法合规且公平合理。
四、大模型备案补贴
为推动人工智能(AI)行业规范化发展,鼓励企业主动落实合规备案要求,全国多个重点AI产业集聚区已陆续出台针对性备案补贴政策。相关政策需要查看当地官方网站公布的AI大模型备案政策。
五、常见问题
1. 大模型备案和登记有什么区别?
大模型登记适用于通过API接口或其他方式直接调用已备案大模型能力,且面向中国境内公众提供具有舆论属性或社会动员能力的生成式人工智能服务的企业。登记流程相对简化,企业需向属地网信部门提交登记申请及相关材料,经审核通过后授予上线编号并公示。
2. 算法备案、大模型备案、大模型登记三者有何联系?
3. 为什么要做大模型备案?
大模型备案侧重于事前风险管控,确保AI大模型在正式投入市场前已满足国家安全标准及合规要求,有效预防潜在危害,如误导用户或传播非法信息,从而构建安全可靠的人工智能生态。
4. 哪些企业要做大模型备案?
向中国境内公众提供具有舆论属性或社会动员能力的生成文本、图片、音频、视频等内容服务的模型,都需要做大模型备案。