新建原始数据集
原始数据集管理页面支持用户进行已有数据集的纳管及上传;
点击【新建数据集】,可进行原始数据集的纳管和上传。
在弹窗中,可以选中新建原始数据集的方式,分为上传文件和纳管两种;
上传文件:支持用户将本地的数据集文件通过拖拽方式上传到平台;
纳管:支持用户选择某个数据源的某个路径,将该路径下的文件形成一个原始数据集;
当选择上传文件方式,需维护数据集的中英文名称、选择数据集的资源类型,选择数据集标签等;并选择需要将该文件上传至哪个类型的哪个数据源,上传完成后,系统会自动生成存放路径。
当选择纳管方式,需维护数据集的中英文名称、选择数据集的资源类型、选择数据集标签等,同时,选择需纳管的数据集所在的数据源及其路径,此时系统会将所填路径下的文件打包为一个原始数据集。在数据集管理中进行管理。
当数据集上传完成后,可在数据集管理列表查看到该原始数据集;
列表有五个状态,其代表的含义如下:
【1】检索同步状态:表示该数据集的信息是否已同步给数据检索,同步完成后,该数据集即可在数据检索页面进行检索;
【2】标注同步状态:表示该数据集的信息是否已同步至标注平台,同步完成后,该数据集即可在创建标注任务时进行选择;
【3】上传进度:选择上传文件方式时该状态有意义,表示上传的进度;纳管方式下无意义,以 [-] 标注;
【4】文件状态:选择上传文件方式时该状态有意义,表示文件解析的结果;纳管方式下无意义,以 [-] 标注;
【5】数据集状态:表示该数据集是否生成完成;
针对原始数据集的操作,分为以下几类:
【编辑】,仅能够编辑数据集的中文名称、数据集的标签、密级信息;
【查看】指查看数据集的内容;
【授权】支持将该数据集授权给个人或团队;
【删除】指能够删除该数据集;
【版本管理】指能够查看数据集的版本情况,可进行版本管理【注意:原始数据集仅有一个版本】
【血缘分析】支持查看该数据集的血缘情况;
【更新元数据】点击后会将该数据集元数据信息进行更新。