应用场景 场景三:AI训练与推理场景说明AI智算平台建设中,在以下场景中会遇到存储挑战:海量数据的存储和处理,包括采集导入、清洗、转换、标注、共享等,这里对存储的要求主要是高吞吐和大容量。模型开发,主要场景包括实验管理、交互式开发和效果评估等。对存储的要求更多集中在POSIX兼容性、可靠性等方面。模型训练的主要场景,一是训练数据的读取,二是为了容错做的Checkpoint的保存和加载。数据集的部分就是要尽量读得快,减少计算对I/O的等待,而Checkpoint主要要求高吞吐、减少训练中断的时间。