Q1. 什么是标准大模型接口？

标准大模型接口，是全国统一、全厂商对齐、格式固定的大模型调用通用API规范。其以OpenAI的/v1体系为事实底座，叠加国内行业团体标准约束，可实现一套代码无缝切换所有大模型，且入参、出参、鉴权、错误提示均统一，与OpenAI的/v1体系完全一致。

Q2. 测评目标添加失败的原因有哪些？

测评目标添加失败，主要有以下几类原因：

一次完整的测评分为采集和测评两个阶段：

全部成功：所有测评样本均成功从目标大模型获取反馈，并生成对应的测评结论；
部分成功：仅部分测评样本成功获取目标大模型反馈及测评结论，另有部分样本未成功获取反馈。针对该情况，可选择两种处理方式：对异常样本再次发起测评，或手动标记为成功。

目前测评系统仅支持文本类型测评，暂不支持图片、视频及多模态测评。

进入“测评记录→样本列表”页面，可查看本次测评的样本总数、已完成样本数、待测评样本数，通过该页面可实时掌握测评进度。

在测评记录页面的“样本列表”子页面，可查看每条样本的测评状态及所处阶段：若异常发生在采集阶段，即为目标大模型的问题；其余阶段的异常，则属于测评业务代码的问题。