预置模型
是指平台提供的原始模型,您可以通过选择预置模型进行训练从而得到行业或细分场景模型,不同的基础模型的参数和能力不同,我们将持续推出不同能力方向的模型。
模型微调
是指利用预先训练好的神经网络模型,并针对特定任务在相对较少量的监督数据上进行重新训练的技术。这种方法能够充分利用预训练模型在大型数据集上学到的通用特征和知识,从而加速在新任务上的训练过程,并通常能够取得较好的性能表现。
函数调用Function Calling
Function Calling 是一种将大模型与外部工具和 API 相连的关键功能,作为自然语言与信息接口之间的“翻译官”,它能够将用户的自然语言请求智能地转化为对特定工具或 API 的调用,从而高效满足用户的特定需求。
Token
在自然语言处理中,token 通常指的是将文本分割成的最小单位,比如词语、子词或字符。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
迭代轮次
是指模型训练过程中模型学习数据集的次数,可理解为学习几遍数据,可依据需求进行调整。
批处理大小
是指在模型训练过程中,每次处理的数据样本的数量,可理解为模型每看多少数据即更新一次模型参数,在选择批处理大小时需要综合考虑各种因素。
学习率
是指更新模型参数的系数,它决定了在每次迭代中,模型参数应该沿着梯度下降的方向更新多少,需要根据具体情况来仔细选择和调整学习率。
训练数据集
是机器学习或深度学习模型训练过程中的重要组成部分。训练数据集是一组已知输入和对应输出的数据,用于训练模型以学习从输入到输出的映射关系。构建合适训练集,通过模型调优可增强模型能力,提升预测效果。
测试数据集
在机器学习和深度学习中扮演着至关重要的角色,它用于评估模型在未见过的数据上的性能。与训练数据集不同,测试数据集在模型训练过程中是不可见的,也就是说,模型在接触到测试数据之前已经完成了所有的训练和调整。