术语解释
更新时间 2026-06-05 17:10:08
最近更新时间: 2026-06-05 17:10:08
模型微调
是指利用预先训练好的神经网络模型,并针对特定任务在相对较少量的监督数据上进行重新训练的技术。这种方法能够充分利用预训练模型在大型数据集上学到的通用特征和知识,从而加速在新任务上的训练过程,并通常能够取得较好的性能表现。
Token
在自然语言处理中,token 通常指的是将文本分割成的最小单位,比如词语、子词或字符。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
数据集
是机器学习或深度学习模型训练过程中的重要组成部分。训练数据集是一组已知输入和对应输出的数据,用于训练模型以学习从输入到输出的映射关系。构建合适训练集,通过模型调优可增强模型能力,提升预测效果。
模型量化
通过降低模型参数的精度(如从FP16转为INT4),减小模型体积与显存占用,提升推理速度的技术。