TeleChat-12B 对于对比模型,我们同时参考了官方汇报的结果以及OpenCompass平台的评估结果,以确保评估的全面性和公正性。此外,中电信在评测MMLU与C-Eval榜单时,采用了自己的评测脚本,具体方法可参见 evaluation/文件夹内的相关文档。 技术亮点 TeleChat-12B-bot在模型结构、训练数据、训练方法等方面进行了改进,在通用问答和知识类、代码类、数学类榜单上相比TeleChat-7B-bot均有大幅提升。 在模型结构方面,使用小规模的模型尝试多种模型结构的组合,选择最优结构。