体验中心可在线体验文本、语音、视觉等各类模型能力
体验中心提供各类AI模型的在线体验功能,无需编写代码即可直观感受模型能力。体验中心分为三大模块:文本模型、语音模型、视觉模型,通过页面顶部Tab页签切换。
文本模型体验
文本模型体验中心提供对话式交互界面,支持3个模型,可通过模型名称旁的切换图标切换:
| 模型名称 | 模型说明 |
|---|---|
| Tele闲聊大模型 | 基于TeleChat2-35B基座模型,基于闲聊场景训练的闲聊语义大模型,适用实时对话场景,模型回复偏口语化、简短的风格。 |
| Telechat通用问答大模型 | 通用问答大模型,具备文本理解、文本创作生成、逻辑推理、语言翻译、数学计算等多种场景的问答能力。 |
| Tele复杂推理大模型 | 复杂推理模型通过多步骤逻辑推导解决数学、编程等难题,具备长上下文处理能力,高效精准。 |
发起对话
进入体验中心-文本模型页面,在底部输入框中输入问题或指令。
按下回车键或点击发送按钮,模型将流式返回回答结果。页面底部显示免费额度消耗情况(文本模型免费额度为50000 Tokens)。
调整模型参数
点击模型名称旁的设置图标,可调整以下推理参数:
| 参数名称 | 默认值 | 说明 |
|---|---|---|
| Temperature | 0.3 | 控制生成文本的多样性。较高的温度值会使生成的文本更加随机和多样化,而较低的温度值会使生成的文本更加确定和一致。 |
| Top_p | 1.00 | 影响输出文本的多样性,取值越大,生成文本的多样性越强。 |
其他操作
快捷话题:页面提供知识问答、内容创作、工作效率、生活服务、技术支持等预设话题分类,点击即可体验;点击"换一换"可刷新预设话题
新建对话:点击"新建对话"按钮清空当前对话内容,开启新的对话
历史记录:点击右上角"历史记录"展开历史对话列表,支持搜索,仅保存近30天的记录
添加服务:最多可同时添加3个模型服务进行对比体验
语音模型体验
语音模型体验中心提供语音合成、语音识别和声音复刻三大功能。
语音合成
语音合成功能(实时语音合成)支持将文本内容转换为语音播报。
在语音模型页面顶部选择"语音合成"Tab页签。
在左侧音色选择区域选择目标发音人(如"翼小贝")。
在右侧声音调整区域调整语速、音量、音调等参数(可选)。
在文本输入框中输入需要合成的文字内容(不超过100字),点击"开始合成"按钮。
声音调整参数:
| 参数 | 默认值 | 说明 |
|---|---|---|
| 语速 | 1x | 调节语音播放速度,取值范围0.5x ~ 2x |
| 音量 | 50% | 调节语音输出音量,取值范围0 ~ 100 |
| 音调 | 1 | 调节语音音调高低,取值范围0.5 ~ 2 |
提供"恢复默认"按钮可一键重置所有参数。免费额度为50次。
语音识别
语音识别功能(实时语音识别-多方言版)支持将语音实时转换为文字,业内首家单模型同时支持中文、英文及60+种方言自由混说。
在语音模型页面顶部选择"语音识别"Tab页签。
点击"开始录制"按钮进行语音录制(单次体验时长1分钟)。
录制过程中,识别结果将实时显示在页面右侧区域。
再次点击按钮结束录制。
免费体验额度为30分钟,页面显示剩余时长。
声音复刻
声音复刻功能只需5秒的语音采样,即可精准复刻用户音色、口音、说话风格及背景环境。
在语音模型页面顶部选择"声音复刻"Tab页签。
录制音频:点击"开始录制",用普通话大声朗读页面显示的参考文案(可点击"换一换"更换文案),录制过程请避免环境噪音。
完成录制后,在下方文本输入框中输入需要合成的内容(不超过100字)。
点击"合成试听"按钮,使用复刻的声音合成语音并试听。
免费额度为20次。
视觉模型体验
视觉模型体验中心提供图像生成、图像理解和图像识别三大功能。
图像生成(人像风格化)
图像生成功能支持对人像进行风格化处理,上传人像照片后选择目标风格即可生成风格化人像图像。
在视觉模型页面顶部选择"图像生成"Tab页签。
上传人像参考图:支持拖拽或点击上传,支持jpg、jpeg、png、bmp格式,大小在10MB以内。
选择目标风格:平台提供13种预设风格(冬日暖阳、薰衣草、宇航员、梅花汉服、圣诞室外、圣诞室内、烟花盛典、街景机甲、喜迎新春、龙年大吉、新春闪耀、东北往事、时代风华)。
点击"开始生成"按钮,等待生成结果。
免费额度为20次。
图像理解
图像理解功能基于多模态理解大模型,能够分析理解文本、图像等多种模态数据。
在视觉模型页面顶部选择"图像理解"Tab页签。
通过输入框旁的上传按钮或拍照按钮上传图片。
在输入框中输入关于图片的问题,如"请描述这张图片中的城市景观",按下回车发送。
模型将分析图片并返回回答结果。
图像理解功能同时支持新建对话、历史记录和搜索功能,仅保存近30天的记录。免费额度为50000 Tokens。
图像识别
图像识别功能提供三大识别能力,通过Tab页签切换:脸人机非全目标解析、明厨亮灶、文字识别。支持上传图片(jpg/jpeg/png/bmp,10MB以内)或输入图片URL进行检测。
脸人机非全目标解析
支持两种检测模式:
全目标属性解析:对图像中人脸、人体、机动车、非机动车进行识别和解析,输出目标位置坐标及详细属性信息(如车牌号、车牌颜色、机动车类型/颜色、顶架、天窗、危险品标记等),每个属性均包含概率值。
人脸1:1比对:上传两张人脸图片进行相似度比对,支持生活照、证件照、身份证芯片照等多种照片类型。
操作示例——全目标属性解析:
在图像识别页面选择"脸人机非"Tab页签,保持默认"全目标属性解析"模式。
上传图片或点击页面提供的示例图片,然后点击"开始检测"。
检测结果分为三个Tab页签查看:识别结果、请求参数、JSON结果。免费额度为50次。
明厨亮灶
针对厨房场景的多目标检测能力,支持同时选择多个检测目标,包含以下8项:
厨师服检测:检测穿着指定颜色上衣或围裙的情况
厨师帽检测:实时监测戴厨师帽颜色和未戴情况
手套检测:识别佩戴手套情况,支持各种颜色的胶皮/医用手套
老鼠识别:针对后厨、仓库等场景提供老鼠检测识别
抽烟检测:识别嘴边附近吸烟行为
打电话检测:识别贴耳边打电话的行为
口罩识别:检测人员配套口罩情况,支持多种口罩类型
垃圾桶未盖盖:识别未正常盖盖的垃圾桶
操作示例:
在图像识别页面选择"明厨亮灶"Tab页签,勾选需要检测的目标。
上传厨房场景图片或选择示例图片,点击"开始检测",查看识别结果。
检测结果以表格形式展示。免费额度为50次。
文字识别
文字识别功能提供三种识别模式:
通用文字识别:基于深度学习技术,提供多场景、高精度的整图文字检测和识别服务
电子签名识别:基于深度学习,智能检测电子手写签名内容
印章识别:支持对合同签章页、委托函等文件上的印章进行智能定位及识别
操作示例——通用文字识别:
在图像识别页面选择"文字识别"Tab页签,保持默认"通用文字识别"模式。
选择示例图片或上传含文字的图片,点击"开始检测"。
检测结果提供三个Tab页签:识别结果、请求参数、JSON结果。免费额度为50次。