概述
DeepSeek-R1 是幻方量化旗下 AI 公司深度求索(DeepSeek)研发的一款高性能推理模型。该模型使用强化学习技术进行后训练,专注于提升在数学、代码和自然语言推理等复杂任务上的表现。
DeepSeek-R1 在需要逻辑推理、思维链推理和实时决策的任务中表现出色,如解决高级数学问题、生成复杂代码、解析复杂科学问题等。在类似Codeforces的挑战场景中获得了2029 Elo评分;在复杂推理基准测试中,表现与OpenAI的o1模型相当。尽管总共有6710亿的庞大参数,但每次前向传递时仅激活370亿个参数,比大多数大模型更加高效的利用资源。
当前在科研助手的社区镜像中,我们已经为您提前部署好了完整的服务,方便您即刻体验,开箱即用。
准备环境
- 进入“科研版”总览页,点击快捷入口【找镜像】,进入镜像商城。
- 进入批量计算控制台,点击左上角,切换“科研版”。
- 在“镜像商城”中,找到名为“DeepSeek-R1:7B模型”的镜像,点击【使用此镜像】,进入开发机创建界面。
- 在购买页面中,【基础信息】-【主机规格】一栏,用户可以按照如下配置选择。
配置 | 算力型号 | 可用区 |
---|---|---|
最低配置 | GPU.gn3.m1 | 厦门4、扬州7 |
推荐配置 | GPU.gn4.2xl1 | 贵阳2 |
高端配置 | NVIDIA A100 40G | 中卫4 |
这里以NVIDIA-A100-40G为例,框架版本已默认选好【社区镜像】的“open-webui-deepseek-r1-cuda11.3”。
- 点击【确认订单】,完成开发机创建并启动。
启动开发机并登录VNC
-
【开发机】刷新状态,等待新创建的开发机状态进入到【运行中】状态后点击右侧操作栏【打开】。
-
点击【打开】跳转到vnc开发机,成功进入到远程桌面中。
启动DeepSeek
-
点击桌面上【启动DeepSeek】图标,等待弹窗浏览器。
使用DeepSeek-R1模型服务
-
在对话框里输入问题后点击【发送消息】图标,deepseek将给出答复。