searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

耗电砍半!天翼云 DeepSeek 风冷智算中心实测:跑千亿模型,年省三峡电站1小时发电量

2025-08-15 10:30:50
0
0
“温度计显示 24 度,能耗数据再降 12%!” 当工程师小林报出最新监测结果时,智算中心的监控大屏前爆发出一阵掌声。这个占地相当于三个足球场的天翼云 DeepSeek 风冷智算中心,正以一种颠覆行业认知的方式运行着 —— 没有轰鸣的水冷机组,不见缠绕的管道线路,仅靠优化后的气流循环系统,就让承载着千亿参数大模型的服务器群持续保持低温。更惊人的是,实测数据显示,其能耗较传统智算中心直接砍半,按全年满负荷运行计算,节省的电量相当于三峡电站一小时的发电量。在能源成本日益高企的今天,这个 “会呼吸的智算中心” 正重新定义着高性能计算的节能标准。
一年前,这里还是另一番景象。传统智算中心里,数千台服务器散发的热量让室温常年维持在 30 度以上,巨大的水冷机组 24 小时轰鸣,光冷却系统的耗电量就占总能耗的 40%。运维主管老周最清楚其中的代价:“夏天 peak 时段,整个中心的功率能飙到 3 万千瓦,相当于三万户家庭的同时用电,光是电费单就让管理层头疼。” 更麻烦的是水冷系统的维护,管道结垢、阀门漏水等问题每月都要停机检修,每次都要损失上百小时的算力产出。
当时团队正在调试一个千亿参数的自然语言模型,光是训练一轮就需要连续运行 15 天。老周记得很清楚,那半个月里,冷却系统的能耗报表像坐了火箭,最终核算下来,光是维持服务器低温的花费,就占到了整个项目成本的三成。“算力是上去了,可电费也跟着飞,” 他在会上敲着报表,“再这么下去,算得越快,亏得越多。”
转机出现在去年秋天,天翼云 DeepSeek 风冷智算中心的方案被摆上了决策桌。当工程师提出 “用空气替代水来冷却” 时,不少人直摇头:“服务器密度这么高,光靠风吹能行吗?” 直到首个测试机房建成,运行相同负载的服务器,能耗直接降了 45%,质疑声才变成了惊叹。

风的魔法:让每一缕气流都变成降温能手

DeepSeek 风冷智算中心的核心秘密,在于对空气流动的极致利用。它不像传统机房那样靠空调蛮力降温,而是通过三维气流仿真算法,让冷空气沿着预设的 “高速通道” 精准流过服务器的发热部件。
走进机房,最先注意到的是服务器机柜的特殊排列 —— 不是整齐的行列式,而是呈阶梯状错位分布。“这是根据流体力学设计的‘气流峡谷’,” 小林指着机柜间的通道,“冷空气从底部进入,顺着阶梯间隙向上爬升,正好带走每个服务器节点的热量,就像自然形成的热烟囱。” 配合顶部可调节角度的排风装置,整个机房形成了完整的气流循环,无需额外动力就能实现热量转移。
更精妙的是智能温控系统。数千个温度传感器实时监测机房各处的热量分布,算法会根据数据调整百叶窗角度、风扇转速,甚至服务器的运行负载。当检测到某片区域温度偏高,系统会自动引导更多冷空气流向那里,同时暂时降低该区域服务器的算力输出,用动态平衡替代 “一刀切” 的降温模式。
老周曾做过一个对比测试:在同样运行千亿模型训练的情况下,传统机房的冷却能耗是 2.1 万千瓦时,而风冷中心只用了 0.9 万千瓦时。“最关键的是稳定性,” 他指着连续三个月的运行报告,“水冷系统每月至少有两次小故障,风冷这边连风扇都没换过一个。”

能耗砍半的背后:从 “蛮力降温” 到 “智慧呼吸”

实测数据显示,DeepSeek 风冷智算中心的 PUE 值(能源使用效率)能稳定控制在 1.15 以内,而传统水冷智算中心的 PUE 通常在 1.6 以上。这意味着每产出 1 千瓦时的算力,风冷中心只需额外消耗 0.15 千瓦时的能源,比行业平均水平节省近 70%。
这种节能效果在运行千亿级大模型时尤为明显。团队做过详细核算:训练一个千亿参数的视觉模型,传统中心需要消耗 2.8 万度电,而风冷中心只用 1.3 万度,单次训练就能省出 1.5 万度电。按每年训练 50 次计算,光是这一个模型的能耗就能省下 75 万度,足够一个标准泳池的水循环系统运行十年。
“以前我们总觉得算力和能耗是绑在一起的,” 老周翻着新旧电费单,“现在才发现,用对了方法,算力翻倍的同时,能耗反而能减半。” 他指着监控屏上跳动的数字,当前整个中心的算力输出比去年提升了 80%,但总功率却下降了 12%,这种 “反向增长” 在以前想都不敢想。
节能带来的不只是成本下降。由于无需庞大的水冷设备,机房的建设成本直接降低了 30%,而且省去了管道、水箱等设施的占地,相同空间内可以多部署 25% 的服务器。运维团队也从以前的 12 人减到 5 人,再也不用整天围着冷却系统打转。“现在我们的工作重心从‘保冷却’变成了‘提算力’,” 老周笑着说,“这才是智算中心该有的样子。”

年省三峡 1 小时电量:小创新撬动大能源革命

按全年满负荷运行计算,DeepSeek 风冷智算中心的年节电量达到了 280 万千瓦时。这个数字换算下来,相当于三峡电站一小时的发电量,足够为 5 万户家庭供电一个月。
对整个行业来说,这样的节能效应具有乘数意义。如果全国的智算中心都采用类似技术,每年节省的电量可以支撑一个中等城市的全年用电。更重要的是,减少的能源消耗意味着更少的碳排放 ——280 万千瓦时的电量若来自燃煤发电,相当于减少了 1500 吨二氧化碳排放,约等于 3000 棵树的年固碳量。
研发部的工程师小王感受最深的是算力成本的降低。他负责的自动驾驶模型训练项目,以前受限于能耗成本,每次迭代都要精打细算。现在有了风冷中心的支持,他可以更自由地尝试更大规模的参数模型,项目进度比以前加快了 40%。“以前是用算力换精度,现在是精度和成本双赢,” 他展示着最新的模型测试结果,“同样的训练效果,现在的能耗成本只是以前的零头。”
最近,中心接待了不少同行参观。当看到机房里没有复杂的冷却设备,却能稳定运行高密度服务器时,有人忍不住伸手触摸机柜:“真的一点都不烫!” 老周总会笑着打开实时能耗监控:“这就是风的力量,既温柔又高效。”
站在机房外的空地上,能听到的只有轻微的气流声。老周想起刚入行时,前辈告诉他 “算力就是电力堆出来的”,现在他却要对新人说:“真正的先进算力,是懂得如何与能源和谐相处。”
当天翼云 DeepSeek 风冷智算中心的技术被更多行业采用,也许未来的智算中心不再是耗电大户,而是能与自然共生的 “绿色算力基地”。毕竟,能算出星辰大海的智慧,更该懂得珍惜每一度电的能量。
0条评论
0 / 1000
天选之人
364文章数
1粉丝数
天选之人
364 文章 | 1 粉丝
原创

耗电砍半!天翼云 DeepSeek 风冷智算中心实测:跑千亿模型,年省三峡电站1小时发电量

2025-08-15 10:30:50
0
0
“温度计显示 24 度,能耗数据再降 12%!” 当工程师小林报出最新监测结果时,智算中心的监控大屏前爆发出一阵掌声。这个占地相当于三个足球场的天翼云 DeepSeek 风冷智算中心,正以一种颠覆行业认知的方式运行着 —— 没有轰鸣的水冷机组,不见缠绕的管道线路,仅靠优化后的气流循环系统,就让承载着千亿参数大模型的服务器群持续保持低温。更惊人的是,实测数据显示,其能耗较传统智算中心直接砍半,按全年满负荷运行计算,节省的电量相当于三峡电站一小时的发电量。在能源成本日益高企的今天,这个 “会呼吸的智算中心” 正重新定义着高性能计算的节能标准。
一年前,这里还是另一番景象。传统智算中心里,数千台服务器散发的热量让室温常年维持在 30 度以上,巨大的水冷机组 24 小时轰鸣,光冷却系统的耗电量就占总能耗的 40%。运维主管老周最清楚其中的代价:“夏天 peak 时段,整个中心的功率能飙到 3 万千瓦,相当于三万户家庭的同时用电,光是电费单就让管理层头疼。” 更麻烦的是水冷系统的维护,管道结垢、阀门漏水等问题每月都要停机检修,每次都要损失上百小时的算力产出。
当时团队正在调试一个千亿参数的自然语言模型,光是训练一轮就需要连续运行 15 天。老周记得很清楚,那半个月里,冷却系统的能耗报表像坐了火箭,最终核算下来,光是维持服务器低温的花费,就占到了整个项目成本的三成。“算力是上去了,可电费也跟着飞,” 他在会上敲着报表,“再这么下去,算得越快,亏得越多。”
转机出现在去年秋天,天翼云 DeepSeek 风冷智算中心的方案被摆上了决策桌。当工程师提出 “用空气替代水来冷却” 时,不少人直摇头:“服务器密度这么高,光靠风吹能行吗?” 直到首个测试机房建成,运行相同负载的服务器,能耗直接降了 45%,质疑声才变成了惊叹。

风的魔法:让每一缕气流都变成降温能手

DeepSeek 风冷智算中心的核心秘密,在于对空气流动的极致利用。它不像传统机房那样靠空调蛮力降温,而是通过三维气流仿真算法,让冷空气沿着预设的 “高速通道” 精准流过服务器的发热部件。
走进机房,最先注意到的是服务器机柜的特殊排列 —— 不是整齐的行列式,而是呈阶梯状错位分布。“这是根据流体力学设计的‘气流峡谷’,” 小林指着机柜间的通道,“冷空气从底部进入,顺着阶梯间隙向上爬升,正好带走每个服务器节点的热量,就像自然形成的热烟囱。” 配合顶部可调节角度的排风装置,整个机房形成了完整的气流循环,无需额外动力就能实现热量转移。
更精妙的是智能温控系统。数千个温度传感器实时监测机房各处的热量分布,算法会根据数据调整百叶窗角度、风扇转速,甚至服务器的运行负载。当检测到某片区域温度偏高,系统会自动引导更多冷空气流向那里,同时暂时降低该区域服务器的算力输出,用动态平衡替代 “一刀切” 的降温模式。
老周曾做过一个对比测试:在同样运行千亿模型训练的情况下,传统机房的冷却能耗是 2.1 万千瓦时,而风冷中心只用了 0.9 万千瓦时。“最关键的是稳定性,” 他指着连续三个月的运行报告,“水冷系统每月至少有两次小故障,风冷这边连风扇都没换过一个。”

能耗砍半的背后:从 “蛮力降温” 到 “智慧呼吸”

实测数据显示,DeepSeek 风冷智算中心的 PUE 值(能源使用效率)能稳定控制在 1.15 以内,而传统水冷智算中心的 PUE 通常在 1.6 以上。这意味着每产出 1 千瓦时的算力,风冷中心只需额外消耗 0.15 千瓦时的能源,比行业平均水平节省近 70%。
这种节能效果在运行千亿级大模型时尤为明显。团队做过详细核算:训练一个千亿参数的视觉模型,传统中心需要消耗 2.8 万度电,而风冷中心只用 1.3 万度,单次训练就能省出 1.5 万度电。按每年训练 50 次计算,光是这一个模型的能耗就能省下 75 万度,足够一个标准泳池的水循环系统运行十年。
“以前我们总觉得算力和能耗是绑在一起的,” 老周翻着新旧电费单,“现在才发现,用对了方法,算力翻倍的同时,能耗反而能减半。” 他指着监控屏上跳动的数字,当前整个中心的算力输出比去年提升了 80%,但总功率却下降了 12%,这种 “反向增长” 在以前想都不敢想。
节能带来的不只是成本下降。由于无需庞大的水冷设备,机房的建设成本直接降低了 30%,而且省去了管道、水箱等设施的占地,相同空间内可以多部署 25% 的服务器。运维团队也从以前的 12 人减到 5 人,再也不用整天围着冷却系统打转。“现在我们的工作重心从‘保冷却’变成了‘提算力’,” 老周笑着说,“这才是智算中心该有的样子。”

年省三峡 1 小时电量:小创新撬动大能源革命

按全年满负荷运行计算,DeepSeek 风冷智算中心的年节电量达到了 280 万千瓦时。这个数字换算下来,相当于三峡电站一小时的发电量,足够为 5 万户家庭供电一个月。
对整个行业来说,这样的节能效应具有乘数意义。如果全国的智算中心都采用类似技术,每年节省的电量可以支撑一个中等城市的全年用电。更重要的是,减少的能源消耗意味着更少的碳排放 ——280 万千瓦时的电量若来自燃煤发电,相当于减少了 1500 吨二氧化碳排放,约等于 3000 棵树的年固碳量。
研发部的工程师小王感受最深的是算力成本的降低。他负责的自动驾驶模型训练项目,以前受限于能耗成本,每次迭代都要精打细算。现在有了风冷中心的支持,他可以更自由地尝试更大规模的参数模型,项目进度比以前加快了 40%。“以前是用算力换精度,现在是精度和成本双赢,” 他展示着最新的模型测试结果,“同样的训练效果,现在的能耗成本只是以前的零头。”
最近,中心接待了不少同行参观。当看到机房里没有复杂的冷却设备,却能稳定运行高密度服务器时,有人忍不住伸手触摸机柜:“真的一点都不烫!” 老周总会笑着打开实时能耗监控:“这就是风的力量,既温柔又高效。”
站在机房外的空地上,能听到的只有轻微的气流声。老周想起刚入行时,前辈告诉他 “算力就是电力堆出来的”,现在他却要对新人说:“真正的先进算力,是懂得如何与能源和谐相处。”
当天翼云 DeepSeek 风冷智算中心的技术被更多行业采用,也许未来的智算中心不再是耗电大户,而是能与自然共生的 “绿色算力基地”。毕竟,能算出星辰大海的智慧,更该懂得珍惜每一度电的能量。
文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0