活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
算力互联调度平台
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      并行文件服务 HPFS

      并行文件服务 HPFS

      • 并行文件服务 HPFS

      无数据

        • 产品动态
        • 产品介绍
        • 产品定义
        • 术语解释
        • 产品优势
        • 功能特性
        • 产品规格
        • 应用场景
        • 使用限制
        • 协议相关限制
        • 操作系统限制
        • 产品能力地图
        • 计费说明
        • 计费概述
        • 计费模式
        • 按需计费
        • 产品价格
        • 欠费说明
        • 退订说明
        • 账单管理
        • 快速入门
        • 入门流程
        • 准备工作
        • 创建文件系统
        • 挂载文件系统
        • 挂载访问概述
        • HPFS-POSIX客户端挂载
        • HPFS-NFS客户端挂载
        • 用户指南
        • 容量调整
        • 查询文件系统详情
        • 删除文件系统
        • 卸载文件系统
        • HPFS-POSIX客户端卸载
        • HPFS-NFS客户端卸载
        • 权限控制
        • 通过IAM进行权限控制
        • 监控告警
        • 云监控
        • 监控指标
        • 创建告警规则
        • 查看监控数据
        • 协议服务
        • 协议服务概述
        • 创建协议服务
        • 查询协议服务
        • 删除协议服务
        • FILESET管理
        • FILESET概述
        • 创建FILESET
        • 查询FILESET
        • 修改FILESET
        • 删除FILESET
        • 标签管理
        • 概述
        • 标签设计原则及示例
        • 标签管理
        • 数据迁移
        • 迁移概述
        • 命令拷贝
        • 工具迁移
        • 数据快递
        • 最佳实践
        • 文件系统子目录权限隔离
        • 性能调优
        • GDS加速HPFS存储访问
        • API参考
        • API说明
        • 常见问题
        • 概念类
        • 规格类
        • 计费类
        • 管理类
        • 操作类
        • 相关协议
        • 产品服务协议
        • 产品服务等级协议
        • 文档下载
          无相关产品

          本页目录

          帮助中心并行文件服务 HPFS最佳实践GDS加速HPFS存储访问
          GDS加速HPFS存储访问
          更新时间 2026-02-28 10:15:43
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2026-02-28 10:15:43
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接

          GDS简介

          GPUDirect Storage(GDS)是NVIDIA推出的一项关键技术,用于实现GPU显存与兼容存储系统之间的直接数据通路,从而绕过CPU和系统内存拷贝。该技术旨在解决高性能计算与AI训练场景中,存储I/O可能成为整体性能瓶颈的问题。其主要优势包括:

          1. 降低数据访问延迟:缩短GPU等待数据的时间。

          2. 提高有效带宽:最大化GPU从存储读取和写入数据的吞吐量。

          3. 释放CPU资源:减少CPU在I/O路径上的介入,使其更专注于计算任务。

          天翼云高性能并行文件服务HPFS已支持GPUDirect Storage技术。用户可在基于NVIDIA GPU的主机上,部署支持GDS的应用程序,并通过cuFile API直接访问HPFS文件系统。实测表明,相较于传统的POSIX API标准访问方式,此项优化可带来约30% 的吞吐性能提升,显著加速GPU数据处理流水线。

          GDS原理

          通过传统的POSIX API读取流程如下:

          int fd = open(...)
          void *sysmem_buf, *gpumem_buf;
          sysmem_buf = malloc(buf_size);
          cudaMalloc(gpumem_buf, buf_size);
          pread(fd, sysmem_buf, buf_size);
          cudaMemcpy(sysmem_buf, gpumem_buf, buf_size, H2D);
          cuStreamSynchronize(0);

          使用GDS API可以绕过CPU直接从HPFS读取,使得数据不经过内存直接从HPFS复制GPU显存,大幅提升性能:

          int fd = open(file_name, O_DIRECT,...)
          CUFileHandle_t *fh;
          CUFileDescr_t desc;
          desc.type=CU_FILE_HANDLE_TYPE_OPAQUE_FD;
          desc.handle.fd = fd;
          cuFileHandleRegister(&fh, &desc);
          void *gpumem_buf;
          cudaMalloc(gpumem_buf, buf_size);
          cuFileRead(&fh, gpumem_buf, buf_size, ...);

          开始使用

          您需要根据硬件版本信息,在使用前在GPU客户端安装GDS,详细安装步骤请自行查询GPUDirect Storage Installation and Troubleshooting Guide。

          以下是使用GDS的示例代码:

          #include <iostream>
          #include <fcntl.h>
          #include <unistd.h>
          #include <cuda_runtime.h>
          #include <cufile.h>
          int main() {
              CUfileHandle_t cfHandle;
              CUfileDescr_t cfDescr = {};
              const char *filename = "/mnt/hpfs/testfile";
              int fd = open(filename, O_CREAT | O_RDWR, 0664);
              if (fd < 0) {
                  perror("File open failed");
                  return 1;
              }
          
              // Set up GDS descriptor
              cfDescr.handle.fd = fd;
              cfDescr.type = CU_FILE_HANDLE_TYPE_OPAQUE_FD;
              CUfileError_t status = cuFileHandleRegister(&cfHandle, &cfDescr);
              if (status.err != CU_FILE_SUCCESS) {
                  std::cerr << "cuFileHandleRegister failed: " << status.err << std::endl;
                  close(fd);
                  return 1;
              }
          
              // Alloc GPU memory and fill GPU memory with data
              void *devPtr;
              size_t bufferSize = 8192;
              cudaMalloc(&devPtr, bufferSize);
              cudaMemset(devPtr, 0xAB, bufferSize);
          
              // Perform the write
              ssize_t writtenBytes = cuFileWrite(cfHandle, devPtr, bufferSize, 0, 0);
              if (writtenBytes < 0) {
                  perror("cuFileWrite failed");
              } else {
                  std::cout << "Wrote " << writtenBytes << " bytes to the file." << std::endl;
              }
          getBoolParameter()
              // Clean up
              cuFileHandleDeregister(cfHandle);
              close(fd);
              cudaFree(devPtr);
              return 0;
          }

          通过以下命令编译:

          g++ -o gds_example gds_example.cc -I/usr/local/cuda/include -L/usr/local/cuda/lib64 -lcuda -lcufile -lcudart

          更多的GDS API用法请您根据硬件版本自行查询 GDS cuFile API Reference。

          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  性能调优
          下一篇 :  API参考
          搜索 关闭
          ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2026天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明