searchusermenu
  • 发布文章
  • 消息中心
FPGA设计
8 文章379 阅读1 订阅
全部 计算 3安全 1网络 2AI 3紫金DPU 5云计算 4芯片 4网卡 1
FPGA设计
8 文章379 阅读1 订阅
全部
  • 在FPGA设计领域,一个经典的“跷跷板”难题困扰了工程师数十年:追求更高的性能(速度),通常意味着消耗更多的逻辑资源(面积);而致力于缩小设计规模(面积),又往往不得不以降低运行频率(速度)为代价。这个“鱼与熊掌不可兼得”的局面,曾是每个FPGA工程师进行设计决策时的核心权衡。 然而,随着应用场景的复杂化和FPGA自身架构的演进,这种非此即彼的旧思路正在被打破。新一代的设计方法论、工具链和架构创新,正赋予我们前所未有的能力,去追求一个更理想的目标:在有限的芯片面积内,榨取极致的性能。 换句话说,“速度”和“面积”不再是二选一,而是可以协同优化的统一体。
    彭薛葵
    2025-09-26
    0
    0
    0
  • 本文探讨FPGA通用化设计的关键方法,包括模块化设计、参数化配置、标准化接口、动态部分重构(Partial Reconfiguration)以及高层次综合(HLS)。
    彭薛葵
    2025-07-01
    0
    12
    0
  • 基于FPGA的云主机技术,本文提出将Host的PCIe PF和PCIe VF枚举过程的交互由SOC来实现,FPGA仅透传相关的配置包,从而达到可灵活扩展PCIe PF和PCIe VF规模的目标,同时FPGA资源可以更有效的专注于数据通道的加速。
    彭薛葵
    2025-03-26
    0
    13
    0
  • 热迁移的效率对于云主机是一个很重要的指标,本文基于多bitmap架构根据迁移状态反馈,动态调整迁移粒度,通过软硬件协作,提升热迁移效率,优化资源使用。
    彭薛葵
    2024-09-26
    0
    24
    0
  • 本文采用一种乒乓buffer设计方法,开辟两片Buffer用于原始数据存储,轮流交替服务于原始数据接收和计算,这样可以提高整个链路的处理效率。
    彭薛葵
    2024-06-21
    0
    37
    0
  • 现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。
    彭薛葵
    2024-03-21
    0
    73
    1
  • 本文介绍了传统机器学习随机森林算法的相关概念和特点,然后介绍了随机森林算法在流量识别的方法、优势及挑战,并就这些挑战提出了FPGA加速方案,说明了相应的加速成果,最后对FPGA在随机森林算法领域的实现优势进行了总结及展望。
    彭薛葵
    2023-09-21
    0
    177
    1
  • 在FPGA设计中,有时要使用到mac ip,像Intel的某些mac ip,对tx方向有整包连续接收的要求,即valid在sop和eop之间必须拉高,这就对相关的fpga设计提出了整包发送的要求。本文搭建platform design实现整包发送功能。
    彭薛葵
    2023-09-19
    0
    43
    0
全部
  • 在FPGA设计领域,一个经典的“跷跷板”难题困扰了工程师数十年:追求更高的性能(速度),通常意味着消耗更多的逻辑资源(面积);而致力于缩小设计规模(面积),又往往不得不以降低运行频率(速度)为代价。这个“鱼与熊掌不可兼得”的局面,曾是每个FPGA工程师进行设计决策时的核心权衡。 然而,随着应用场景的复杂化和FPGA自身架构的演进,这种非此即彼的旧思路正在被打破。新一代的设计方法论、工具链和架构创新,正赋予我们前所未有的能力,去追求一个更理想的目标:在有限的芯片面积内,榨取极致的性能。 换句话说,“速度”和“面积”不再是二选一,而是可以协同优化的统一体。
  • 本文探讨FPGA通用化设计的关键方法,包括模块化设计、参数化配置、标准化接口、动态部分重构(Partial Reconfiguration)以及高层次综合(HLS)。
  • 基于FPGA的云主机技术,本文提出将Host的PCIe PF和PCIe VF枚举过程的交互由SOC来实现,FPGA仅透传相关的配置包,从而达到可灵活扩展PCIe PF和PCIe VF规模的目标,同时FPGA资源可以更有效的专注于数据通道的加速。
  • 热迁移的效率对于云主机是一个很重要的指标,本文基于多bitmap架构根据迁移状态反馈,动态调整迁移粒度,通过软硬件协作,提升热迁移效率,优化资源使用。
  • 本文采用一种乒乓buffer设计方法,开辟两片Buffer用于原始数据存储,轮流交替服务于原始数据接收和计算,这样可以提高整个链路的处理效率。
  • 现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。
  • 本文介绍了传统机器学习随机森林算法的相关概念和特点,然后介绍了随机森林算法在流量识别的方法、优势及挑战,并就这些挑战提出了FPGA加速方案,说明了相应的加速成果,最后对FPGA在随机森林算法领域的实现优势进行了总结及展望。
  • 在FPGA设计中,有时要使用到mac ip,像Intel的某些mac ip,对tx方向有整包连续接收的要求,即valid在sop和eop之间必须拉高,这就对相关的fpga设计提出了整包发送的要求。本文搭建platform design实现整包发送功能。
  • 没有更多了