- 本文详细介绍了Intel FPGA SoC中HPS地址映射的工作机制,包括地址空间结构、HPS与FPGA通信接口、Platform Designer设计中的地址配置以及调试方法,为SoC系统开发提供实用指导。Du_carry2025-07-0130
- 介绍紫光同创DDR IP接口以及不同接口的转换逻辑。Du_carry2025-06-2750
- 本文介绍了TCAM的实现原理和优化方案,可以应用于芯片设计、FPGA实现等,在网络设备领域有重要作用。乱序不丢包2025-06-2390
- nohup UVM 测试用例 自动化回归脚本皮纳特没烦恼2025-06-0630
- UVM验证中使用verdi快速定位问题的实例分享c****c2025-05-26100
- 本文主要介绍HPS(硬核处理器系统)在SoC FPGA中的核心架构、与FPGA协同机制,及其在工业控制、网络加速等场景的应用与开发流程。Du_carry2025-03-25200
- 本文介绍一种在大规模逻辑设计中的寄存器分级设计方法,可用于FPGA设计和芯片设计。乱序不丢包2025-03-07130
- PPR,即Post Package Repair,封装后修复技术,是一种对封装后内存颗粒的故障进行修复的技术。为什么强调封装后呢?是因为更早期的时候这种技术是用于封装前的内存故障修复,即在wafer上对还未切割、封装的内存芯片进行修复。CyrusYoung2024-12-162310
- Spyglass tcl皮纳特没烦恼2024-12-043190
- 服务器CPU(中央处理器)是服务器硬件的核心组件之一,它在服务器的运行中扮演着至关重要的角色。它的作用包括但不仅限于数据处理、任务调度、控制协调、多任务处理、缓存管理、虚拟化支持、安全功能及性能监控等。刘****明2024-11-28430
- UVM中一种创建base sequence的方法介绍c****c2024-10-28170
- 收包模式及模式协商c****m2024-10-111150
- 在自回归(Auto-regressive)语言模型的推理过程中,随着新词汇的不断生成,输入序列的长度持续增加,这对计算效率提出了严峻挑战。FlashAttention算子,作为一种高效的注意力机制实现,尤其在增量推理场景下展现出其独特优势。在此场景下,FlashAttention的query维度(S轴)被固定为1,而key和value则通过KV Cache机制,将先前推理过程中的状态信息累积并叠加,以适应每个Batch可能不同的实际长度。值得注意的是,尽管输入数据经过padding处理以维持固定长度,但FlashAttention能够灵活应对这种变化。此外,在全量推理场景中,尽管query的S轴大小不再固定,但FlashAttention的推理流程与增量推理保持一致,确保了算法的通用性和高效性。wanyw2024-09-181500
- UVM field automation机制的使用,让object类中的变量使用更加便捷。但对于某些协议,总线分时复用多种报文类型,也就对应着不同的object类变量。可以使用if条件更准确的进行field automation注册。余泊江2024-09-04220
- 凭借着更高的可靠性、更好的环境耐受性、更快的生产效率,国产SD8564 RTC芯片将是边缘设备、服务器等设备的新选择。悟****空2024-08-221610
- 本文将介绍Vunit平台的特点和运作方式,并在Vunit框架的基础上编写一个小型自动化Verilog/System Verilog HDL模块测试平台。Vunit是一种用于硬件验证的开源工具,它具有许多强大的功能,可以帮助工程师更轻松地进行FPGA设计的模块验证工作。通过深入了解Vunit的特点和运作方式开发轻量化,自动化的测试平台,从而提高FPGA设计代码的质量和效率。夏蒙2024-07-26982
- 这篇文章详细介绍了NVDIA BlueFiled3 DOCA Core,有助于理解BF3的架构和支持的功能。c****62024-06-212770
- 服务器中的导热材料的介绍石金帅2024-05-0790
- 智能网卡存储业务验证过程中,从host侧发送到soc侧的IO读写存储报文,在soc侧需要对IO读写报文进行解析并响应,如果是blk write命令,需要回复blk cpl完成响应,如果是blk read命令,需要返回读数据与blk cpl响应。黄****超2024-04-25241
- 现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。彭薛葵2024-03-21721
- 本文介绍了DSA SVM功能的实现以及需要的硬件支持。l****n2023-12-262194
- 当前,在云计算、数字经济等需求带动下,信息呈爆炸式增长,导致数据量也成倍增长,硬盘容量持续飙升,单盘容量已可达到TB级别,半导体存储登上了历史的舞台。和传统磁盘存储介质相比,半导体存储介质具有天然的优势,无论在可靠性、性能、功耗等方面都远远超越传统机械磁盘。乘风2023-12-051430
- 一文搞懂芯粒(Chiplet)技术c****n2023-12-055450
- 芯片设计流片、验证、成本c****n2023-12-05820
- 在过去的十年中,半导体存储器领域最重要的现象是闪存市场的爆炸式增长,其推动力来自手机和其他类型的便携式电子设备。强大的综合技术、灵活性和成本使闪存在大多数非易失性存储器应用中成为一种广泛使用、成熟稳固的技术。如今,闪存的销售额在整个半导体市场中占有相当大的比重。乘风2023-11-24400
- ExaGear是一款二进制指令动态翻译软件,运行在ARM64服务器上,通过将x86的指令在运行时翻译为ARM64指令并执行,使得绝大部分Linux on x86应用无需重新编译就可运行在ARM64服务器上。ExaGear主要有两个组件:指令翻译引擎和x86运行环境,指令翻译引擎是一个“中间件”软件解决方案,位于x86应用程序与ARMv8架构服务器之间。x86应用启动时,ExaGear的指令翻译引擎接管x86应用的运行,使用二进制翻译技术将它们转换为兼容ARM的代码,再执行x86应用程序;x86运行环境是一个包含所有标准库、实用程序的x86应用执行环境。w****n2023-10-262320
- 龙芯平台二进制翻译是混合二进制翻译系统,LATX非纯软件的实现,除了用户态来实现的翻译的模块,CPU中为二进制翻译增加了一些特殊指令和一些专门的硬件设计来加速翻译;w****n2023-10-256610
共 35 条
- 1
- 2
页
- 本文详细介绍了Intel FPGA SoC中HPS地址映射的工作机制,包括地址空间结构、HPS与FPGA通信接口、Platform Designer设计中的地址配置以及调试方法,为SoC系统开发提供实用指导。
- 介绍紫光同创DDR IP接口以及不同接口的转换逻辑。
- 本文介绍了TCAM的实现原理和优化方案,可以应用于芯片设计、FPGA实现等,在网络设备领域有重要作用。
- nohup UVM 测试用例 自动化回归脚本
- UVM验证中使用verdi快速定位问题的实例分享
- 本文主要介绍HPS(硬核处理器系统)在SoC FPGA中的核心架构、与FPGA协同机制,及其在工业控制、网络加速等场景的应用与开发流程。
- 本文介绍一种在大规模逻辑设计中的寄存器分级设计方法,可用于FPGA设计和芯片设计。
- Wi-Fi 6(原称:IEEE 802.11.ax)即第六代无线网络技术,是Wi-Fi标准的名称。 是Wi-Fi联盟创建于IEEE 802.11标准的无线局域网技术。 Wi-Fi 6将允许与多达8个设备通信,最高速率可达9.6Gbps。
- PPR,即Post Package Repair,封装后修复技术,是一种对封装后内存颗粒的故障进行修复的技术。为什么强调封装后呢?是因为更早期的时候这种技术是用于封装前的内存故障修复,即在wafer上对还未切割、封装的内存芯片进行修复。
- 本文简单介绍了RISC-V指令集的定义,起源以及发展现状
- Spyglass tcl
- 服务器CPU(中央处理器)是服务器硬件的核心组件之一,它在服务器的运行中扮演着至关重要的角色。它的作用包括但不仅限于数据处理、任务调度、控制协调、多任务处理、缓存管理、虚拟化支持、安全功能及性能监控等。
- UVM中一种创建base sequence的方法介绍
- 简单介绍PCIE的信用作用与分类
- 收包模式及模式协商
- 在自回归(Auto-regressive)语言模型的推理过程中,随着新词汇的不断生成,输入序列的长度持续增加,这对计算效率提出了严峻挑战。FlashAttention算子,作为一种高效的注意力机制实现,尤其在增量推理场景下展现出其独特优势。在此场景下,FlashAttention的query维度(S轴)被固定为1,而key和value则通过KV Cache机制,将先前推理过程中的状态信息累积并叠加,以适应每个Batch可能不同的实际长度。值得注意的是,尽管输入数据经过padding处理以维持固定长度,但FlashAttention能够灵活应对这种变化。此外,在全量推理场景中,尽管query的S轴大小不再固定,但FlashAttention的推理流程与增量推理保持一致,确保了算法的通用性和高效性。
- UVM field automation机制的使用,让object类中的变量使用更加便捷。但对于某些协议,总线分时复用多种报文类型,也就对应着不同的object类变量。可以使用if条件更准确的进行field automation注册。
- 凭借着更高的可靠性、更好的环境耐受性、更快的生产效率,国产SD8564 RTC芯片将是边缘设备、服务器等设备的新选择。
- 本文将介绍Vunit平台的特点和运作方式,并在Vunit框架的基础上编写一个小型自动化Verilog/System Verilog HDL模块测试平台。Vunit是一种用于硬件验证的开源工具,它具有许多强大的功能,可以帮助工程师更轻松地进行FPGA设计的模块验证工作。通过深入了解Vunit的特点和运作方式开发轻量化,自动化的测试平台,从而提高FPGA设计代码的质量和效率。
- 这篇文章详细介绍了NVDIA BlueFiled3 DOCA Core,有助于理解BF3的架构和支持的功能。
- 服务器中的导热材料的介绍
- 智能网卡存储业务验证过程中,从host侧发送到soc侧的IO读写存储报文,在soc侧需要对IO读写报文进行解析并响应,如果是blk write命令,需要回复blk cpl完成响应,如果是blk read命令,需要返回读数据与blk cpl响应。
- 现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。
- 本文介绍了DSA SVM功能的实现以及需要的硬件支持。
- 当前,在云计算、数字经济等需求带动下,信息呈爆炸式增长,导致数据量也成倍增长,硬盘容量持续飙升,单盘容量已可达到TB级别,半导体存储登上了历史的舞台。和传统磁盘存储介质相比,半导体存储介质具有天然的优势,无论在可靠性、性能、功耗等方面都远远超越传统机械磁盘。
- 一文搞懂芯粒(Chiplet)技术
- 芯片设计流片、验证、成本
- 在过去的十年中,半导体存储器领域最重要的现象是闪存市场的爆炸式增长,其推动力来自手机和其他类型的便携式电子设备。强大的综合技术、灵活性和成本使闪存在大多数非易失性存储器应用中成为一种广泛使用、成熟稳固的技术。如今,闪存的销售额在整个半导体市场中占有相当大的比重。
- ExaGear是一款二进制指令动态翻译软件,运行在ARM64服务器上,通过将x86的指令在运行时翻译为ARM64指令并执行,使得绝大部分Linux on x86应用无需重新编译就可运行在ARM64服务器上。ExaGear主要有两个组件:指令翻译引擎和x86运行环境,指令翻译引擎是一个“中间件”软件解决方案,位于x86应用程序与ARMv8架构服务器之间。x86应用启动时,ExaGear的指令翻译引擎接管x86应用的运行,使用二进制翻译技术将它们转换为兼容ARM的代码,再执行x86应用程序;x86运行环境是一个包含所有标准库、实用程序的x86应用执行环境。
- 龙芯平台二进制翻译是混合二进制翻译系统,LATX非纯软件的实现,除了用户态来实现的翻译的模块,CPU中为二进制翻译增加了一些特殊指令和一些专门的硬件设计来加速翻译;
点击加载更多