arxiv.org/pdf/2503.20481
一篇通过逆向工程来了解现代 NVIDIA GPU 核心的架构设计的论文。该文章揭示了其指令发布逻辑、寄存器文件结构、缓存机制以及内存管线等关键特性,并基于这些发现改进了 GPU 模拟器,使其与真实硬件的执行周期误差大幅降低,还对比了不同依赖管理机制的性能和面积开销。
arxiv.org/pdf/2503.20481
一篇通过逆向工程来了解现代 NVIDIA GPU 核心的架构设计的论文。该文章揭示了其指令发布逻辑、寄存器文件结构、缓存机制以及内存管线等关键特性,并基于这些发现改进了 GPU 模拟器,使其与真实硬件的执行周期误差大幅降低,还对比了不同依赖管理机制的性能和面积开销。
作者最新文章
热门分类
科技TOP
科技最新文章