建议:关注公众号进行“标星”,连续多次点“在看”“点赞”,系统将会优先推送。
AI服务器浪潮席卷全球,带动AI加速芯片需求。DRAM关键性产品HBM异军突起,成为了半导体下行周期中逆势增长的风景线。业界认为,HBM是加速未来AI技术发展的关键科技之一。
当代电子计算机的性能表现依赖于中央处理器(CPU)和动态随机存取存储器(DRAM)内存的协同配合,在冯·诺伊曼计算机架构中,计算处理单元根据指令从内存中读取数据,完成计算处理后将数据存回内存。
先进的DDR4内存主频为2666~3200MHz,带宽为6.4GB/s。在高性能计算、数据中心、人工智能(AI)应用中,顶级高算力芯片的数据吞吐量峰值在数百TB/s级别,但主流DRAM内存或显存带宽一般为几GB/s到几十GB/s量级,与TB/s量级还有较大差距。
DRAM内存带宽已经成为了制约计算机性能发展的重要瓶颈,即所谓阻碍性能提升的“内存墙”。
针对内存高带宽、大容量、低功耗的需求,从2013年开始,国际电子元件工业联合会(JEDEC)先后制定了3代、多个系列版本的高带宽存储器(HBM、HBM2、HBM2E、HBM3)标准。
HBM的3D堆叠结构
HBM堆叠结构如图1所示,包含多层DRAM芯片和一层基本逻辑芯片。4层或8层甚至更多层数的DRAM芯片以堆叠形式整合在一起,不同DRAM芯片之间以及DRAM芯片与逻辑芯片之间用TSV和微凸块技术实现通道连接。每个HBMDRAM芯片可通过多达8条通道与外部相连,每个通道可单独访问1组DRAM阵列,通道间访存相互独立。
逻辑芯片可控制DRAM芯片,并提供与控制器芯片连接的接口,主要包括测试逻辑模块和物理层(PHY)接口模块,其中PHY接口通过中间介质层与CPU/图形处理器(GPU)/片上系统(SoC)直接高速连通,直接存取(DA)端口提供HBM中多层DRAM芯片的测试通道。
中间介质层通过微凸块连接到封装基板,从而形成2.5D的SiP系统。
HBM的技术特点
HBM堆栈没有以外部互连线的方式与信号处理器芯片连接,而是通过中间介质层紧凑而快速地连接,同时HBM内部的不同DRAM采用TSV实现信号纵向连接,HBM具备的特性几乎与片内集成的RAM存储器一样。
HBM的高速、高带宽指标如图2所示,HBM2E和HBM3的单引脚最大输入/输出(I/O)速度分别达到3.2Gbit/s和6.4Gbit/s,低于第五版图形用双倍数据传输率存储器(GDDR5存储器,7.0Gbit/s)。
但HBM的堆栈方式可以通过更多的I/O数量提供远高于GDDR5存储器的总带宽,如HBM2(1024)带宽可以达到307GB/s,而GDDR5存储器(32)的带宽仅为28GB/s。
由于采用了TSV和微凸块技术,DRAM裸片与处理器间实现了较短的信号传输路径以及较低的单引脚I/O速度和I/O电压,使HBM具备更好的内存功耗能效特性。HBM2与传统DDR存储器的单引脚I/O带宽功耗比对比如图3所示,
以DDR3存储器归一化单引脚I/O带宽功耗比为基准,HBM2的I/O功耗比明显低于DDR3、DDR4和GDDR5存储器,相对于GDDR5存储器,HBM2的单引脚I/O带宽功耗比数值降低42%。
目前HBM主要用于数据中心、AI等高性能计算机、AI计算加速卡、高端专业显卡,可以显著提高AI、机器学习运算的性能,如AMDInstinct、NVIDIAA100、华为Ascend910等AI训练加速器以及Xilinx的VirtexUltraScaleFPGA都搭载了HBM芯片。
未来,各种服务器、网络和其他应用程序也可能使用HBM芯片,支持HBM的SoC也将更多。
国外HBM产品及技术发展
2013年10月,JEDEC发布了第一个HBM标准JESD235。JESD235标准定义了具有1024bit接口和单引脚1Gbit/s数据速率的HBM1存储芯片,该芯片堆叠了2个或4个DRAM,HBM1堆叠DRAM架构如图4所示,在基本逻辑芯片上,每个DRAM芯片具有2个128bit通道,共有8个阵列(B0~B7),最多支持8个128bit通道(CH0~CH7),总带宽为128GB/s。
每个通道实质上是具有2n(n代表总线位宽)预取架构的128bitDDR存储器接口,主要包括128bit数据、8bit行命令地址和6bit列命令地址、源同步时钟、校验、数据屏蔽等信号,还包括复位、IEEE1500测试端口和电源、地等公共信号。
访存的读、写操作过程基本与DDR存储器芯片相同。HBM1芯片具备半独立的行、列命令接口,支持读、写命令与其他命令并行执行,增加了命令接口带宽,提高了访存性能。
2015年11月,HBM1标准更新为第二版———JESD235A。HBM的位宽仍是1024bit,支持的数据速率提高到单引脚2.0Gbit/s,总带宽提升到256GB/s,堆栈容量提升到8GB。
HBM1主要增强的功能之一是伪通道模式,该模式将通道分为2个单独的子通道,每个子通道分别具有64bitI/O,从而为每个存储器的读写访问提供128bit预取。伪通道以相同的时钟速率运行,它们共享行列命令总线、时钟信号CK和时钟使能信号CKE。
HBM1使用伪通道模式,进一步优化通道带宽性能,降低延时,提升速率。其他改进包括用于通道软硬修复的通道重新映射模式、防过热保护等。
2018年11月,JEDEC在JESD235A的基础上发布了JESD235B标准,即HBM2技术。HBM2充分融入了I/O高带宽存储技术、TSV工艺,支持最多12层的TSV堆叠,单片容量达到16Gbit,使用1024bit总线,分成8个相互独立的128bit通道,单引脚数据速率提升到2.4Gbit/s,总带宽达到307GB/s。
HBM2可以在全带宽下支持2层、4层、8层和12层的TSV堆栈,从而使系统在容量要求方面具有灵活性,堆栈容量为1GB和24GB。
为适应12层大容量高密度封装,HBM2增加了新的封装选项,并更新多输入特征寄存器(MISR)的配置,测试部分和兼容性与HBM1保持一致。
相对于SKHynix主导研发的HBM1存储芯片,三星、镁光等公司也都推出HBM2产品,且三星更为领先。
2018年,三星宣布量产第二代高带宽显存Aquabolt(HBM2),可提供每引脚2.4Gbit/s的数据传输速度,I/O电压为1.2V,8GBHBM2封装将提供307GB/s的数据带宽,数据传输速度是GDDR5存储器芯片(32GB/s数据带宽)的9.6倍,包含4个Aquabolt的显卡,传输性能可达到1.23TB/s。
2020年1月,JEDEC更新发布HBM技术标准JESD235C,并于2021年2月更新为JESD235D,以支持增加的带宽和容量,即HBM2E。按照HBM2E技术规范,单片最大容量为16Gbit,支持2层、4层、8层和12层的TSV堆栈,无标准高度限制,最大堆栈容量为24GB,支持IEEE1500测试,独立8通道和16个伪通道,单引脚的数据传输速率提升到3.2Gbit/s,匹配1024bit总线,单堆栈理论最大带宽为410GB/s。
2019年,三星推出FlashboltHBM2E内存,堆叠8个16GbitDRAM芯片,使用TSV技术实现8芯片堆栈配置互连。每个Flashbolt封装都具有1024bit总线,每个引脚的数据传输速率达到3.6Gbit/s,提供高达460GB/s的带宽。
2022年1月,JEDEC发布了HBM3高带宽内存标准JESD238,即第四代HBM技术。HBM3在带宽、通道、存储密度、可靠性、能效等层面进行了扩充升级。
在HBM2架构基础上,HBM3扩展到更高的带宽,将HBM2E的每引脚数据速率提高1倍,并定义了高达6.4Gbit/s的数据传输速率,相当于819GB/s;将独立通道的数量从HBM2的8个增加到16个,每个通道有2个伪通道,HBM3实际上支持32个通道;
支持4层、8层和12层TSV堆栈,并为未来扩展至16层TSV堆栈做好了准备,支持8~32Gbit的单层存储容量,堆栈容量为4~64GB。
HBM3引入了片上纠错(ECC)技术,支持实时错误报告,满足更高级平台的可靠性、可用性和可维护性(RAS)需求。I/O电压降低至1.1V,能效进一步提升。
在HBM3标准推出前,SKHynix推出了HBM3内存。SKHynix最新的HBM3芯片堆栈容量为24GB,最高带宽达到了819GB/s,相比HBM2E提升了78%。
目前,HBM3内存提供16GB和24GB2种类型,分别为8层和12层堆叠,每层容量为16Gbit。Rambus推出的HBM3内存单引脚的数据传输速率高达8.4Gbit/s,带宽突破1TB。
从2013年JEDEC发布第一代HBM技术标准JESD235到2022年发布第四代HBM技术标准JESD238,在不到10年的时间里,HBM技术发展经历了4代,其性能对比如表1所示。
美光透露「HBMNext」内存将于2026年左右出现,提供32Gb至64Gb之间的每堆客栈容量,以及每堆占2TB/s或更高的峰值带宽,较HBM3的每堆栈1.2TB/s显著增加。
国内HBM相关公司:
通富微电:深度绑定AMD,拓展全球封测产业布局
深度绑定AMD,AMD的2.5/3D封装也是具有一定的市场份额,在HBM领域也在持续研发,拓展全球封测产业布局,通富微电与世界领先芯片设计公司超威半导体AMD形成了“合资+合作”的强强联合模式,通过收购超威苏州、超威槟城,拓展公司全球产业布局。
通富微电作为国内先进封装领航者,与AMD深度绑定,将在AI浪潮中受益。
香农芯创:公司作为SK海力士分销商之一具有HBM代理资质
香农芯创作为SK海力士的分销商之一,拥有HBM存储产品的代理资质。
公司与海力士的合作使其能够接触到最新的HBM技术,比如HBM3E,这类产品提供了超过1TB/s的数据带宽,对于需要极高带宽和低延迟存储解决方案的市场来说极为关键。
鉴于HBM技术在AI算力需求高的应用场景中的重要作用,香农芯创有望通过其在HBM存储的代理业务,积极参与到AI存储解决方案的供应中,特别是在高性能计算(HPC)、网络交换设备等领域。
雅克科技:公司是SK海力士HBM前驱体材料的核心供应商
雅克科技是全球半导体前驱体材料的主要供应商之一,特别是在HBM存储芯片的生产中发挥着关键作用。
前驱体材料用于半导体薄膜沉积的CVD(化学气相沉积)和ALD(原子层沉积)工艺,是制造先进制程芯片不可或缺的材料,对于提升存储芯片性能至关重要。
公司是SK海力士HBM前驱体材料的核心供应商,而SK海力士占据了全球HBM市场约50%的份额。
随着AI、数据中心和高性能计算(HPC)对HBM存储需求的激增,公司作为关键材料供应商,其业务有望随着HBM市场的高景气度而快速增长。
风险提示:本文仅为个人笔记,不能作为投资决策的依据,不构成任何建议,据此入市风险自担。
沃泽周期
几个朋友一起分析科技与投资,周期与投资的心得
236篇原创内容
公众号
感恩粉丝一路支持陪伴!
新兴行业4
新兴行业 · 目录
上一篇新的技术炒作方向!玻璃基板封装的底层逻辑!