HBF技术崛起:NAND存储的“封神之路”能否复制HBM奇迹?
发布时间:
2025-11-06 10:03:59
来源: 保山日报网
公众号记得加星标⭐️,第一时间看推送不会错过。
近期,存储市场正经历一场由AI需求驱动的供需剧变。云服务巨头资本支出持续扩张,人工智能训练与推理任务对内存的依赖度飙升,直接导致内存供应短缺问题加剧。三星率先于10月暂停DDR5 DRAM合约定价,引发内存价格狂飙,而NAND闪存也在这轮涨价潮中扮演关键角色——9月以来,512Gb TLC晶圆价格稳步攀升至5美元,1Tb TLC/QLC晶圆价格触及6.5至7.2美元区间,传统“廉价大容量存储”的定位正被彻底改写。
这场变革的核心,指向一项新兴技术概念:高带宽闪存(HBF,High-Bandwidth Flash)。若将HBM视为DRAM在AI时代的“封神之作”,HBF或正为NAND开启同样的颠覆性路径。
HBF:从概念到产业共识的跨越今年上半年,闪迪在投资者日上首次提出高带宽闪存概念,其技术本质是NAND版本的高带宽内存技术。通过将16层NAND堆栈经逻辑芯片连接至中介层,再以多通道高带宽方式与GPU或其他处理器交互,HBF试图在DRAM的速度与NAND的容量之间找到最优解。
当前AI模型向多模态、长上下文方向演进——GPT-4V的视觉理解、Claude的100K token上下文、Gemini的多模态能力——这些应用需在内存中维护海量中间状态数据。传统DRAM虽速度快,但容量扩展成本高昂;NAND虽容量大,但访问延迟显著。HBF依托闪迪成熟的CBA(CMOS直接键合阵列)技术,将逻辑芯片与3D NAND堆叠层键合,其中16层核心芯片通过类HBM的硅通孔(TSV)实现层间互联。这种设计使HBF在性能与成本间达成平衡:据闪迪HBF负责人Ilkbahar透露,其能“匹配HBM内存的带宽表现,同时以相近成本提供8至16倍存储容量”,这一优势在大模型存储场景中极具竞争力。
2月闪迪发布HBF概念时,NAND市场尚处低迷期,但技术潜力迅速吸引行业关注,多家厂商加速布局,生态雏形初现。
四大阵营的技术路径博弈SK海力士:生态联盟的先行者在2025年OCP全球峰会上,SK海力士发布包含HBF的AI产品战略,构建“AIN Family”产品阵容。其中,AIN B正是采用HBF技术的核心产品,通过将高容量、低成本的NAND与HBM堆叠结构结合,解决内存容量不足问题。
SK海力士表示:“AI推理市场对快速处理海量数据的需求激增,我们以‘AIN(AI-NAND)Family’满足客户需求。”该系列从性能(Performance)、带宽(Bandwidth)、容量(Density)三维度优化:
AIN P(Performance):针对大规模AI推理环境设计,通过最小化计算与存储瓶颈,提升处理速度与能效,计划2026年底推出样品。AIN D(Density):以低功耗、低成本存储大容量数据为目标,将QLC SSD容量从TB级提升至PB级,兼具SSD速度与HDD经济性,定位中间层级存储。AIN B(Bandwidth):通过垂直堆叠NAND扩大带宽,正是采用HBF技术的产品名称。为推动AIN B生态发展,SK海力士举办“HBF之夜”活动,邀请全球科技公司代表与专家团参与圆桌讨论,提议业界携手加速NAND创新。公司开发总括安贤社长表示:“我们将通过下一代NAND存储与客户及合作伙伴共同引领AI内存市场。”
据业界消息,SK海力士已向清州M15X工厂运入首批设备,该厂将重点量产下一代HBM产品,并率先完成第六代HBM4量产准备。HBM产能扩张为HBF部署奠定基础——HBF可位于HBM基础芯片中LPDDR的位置,补充容量限制,使大型AI模型直接存储于GPU上。凭借HBM生态积累,SK海力士有望成为首批量产HBF的NAND厂商。
闪迪:技术激进派的豪赌闪迪宣布将于2026年下半年提供HBF样本,2027年初为推理AI提供正式产品,时间表彰显技术信心。最初,工程师曾设想在HBF封装中融合NAND与DRAM,以DRAM缓存关键数据(如AI推理中的键值缓存KV caches)。但DeepSeek AI提出的“多头潜在注意力”技术改变了这一思路——该技术将KV缓存压缩为潜在向量存储,实现93%的容量缩减,使HBF无需依赖DRAM即可承载超大模型:单块GPU搭载的HBF内存可达4TB容量(由8颗512GB HBF芯片组成),足以容纳16位权重的GPT-4模型(1.8万亿参数,需3.6TB存储),彻底消除“模型数据跨设备调度”的效率损耗。
HBF的核心价值在于为混合专家模型(MOE)及多模态大模型端侧部署提供可能。MOE模型通过拆解超大模型为多个“专家子模型”,生成token时仅激活部分专家,大幅降低计算需求,但对存储容量要求极高;多模态模型同样属于“内存受限型应用”,这些正是HBF的适配场景。
以智能手机为例,端侧AI体验受限于内存、功耗与空间——即使将模型缩减至数十亿参数,性能仍难满足需求。HBF通过架构创新破解困局:一颗512GB HBF芯片可承载640亿参数的MOE模型(与Llama 3.1、DeepSeek 70B性能相当),且可拆分为8个64GB迷你阵列,为MOE的8个专家子模型提供专属存储与数据通道,实现“精准激活、高效响应”的端侧AI体验。闪迪将其形容为“赋能边缘设备的卓越AI体验”。
值得注意的是,闪迪HBF负责人Ilkbahar曾担任英特尔Optane部门副总裁。Optane技术因专有化策略失败,这一教训影响了闪迪的HBF策略——2025年8月,SK海力士与闪迪签署HBF标准化谅解备忘录,通过开放式生态平衡技术激进与生态开放,避免重蹈覆辙。
铠侠:多路径探索的务实派作为闪迪的NAND制造合资企业伙伴,铠侠在HBF赛道上展现务实与多元化策略。2025年8月,铠侠发布面向边缘服务器的高速闪存驱动器原型,采用串联连接的闪存“珠子”(beads)与PCIe 6总线,实现5TB容量和64 GBps数据速率。
其创新在于采用菊花链连接方式:闪存珠子与控制器以菊花链连接至内存板,而非传统总线连接。铠侠强调,“即使增加闪存存储器数量,带宽也不会下降”,解决了传统架构的带宽瓶颈问题。该原型通过PCIe Gen 6总线(8通道)提供高达64 GBps的速度,总吞吐量约为美光9650 Pro的2.3倍,按每通道计算高出约14%。
此外,铠侠在接口应用低幅度信号和失真校正技术,实现内存珠子与控制器间4 Gbps带宽,并通过控制器预取技术缩短读取延迟。据《日经新闻》报道,应英伟达要求,铠侠正在开发一款1亿IOPS的SSD,预计2027年推出,支持PCIe 7.0标准,两个SSD直接连接英伟达GPU可提供2亿IOPS性能,部分替代HBM用于生成式AI工作负载。
目前,铠侠AI SSD有三条技术路径:CXL连接的XL-Flash驱动器、菊花链连接的XL-Flash珠子,以及XL-Flash HBF实现方案(多层XL-Flash芯片堆栈通过TSV连接基础逻辑层)。这种全方位布局降低了单一技术路线失败的风险,但资源分散也可能导致关键突破延迟。2027年与英伟达合作的超高速AI SSD推出时,或将检验这一策略的成败。
三星:沉默巨头的后发策略三星在HBF上态度谨慎。据韩国《金融新闻》报道,三星已启动自有HBF产品早期概念设计,利用3D NAND堆叠、TSV工艺、先进封装等技术积累,开发满足数据中心需求的新解决方案。然而,产品规格与量产时间表尚未明确,开发仍处于早期阶段。
作为全球NAND市场份额最大的厂商,三星在DRAM和NAND领域均有深厚积累,其垂直整合能力(逻辑芯片、内存芯片、封装工艺协同优化)在开发HBF时具备天然优势。但三星在HBM市场的表现或影响其HBF策略——尽管在DRAM市场长期领先,但在HBM领域被SK海力士反超,后者凭借与英伟达的深度绑定成为首选供应商,而三星的HBM产品因良率、性能等问题遭遇质疑。
分析认为,三星HBM与SK海力士的质量差异可能源于TSV使用过于节省。TSV在电力供应和热管理中至关重要,减少数量可能导致产品稳定性下降。这一教训对HBF开发同样适用——HBF需大量TSV连接堆叠的NAND层,成本与性能平衡是关键。更深层的问题在于生态位把控:SK海力士在HBM市场的成功源于早期与英伟达的紧密合作,而三星试图以标准化产品打入市场,导致竞争被动。
对于HBF,三星选择“后发制人”:先观察竞争对手的技术路线与客户反馈,再以更成熟的方案进入市场。这种策略在技术标准未确定的阶段或更为稳妥。
NAND的“第二春”:HBF能否复制HBM的封神之路?从廉价存储到高价值核心组件,NAND正经历与HBM相似的转型:均源于AI需求爆发,需突破传统架构限制,依赖生态协同演进。不同的是,HBM的故事已写就,而HBF的故事才刚开始。SK海力士的生态联盟、闪迪的技术激进、铠侠的多元探索、三星的后发准备,四大阵营的博弈将决定新兴市场格局。
HBM用五年时间从配角成为主角,NAND能否在HBF加持下复制这条路径?答案或许藏在2026-2027年的关键窗口期。对于内存厂商而言,这不仅是技术竞赛,更是关于未来AI基础设施话语权的争夺战。
免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4218期内容,欢迎关注。
加星标⭐️第一时间看推送,小号防走丢 求推荐
近期,存储市场正经历一场由AI需求驱动的供需剧变。云服务巨头资本支出持续扩张,人工智能训练与推理任务对内存的依赖度飙升,直接导致内存供应短缺问题加剧。三星率先于10月暂停DDR5 DRAM合约定价,引发内存价格狂飙,而NAND闪存也在这轮涨价潮中扮演关键角色——9月以来,512Gb TLC晶圆价格稳步攀升至5美元,1Tb TLC/QLC晶圆价格触及6.5至7.2美元区间,传统“廉价大容量存储”的定位正被彻底改写。
这场变革的核心,指向一项新兴技术概念:高带宽闪存(HBF,High-Bandwidth Flash)。若将HBM视为DRAM在AI时代的“封神之作”,HBF或正为NAND开启同样的颠覆性路径。
HBF:从概念到产业共识的跨越今年上半年,闪迪在投资者日上首次提出高带宽闪存概念,其技术本质是NAND版本的高带宽内存技术。通过将16层NAND堆栈经逻辑芯片连接至中介层,再以多通道高带宽方式与GPU或其他处理器交互,HBF试图在DRAM的速度与NAND的容量之间找到最优解。
当前AI模型向多模态、长上下文方向演进——GPT-4V的视觉理解、Claude的100K token上下文、Gemini的多模态能力——这些应用需在内存中维护海量中间状态数据。传统DRAM虽速度快,但容量扩展成本高昂;NAND虽容量大,但访问延迟显著。HBF依托闪迪成熟的CBA(CMOS直接键合阵列)技术,将逻辑芯片与3D NAND堆叠层键合,其中16层核心芯片通过类HBM的硅通孔(TSV)实现层间互联。这种设计使HBF在性能与成本间达成平衡:据闪迪HBF负责人Ilkbahar透露,其能“匹配HBM内存的带宽表现,同时以相近成本提供8至16倍存储容量”,这一优势在大模型存储场景中极具竞争力。
2月闪迪发布HBF概念时,NAND市场尚处低迷期,但技术潜力迅速吸引行业关注,多家厂商加速布局,生态雏形初现。
四大阵营的技术路径博弈SK海力士:生态联盟的先行者在2025年OCP全球峰会上,SK海力士发布包含HBF的AI产品战略,构建“AIN Family”产品阵容。其中,AIN B正是采用HBF技术的核心产品,通过将高容量、低成本的NAND与HBM堆叠结构结合,解决内存容量不足问题。
SK海力士表示:“AI推理市场对快速处理海量数据的需求激增,我们以‘AIN(AI-NAND)Family’满足客户需求。”该系列从性能(Performance)、带宽(Bandwidth)、容量(Density)三维度优化:
AIN P(Performance):针对大规模AI推理环境设计,通过最小化计算与存储瓶颈,提升处理速度与能效,计划2026年底推出样品。AIN D(Density):以低功耗、低成本存储大容量数据为目标,将QLC SSD容量从TB级提升至PB级,兼具SSD速度与HDD经济性,定位中间层级存储。AIN B(Bandwidth):通过垂直堆叠NAND扩大带宽,正是采用HBF技术的产品名称。为推动AIN B生态发展,SK海力士举办“HBF之夜”活动,邀请全球科技公司代表与专家团参与圆桌讨论,提议业界携手加速NAND创新。公司开发总括安贤社长表示:“我们将通过下一代NAND存储与客户及合作伙伴共同引领AI内存市场。”
据业界消息,SK海力士已向清州M15X工厂运入首批设备,该厂将重点量产下一代HBM产品,并率先完成第六代HBM4量产准备。HBM产能扩张为HBF部署奠定基础——HBF可位于HBM基础芯片中LPDDR的位置,补充容量限制,使大型AI模型直接存储于GPU上。凭借HBM生态积累,SK海力士有望成为首批量产HBF的NAND厂商。
闪迪:技术激进派的豪赌闪迪宣布将于2026年下半年提供HBF样本,2027年初为推理AI提供正式产品,时间表彰显技术信心。最初,工程师曾设想在HBF封装中融合NAND与DRAM,以DRAM缓存关键数据(如AI推理中的键值缓存KV caches)。但DeepSeek AI提出的“多头潜在注意力”技术改变了这一思路——该技术将KV缓存压缩为潜在向量存储,实现93%的容量缩减,使HBF无需依赖DRAM即可承载超大模型:单块GPU搭载的HBF内存可达4TB容量(由8颗512GB HBF芯片组成),足以容纳16位权重的GPT-4模型(1.8万亿参数,需3.6TB存储),彻底消除“模型数据跨设备调度”的效率损耗。
HBF的核心价值在于为混合专家模型(MOE)及多模态大模型端侧部署提供可能。MOE模型通过拆解超大模型为多个“专家子模型”,生成token时仅激活部分专家,大幅降低计算需求,但对存储容量要求极高;多模态模型同样属于“内存受限型应用”,这些正是HBF的适配场景。
以智能手机为例,端侧AI体验受限于内存、功耗与空间——即使将模型缩减至数十亿参数,性能仍难满足需求。HBF通过架构创新破解困局:一颗512GB HBF芯片可承载640亿参数的MOE模型(与Llama 3.1、DeepSeek 70B性能相当),且可拆分为8个64GB迷你阵列,为MOE的8个专家子模型提供专属存储与数据通道,实现“精准激活、高效响应”的端侧AI体验。闪迪将其形容为“赋能边缘设备的卓越AI体验”。
值得注意的是,闪迪HBF负责人Ilkbahar曾担任英特尔Optane部门副总裁。Optane技术因专有化策略失败,这一教训影响了闪迪的HBF策略——2025年8月,SK海力士与闪迪签署HBF标准化谅解备忘录,通过开放式生态平衡技术激进与生态开放,避免重蹈覆辙。
铠侠:多路径探索的务实派作为闪迪的NAND制造合资企业伙伴,铠侠在HBF赛道上展现务实与多元化策略。2025年8月,铠侠发布面向边缘服务器的高速闪存驱动器原型,采用串联连接的闪存“珠子”(beads)与PCIe 6总线,实现5TB容量和64 GBps数据速率。
其创新在于采用菊花链连接方式:闪存珠子与控制器以菊花链连接至内存板,而非传统总线连接。铠侠强调,“即使增加闪存存储器数量,带宽也不会下降”,解决了传统架构的带宽瓶颈问题。该原型通过PCIe Gen 6总线(8通道)提供高达64 GBps的速度,总吞吐量约为美光9650 Pro的2.3倍,按每通道计算高出约14%。
此外,铠侠在接口应用低幅度信号和失真校正技术,实现内存珠子与控制器间4 Gbps带宽,并通过控制器预取技术缩短读取延迟。据《日经新闻》报道,应英伟达要求,铠侠正在开发一款1亿IOPS的SSD,预计2027年推出,支持PCIe 7.0标准,两个SSD直接连接英伟达GPU可提供2亿IOPS性能,部分替代HBM用于生成式AI工作负载。
目前,铠侠AI SSD有三条技术路径:CXL连接的XL-Flash驱动器、菊花链连接的XL-Flash珠子,以及XL-Flash HBF实现方案(多层XL-Flash芯片堆栈通过TSV连接基础逻辑层)。这种全方位布局降低了单一技术路线失败的风险,但资源分散也可能导致关键突破延迟。2027年与英伟达合作的超高速AI SSD推出时,或将检验这一策略的成败。
三星:沉默巨头的后发策略三星在HBF上态度谨慎。据韩国《金融新闻》报道,三星已启动自有HBF产品早期概念设计,利用3D NAND堆叠、TSV工艺、先进封装等技术积累,开发满足数据中心需求的新解决方案。然而,产品规格与量产时间表尚未明确,开发仍处于早期阶段。
作为全球NAND市场份额最大的厂商,三星在DRAM和NAND领域均有深厚积累,其垂直整合能力(逻辑芯片、内存芯片、封装工艺协同优化)在开发HBF时具备天然优势。但三星在HBM市场的表现或影响其HBF策略——尽管在DRAM市场长期领先,但在HBM领域被SK海力士反超,后者凭借与英伟达的深度绑定成为首选供应商,而三星的HBM产品因良率、性能等问题遭遇质疑。
分析认为,三星HBM与SK海力士的质量差异可能源于TSV使用过于节省。TSV在电力供应和热管理中至关重要,减少数量可能导致产品稳定性下降。这一教训对HBF开发同样适用——HBF需大量TSV连接堆叠的NAND层,成本与性能平衡是关键。更深层的问题在于生态位把控:SK海力士在HBM市场的成功源于早期与英伟达的紧密合作,而三星试图以标准化产品打入市场,导致竞争被动。
对于HBF,三星选择“后发制人”:先观察竞争对手的技术路线与客户反馈,再以更成熟的方案进入市场。这种策略在技术标准未确定的阶段或更为稳妥。
NAND的“第二春”:HBF能否复制HBM的封神之路?从廉价存储到高价值核心组件,NAND正经历与HBM相似的转型:均源于AI需求爆发,需突破传统架构限制,依赖生态协同演进。不同的是,HBM的故事已写就,而HBF的故事才刚开始。SK海力士的生态联盟、闪迪的技术激进、铠侠的多元探索、三星的后发准备,四大阵营的博弈将决定新兴市场格局。
HBM用五年时间从配角成为主角,NAND能否在HBF加持下复制这条路径?答案或许藏在2026-2027年的关键窗口期。对于内存厂商而言,这不仅是技术竞赛,更是关于未来AI基础设施话语权的争夺战。
免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4218期内容,欢迎关注。
加星标⭐️第一时间看推送,小号防走丢 求推荐
