
5月27日,存储芯片大厂闪迪(Sandisk)首席技术官(CTO)兼执行副总裁Alper Ilkbahar在接受《日经亚洲》采访时抛出了一个核心判断:全球AI竞赛正变得越来越“以存储器为中心”,而非算力。在他看来,这一趋势或将加剧全球史无前例的存储芯片供应紧张局面。
“算力堆砌的时代正在过去”
Ilkbahar在访谈中详细阐释了为何存储器正取代算力成为AI的新瓶颈。他指出,有三个关键趋势正在让存储器的战略地位大幅提升,每一个都在将AI系统的重心从计算单元拉向存储单元:
趋势一:大语言模型的“胃口”在膨胀。随着大语言模型变得更大、更智能,它们需要更多存储器才能有效运作。模型规模的指数级增长直接推高了对内存容量的需求——更大的模型参数意味着每一轮推理都需要加载更多的权重数据,而这些数据必须常驻于高带宽存储器中。
趋势二:KV缓存——AI的“短期记忆”需求增长。OpenAI的ChatGPT、谷歌的Gemini及Anthropic的Claude等系统越来越依赖所谓的KV(Key-Value)缓存。简单来说,KV缓存就像AI的短期记忆,让系统能够记住之前的用户输入及对话早期部分,而不必从头开始重复计算每项内容。这种方法显著提升了速度与效率。但随着AI对话及上下文窗口变长,KV缓存需要越来越庞大的存储器容量。这也是为什么“长上下文”模型会带来指数级增长的存储需求。
趋势三:混合专家模型(MoE)——减运算、增存储。Ilkbahar特别指出,MoE架构的普及是存储器需求攀升的另一关键因素。这种架构通过“稀疏激活”减少计算量,但需要将所有专家的参数都加载到内存中——结果是:计算需求下降,存储需求反而上升。这正是他将AI竞赛称为“以存储器为中心”的核心逻辑。
Ilkbahar透露,这些趋势已对市场产生实质性影响——客户正主动作出预先承诺,并签订长期采购协议以确保未来供应。“现在客户开始主动锁定长期供应,”他在采访中表示,“这反映了行业对存储器短缺的普遍担忧。”
从资本市场反应来看,市场早已嗅到了这一变革的气息。闪迪股价今年以来已累计飙升约5.7倍,自去年5月以来的一年内涨幅超过35倍。这一惊人的市场表现,正是投资者对存储器在AI时代战略价值重估的直接体现。
HBF:闪迪的下一代王牌
面对即将到来的存储器需求井喷,闪迪的应对方案是什么?Ilkbahar给出了明确答案:高带宽闪存——High Bandwidth Flash(HBF)。
Ilkbahar指出,随着AI推理工作负载需要更大存储器容量,HBF可发挥更大作用。HBF能提供远高于HBM的容量与存储器密度,同时保持相近的频宽,更适合未来的AI推理需求。
HBF 的设计概念与 HBM 相似,均通过硅通孔(TSV)技术将多层芯片堆叠连接。 差别在于HBM以DRAM为核心,而HBF则采用NAND Flash闪存进行堆栈,具备“容量更大、成本更具优势”的特点。虽然NAND Flash的速度不及DRAM,但容量往往高出10倍以上,若以数百层乃至数千层堆叠方式构建,将能有效满足AI模型对庞大储存的需求,有望成为NAND Flash版本的HBM。
Ilkbahar也表示:“随着AI推理工作负载需要更大存储器容量,HBF能提供远高于HBM的容量与存储器密度,同时保持相近的带宽,更适合未来的AI推理需求。”
“我相信下一件大事将是HBF,”Ilkbahar在采访中表示,目前闪迪正在设计相关芯片。他还给出了清晰的时间表:HBF存储器芯粒将于今年底提供样品,配备控制器的完整产品预计明年推出。
值得一提的是,闪迪已与HBM市场的领导者SK海力士合作,共同制定HBF技术标准。两家存储器巨头的联手,有望加速HBF技术的标准化进程。
存储器不再是“配角”
Ilkbahar在采访当中的表态,实际上点出了一个行业正在发生的深层变革:在AI时代,存储器的战略地位正在被重新定义。
过去,行业关注的焦点几乎全部集中在GPU的算力上。但当前的现实是,即便拥有最强的算力集群,如果存储器带宽不足或容量不够,AI芯片也无法全速运转。随着模型规模持续扩大、上下文窗口不断延伸,存储器的瓶颈效应将愈发凸显。
这一趋势已在供应链端产生连锁反应。行业分析人士指出,如果AI工作负载继续按当前轨迹扩展,存储器芯片的供需缺口可能比预期来得更早、更大。