ViWANT
8 5 月 2026, 周五

AI热潮如何加剧内存危机?

内存危机的底层逻辑正在发生微妙位移。过去两年,芯片短缺多被归咎于供应链中断与地缘政治摩擦,但眼下这场风暴的核心驱动力已截然不同——生成式AI的爆发式需求正在重塑整个半导体产业的资源分配格局,而内存作为算力基础设施的"燃料",首当其冲承受挤压。

算力饥渴的传导链条

训练一个大语言模型究竟需要多少内存?以GPT-4级别的模型为例,单就参数存储就需要数百GB的HBM(高带宽内存),若加上训练过程中的优化器状态、激活值缓存,实际消耗往往翻倍。这还没计入推理部署环节——企业级AI服务器普遍配置1.5TB至2TB的DRAM,是传统云计算节点的六到八倍。

更棘手的是需求曲线的陡峭程度。2023年全球HBM出货量约15亿GB,市场机构预测2025年将突破50亿GB,这种增速在任何成熟制造业都堪称异常。三星、SK海力士、美光三巨头虽持续扩产,但HBM的制造工艺复杂度远超标准DRAM:从晶圆投片到成品出货需要四至五个月,而良率爬坡往往耗费数个季度。产能建设的物理极限,撞上了AI资本开支的狂热节奏。

消费市场的"抽血效应"

晶圆厂的总产能是相对刚性的。当AI服务器芯片以数倍溢价抢占先进制程时,消费级产品的生存空间被系统性压缩。这不是简单的"涨价"问题,而是产品结构的根本性扭曲——高通CFO阿卡什·帕尔基瓦拉所说的"高端优先"策略,本质是制造商在资源约束下的理性选择,却客观上制造了二级通胀。

一个常被忽视的细节:DDR4向DDR5的迁移节奏已被彻底打乱。AI对DDR5和高带宽内存的吞噬,使得晶圆厂加速淘汰旧产线,而Sonos等依赖DDR4的厂商被迫在全球扫货。这种技术迭代的"踩踏",让本可平滑过渡的升级周期变成了一场库存恐慌。

价格信号的失灵与重构

传统半导体周期中,价格上涨会抑制需求、刺激供给,最终回归均衡。但当前内存市场的价格机制部分失效——云厂商和AI实验室的资本预算对价格敏感度极低,它们签下的多年长约锁定了未来数年的产能,却将波动风险转嫁给缺乏议价能力的消费电子供应链。

SanDisk CEO戴维·戈克莱尔的表态颇具代表性:面对"承诺采购量、季度谈价格"的旧模式,供应商开始说"不"。这种合同结构的变迁,意味着内存定价正从现货市场向双边谈判转移,价格透明度下降,小型买家的采购成本波动反而加剧。

终端产品的隐性妥协

消费者尚未充分意识到的是,"内存危机"未必表现为标价签上的数字飙升,更可能隐藏在产品定义的悄然降级。某品牌新款笔记本沿用16GB"标配"而非跟进32GB,某游戏主机版本迭代延迟——这些决策的背后,往往是采购团队在配额分配中的艰难取舍。

微软对Copilot Plus PC的内存配置坦诚,无意间揭示了行业的一个尴尬现实:AI功能的营销承诺与硬件交付能力之间,存在一道正在扩大的鸿沟。当软件层级的"智能"叙事超前于物理层级的存储供给,用户体验的裂缝便难以避免。

这场危机的终点难以预测。部分分析师将目光投向2026年下半年,期待新产能释放带来缓和;亦有声音认为,AI推理效率的提升可能重塑需求结构,在硬件层面制造新的不确定性。唯一确定的是,内存作为数字经济的底层商品,其分配逻辑已被永久改写——算力即权力,而权力的价格正在重估。