人工智能的下一个阶段可能需要截然不同的处理器

全球市值最高的芯片巨头NVIDIA，正面临业务重心转换的挑战。AI算力的需求核心已从“模型训练”悄然转向“模型推理”（即让模型回答实际问题）。据麦肯锡预测，到本十年末，推理将占据AI数据中心需求的三分之二。

训练与推理对硬件的要求截然不同：

相比板载缓存（SRAM），读取外部DRAM速度慢且耗能高。随着AI模型日益庞大，计算性能的提升远超内存带宽的增长，形成了制约推理速度的“内存墙”。

NVIDIA已推出专门针对推理的Groq 3 LPX芯片，通过更精密的软件调度来优化内存访问。与此同时，一批初创企业正尝试通过更激进的硬件设计挑战其霸主地位：

尽管初创公司设计新颖，但面临巨大风险：芯片设计周期长达12-18个月，而AI算法的演进速度极快，高度定制化的硬件极易因算法更迭而过时。

NVIDIA在“训练”时代已大获全胜，但在AI推理的新战场上，群雄并起，未来谁能胜出仍是未知数。