行业资讯 2024 年 7 月 2 日

AI 芯片短缺持续，但曙光乍现

随着生成式人工智慧 (genAI) 的采用持续飙升，GPU 需求量大之余，AI 应用程式需要的高性能内存芯片需求量也大增。目前两者市场供应紧张，但预计情况会有所缓解。

根据IDC的调查研究，全球66%的企业表示他们将在未来18个月内对genAI进行投资。在计划2024年增加IT支出的组织中，基础设施将占到总支出的46%。问题在于：构建 AI 基础设施所需的关键硬体供应不足。

在过去两年中，AI应用的迅速增长给行业带来了压力，使其难以供应运行 genAI 和其他 AI 密集型运算所需的特殊高性能芯片。宾夕法尼亚大学电脑与资讯科学系教授 Benjamin Lee 表示，人们对处理器短缺的关注主要集中在对Nvidia GPU及其他芯片公司（如AMD、Intel和超大规模资料中心营运商）的需求上。然而，很少有人关注对高带宽内存芯片需求的爆炸性增长，这些晶片由韩国的SK海力士 (SK Hynix) 生产。

早前SK海力士表示，由于需求旺盛，能与高性能 GPU 结合使用以处理 AI 处理需求的高带宽内存 (HBM) 产品几乎已订满到2025年。根据市场研究公司 TrendForce 的数据，由于 AI 芯片的价格溢价和容量需求增加，HBM 的价格最近也上涨了 5% 到 10%。

根据TrendForce高级研究副总裁Avril Wu表示，从2024年开始，HBM晶片预计将占DRAM总市场价值的20%以上，到2025年可能超过30%。由于并非所有主要供应商都通过了[高性能HBM]的客户资格认证，买家为了确保稳定和高品质的供应，接受了更高的价格。

为什么 GPU 需要高带宽内存

HBM 为 GPU 提供需要处理的数据。没有 HBM 芯片，数据中心服务器的内存系统将无法跟上 GPU这些高性能处理器的速度。任何为 AI 计算购买 GPU 的人都需要高带宽内存。虽然SK海力士的产量接近极限，但随着三星和美光扩大HBM产量，市场需求应该可以满足。

目前的HBM短缺主要受到台积电先进封装CoWoS产能不足的限制。台积电正在扩充CoWoS产能，预计到明年底时，供应紧张的情况可能会有所缓解。根据 TrendForce 的数据，Nvidia 正在通过提高其 CoWoS 和 HBM 产能来解决 GPU 供应短缺问题。预计这种积极的措施将在2024年第二季将目前的平均交货时间从40周缩短一半，因为新的产能开始投入使用。这种扩张旨在缓解由于 GPU 短缺而阻碍 AI 服务器供应的供应链瓶颈。

根据 Gartner 研究的数据，全球对 AI 芯片的支出预计今年将达到 530 亿美元，并且在未来四年内将增长一倍以上。因此，芯片制造商正加紧推出新的处理器。然而，没有 HBM，这些处理器可能难以满足 genAI 的高性能需求。