2024-12-20
价格暴跌 70%:AI 算力租赁泡沫是如何破灭的?
价格暴跌 70%:AI 算力租赁泡沫是如何破灭的?
作者:Eugene Cheah 编译:J1N,Techub News
AI 算力成本下降,将激发初创公司利用低成本资源进行创新的热潮。
去年由于 AI 算力供应紧张,H100 的租赁价格高达每小时 8 美元,但现在市场上算力供应过剩,价格降到了每小时 2 美元以下。这是由于一些公司在早期签署了算力租赁合同,为了不让过剩的算力浪费,于是开始转售其预留的计算资源,而市场大多选择使用开源模型,导致新模型的需求减少。现在,市场上 H100 的供应量远超需求,因此租用 H100 比购买更划算,投资购买新的 H100 已不再具有收益。
AI 竞赛简史
GPU 算力市场的价格一路飙升,H100 最初的租金约为每小时 4.70 美元,涨到最高超过 8 美元。这是由于项目创始人为了实现下一轮融资,并说服投资者,必须抓紧时间训练他们的 AI 模型。
ChatGPT 于 2022 年 11 月推出,使用的是 A100 系列的 GPU。到了 2023 年 3 月,NVIDIA 推出了新的 H100 系列 GPU,在其宣传中提到 H100 的性能比 A100 强 3 倍,但价格却只比 A100 高 2 倍。
这对 AI 初创公司来说是一个巨大的吸引力。因为 GPU 的性能直接决定了他们可以开发的 AI 模型的速度和规模。H100 的强大性能意味着这些公司能够开发出比以前更快、更大、更高效的 AI 模型,甚至有可能追赶或超过像 OpenAI 这样的行业领导者。当然,这一切的前提是他们拥有足够的资本来购买或租用大量的 H100。
由于 H100 的性能大大提升,再加上 AI 领域的激烈竞争,很多初创公司都投入了巨额资金来抢购 H100,用它来加速他们的模型训练。这种需求的激增导致 H100 的租赁价格暴涨,最初每小时 4.70 美元,但后来涨到超过 8 美元。
这些初创公司之所以愿意支付高昂的租金,是因为他们急于快速训练模型,以便在下一轮融资中吸引投资者的注意,争取到数亿美元的资金来继续扩展他们的业务。
对于拥有大量 H100 GPU 的算力中心(农场)来说,租赁 GPU 的需求非常高,这就像是「送上门来的钱」。原因是这些 AI 初创公司急于租用 H100 来训练他们的模型,甚至愿意预付租金。这意味着 GPU 农场可以以长期的每小时 4.70 美元(或更高)租出他们的 GPU。
根据计算,如果他们能以这种价格持续出租 GPU,那么他们投资购买 H100 的回报周期(即收回购买成本的时间)将不到 1.5 年。回报期结束后,之后每台 GPU 每年能带来超过 10 万美元的净现金流收入。
由于对 H100 和其他高性能 GPU 的需求持续高涨,GPU 农场的投资者看到了巨大的利润空间,因此他们不仅同意了这种商业模式,甚至还追加了更大的投资,购买更多 GPU 以赚取更多利润。
《郁金香的愚蠢》:创作于有记载的历史上第一次投机泡沫之后,郁金香价格在 1634 年持续攀升,并于 1637 年 2 月崩盘
随着人工智能和大数据处理需求的增长,企业对高性能 GPU(尤其是 NVIDIA 的 H100)的需求激增,为了支持这些计算密集型任务,全球企业在硬件和基础设施上初期已投入约 6000 亿美元,用于购买 GPU、建设数据中心等,以提升计算能力。然而,由于供应链的延迟,H100 的价格在 2023 年大部分时间里居高不下,甚至超过每小时 4.70 美元,除非买家愿意预付大额定金。到了 2024 年初,随着更多的供应商进入市场,H100 的租赁价格降至约 2.85 美元,但我开始收到各类推销邮件,反映了市场供应增加后竞争加剧的情况。
虽然最初 H100 GPU 的租赁价格在每小时 8 至 16 美元之间,但到了 2024 年 8 月,拍卖式租赁价格已降至每小时 1 到 2 美元。市场价格每年预计会下降 40% 或更多,远超 NVIDIA 预测的 4 年内维持每小时 4 美元的预期。这种迅速的价格下滑给那些刚购买高价新 GPU 的人带来了财务风险,因为他们可能无法通过租赁回收成本。
投资 5 万美元购买一张 H100 的资本回报率是多少?
在不考虑电力和冷却成本的前提下,H100 的购买成本大约为 5 万美元,预计使用寿命为 5 年。租赁通常有两种模式:短期按需租赁和长期预订。短期租赁价格较高,但灵活性强,长期预订则价格较低但稳定。接下来,文章会通过分析这两种模式的收益,来计算投资者在 5 年内能否收回成本并获得盈利。
短期按需租赁
租赁价格以及对应的收益:
>$2.85 : 超越股市 IRR,实现盈利。