微软,为什么放任OpenAI“另寻新欢”?
10月17日消息,企业合作关系的裂痕,往往以不欢而散告终。然而,微软与OpenAI却为科技联盟探索出一种全新范式:微软主动放宽排他性协议,允许OpenAI与其他云服务商展开合作。
这一转变的背后是OpenAI急速膨胀的计算需求。据预测,到2030年,OpenAI在甲骨文等第三方云服务上的服务器支出,甚至可能超过其对微软的支出。面对AI训练对算力的巨大渴求,微软高管也对过度投资数据中心可能带来的产能过剩与回报风险心存顾虑。为此,双方最终选择以更开放的姿态重塑合作框架。
这一决策不仅揭示了超大规模AI模型对算力资源的惊人消耗,也预示着头部科技企业正在探索更具弹性的新型合作伙伴关系。
翻译全文
过去三年间,OpenAI从一家小型AI研究实验室迅速成长为全球估值最高的初创企业。在此期间,其每年用于支持AI运算的数十亿美元服务器开支,几乎全部由微软一家承担。然而,近期OpenAI接连宣布与微软的多家竞争对手达成巨额合作协议,表明其所需的计算规模已超出其原独家云服务伙伴的承载能力。
据知情人士透露,这些新合作的规模之大,预计将使OpenAI在2030年之前在甲骨文等微软竞争对手平台上的服务器租赁支出,反超其对微软的投入。OpenAI为此规划的服务器总预算高达惊人的4500亿美元。
微软与OpenAI的合作曾被视为AI时代最具影响力的联盟,既推动了微软Azure云业务的增长,也支撑了OpenAI的快速崛起。但随着OpenAI计算需求的爆炸式增长,微软的独家合作条款反而被视为制约其发展的瓶颈,双方在过去一年中就合作条款进行了多轮艰难谈判。
这种合作摩擦的背后是双方的不同立场。对OpenAI而言,其逐月倍增的计算需求已呈井喷之势。首席执行官山姆·奥特曼(Sam Altman)不断敦促微软加速扩容。而微软方面则表示,数据中心建设受制于电网接入等基础设施环节,无法完全按OpenAI期望的速度交付。
转机出现在2024年夏天。据知情人士称,奥特曼与微软首席执行官萨提亚·纳德拉(Satya Nadella)达成共识:鉴于OpenAI的发展速度,微软已难以继续担任其唯一云服务提供商。微软随后允许OpenAI寻求其他云服务伙伴。
其中,OpenAI与甲骨文的合作最为引人注目,OpenAI计划在该平台投入数千亿美元。此外,该公司还与CoreWeave签订了价值224亿美元的云服务合同,与谷歌达成合作,并获英伟达1000亿美元投资用于自建数据中心。
尽管部分微软股东更希望保持独家合作,但微软管理层认为开放合作是正确的选择。根据现有协议,微软仍可从OpenAI快速增长的收入中获得20%的分成,并保留其模型的无偿使用权。更重要的是,微软目前仍是唯一为OpenAI提供模型训练所需专用超级计算机的云服务商,这是其计算工作中至关重要的部分。
不过,微软内部对OpenAI的新合作持保留态度。有高管认为,甲骨文在2032年前提供4.5吉瓦数据中心容量的承诺在实施层面存在困难,同时担心下一代芯片定价未明可能导致预算超支。相较之下,投资者普遍认为,微软在数据中心投资方面采取了比甲骨文更审慎的策略。
坎坷的谈判之路
2023年初,当微软向OpenAI注资100亿美元时,这家初创公司还远未展现出如今的行业地位。当时OpenAI仅推出了ChatGPT的“研究预览版”,尚未实现任何商业化收入。然而,这款聊天机器人以超出预期的速度快速积累用户,促使双方重新评估并提升了原定的计算能力合作规模。值得一提的是,当时OpenAI的服务器开支仍完全依赖于微软的投资资金。
双方合作关系的重大考验出现在2023年11月,当时OpenAI董事会突然宣布解雇奥特曼。这一决定令微软深感意外。尽管奥特曼很快官复原职,但此事促使微软管理层开始重新审视与OpenAI的合作模式,考虑将其从“战略合作伙伴”调整为更接近常规Azure客户的关系。
不过,OpenAI最终仍是微软最重要的客户之一。在接下来的一年里,微软投入了空前的资源为OpenAI定制超级计算机。
据知情人士透露,2024年初,双方高管开始商讨为OpenAI建设超大规模数据中心的计划。据称,微软与OpenAI内部将此项目命名为“星际之门”(Stargate)。而微软内部另有一个代号“水星”(Mercury)。
当时,微软已在菲尼克斯等地的数据中心为OpenAI提供了数百兆瓦的计算能力,并刚刚启动威斯康星州新数据中心的建设。该中心计划部署为OpenAI专设的、代号为“Fairwater”的超级计算机,预计耗资数十亿美元,电力负荷近1吉瓦,相当于一个中小城市的用电规模。按规划,该设施与微软在亚特兰大的数据中心将于2026年前投产,而威斯康星州的第二个数据中心则定于2028年启用。
但奥特曼预判,即便这些项目全部落地,仍无法满足未来的算力需求。他向微软提出,OpenAI还需要额外数吉瓦的计算容量。据双方估算,满足这一需求需再投入数百亿美元,主要用于采购英伟达芯片和保障电力供应。
然而,2024年威斯康星州数据中心的建设进度却给合作蒙上了阴影。由于施工延误,项目投产时间推迟了数月。虽然OpenAI尚未正式签署该中心的服务器租用协议,但该公司早已将部分产能纳入发展规划,迫切期待其如期交付。
为缓解算力缺口,微软通过向CoreWeave等云服务商租用服务器作为临时措施。但奥特曼对微软的推进效率日益不满,认为对方未能充分重视其需求。据知情人士透露,奥特曼及其他OpenAI高管曾多次直接向微软管理层表达这种焦虑情绪。
算力容量激增
就在奥特曼不断向微软争取更多算力的同时,他也在积极寻求修改双方协议,以打破原有的排他性约束。
2024年初夏,据知情人士透露,奥特曼正式向微软提出请求,希望获准与其他云服务商洽谈服务器租赁事宜。此时,微软正面临美国联邦贸易委员会和欧盟监管机构对其OpenAI投资案的审查,纳德拉对可能被视为“阻碍OpenAI发展”的舆论格外敏感。
在此背景下,微软于当年夏季主动放弃了在OpenAI董事会的观察员席位,以缓解监管压力。此前,埃隆·马斯克(Elon Musk)等批评者曾公开指责微软试图“控制”OpenAI。
在纳德拉的推动下,2024年初夏,微软与OpenAI达成新协议,允许后者使用其他云服务商。根据新条款,微软仍保留优先承接权,即有权优先决定是否自行满足OpenAI的新增算力需求。若无法满足,则允许其转向其他供应商。
获得授权后,OpenAI迅速展开行动。2024年7月,便与甲骨文达成协议,在得克萨斯州合作建设1吉瓦规模的新数据中心。
这一数字很快被刷新。2024年底,OpenAI向微软提出新需求:除既有及预期的算力来源外,未来数年还需额外增加数吉瓦容量。但微软Azure团队评估认为,任何厂商(包括微软自身)都难以在如此短的时间内满足其要求。
在一次关键会议上,微软高管曾向奥特曼团队提出一个假设性问题:若OpenAI未来需要数百吉瓦容量——这一目标看起来有些不切实际,且需投入数万亿美元——微软应如何应对?OpenAI方的回应很明确:微软可选择承担建设,或让位于其他愿意投入的供应商。
尽管存在分歧,微软仍作出了部分让步。2024年12月,微软承诺在威斯康星州为OpenAI增建第二座数据中心,投资逾40亿美元。同月,微软同意OpenAI与甲骨文开启新一轮扩容谈判,最终于七个月后达成4.5吉瓦容量的合作,其耗电量相当于两座胡佛水坝的发电总量。
进入2025年,OpenAI的算力布局继续扩展:先后接入谷歌云服务、与CoreWeave签订120亿美元服务器租约,并于上月宣布接受英伟达1000亿美元投资,用于自建数据中心。这也是该公司迄今最大胆的规划。
这一系列合作中,甲骨文的转型尤为引人注目。这家曾被视为云服务领域“陪跑者”的企业,在宣布未来四年将通过服务器租赁获得4000亿美元收入(主要来自OpenAI合作)后,股价于9月初应声上涨36%。
对微软而言,尽管面临竞争分流,其仍有望从中获得源源不断的巨额收入。OpenAI方面透露,至2030年预计仍将向微软支付约1350亿美元的服务器费用。
一位参与谈判的人士坦言:“与2023年签约时相比,眼下每个数字都超出了我们最初的想象。世界变化太快,我们必须找到适应之道。”
而OpenAI对算力的追求仍在升级。据透露,奥特曼近期向团队提出新目标:到2033年,实现250吉瓦的数据中心容量,这相当于美国当前峰值用电负荷的三分之一。(小小)