穆斯塔法·苏莱曼并没有得到他想要的答案。
据一位在场人员和另外两名了解情况的微软员工称,去年秋天,在与 OpenAI 和微软高层领导的视频通话中,领导微软内部人工智能部门的苏莱曼希望 OpenAI 员工解释其最新模型 o1 的工作原理。苏莱曼对 OpenAI 没有向微软提供文档感到恼火,因为文档说明了它如何对 o1 进行编程,使其在回答用户的问题之前先思考。这一过程被称为思维链,是任何人工智能模型秘方的关键要素。
总结
• 微软正在开发内部 AI 推理模型,与 OpenAI 竞争,并可能将其出售给开发人员• 它已开始在 Copilot 中测试 xAI、Meta 和 DeepSeek 的模型,作为 OpenAI 的潜在替代品• 微软 AI 首席执行官 Mustafa Suleyman 与 OpenAI 领导人就后者隐瞒技术信息发生冲突
据知情人士透露,苏莱曼大声告诉 OpenAI 员工,包括当时的首席技术官米拉·穆拉蒂 (Mira Murati),这家人工智能初创公司没有履行与微软达成的广泛协议。通话突然结束。
此事反映出苏莱曼自担任微软人工智能首席执行官以来面临的一个核心挑战。微软已向 OpenAI 投资了超过 130 亿美元,以换取其部分收入和重复使用其技术的权利。苏莱曼一年前开始担任这一职务,据其部门高管称,他的工作有两项相互冲突的职责。
首先,他必须同时继续与 OpenAI 合作,通过这种合作,两家公司可以共享有关人工智能研发的信息。与此同时,他还奉命让微软走上人工智能自给自足的道路,这样微软的大多数人工智能产品就不必无限期地依赖 OpenAI 的技术。
现在,苏莱曼所在部门的人工智能研究人员认为,他们在第二个优先事项上取得了重大进展。据参与该项目的人士称,苏莱曼副手卡伦·西蒙尼扬领导的团队最近完成了微软模型系列(内部称为 MAI)的训练,该模型在普遍接受的基准上的表现几乎与 OpenAI 和 Anthropic 的领先模型一样好。该人士表示,该团队还在训练推理模型(使用思维链技术在解决问题之前先思考问题),可以直接与 OpenAI 竞争。
这位知情人士表示,苏莱曼的团队已经在尝试将 MAI 模型(比微软早期的 Phi 模型系列要大得多)换成微软 Copilot 中的 OpenAI 模型。这位知情人士表示,该公司正考虑在今年晚些时候将 MAI 模型作为应用程序编程接口发布,这是一个软件挂钩,允许外部开发人员将微软模型编织到自己的应用程序中。
这些计划之前从未报道过,将使微软的模型与 OpenAI 和其他人工智能实验室提供的类似 API 产品直接竞争。
在苏莱曼的指导下,微软一直在进一步规避风险,尝试使用 OpenAI 竞争对手的模型来为 Copilot 提供支持——Copilot 是内置于 Windows、Edge 网络浏览器和其他微软产品中的 AI 工具系列,目前这些产品都运行在 OpenAI 的技术上。据知情人士透露,微软对 Copilot 的替代模型的测试包括来自 Anthropic 和马斯克的 xAI 的模型,以及来自 DeepSeek 和 Meta Platforms 的开源模型。
“这是一个竞争异常激烈、创意无限的时代,”苏莱曼在接受采访时表示。“我们现在使用的基本上是各大实验室的所有模型,包括所有开源模型。我们正在对它们进行实验,对它们进行飞行,这是任何人都想不到的。”
现在还无法判断苏莱曼这位人工智能领域的巨星能否成功帮助微软在人工智能领域实现更大程度的自给自足。尽管西蒙尼安的团队在内部庆祝了 MAI 模型的表现,但尚未公开发布这些模型,微软也没有在公司内部广泛使用它们,因此很难判断它们的质量。
根据对六名曾与苏莱曼及其副手共事的微软现任和前任员工的采访,由于技术挫折、战略突然变化以及几位不同意苏莱曼管理和技术方法的微软资深人士离职,训练 MAI 模型的努力耗时近一年。在此期间,OpenAI 训练并发布了几批尖端模型
这些挫折使得一些局外人不再相信苏莱曼能够实现他的宏伟战略。
“从外部来看,目前还不清楚一年后在苏莱曼的领导下,他们成立这个部门能带来什么。”投资人工智能初创公司的风险投资家内森·贝纳奇 (Nathan Benaich) 表示。“他们需要让 Copilot 成为 ChatGPT 的有力竞争对手,但我不确定他们打算如何做到这一点,也不知道除了追赶 OpenAI 已经取得的成就之外,他们的战略是什么。”
在本文发布后的一份声明中,微软发言人弗兰克·肖 (Frank Shaw) 表示,MAI 去年夏天还训练了一系列模型,这些模型在当时达到了“最先进的”性能,但拒绝具体说明如何在实践中使用这些模型。
对微软来说,没有什么赌注比它在人工智能上的赌注更重要。上个月,该公司告诉股东,其所有业务的年度人工智能收入超过 130 亿美元(最近一个月的收入乘以 12),而三个月前这一数字仅为 100 亿美元。
大部分收入来自微软的 Azure 云计算部门(包括 OpenAI 对该服务的大量使用),以及面向企业客户的 OpenAI 支持的 Office 365 产品和面向开发者的 AI 工具(如 GitHub Copilot),而这些都不在 Suleyman 的监管范围内。相反,他的职责仅限于微软消费者应用程序(如 Bing 和 Windows)中的 AI。
但苏莱曼表示,他最大的关注点是让微软在未来十年实现人工智能自给自足,而不是短期成果。虽然他只负责微软业务的一小部分,但他负责的产品可能会对整个公司的未来产生影响。
“我们(微软人工智能部门)真正想做的是不要太纠结于今年或明年发生的事情,而是真正关注未来 10 年会是什么样子,”苏莱曼说。“(我们)确保公司在内部打造这种实力,以便能够打造世界上最好的模型,并与其他所有人合作使用最好的模型。”
局外人
在与 OpenAI 发生激烈冲突后,苏莱曼来到了微软。
2023 年末,OpenAI 濒临崩溃,当时其非营利组织董事会解雇了首席执行官山姆·奥特曼 (Sam Altman),指控他对公司的发展不诚实。这对微软来说并不是一个令人放心的发展,因为微软当年早些时候在 Bing 中推出了一款由 OpenAI 驱动的聊天机器人,并计划与其合作伙伴做更多事情。几周后,OpenAI 重新聘请了奥特曼,而驱逐他的大多数董事会成员也辞职了,这在一定程度上平息了微软的紧张情绪。
尽管如此,据两位与纳德拉交谈过的人士透露,该公司董事会对这场动荡做出了反应,向微软首席执行官萨蒂亚·纳德拉施压,要求他改变其人工智能战略,以免完全依赖 OpenAI。
几个月后,纳德拉聘请了人工智能先驱苏莱曼,他曾与他人共同创立了 DeepMind,这是谷歌于 2014 年收购的实验室,在人工智能领域取得了多项科学突破。苏莱曼从他的初创公司 Inflection AI 加入微软,他曾公开宣称该公司开发的人工智能与 OpenAI 不相上下。作为聘用苏莱曼的一部分,微软签署了一项价值 6.5 亿美元的许可协议,以获得 Inflection 的技术。
苏莱曼迅速重组了微软内部的人工智能团队,将之前从事不同人工智能项目的各个部门整合成一个专注于建立模型的新部门,由他的联合创始人兼 Inflection 首席科学官西蒙尼安领导。苏莱曼的新报告员包括时任 Bing 首席执行官的米哈伊尔·帕拉欣,他曾负责监督 OpenAI 产品与搜索引擎的整合。
在纳德拉的支持下,苏莱曼从其他部门调动了几名工程师,包括之前训练过微软 Phi 系列小型语言模型的研究部门的工作人员。其他部门的高管也开始向苏莱曼汇报工作,其中包括曾领导开发 Bing 早期模型的 Saurabh Tiwary 和最近负责 Phi 项目的 Azure 高管 Misha Bilenko。
但在苏莱曼领导下的各个 AI 团队之间建立和谐关系被证明是困难的。
去年 3 月底,苏莱曼加入微软仅几周后,前 Yandex 工程师帕拉金就从微软辞职。帕拉金亲自监督 Bing,有时还亲自编写和编辑代码。据一位与帕拉金交谈过的人说,他向同事表达了对失去对 Bing 业务控制权的不满。
几周后,苏莱曼在 TED 演讲中谈到了先进人工智能对人类的安全风险,帕拉欣似乎公开抨击了他的前任老板。一些批评者猛烈抨击了苏莱曼的言论,包括安德森·霍洛维茨合伙人马丁·卡萨多,他在 X 上的一篇帖子中称这些言论“完全是一派胡言”。X 上的一名用户在回复中标记了帕拉欣,并说:“我们需要你。”
“很难不同意,”帕拉欣回答道,并配上一个笑脸表情符号。
帕拉欣没有回应置评请求。
在接下来的几个月里,又有更多人叛逃。8 月,在微软工作了十多年的 Bilenko 和 Tiwary 离开微软,加入谷歌。
与此同时,一些 Bing 工程师抱怨称,苏莱曼作为企业家和高管的经验比作为实践型程序员的经验丰富,因此他不像前任那样专注于人工智能开发的细节。虽然帕拉欣会定期与工程师开会审查他们的代码,但苏莱曼采取了不同的方法。
他每月都会与整个部门召开全体会议,每周给员工写电子邮件,介绍他的优先事项和对更广泛的人工智能行业的想法,以及每两个月与 10 到 20 名员工的小组举行一次分组会议。
据两位参加过会议的人士称,这些会议对制定全公司的议程很有帮助。这些人士表示,其他时间的对话影响深远,而每两周一次的分组讨论通常集中在非技术性话题上,比如员工的工作以外的爱好。
最近,苏莱曼进行了一系列高调招聘,包括今年早些时候招聘了四名来自谷歌 DeepMind 的前研究员。
训练轮
甚至在苏莱曼加入之前,微软就已经在创建自己的 AI 模型方面取得了一些进展,这些模型有朝一日可以取代 OpenAI 的模型。最突出的例子是 Phi,它是由微软更注重学术的研究部门微软研究院的工作人员于 2023 年首次开发的。
微软研究人员使用 OpenAI 技术生成的所谓合成数据训练 Phi 模型。因此,Phi 能够模仿 OpenAI 模型的质量,同时只需要运行 OpenAI 技术的一小部分计算能力和成本。为了节省成本,微软很快就开始将其 Copilot 产品中的一些 OpenAI 模型换成 Phi,并在其 Azure 云计算平台上向开发人员提供 Phi。
在 Suleyman 入职后,Phi 首席研究员 Sébastien Bubeck 开始直接向他汇报。在 Suleyman 的指导下,Bubeck 开始在类似于 OpenAI 的大型模型上使用他的 AI 训练方法,以处理 Phi 和小型模型无法处理的更复杂的任务。
据两位参与该项目的人士透露,在苏莱曼的领导下,Phi 团队很快就能使用比微软研究院之前所能使用的更大的计算机集群来训练新模型。
但额外的计算能力并没有帮助该团队产生他们想要的结果。据参与该项目的人士称,大型模型至少进行了三次训练,每次训练花费了数百万美元,但结果却不尽如人意。他们说,这些模型的错误或误导性结果(即幻觉)发生率很高,而且在提供简洁的答案方面不如 OpenAI 的模型可靠。
据参加讨论的人士透露,苏莱曼和西蒙尼扬认为,这些问题源于布贝克使用人工智能生成的数据训练 Phi 的方法,而布贝克则认为,这些问题是在训练过程的后期出现的。
到 9 月,布贝克离开苏莱曼的部门,回到微软研究院。据 The Information 查看的一份内部演示文稿副本显示,他告诉同事,他计划继续训练 Phi 模型,这些模型将至少比以前的版本大五倍。微软研究院团队继续向 Phi 发布更新。
但据两位参与其中的人士透露,去年 10 月,布贝克离开微软,加入 OpenAI,在那里他继续致力于使用合成数据训练模型,并挖走了多位前微软研究人员加入他的初创公司。
花时间
在布贝克离开微软的时候,苏莱曼对 OpenAI 的失望开始加剧。
这家初创公司率先推出了一种名为 o1 的新模型,该模型经过编程,可以花更多时间回复用户的查询,从而更准确地解决数学和逻辑问题。
但由于 OpenAI 不允许微软看到 o1 推理的思路链,Suleyman 和他的团队很难弄清楚如何在微软自己的 AI 模型中复制该编程。
尽管如此,苏莱曼的人工智能团队在随后的几个月里成功重现了 OpenAI 取得的一些成就。由西蒙尼安领导的模型训练团队开始使用思维链推理来提高输出质量。这帮助他们克服了源自模型训练数据的困难。
但 OpenAI 并未止步不前。其模型进步的产出已超过微软。在过去两个月中,这家初创公司发布了更强大的推理模型 o3 的预览版,以及迄今为止最大的模型 GPT-4.5。微软能否赶上还有待观察。
联系我们 |
---|
加美股交流群?券商开户?资产配置?联系我们,解答助力! |
① 微信:35531906 |
② Telegram:@mgn688 |
③ 美股开户中心 |
④ 工作时间:周一至周五,9:00-17:00,节假日休息 |