OpenAI组织内部,到底是如何运作的?

【来源:虎嗅网】

本文来自微信公众号:极客公园 (ID:geekpark),作者:Moonshot,编辑:靖宇

作为这一波大模型浪潮中最成功的创业公司,OpenAI一直备受关注,数亿人使用ChatGPT,但是这家公司内部是如何运作的,一直保持神秘

近日,一位刚刚从OpenAI离职三周的工程师,写下了他过去一年在这家全球最受关注AI公司的所见所感。

他叫Calvin,2024年5月加入OpenAI,今年6月底离职。Calvin的离职,并不是因为任何纠纷或理念不合。他在文中坦言,自己更适合构建从0到1的系统,而不是在3000名员工中做一个螺丝钉。

在这篇名为《Reflections on OpenAI(在OpenAI的所思所感)》的文章(点击可跳转全文翻译)中,他并不打算揭露什么惊天内幕,而是以一种近似私人备忘录的方式,记录了他作为技术人、产品人、创业者和父亲的交叠视角下,他在OpenAI的一线观察。

用他自己的话说:“这里没有任何商业机密,只有我对历史上最迷人的组织之一,在当下飞速迭代时期的所思所感。”

从这篇文章中,我们能一窥OpenAI内部的运作规律。

OpenAI的文化:既混乱又高效,既集中又分散

在OpenAI工作的一年里,Calvin对这个组织的文化有了非常立体的理解。他加入的时候公司大约有1000人,一年之后员工已经增长到超过3000。在这短短的时间内,他已经算得上“老员工”了。

OpenAI的极速扩张也带来了典型的大公司问题:组织结构剧烈变化、沟通成本上升、团队间协作方式多样化。

Calvin观察到,不同的团队文化之间差异巨大,有的像创业公司一样日夜冲刺,有的则像传统企业那样遵循流程推进。Calvin本人所在的Codex团队更偏前者:节奏极快,方向灵活,什么事情都是“先做再说”。

而令所有人都意想不到的是,OpenAI整个公司所有的事项,都放在了Slack上。包括且不限于内部交流,包括项目协调、技术问题讨论、领导层的实时对话……Calvin入职一年多,工作邮件不超过10封。

协作软件Slack|图源:Slack

Calvin还观察到一个非常鲜明的特征:OpenAI非常依赖工程师和研究者“从下到上”推动项目

“好主意可以来自任何地方,进展不是规划的,而是迭代的。”Calvin写道。

得益于这种自下而上的文化,OpenAI也非常任人唯贤。从公司发展史上看,OpenAI领导班子的晋升主要就基于谁有“能提出好主意”的能力,并且能把想法落地。

“最好的想法在OpenAI确实会获胜。”

OpenAI的公司文化还鲜明地“偏爱行动(action-bias)”:你可以直接行动让想法落地,不必等上层批准。

Codex负责人Andrey就曾告诉Calvin,OpenAI的研究员应该被看作“自己的小执行官(mini-executive)”,大家各做各的方向,看看最后跑出来什么成果。

OpenAI的另一个显著特征,是“根据新信息及时调整策略”的理念,Calvin指出,哪怕公司规模已非常庞大,依然保留了这种快速转向的能力。

一旦OpenAI决定要推进某个方向,通常就是全力投入、毫不含糊。他还轻轻拉踩了Google,认为相比OpenAI,Google显得迟缓许多。

Calvin评价OpenAI是他见过最“雄心勃勃”的公司之一。哪怕已经拥有全球最成功的消费级AI应用,它依然在同时推进十几个方向:API、基础研究、硬件、代码智能体、图像生成,还有一些尚未公开的项目

不同团队之间的协作也非常灵活。Codex推出前,他们急需几位经验丰富的ChatGPT工程师支援,和对方团队聊了一次,第二天就有两位高手直接加入,没有层层审批,也不等季度规划,人才来了“即插即用”。

OpenAI领导层也出奇活跃,高层几乎每天都在Slack上露面,直接参与群聊讨论,不是那种“遥不可及”的管理者。

这种内部开放,对应的则是对外的保守

刚入职最让Calvin震惊的是,OpenAI所处的“聚光灯中心”。当时的OpenAI是媒体报道、政策讨论、公众争议的中心,很多新闻他在公司内部都还没听说,就已经被媒体抢先爆出来。

因此,为了避免信息外泄,公司内部的保密机制异常严格。Calvin在任职期间,几乎无法跟外人谈论自己具体在做什么。公司的Slack上有多个权限分级的分组,不同级别的员工能看到的信息差别很大。像是公司的财务数据、收入、GPU成本等核心数字,都受到严密保护。

尽管外界经常用“神秘”“封闭”形容OpenAI,但Calvin更愿意将这种状态理解为一种对责任的回应。

这种回应塑造了OpenAI内部严肃和紧绷的气息:一方面,团队在追求AGI,最终目标可能会影响全人类;另一方面,产品已经被数亿用户用来获取医学建议、心理支持、甚至学习和工作协助。

与此同时,OpenAI还在当下最火热的行业里,与Google、Meta、Anthropic等大公司竞争。作为行业领头羊,OpenAI还要面对媒体的审视,还要小心翼翼地把握人类对AI开发和掌握的边界。

对此等压力,Calvin表示自己在公司内部遇到的每一个人,都在尽力做“对的事情”。但大众也别把OpenAI想象成一个统一的意志体。

他认为OpenAI更像是从“洛斯阿拉莫斯实验室”(Los Alamos,美国研究出原子弹的实验室)的现代版本

原本一群科学家和工程师在边缘地带探索前沿技术,结果一不小心孵化出了史上最火的消费级应用ChatGPT。此后,公司又逐渐拓展为一个同时面向政府、企业和消费者的庞然大物,并且大众尚不可知研究成果时好时坏。

在AI安全问题上,Calvin的观察是:OpenAI比许多人想象中更认真。

他看到有不少团队专门负责构建安全系统,聚焦的也多是现实风险,比如仇恨言论、滥用内容、政治操控、生物武器设计等等。遗憾的是,多数成果未对外发表,Calvin觉得OpenAI在这方面可以更透明一些。

“不统一的意志体”还体现在不同部门和员工对OpenAI的理解也完全不同。有些人仍然把它当作一个“为公益而设立的研究实验室”,而另一些人则更多地从商业、产品或政策角度出发。

但无论如何,Calvin最欣赏的一点,是公司在“AI红利的分配”上说到做到。最先进的模型从不会只留给企业级大客户,任何普通用户都能免费使用ChatGPT。大多数模型的API也对开发者开放。

在Calvin看来,OpenAI的文化是一种奇特的混合体:既高度去中心化、强调个人驱动,又在某些关键问题上异常克制和谨慎;既像一家科研机构,鼓励想法和理论思考,又像创业公司,保持着惊人的速度和执行力。

这种文化,塑造了OpenAI的产品形态,也决定了它的代码长什么样。

技术的细节

在技术架构层面,Calvin透露OpenAI的核心代码托管在一个巨大的monorepo中,主要以Python为主。近年来,Rust服务的比重逐渐增加,此外也有一些Golang项目,通常用于处理诸如网络代理这类系统级任务。

这个庞杂的代码库带来一个直观的感受就是:风格极不统一。在这里你既会看到由Google十年老兵写出的、面向大规模系统设计的库,也会碰到刚刚入职的博士生丢进来的临时Jupyter笔记本。

基础设施方面,OpenAI的一切都跑在Azure上,此外,OpenAI很少依赖Azure的自动伸缩服务或IAM权限系统。

相反,公司对自研系统的偏好非常强烈。能自己写的,尽量自己写

人员背景方面,Calvin观察到一个显著趋势:工程团队中有不少成员来自Meta,尤其是Meta和Instagram的基础架构部门。

这也让OpenAI在某种程度上,有点像早期的Meta:一款现象级的消费级应用、配套基础设施还在建设中、团队渴望快速迭代。

另一个非常核心的架构特征是:“Chat架构深入骨髓”。

自从ChatGPT爆红以来,大量代码围绕“聊天消息”与“对话”这两个概念进行组织,这些设计已经成为不可忽视的原语(primitives,不能分解为更小语言单位的基本编程元素)。Calvin提醒说:如果在开发中忽视这些设计,后果可能很麻烦。

决策架构的过程也体现了OpenAI一贯的“行动偏好”:谁做,谁决定架构。这里没有架构委员会,也不太讲“自上而下”的计划,多数技术方案是哪个团队想做、就直接开干。

结果代码库里常常会出现多个“重复造轮子”的场景,光是排队系统、Agent运行框架,Calvin至少看到了五六种不同的方法造出类似的结果。

这种快速增长也不是没有代价。有些系统因此变得混乱,所以就算是最顶级的AI公司,在快速扩张时也会踩到最常见的工程坑。

在技术架构的框架之上,Calvin最重要的项目,是参与Codex的落地与发布。在他离职前的最后三个月里,Codex的冲刺毫无疑问成了他职业生涯的一大高光。

时间回到2024年11月,那时OpenAI正式定下了一个2025年的产品目标:推出一款coding agent。到2025年2月,内部已经出现了一些使用模型进行编程任务的工具,效果相当不错。

但与此同时,越来越多的agent工具问世后,OpenAI内部感受到了外部压力,团队进入一种几近狂奔的节奏。从第一行代码写下到产品上线,只用了7周时间

这是Calvin回忆,那段时间几乎每天都加班到深夜十一二点,凌晨五点半被刚出生的孩子叫醒,七点又准时出现在办公室,周末也不例外。

整个团队拼尽全力,Calvin说得直接:“这家公司,还有那股冲劲儿。”

而在七周时间里,他们8位资深工程师,4位研究员,2位设计师,2位市场与销售成员,以及1位产品经理,共同打造出了一个可发布,可上线,可直接使用的AI编程Agent。

发布前夜,五个人熬到凌晨四点部署主服务,紧接着清晨八点又准时回到办公室,准备直播和公告上线。当时功能开关一打开,流量瞬间涌入。

Calvin说,他从没见过一个产品仅仅是出现在ChatGPT左侧边栏,就能瞬间引发如此大量的用量,他称“这就是ChatGPT的力量。”

从怀疑到收获

在回顾这一年时,Calvin承认,最初加入OpenAI时他其实是犹豫的。他不确定自己是否适合进入这样一家AI巨头,甚至为了预留退路,他在刚加入时对外保持了相当低调。

但他也为自己设下了三个在OpenAI想完成的目标:一是建立对模型训练与能力边界的直觉;二是和一群优秀的人共事并从中学习;三是发布一个真正打动人的产品。

现在回看,这一年无疑是他职业生涯中最重要的一段经历之一。他说,很难想象还有哪里能学到这么多。

这段经历也刷新了他对“大品牌”的理解。在参与Codex时他意识到,OpenAI所有的产品设计几乎都是围绕“Pro用户”展开的,哪怕是面向开发者的Codex,也主要以个人用户为导向,而非团队

这对来自B2B世界的他来说完全是另一种思维方式:ToC的开关一旦打开,流量立刻涌入,不像ToB的传统企业产品,还需要漫长的客户开发周期。

他也第一次站在一线,了解大模型是如何训练的。实验不只是算法问题,调数据、盯指标、调边缘案例,样样都得自己动手。而到了大规模训练时,每一次都像一场不可预知的系统挑战。

对其他创业者来说,他也给出两点建议:如果你感到自己创业的项目停滞不前,不妨认真考虑两个方向:要么更激进地出击、增加试错次数;要么加入顶级实验室,去亲眼见证未来是怎么被构建的。

在他看来,通向AGI的竞赛已经进入三国演义:OpenAI、Anthropic和Google各自代表着不同的技术与文化路径:消费产品、企业服务、工程硬核

Calvin相信,进入其中任何一家,都会是一段眼界大开的经历,正如过去一年他的亲身经历。

本文来自微信公众号:极客公园 (ID:geekpark),作者:Moonshot,编辑:靖宇