个人资料
正文

奥特曼专访:谷歌认真点就没有OpenAI,GPT周活近9亿,明年Q1推新模型

(2025-12-19 07:34:54) 下一个

当地时间12月18日,OpenAI首席执行官山姆奥特曼(Sam Altman)接受了科技媒体Big Technology Podcast的深度专访。访谈正值OpenAI成立十周年、ChatGPT发布三周年这一关键节点。在这场持续近一小时的对话中,奥特曼集中回应了外界对OpenAI竞争格局、技术路线、商业转型、长期财务模型以及未来愿景的核心关切。

访谈中,奥特曼首次公开提及OpenAI是否可能在未来进行IPO,坦言自己对成为上市公司CEO毫无兴奋感,并披露其产品的周活跃用户数量已接近9亿人,凸显生成式人工智能在全球范围内的快速渗透。

谈及竞争,他直言,如果谷歌在2023年真正认真对待OpenAI,他们本可以直接碾压我们。但在他看来,将AI能力附加到既有产品体系中的做法存在结构性局限,而OpenAI选择以AI优先为原则重构产品逻辑,这种路径差异将构成长期竞争优势。

在技术层面,奥特曼透露,OpenAI计划在2026年第一季度推出一款性能超越GPT-5.2的新模型,重点强化企业级智能应用。他指出,产品形态正从被动响应向主动代理转变,记忆能力也将从短期上下文扩展至对用户全生命周期的持续理解。

针对高达1.4万亿美元的基础设施投资,奥特曼解释称,随着推理成本占比上升、训练成本占比下降,OpenAI的商业模型正在发生变化,并预计将在2028至2029年实现盈利。他强调,当前增长的主要瓶颈在于算力供给,而非市场需求。

在更长期的视角下,奥特曼提出能力积压概念,认为模型能力已明显领先于现实应用,相关价值将在未来数年逐步释放。他表示,小规模科学发现已在2025年底开始出现,未来五年内有望取得更具突破性的成果。对于AGI的定义争议,他倾向于将讨论重心转向更明确的超级智能目标。

以下为访谈核心内容:

01 竞争格局:为什么谷歌无法通过 缝补 赢过我们

问:Gemini 3发布后,OpenAI陷入了罕见的竞争压力,甚至被传进入红色警戒状态,不少公司都在试图削弱你们的优势,这是OpenAI首次失去明确领先地位吗?你们计划如何从中脱颖而出?

答:所谓红色警戒,我们认为这类竞争威胁属于相对低风险、发生频率较高的情况。保持警惕并在潜在威胁出现时迅速行动是有益的,这种情况之前也发生过,比如今年年初DeepSeek发布时。我将疫情应对的理念应用到竞争中:早期采取的每一项行动,价值都远高于后期。

目前来看,Gemini 3尚未产生我们担心的影响,但它和DeepSeek一样,指出了我们产品供应策略中的一些弱点,我们正在快速推进解决。历史上这类警戒状态大约持续6-8周,所以我们不会被这种状态困扰太久。ChatGPT仍是目前市场上占主导地位的聊天机器人,我预计它的领先优势会随时间增加而非减少。毕竟,无论对消费者还是企业来说,人们选择产品的原因远不止模型本身,综合体验才是核心。

问:如果未来模型对普通用户的体验达到均等水平,谷歌拥有强大的平台分发优势,能直接推广Gemini,而ChatGPT还在为每个新用户逐个争取,这种情况下谷歌的威胁到底有多大?

答:谷歌绝对是巨大的威胁,它是一家极其强大的公司。如果2023年谷歌真的下定决心专注于AI领域与我们竞争,我们会陷入非常被动的境地,甚至可能被直接碾压。但当时谷歌的AI工作在产品方向上出现了偏差,即便他们也曾进入过 红色警戒,却没有真正重视起来。

此外,谷歌拥有科技行业中顶尖的商业模式,但这种模式也让他们难以割舍现有体系。将AI嵌入传统网络搜索的做法,远不如以AI为核心重新设计产品有效。这是一个更广泛的趋势:把AI嵌入现有做事方式,永远比不上在AI优先的逻辑下重新创造。

就像把AI塞进消息应用,它能总结消息、起草回复,确实能提升效率,但这绝非最终形态。真正智能的AI应该像你的专属智能体,能与他人的代理协作,判断何时打扰你、何时自主处理事务、哪些决定需要征询你意见。搜索、生产力套件等领域也是如此,未来主流品类会出现完全围绕AI构建的新产品,而非AI嵌入型产品,这正是谷歌的弱点,即便它拥有巨大的分发优势。

02 技术演进:从对话框向物理世界模型的跨越

问:ChatGPT在明年及未来两年会呈现出怎样的发展形态?

答:我每天要花大量时间在电子邮件、短信、Slack等各类消息应用上,但我认为这种交互界面本身是有问题的。即便在这些应用上嵌入AI,体验只能得到小幅提升,却无法满足核心需求。

我更期待的是,早上醒来只需告诉AI:这是我今天要完成的事、我的担忧和期望,之后就不用再整天发消息、看总结、审草稿,AI能自主处理所有力所能及的事。它了解我、了解相关的人、清楚我的目标,每隔几个小时给我批量更新进度即可。但这种模式和当前应用的运作逻辑完全不同,也是我们未来的发展方向。

问:你预期ChatGPT的界面会有哪些具体变化?

答:坦白说,我原以为到现在ChatGPT的界面会和发布时大相径庭。最初那个聊天界面只是作为研究预览推出,甚至没打算成为正式产品,我本以为它要成长为如今这样规模庞大、用于实际工作的重要产品,界面必须有更大突破。

虽然我现在依然认为界面需要革新,但当前聊天界面的通用性,其力量超出了我的预期。未来,AI应该能为不同类型的任务生成专属界面:比如讨论数据时,能以多样化形式呈现并支持多元交互;交互过程也会更具动态性,不再是简单的来回对话,而是针对某个对象持续更新。随着新问题、新想法、新信息的输入,AI能实时响应。长期来看,AI会更主动,它能理解你当天的目标,在后台持续工作并主动推送更新。

问:ChatGPT的记忆功能未来会强大到什么程度?

答:人类的记忆存在天然限制,即便最优秀的私人助理,也无法记住你一生中说过的每一句话、读过的每封邮件、写过的每份文件,更无法精准记住你日常工作的所有细节,没有人拥有完美的无限记忆,但AI完全可以做到这一点。

目前我们的记忆功能还非常粗糙,处于类似GPT-2的早期阶段,但未来它能记住你生活中的所有细节,不仅是明确的事实,还包括你未曾刻意表达的潜在偏好,通过这些实现深度个性化。这是我最兴奋的功能之一,虽然2026年前可能还无法达到这种终极状态,但它的潜力无可限量。

问:OpenAI正在开发的设备具体是什么样的?

答:我们不会推出单一设备,而是会打造一个小型设备家族。未来,人们使用计算机的方式会发生根本性转变:从呆板的反应式工具,变成能理解你整个人生、背景和周遭环境的主动式智能体。

但当前的设备形态完全不适应这种转变,我们其实一直受限于现有设备的设计逻辑。比如电脑只有开机关机两种状态,无法做到关注这场采访,若我忘记提问就在耳边提醒;屏幕限制了我们几十年来依赖图形用户界面的交互方式;键盘的设计本身就降低了信息输入效率。这些都是长期未被质疑的默认设定,虽然曾经有效,但面对AI带来的全新可能性,现有设备形态已经不再是最佳匹配。

03 增长红利:如何将9亿用户转化为 生态粘性

问:ChatGPT的周活跃用户从今年年初的4亿增长到如今的8亿,报道称已接近9亿,但谷歌等对手拥有强大的分发优势。如果未来模型走向商品化,OpenAI的核心竞争力会是什么?

答:用商品化来定义模型的发展趋势并不准确。不同模型会在不同场景下各展所长:日常聊天场景可能会有很多优质选择,但在科学发现等前沿领域,人们依然会选择为特定场景优化的顶尖模型。所以模型会呈现差异化优势,而最大的经济价值将由前沿模型创造,我们计划持续保持这一领先地位。

我们很自豪,GPT-5.2是目前世界上最好的推理模型,不仅助力科学家取得更多进展,也被企业认可为能高效完成各类业务任务的最优选择。除了模型本身,产品、分发和品牌同样至关重要。以ChatGPT为例,个性化功能极具粘性,人们喜欢模型随时间推移逐渐了解自己,我们也会在这一方向持续深化。

ChatGPT也会通过神奇体验留住用户。比如医疗领域,不少用户通过输入血液检测结果或症状,借助ChatGPT发现潜在疾病,进而就医治愈了此前未能确诊的病症,这类用户的忠诚度极高,再叠加个性化体验,粘性会进一步增强。此外,我们刚推出的浏览器指向了新的潜力模式,设备业务虽尚处远期,但同样值得期待。

企业端的核心竞争力则在于企业个性化:公司与我们建立合作,连接自身数据,通过多个代理协同运作确保信息合规处理,这种模式会形成强大的粘性。目前我们已有超百万企业用户,API业务的增长速度甚至超过ChatGPT,企业端市场今年已进入快速发展阶段。

04 战略转折:开启企业之年与GDP级的AI产出

问:你上周告知新闻公司高管,企业业务将成为OpenAI明年的核心优先事项,这被认为是从专注消费者业务的重大转变,能否详细介绍一下企业业务计划?

答:我们的战略一直是消费者优先,背后有两个核心原因:一是早期模型的健壮性和熟练度不足以满足大多数企业的需求,而现在模型能力已逐渐接近企业标准;二是消费者领域的胜利机会罕见且珍贵,而在消费者市场站稳脚跟后,进军企业领域会变得更加容易,这一点我们如今已切实感受到。

值得注意的是,今年企业业务的增长速度已经超过了消费者业务。结合当前模型的发展状态以及明年的预期水平,我们认为现在是快速打造重要企业业务的最佳时机。编码是目前企业端最成功的应用案例,除此之外,多个垂直行业的需求也在快速增长,我们不断听到企业表示 只想要一个专属AI平台,这正是我们的发力方向。

问:在企业垂直行业中,你最看好哪些领域?答:金融和科学是我个人最感兴趣的领域,客户支持领域的应用也已取得不错的成效。此外,我们有一个重要的评估工具:GDP评估,它能衡量AI在知识工作任务中的表现。

问:GDP评估显示,GPT-5思考模型在38.8%的测试中与知识工作者持平或胜出,GPT-5.2思考在70.9%的知识工作任务中达到这一水平,GPT-5.2 Pro更是在 74.1% 的任务中表现相当或更优,还通过了专家级别门槛,能处理约60%的专家任务。这些数据背后,意味着AI能为企业带来哪些改变?

答:GDP评估覆盖了40多个企业核心垂直行业,包括制作PowerPoint、法律分析、开发小型网络应用等各类任务,评估标准是 专家是否更偏好模型的输出结果。需要说明的是,这些任务多为范围明确的小型任务,尚未涉及复杂、开放式的创造性工作,但即便如此,能在70%-74%的任务中达到或超越专家水平,依然是非常惊人的成果。

三年前ChatGPT刚发布时,没人能想到我们会在这么短的时间内实现这一突破。这意味着企业的知识工作模式将被重塑:不再局限于AI编码,而是所有可明确指定的知识工作任务,都能分配给AI完成。虽然企业需要时间探索如何整合这种能力,但长期来看,其价值不可估量。

问:AI在知识工作领域的高效表现,会对就业产生怎样的影响?有技术文案撰写人表示,聊天机器人让我的工作变成了管理机器人,而非带领团队,一旦机器人训练成熟,我就会被淘汰,你如何看待这种担忧?

答:未来每个人确实都会管理多个AI来处理不同事务,但这并不意味着被淘汰。就像优秀的管理者会希望团队能力不断提升一样,AI 的加入会让人类承担更广泛、更核心的责任。

我并非 工作末日论者,短期内部分岗位的转型可能会面临挑战,但从长远来看,人类的核心需求不会改变:我们天生渴望关心他人、追求相对地位、希望变得有用、乐于创造,这些本能不会消失。未来的 工作(甚至可能不再用工作这个词)会和今天大不相同,但绝不是生活失去意义、经济彻底崩溃的局面,进化生物学决定了人类会持续适应和进步。

问:有企业正在从Azure迁移,选择直接与OpenAI集成,这是否意味着你们计划打造大型云业务?

答:企业对token的需求远超我们当前的供应能力,预计2026年仍会处于供不应求的状态。但我们的战略并非打造传统意义上的云业务,而是聚焦企业的核心诉求:企业希望拥有专属AI,比如带公司名称的定制化API、定制版ChatGPT Enterprise,以及能安全运行各类智能体、信任数据处理合规性的平台,还需要支持数万亿token输入产品的能力。

目前我们尚未推出能满足这些需求的一体化产品,这正是我们接下来要重点打造的。

问:你们的目标是成为AWS、Azure级别的世界级云服务提供商吗?

答:我们要做的和AWS、Azure这类传统云服务完全不同。我的判断是,企业会继续使用现有的网络云服务,同时会需要一个专门的AI平台,用于内部所有AI相关需求和对外提供AI服务。虽然这个平台也需要物理硬件支撑,但它的产品形态和传统云服务有本质区别,是专注于AI场景的专属解决方案。

05 财务豪赌:用千亿亏损换取智能税的盈利闭环

问:GPT-6预计何时推出?

答:我们尚未确定将哪个模型命名为GPT-6,但可以预计,2026年第一季度会推出比GPT-5.2有显著提升的新模型。

问:显著提升具体体现在哪些方面?

答:目前我还没有具体的评估分数可以分享,但新模型会在企业端和消费者端均有大幅改进。消费者当前的核心需求并非更高IQ,而企业依然对模型的智能水平有更高要求,所以我们会针对不同用途差异化优化,但最终目标是打造一个让所有人都更满意的模型。

问:OpenAI承诺投入约1.4万亿美元建设基础设施,你也提到10倍、100倍算力与当前的差距巨大,这么庞大的算力资源将用于哪些方面?

答:我个人最期待的是利用AI和海量算力资源推动科学发现。科学发现是让世界变得更美好的核心驱动力。现在已经有一些微小的突破出现,一旦这一趋势启动,我们就有能力持续放大成果,但这需要巨量计算资源支撑。

近期的一个典型案例是,我们的团队用Codex在不到一个月的时间内就构建了Sora Android应用,虽然消耗了大量token,但完成了通常需要多人耗时更久才能实现的工作。未来,整个公司都可以借助海量算力资源高效打造产品,科学发现、企业服务等领域的潜力更是不可限量。

问:这种大规模算力资源的需求,是基于当前明确的市场需求,还是对未来的假设?

答:当前的所有迹象都表明,市场对计算资源的需求会持续爆发。当然,未来也可能出现变数。比如有人发现全新架构,让计算效率提升1万倍,那我们可能会面临短期内过度建设的情况。但从目前的趋势来看,模型每升级一个级别,性能提升速度、用户使用意愿都会大幅增加,而且每次降低成本后,用户需求还会进一步释放。

无论是用于有价值的场景,还是相对愚蠢的用途,算力资源的需求增长都是未来的必然趋势。过去一年,我们的算力大约提升了三倍,明年计划再次提升三倍,之后还会持续加码。收入增长速度略快于算力增长,且大致保持同步,我们从未遇到过算力资源无法有效货币化的情况 。如果现在有双倍的算力,我们的收入也会同步翻倍。

问:目前OpenAI的收入在增长,但算力支出增长更快,报道称你们预计在2028-2029年前将累计亏损约1200亿,之后才能实现盈利。这种亏损转盈的转折点会如何到来?

答:盈利的核心逻辑是收入增长覆盖训练成本。随着收入持续增长,推理业务在整体业务中的占比会越来越高,最终推理业务的收入将足以覆盖模型训练的巨额成本,这就是我们的盈利计划。如果我们没有持续加大训练成本投入,其实早就可以实现盈利,但我们选择了激进投资大模型训练,这是我们的核心赌注。

问:今年OpenAI收入预计达200亿美元,而基础设施支出承诺达1.4万亿,市场普遍好奇这两组数字如何匹配,你们如何确保收入能覆盖如此庞大的支出?

答:这需要放在长期视角来看。指数增长的逻辑很难用短期思维理解。我们坚信,未来很长一段时间内,收入会保持陡峭的增长曲线,而这一切的前提是充足的计算资源。当前我们最大的限制就是算力,它严重制约了收入增长。

我们已经通过多种方式验证过这一逻辑:一方面,消费者业务和企业业务都在快速增长,还有大量未推出的新业务即将落地;另一方面,我们会持续提升效率。算力是实现所有增长的命脉,我们一直处于算力赤字状态,算力的提升直接决定了收入的上限。

问:市场最近有点失去理智。我认为让市场感到恐慌的是债务融资已经进入了OpenAI的融资结构。通常来说,企业使用债务融资的前提是有可预测的收入来偿还,但AI是一个全新的、不确定性很高的领域。你如何看待在这种情况下使用债务融资?

答:首先,我认为市场在前一段时间更失去理智,当时我们会与某家公司会面,那家公司的股票第二天会上涨20%或15%。那很疯狂。那感觉真的不健康。

实际上,我很高兴现在市场上有更多的怀疑和理性,因为对我来说感觉我们只是完全朝着一个非常不稳定的泡沫前进,现在我认为人们有某种程度的纪律。所以我实际上认为事情我认为人们之前疯了,现在人们在债务方面更理性了。

我认为我们确实知道,如果我们建设基础设施,行业的某人会从中获得价值。这仍然完全是早期的。但我认为没有人仍然在质疑AI基础设施不会有价值。所以我认为债务进入这个市场是合理的。我认为也会有其他类型的金融工具。但借钱给公司建数据中心,对我来说似乎很好。

问:如果模型进步饱和,基础设施的价值可能低于预期,甚至面临清算折价的风险,你如何应对这种担忧?

答:我确实预计行业会经历繁荣与萧条的周期,但有两点可以明确:第一,我愿意拿公司打赌,模型会持续变得更好,我们对此有充分的认知和信心;第二,即便模型进步放缓,世界对AI的适应也存在巨大惯性,需要很长时间消化现有模型的价值。

GPT-5.2本身蕴含的经济价值,远超当前世界已挖掘的部分。即便把模型冻结在5.2版本,未来仍能创造海量价值、驱动巨额收入。现在存在一个巨大的价值积压:模型已经非常强大,但大多数人仍在以 GPT-4时代的方式使用它。除了科学家、编码者等少数群体,大多数用户的使用方式尚未跟上模型的进步,这种价值积压会带来很多特殊影响,但也意味着巨大的增长潜力。

问:很多企业反映,虽然模型很先进,但实施后并未获得预期投资回报,这一矛盾该如何理解?

答:这一点确实让人困惑,因为我们听到的反馈截然相反。很多企业表示,即便GPT-5.2涨价10倍,他们依然愿意付费,认为我们定价过低,他们从中获得的价值远超成本;编码者甚至表示愿意支付100倍价格。

我认为问题可能出在官僚主义和工作流程变革上。根据GDP评估数据,对于明确指定的知识工作任务,GPT-5.2有70%的概率能让用户满意或更满意,企业本应大规模应用,但改变长期形成的工作流程需要时间,这可能导致部分企业暂时未能看到投资回报。

06 未来走向:关于IPO的必然性与个人心态

问:OpenAI明年会IPO吗?

答:我不知道。

问:你是否希望OpenAI成为上市公司?你们似乎可以长期私有运营,会在需要资金前提前上市吗?

答:这里有很多复杂因素在起作用。公开市场参与价值创造的模式确实很酷,而且和其他公司相比,我们即便上市也会是非常晚的阶段。作为私营公司有很多优势,比如能更专注长期发展,我们也需要大量资本支持,未来还会面临股东限制等问题。

但就我个人而言,对成为上市公司CEO毫无兴趣,兴奋度为0%。对OpenAI成为上市公司,我既有期待的地方,也清楚这会带来很多麻烦。

[ 打印 ]
评论
目前还没有任何评论
登录后才可评论.