今年我会在更深层理论上明白目前AI发展的前景和局限, 具体把握会在时间节点和产出的数据上, 毕竟我自己也在局部参与机器人和AI的开发, 有比其他投资者更多的第一手资料.
下面是3者在世界模型上的不同出发点. 我更看好Jensen和李飞飞的具体操作. Lecun偏学术, 他的动作毕竟慢.
在“世界模型(World Models)”这一概念上,杨立昆(Yann LeCun)、李飞飞(Fei-Fei Li)和黄仁勋(Jensen Huang)确实展现出了高度的共识,但他们推崇的侧重点和应用场景有所不同。
可以理解为:他们都认为 AI 必须理解物理世界,但杨立昆侧重于架构革新,李飞飞侧重于空间智能,黄仁勋侧重于产业落地。
杨立昆是“世界模型”最坚定的倡导者。他认为当前的 LLM(大语言模型)只是文字游戏,缺乏对物理现实的理解。
核心主张: 提出了 JEPA(联合嵌入预测架构)。他认为 AI 应该像人类婴儿或动物一样,通过观察视频或真实世界来学习物理规律(例如:松手物体会下落),而不是只学习文本。
目的: 解决 AI 的常识问题,使其具备推理和规划能力,从而超越现有的自回归模型。
李飞飞近期提出的**空间智能(Spatial Intelligence)**概念,本质上就是三维空间中的世界模型。
核心主张: 她认为智能离不开“感知”与“行动”的循环。AI 不仅要能识别图片,还要理解物体在三维空间中的关系、遮挡以及物理属性。
目的: 赋予 AI 像人类一样在现实空间中导航、交互的能力。这与杨立昆强调的“通过观察学习世界规律”在逻辑上是高度一致的。
作为 NVIDIA 的掌舵人,黄仁勋对世界模型的推崇更多集中在具身智能(Embodied AI)和数字孪生上。
核心主张: 他认为下一波 AI 浪潮是机器人。要让机器人工作,必须先在虚拟的 Omniverse(NVIDIA 的模拟平台)中建立一个符合物理定律的世界模型。
目的: 物理仿真。他认为 AI 需要在模拟的物理世界中进行成千上万次的训练,才能进入现实世界。