今年7月举行的(上海)世界人工智能大会上(下图 DAO),
初创公司快手创始人曲东奇展示了他最近在网上发布的一段视频。视频中展示了一张老照片,照片上是一名妇女抱着两个孩子。随后,照片仿佛有了生命,妇女将两个似乎在蹒跚学步的孩子抱在怀里,孩子们惊喜地笑了起来。该视频由中国大陆互联网公司快手的人工智能技术制作。笔者在撰写本文时去到了快手网页,实际体验了将静态图像转换为鲜活逼真的5秒视频(Image-to-Video)。有兴趣你不妨也去试试 – 坐在椅子上双手交叉重迭放在身前的蒙娜丽莎,忽然动了起来,给自己戴上一副酷酷的墨镜,同时她整个上身都非常协调地配合她戴墨镜的行动(下图 KLING)。这是快手的视频生成器可灵(Kling)展示的众多demo之一。虽说距OpenAI于2024年2月推出的视频生成器Sora有5个月的时间。关键是当只有少数几个人能够有权访问使用Sora时, 快手的同类视频生成器可灵(Kling)已于7月24日向全球用户正式发布。
在同行互“卷”激烈的中国大陆,或许快手的可灵“弯道超车”实现了AI视频生成器的领先突破。但在这一赛道上的其它玩家并没闲着 – 字节跳动有自己的AI作图和AI视频生成功能的“即梦”(下图 Bytedance),支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力;腾讯推出了自己的大语言模型“混元”,可文生文本、 图生文本和文生图。此外,还有李开复的零一万物(基准测试中的得分几乎与美国领先技术相当),阿里、百度、华为等科技公司各自的AI项目。据互联网监管机构中国国家互联网信息办公室4月2日披露,已有117个生成式人工智能模型获准公开使用。这些模型包括大型科技公司开发的强大模型,如阿里巴巴的“通义千问”(居开源人工智能系统排行榜榜首),它可以执行从写邮件、周报、提纲、创作诗歌、小说、剧本、计算机编码、制表、甚至角色扮演任务;也有用途更具体的模型,如好未来教育集团开发的“MathGPT”,它可以解决数学问题;以及游戏公司上海巨人网络科技用于游戏开发的“GiantGPT”。
可灵(Kling)以及其它中国大陆公司推出的可与美国领先系统相媲美的人工智能技术并向全球用户正式开放一事表明,中国大陆正迎头赶上在人工智能发展方面处于领先地位的美国(下图 YouTube)。由于大陆公司普遍开源,即更愿意向消费者发布其技术,甚至与其他企业和软件开发商共享底层软件代码,其他人能够更快地使用相同技术构建和分发自己的产品。开源一直是计算机软件、互联网以及现在的人工智能发展的基石。其理念是,当计算机代码可供任何人免费查看、使用和改进时,技术进步会更快。具体在AI大模型上,随着模型的增长,应用程序也随之激增,进入门槛也降低了。如百度的软件工具套件,它可以帮助几乎没有编码知识的人使用生成式人工智能制作应用程序。
目前中国大陆科技公司已将人工智能融入到从数字娱乐到商业等经济的方方面面。在大陆政府从资金、战略规划、基础设施和生态系统发展等方面给予大力支持下大陆庞大的人口数量使得人工智能应用能够大规模开发、测试和部署,并实现快速迭代和创新。随着未来几年人工智能技术的不断发展,大陆科技公司的努力可能会产生巨大的影响,甚至超越领先的美国。(下图 Milton Marketing/AIport)
当然超越并非易事。美国仍然处于人工智能研究的前沿,尤其是AI底层逻辑-基础理论研究,大陆公司往往是在美国公司开源模型的基础上追赶美国。此外,美国拥有对构建人工智能至关重要的最强大的计算机图形芯片GPU。据说美国政府有可能在今年10月进一步收紧对华出口芯片,限制英伟达公司出售阉割版的GPU芯片H20。GPU芯片显然是北京赶超美国AI必须跨越的一座高山。前谷歌CEO斯密特(Eric Schmidt)因此认为美国在AI“遥遥领先”中国大陆。虽然大陆的华为公司据称拥有算力可媲美英伟达A100的升腾GPU芯片910B,但由中芯国际生产的这款人工智能芯片(910B)因良率不高,大陆仍然需要进口使用英伟达的GPU芯片。近日《华尔街日报》爆料华为正测试GPU芯片升腾910C,该款图形芯片据说不逊于英伟达的H100,预定于今年10月发售。另有媒体报道大陆浙江省绍兴投建一所制造光刻机的工厂,计划明(2025)年建成投产,一年生产50-100台光刻机。据tom’sHARDWARE援引香港《南华早报》消息,大陆有望在今年夏天就实现芯片制造设备的基本自给自足。绍兴的这些光刻机将可以生产小至28纳米的芯片,帮助大陆在2026年时在GPU芯片自给率方面有一个大的提升。由于芯片尺寸即将达到摩尔定律极限,时间对中国大陆在人工智能领域赶超美国是有利的,前提是如果不发生什么“黑天鹅”或“非犀牛”事件的话。
参考资料
Zhang, L. M. (2024). ‘Everyone is a developer’: China’s generative AI frenzy sparks boom in app creation. THE STRAITSTIMES. 链接 https://www.straitstimes.com/asia/east-asia/everyone-is-a-developer-china-s-generative-ai-frenzy-sparks-boom-in-app-creation
Tobin, M. & Metz, C. (2024). China is closing the A.I. gap with the United States. The New York Times. 链接 https://www.nytimes.com/2024/07/25/technology/china-open-source-ai.html#:~:text=Closing%20the%20A.I.-,Gap%20With%20the%20United%20States,of%20consumers%20and%20software%20developers.