题图:AlphaGo打开了AI技术未来的想象空间
2016年,人工智能(AI)程序“阿尔法狗”(AlphaGo)在一场五局比赛中,击败了世界职业围棋顶尖选手李世石,一时间轰动世界,进而引发了人们对AI技术能走多远的热烈讨论,AI未来的想象空间从此变得无比丰富。
当时没人能知道,六年前的这段往事会与近日媒体争相报道的“美国华裔女科学家颜宁即将回国任职”的新闻挂上钩。
的确,围绕颜宁接受深圳医学科学院创始院长这一任职新闻的背景,或许真的与近年来AI技术的发展对传统结构生物学领域的冲击有关。
当年研发出“阿尔法狗”的,是一家英国的人工智能技术公司。这家名为深思技术(DeepMind Technologies)的公司创立于2010年9月,当时的创始人有三位:哈萨比斯(Demis Hassabis)、莱格(Shane Legg)和苏莱曼(Mustafa Suleyman)。
1976年出生在伦敦的哈萨比斯,是希腊裔和新加坡华裔的混血儿。他从小就是个国际象棋神童,13岁就已经获得了国际象棋大师头衔,到了19岁,他开始学习围棋。他是深思的首席执行官。
哈萨比斯(Demis Hassabis)
而出生于新西兰的莱格,曾分别在新西兰、意大利和瑞士攻读硕士和博士,研究领域为超级智能机器(AIXI)理论模型。他后来在伦敦大学从事与人工智能有关的博士后研究,目前仍是深思的首席科学家。
三人中的苏莱曼更年轻,他出生于1984年,父亲是一名叙利亚出生的出租车司机,母亲是一名英国护士。19岁时,苏莱曼向不少IT界的大牛人一样,从牛津大学曼斯菲尔德学院退学,与大学同学开始自己的创业。后来,他又作为公司的创始人之一,成为深思当时的首席产品官。
这几位年轻人回忆起当年畅想未来时的情景:
我们常常就如何影响世界进行讨论,我们打算建立一个庞大的模型,并期待有朝一日为金融系统的所有复杂动态进行建模,进而解决这一最棘手的社会问题。我们今天必须与现实世界打交道,讨论如何让世界变得更好……
这样的组合,这样的梦想,诞生出像“阿尔法狗”这样的AI技术,并非偶然。
位于伦敦的深思公司总部
2014年1月26日,谷歌以5亿美元收购了深思,使其成为谷歌母公司Alphabet Inc旗下的全资子公司。
从此,深思的既定目标成为:结合机器学习和系统神经科学领域中的最优技术,建立强大的通用学习算法。
2016年,深思推出了利用AI技术监测论文中不良行为的开源测试平台。
接着,深思继续在游戏领域耕耘。他们利用AI技术来理解如何玩游戏,并宣称在不改变代码的情况下玩出比世界上任何人都更有效率的游戏!他们称自己的系统无需预先编程,只需输入原始数据即可,其余的,都是从经验中学习而来。这种学习当然不是一般的学习,而是一种无模型的深度强化学习。
结果,深思推出的AlphaStar星际争霸秒杀了一切玩家!
2016年,深思将AI技术转向了蛋白质折叠,这是科学中最棘手的问题之一。
2018年12月,深思的AlphaFold成功地预测了43种蛋白质中25种的最准确结构。当时哈萨比斯对媒体自信地表示:
这是一个标志性项目,是公司在人员和资源方面的第一次重大投入,它要要解决的,是现实世界中最基本,也是最重要的科学问题。
2020年,在第14届世界蛋白质结构预测技术关键测试(Critical Assessment of protein Structure Prediction,CASP)竞赛中,AlphaFold的预测取得了被专家认为是可与实验室技术相媲美的准确度得分。专家们表示:
这是一个真正了不起的成就,预测蛋白质如何折叠的问题已经基本解决。
2021年7月,深思发布了开源的AlphaFold2,可供全世界的所有科学家使用。
2022年7月,深思又在AlphaFold数据库中发布了超过两亿个预测的蛋白质结构,这几乎涵盖了目前所有已知的蛋白质结构!
这是对传统结构生物学领域的一次革命性突破。
结构生物学家、中科院院士施一公(1967—)
而著名的华裔生物学家施一公和颜宁所从事的工作,正属于这一领域。
2021年7月23日,施一公在接受DeepTech公司独家专访时说:
AlphaFold的预测,是人类在认识自然界的科学探索征程中一个非常了不起的历史性成就。它的第一个影响是对结构生物学领域的一个颠覆性突破。第二个影响是对生物化学、细胞生物学、遗传发育、神经生物学、微生物学、病理药理等一大批生命学科和研究领域的影响,这会大大改进我们对于生命过程的理解。第三个影响可能会超越生命科学的界限。AlphaFold的预测结构如果广泛应用在生命学科各分支、创新制药,可能会给社会和老百姓带来很大好处,甚至会对人类文明产生一些影响。
我同意深思公司创始人兼首席执行官哈萨比斯的说法:“我们使用AlphaFold生成了人类蛋白质组最完整、最准确的图片。我们相信这是迄今为止人工智能对推进科学知识所做的最重要贡献,也是人工智能可以为社会带来的各种好处的一个很好的例证。”
这的确是迄今为止人工智能对科学界做出的最重要的贡献。这也是21世纪截止到目前人类在科学技术领域上的最大突破之一,也应该是人类有史以来在科学和技术领域最重要的突破之一。它所带来的在生命科学各分支领域的革命,将在今后几年到十几年中逐渐显现出来。在我看来,这项突破堪比人类基因组完成测序,甚至更重要!
如此溢美之词,出自一位严谨的科学家之口,可见其意义非凡!
正因如此,未来从事传统结构生物学研究的科学家们,或许在学术界和工业界的竞争力将大幅下降,从而走到科研与职业的天花板。
的确,一个显而易见的事实是:几十年来,数万名结构生物学家努力工作,才解析出19万个蛋白质结构,而深思已经完成的结果是2亿个结构!
小的紫色圆代表之前科学家解析出的19万个结构,大的蓝色圆代表由AI解析出的2亿个结构
不仅如此,更利害的是,世间几乎所有已知的蛋白质结构,现在都被深思开源了!
由此带来的一个无奈的事实是:在AI技术的巨大冲击下,结构生物学已经开始从探索型的研究工作,转向了工程师型的寻常工作。
有人做了一个形象的比喻:
传统结构生物学家的工作 = 手工织衣服
深思的AlphaFold = 珍妮纺织机
前者是优秀的裁缝,有着良好的纺织技术训练,也有良好客源的裁缝铺和裁缝界声望,但局限于产量和效率,已经达到天花板。后者则由革命性的技术推动,早期也许衣服质量还不够好,但效率却提升了百万倍。到了后期,技术已日臻完善,完全可与前者相匹敌,而且未来的潜力难以估量。
颜宁(1977—)
其实,颜宁的研究已经十分出色了。2021年,她和她的团队利用AI技术,进一步解析了胆固醇代谢调节机制中两个关键蛋白Scap和Insig的结构及作用机制,该研究结果于6月29日发表在《细胞报告》(Cell Reports)上。
只是,深思的AlphaFold2实在是太过强大了。
那么,我们该如何看待AI技术的发展呢?
我始终坚定地认为,AI技术即使再牛,也无法最终替代人类,因为人的复杂性远远超出人自身所拥有的一切知识和想像。但是,在许多领域,特别是那些重复的、有规律的或有规则的领域,并不排除AI的能力与效率会远超人类,而且这恰恰是AI技术的长处。这就如同人类没有翅膀、无法在天空上飞翔,但经由人类发明的飞机则完全可以做到一样。而这,并不意味着飞机就超越了人类。
所以,在许多情况下并非是科学家本身的能力不足,而是这一领域中的工作恰好更适合由AI技术去承担而已,也因此,使得许多原本对科学家的人工产生依赖的领域,从现在起,或在不远的将来,将不再产生依赖。
由此产生的影响必然是:研究工作的方向开始转变,投资人也将原来指向传统结构生物学研究的经费,不断地转移到生物AI实验室。
这些变化,通过对颜宁团队2019年以来科研产出(主要是论文)和项目经费方面的统计数据比较就可以清楚地发现,科研产出呈大幅下降趋势,相应的项目资金也在逐年减少。
当然,这一颠覆性的革命所带来的冲击并非只是针对颜宁,而是针对这一领域中的所有人。他们会从之前的解析结构,变为验证结构的正确性。有人用了一个不太恰当的“岗位”概念做比喻:就好像是从算法岗位降级为测试岗位,进而再降为数据专员!
这的确不是个人所能左右的,这是时代的浪潮使然。
以颜宁的个人履历来看,她实际上是一位不甘寂寞、寻求变化的十分聪明的学者型人才(至少现在看还是)。而以她在结构生物学领域中的见识与成就,应该不难判断出未来的技术走势并据此作出自己个人的选择。
这位1977年出生的山东姑娘,2000年毕业于清华大学生物系,后获得普林斯顿大学分子生物学博士学位。当时她的导师正是施一公。
接着她继续在普林斯顿大学分子生物学系做博士后。
2007年,颜宁学成回国,进入清华大学,成为清华生命科学学院当时最年轻的教授和博导。
到了2017年,颜宁出人意料地华丽转身,选择离开清华大学,回到了她曾经工作过的母校——普林斯顿大学,成为分子生物学系首位雪莉·蒂尔曼(Shirley M. Tilghman)终身讲席教授。而当时,深思在结构生物学领域中的研发还处在萌芽中,许多突破性的研究还停留在愿景阶段,远未落地。
而当时的颜宁等一众结构生物学家的蛋白质解析研究,则代表着最前沿的技术和最先进的路线。
只是,仅仅过了五年,深思就携带着它的大杀器AlphaFold呼啸而来,席卷了整个行业!
2022年11月1日上午,颜宁在2022深圳全球创新人才论坛上宣布,她即将辞去普林斯顿大学教职,出任深圳医学科学院创始院长。
这是颜宁的又一次选择,或许是她又一次的华丽转身?或者,这算是她以目前认知范围内所能找到的局部最优解?
让我们拭目以待。
规划的深圳医学科学院位于坪山的西南、马峦山郊野公园以北、碧湖文化健康城范围内。初期用地41万平方米,预留20万平方米作为未来拓展用地
只是,围绕着回国一事,颜宁与媒体一道开始了一轮大规模的造势,从提前高调宣布,到媒体的竞相报道,再到招聘广告隆重推出......所有这一切,对于一位曾经在科研领域潜心耕耘、踏实做事的学者来说,多少有些令人意外。
尤其是,从美国到中国、从教授到院长,其工作环境差异之大,工作性质变化之巨,必定超出许多研究人员和学者的个人想象。只五年时间,选择得是不是有点太快了?
然而,毕竟有过2017年离开中国的个人经历,想必颜宁本人对此不会没有充分的思想准备吧。况且,对于45岁的年龄以及已经成就的事业,颜宁即使选择了从单纯的学术研究逐渐转向行政管理,也不失为一种合理且常规的正常走向。
需要提及的是,从媒体的介绍看,深圳市医学科学院并非是一所普通的学院。它是一个由中央和国家隆重圈出、深圳市政府亲自操刀、并且据说是对标美国国立卫生研究院(NIH)等世界顶级医学研究资助机构那样的单位。
负责筹建工作的深圳市卫健委官员表示:深圳市医学科学院,不仅仅是一个单纯的研究机构,它更核心的功能是承担政府赋予的在医学科技研究方面的公共管理和服务职能。它的建设思路,是成为一个枢纽型的科研机构,相当于“组织科研的科研组织”。
以这样重要且隆重的定位,或许非颜宁领军莫属。
所以,颜宁的再次回国对国家无疑是件好事。
愿颜宁不负众望,未来能带动这一领域快速发展,使之成为国际同行中的佼佼者。
(文中图片均引自网络)
另外,如果拿了对方的经费,FBI对这种墙头草难免不放心, 只要请喝一杯咖啡,立马逃之夭夭。 那1400人也大多就是这样被吓跑的
氨基酸数量越多空间构型的排列组合越多,人工确定小蛋白质空间构型可以,但大蛋白质的空间构型几乎不可能了。
确定就确定,不存在准不准的问题。
-----我一个搞业务的。她还不抓住业务上的瑕疵整死我。 国内你你就不可能有健康的环境安安心心搞业务。
=========
是不是你想多了?她说“我就等着你接班了”,这更可能是一种友善的表示,显示看重你,也有一点拉拢的意思。
读书人往往计较太多,宽厚不够。
蛋白质3维结构就像个坑坑洼洼的土豆,由氨基酸链条折叠而成。用X射线晶体学方法测蛋白质结构,是个费用高的细活。 至今,只测出了194,000 种蛋白质的3-D结构。
DeepMind公司的AlphaFold蛋白质预测软件,现在已预测出2亿+种蛋白质的结构,放在数据库里让大家看,但不是都准确。
AlphaFold在预测蛋白质相互作用时形状变化的准确性,远不及它对单一蛋白质结构预测。AlphaFold 的开发者也承认这一点。实验方法对于了解蛋白质如何折叠仍然至关重要。
文章好极了, 言简意赅, 文笔优美, concise yet comprehensive, precise and insightful.
Thanks for sharing.