> 科技 >

在120人大组里“卷”,博后一作再发《科学》 环球简讯

时间:2023-05-05 09:12:01       来源:今日科学

“我博士后期间熬的夜比读博时候还多!”在进入这个120人的大组里后,王顺智不小心把自己变成了一个“夜猫子”。

在一个如此庞大的组里,导师很难照顾到每个人,组员受到的直接关注较少,要想学有所成基本全靠自我驱动力。“其实真的不是想要‘卷’,而是到了一个新领域,要补的知识太多了!”博后期间调整方向的王顺智本就是个闲不住的人,身体里就像装了发条,这样的性格反而在大组里如鱼得水。


(资料图)

更何况,他还有一个更疯狂的导师——蛋白质领域大牛、美国华盛顿大学生物化学系教授David Baker。他是一位60岁的“纯粹科学家”,全身心扑在科研上,一得空就泡在实验室,谈起研究就像打了“鸡血”。

王顺智对待科研的这股子热情,也受到David的感染。尽管到David组里做博士后已有3年,但导师每一次重现那种“冲劲儿”,都令他十分佩服。

“强将手下无弱兵”,近日,王顺智以共同第一作者身份在Science发表论文,这也是他在两个完全不同领域里的第二篇Science。他和合作者采用一种人工智能强化学习算法,开发了一款强大的新型蛋白质设计软件。该成果是利用人工智能开展蛋白质科学研究的里程碑,这种方法可能会引领蛋白质设计的新时代。

从棋盘游戏到蛋白设计

一开始,王顺智的研究领域与人工智能并无交集。

他在本科和博士阶段都是学的化学专业。本科是在美国北卡罗来纳大学教堂山分校学金属有机化学,博士期间就读于美国西北大学,主要做纳米材料和DNA超分子化学。在读博接近尾声,他才逐渐接触计算领域。

“读博快结束的时候,我跟很多分子动力学模拟的研究人员在交流与合作的过程中,有了很多机会去接触计算机模拟,让我对编程以及计算辅助实验产生了非常浓厚的兴趣。”王顺智在接受《中国科学报》记者采访时说。

那时候,他就意识到,在研究分子生成的领域中,如何用人工智能去更好地生成分子,将会是未来的一大趋势。

而在人类的生命健康领域,蛋白质承担了很多重要的生命功能,比如新陈代谢、免疫等等。在传统自然过程中,这些蛋白质的产生,主要来源于遗传和演化。但在应对大流行病、癌症等突发状况时,亟需快速高效生成能应对它们的这类型分子。

“这时候,我们就想到了借助计算机和人工智能来实现,这也就是我做蛋白质设计的一个初衷。”王顺智表示。

蛋白质设计已有很多学者在做,也取得了不错的进展。但对于一些高度复杂、有特定形状的蛋白质,要想天衣无缝地形成对称的组装体,仍然是研究的一大难点。

王顺智最开始的想法,是要寻找一套人工智能的算法来解决这个问题。前期,他一直在尝试用机器学习去做纳米蛋白笼的设计。在一次组会上,他讲完相关研究进展报告后,引起了另一位组员Christoffer Norn的兴趣,Norn同时提到组员Isaac D. Lutz也在做类似的方向,但还未做到纳米蛋白笼的设计层面。

三人一拍即合,组成了科研小分队。尽管平日里的科研工作非常忙碌,小分队每周也必定会约见好几次,一起讨论研究思路、进展、困难以及解决办法。他们用了一年的时间去研究算法,并不断尝试各种序列设计,迭代了10个版本,才慢慢摸出门路。这三人也是这篇文章的三位共同第一作者。

不断探索的过程中,王顺智从国际象棋和围棋上获得了灵感。在棋盘游戏里,一种名为蒙特卡洛树搜索(MCTS)的强化学习算法表现出众,它也是阿尔法狗的核心算法之一。王顺智和合作者们首次把这一算法应用到了生成蛋白质组装体的结构上,解决创建像拼图一样组合在一起的蛋白质形状问题。而在此之前,根本无法做到这一点。

多次实验证明,这种方法不仅准确,而且高度可定制。例如,可以要求该软件制作没有孔、小孔或者大孔的球形结构。

在一项实验中,他们发现,使用该软件制作的蛋白质在小鼠身体中产生了更有效的抗体。这表明,这一重磅突破可能很快就能催生出更强效的疫苗。

这是一次前所未有的突破,其潜在应用十分广泛,除了可以制作强效疫苗外,还能开发更有效的癌症治疗手段、创建新的可生物降解纺织品等。其对再生医学也将产生深远影响,在糖尿病、脑损伤、中风以及血管治疗等领域发挥作用。

更广泛地说,这种方法可能会引领蛋白质设计新时代的到来。

身处逆境时,如何走出来?

科研本就是一项长期且极具挑战的工作,是一个需要不断探索、实验和积累的过程,在如此漫长的路途上,难免遭遇不同程度的磕碰。

虽然已是手握两篇Science、多篇Nature子刊,但王顺智坦言,自己的科研之路并非一帆风顺。

到美国西北大学读博,原本是一件令王顺智很愉悦的事情,毕竟可以夜以继日地从事自己热爱的科研工作。但在头两年,他都被困在一个课题里,一直处于卡壳状态。彼时,年轻气盛的他想去做一项比较有挑战性的实验,即用DNA把合成的纳米颗粒形成超晶格的多层级组装,但每一次都以失败告终。

实验到底能不能成,他心里完全没底。

自己没有产出,而周围的小伙伴一个个都进展顺利,压力感日复一日加重。

王顺智不允许自己陷入失败的泥潭,生活要继续,科研工作也要往前推进,于是他采取了迂回策略,开始积极探索新的研究方向,那个卡壳的课题就偶尔做一做。

“要拿得起放得下,有些人可能会‘咬定青山不放松’,但我觉得应该适时拥抱一些新的趋势,顺势而上,或许会‘柳暗花明又一村’。”王顺智说。

事实上,那个令他一直裹足不前的课题直到读博第五年才给攻克,最终发表在Nature Communications。反倒是后来新开的课题,为他赢得了人生中的首篇Science。如果当时他没有灵活调整研究方向,可能还在第一棵树下打转。

当记者问及身处逆境如何才能走出来时,王顺智分享了一些自己的做法。

“做科研本就要有一颗强大的心脏,迷茫是生命中难以逃避的一部分,而解决迷茫和困境需要一些正向激励。”王顺智建议,可以经常参与一些学术会议,这个过程中既可以认识一些志同道合、同样被虐的很惨的朋友,领略学术大佬风采,还可以得到更多维度的思维训练,视野打开了,也就不太会拘泥于原来的目标。

在他看来,最关键的一点是,科研人员需要有一两个除了科研以外的兴趣爱好。“我自己有挺多爱好,进展不顺的时候,它们都能帮我从学术的压力中解脱出来。比如我喜欢打羽毛球、滑雪,大学时还认真练过一段时间国标和拉丁舞,偶尔旅行、帆船,也热衷于电脑和棋牌游戏,虽然现在基本没时间玩了。”

兴趣爱好不仅能释放压力,有时候还能为科研带来灵感。例如,棋盘游戏在这项关于蛋白质设计的研究中就给了王顺智很大助力。

最让王顺智崇拜的就是导师David ,他不仅是蛋白质领域的学术大牛,更是一名狂热的体育爱好者,学术和爱好皆已发挥到极致。虽然已到花甲之年,David还能登山徒步20多公里,做高山滑雪极限运动。

“华盛顿州处在多山地带,野外滑雪资源非常丰富,老板经常约上实验室的学生或博士后,在周末的时候背上滑雪板,攀登到很高的山顶,飞身直下三千尺肾上腺素爆表。”王顺智说。

David精力非常旺盛,大脑时刻处于亢奋状态,业界流传他是不需要喝咖啡的科学家。

选大组好,还是小组好?

读博常面临去大课题组好,还是去小课题组好的抉择问题。作为过来人的王顺智给出了自己的理解和建议。

“大组不差钱是最直观的感受,人脉物质极大丰富,从来不缺东少西,资源多、路子广。”王顺智介绍,“我博士期间在Chad Mirkin团队,有近80个成员,每年的科研经费要烧掉好几百万美元左右。而我现在所在的David实验室,每年的科研经费更高,能达到上千万美元。”

但大组的大老板不可能照顾到每个人,组员受到的直接关注可能较少,学生更多的是交给博士或博士后来带。但David是个特别大的例外,他有一套被称作“communal brain”的组织管理哲学,自己亲自上阵带所有学生和博后,通过自己连接起了组里所有人,形成了一个具有集体智慧的“大脑”,简直就是业界的一个标杆。

管理这么大的摊子实属不易,为了纯粹地做科研,David把很多琐事都交给了副手和秘书来打理,在学术界和科研领域中广受赞誉的他,除了去享受户外运动外,从未脱离过学术一线,对学生的指导十分上心。用他的话说就是,“在外边宣传自己、讲报告,还不如在实验室里跟学生讨论来得有趣。”

虽然他麾下有一百多人,但能保证每个人每三周跟他有一对一、面对面的半小时交流时间,有时候他一天就要进行15个一对一的聊天。如果平时想见他,去实验室总能有所收获。起早贪黑是他的常态,即便是早上7点或晚上11点都还能收到他的邮件回复。

午饭时刻,David也会端着餐盘到学生集中入座的位置,加入到大家的讨论中,这幅场景已是司空见惯。在这个组里,学生见到大老板时没有毕恭毕敬,也没有局促和不适应。David虽是学术界大佬,却也出现过被学生遗忘在角落的有趣一幕。

“如果你是一个独立又要强的人,可能更适合大组的氛围,自主性和内驱动力是大组生存必备武器。如果你更需要手把手带,在较好的呵护过程中才能得到成长,抗压能力不强,可能更适合小组。”王顺智建议。

王顺智博士和博士后阶段都选择了到大组里历练。“我很幸运,加入的两个大组氛围都很好。而我本就是个不太依赖于手把手被引导的人,大团队有两个特别大的好处是,有一个让你仰望的导师,还有能给你极大的学术自由度去探索你想做的任何有意思的课题。”

而且,大组里往往卧虎藏龙,不缺优秀的同事。David组里的专业背景多样化,例如有研究基因组学、免疫工程学、生物物理、材料和化学、有机化学、生物信息学、计算机等等。

“我们能够在这样一个特别大的实验室里相互借鉴、碰撞思想,是一件非常宝贵且有趣的事情。”王顺智说,“和优秀的群体为伍,自己也会被光芒感召。同事们的成就也时常令我备受激励和鼓舞。”

(文中图片皆由受访者提供)

标签:

消息推送