AI+病毒学研究:跨界合作就像无影灯,减少跨领域认知阴影
2022-12-05 | 作者:微软亚洲研究院
编者按:在地球上,任何一种生物都摆脱不了病毒的纠缠,所有生物都会被病毒感染,例如感染细菌的噬菌体,感染阿米巴虫的米米病毒,还有感染人体的各种病毒,包括肝炎病毒、狂犬病病毒、埃博拉病毒、艾滋病病毒、新冠病毒等等。经过多年的研究,人类是否认清了病毒的本质?病毒究竟从何而来,又将去往何处?人类能否真正消灭病毒?它与人类只是敌对关系吗?AI+病毒学的跨界研究能否追本溯源?
近期,来自西湖大学生命科学学院的助理教授魏磊博士与微软研究院科学智能中心主管研究员邓攀进行了一场精彩的跨界对话,就上述问题进行了分享,并共同探讨了病毒学的核心前沿,以及大数据、AI 等计算机技术对病毒学领域和抗病毒研究可能产生的革命性影响。
邓攀:非常高兴能邀请您来微软亚洲研究院为我们讲述病毒学研究领域的过去与未来。病毒一词我们经常听到,也时刻存在于我们身边,我们该如何定义病毒?
魏磊:了解病毒之前,我们首先对生命做一个简单的定义:一、要有一个与环境的边界,如细胞膜;二、本身具有遗传物质,比如细胞中的 DNA;三、可以从环境中吸取养分,供给遗传物质或自身复制。从这个定义上看,病毒是没有生命的,它虽然满足前两个特点,但没有办法实现自我复制,只能以某种形式进入细胞,将它的遗传物质递增到细胞内,再利用整个细胞的资源、蛋白质来复制病毒的遗传基因,进行数量扩张,传染更多宿主。病毒种类非常多样,但它们有一个共同的特点,就是非常微小,比细胞,甚至细菌都要小很多,但病毒内部又是非常复杂的,包含着一个完全不一样的世界。
邓攀:病毒是无生命的,所以它无法离开宿主细胞生存,那么病毒与人类之间又有着怎样的关系?
魏磊:如果把地球46亿年的历史压缩到一个小时,第一个生命大概是在9分钟时出现,而人类出现的时间只是在这一小时结束前的0.1秒。
地球生命的演化图(图片来源:肯塔基大学官网 https://www.uky.edu/KGS/education/clockstime.htm)
生命与病毒之间的战争其实持续了相当长的时间,而且大部分时间人类并不存在,因此人类与病毒的关系就是一种生命进化中的历史遗留问题。不管是哪一种生物,只要来到地球上,肯定是需要经历病毒“洗礼”的。在整个人类的发展史上遍布着各种瘟疫记录,而且大部分由病毒导致,比如较早的天花病毒带走了5,600万生命;100年前的西班牙流感带走了5,000万生命;艾滋病带走了大概3,500万生命;目前新冠病毒还在威胁着人类的健康。可以说,病毒与宿主一直在相互缠斗,双方都需要不断奔跑和改变,才能在这样一场战争中取得上风。
流行病的历史(图片来源:Visual Capitalist https://www.visualcapitalist.com/history-of-pandemics-deadliest/)
邓攀:您将人类和病毒的关系比作一场战争,而战争胜利的关键是“知己知彼”。从病毒学专家的角度来看,您认为科学界现在对病毒的了解到了什么程度?病毒研究领域是否存在大家都十分关注的未解之谜?
魏磊:我关注的问题有几个:一是,病毒的起源到底是什么?现在有很多不同的理论,有人认为它是在细胞之前产生的,也有人认为它是在生命出现之后产生的,是生命体系里的一部分。
二是,病毒在人类进化中究竟起什么样的作用,与人类的关系是什么?虽然前面我讲的是把病毒当成我们的敌人,我们要跟它们作战。但事实可能并不是这样,病毒也分好坏,能够致病的病毒是一小部分,很多病毒我们可能根本不知道它的存在,也不会致病,甚至还对人类有帮助。
三是,病毒何去何从,它整个进化的走向是怎样的?这点可能对理解、研究整个病毒都起到推进作用。现在很大的一个问题是很多历史信息已经遗失,我们是否有办法了解某一种病毒进化的历程?是否能预测病毒的发展过程?
最后,是疫苗的问题。为什么疫苗对抗某些病毒很有效,比如乙肝疫苗具有十几年的效力,但新冠疫苗抗体可能几个月就失效了,这也是免疫学上一个很大的问题。
在病毒研究领域,魏磊博士都关注了哪些问题?
邓攀:就像您说的,病毒就像生命的影子一样。而且从人类感染病毒的历史记录来看,病毒造成的瘟疫是反复周期性出现的,人类也的确没有摆脱病毒的纠缠。在这个过程中,病毒学主要在研究哪些内容?
魏磊:病毒学就是研究病毒与宿主相互作用的过程,这里主要包括三个方面:第一,病毒是怎样感染宿主细胞从而实现整个生命周期复制的。第二,宿主的免疫系统是可以压制病毒的,但病毒可以不断变异,逃逸免疫,所以要研究病毒的变异机制是什么。最后,是研究各种各样不同的抗病毒策略。
病毒与宿主的相互作用
具体则有五个方向:首先,我们必须认识到有病毒入侵这件事情。如果你不知道到有“敌人”入侵,那就根本无从下手,在微生物发现前的长时间内,人类都不知道一些疾病发生的原因,只能坐以待毙。其次,要认识到“敌人”究竟是谁,要知道跟你争斗、与你赛跑的对象是谁。第三,是构建一个细胞模型,重现病毒感染的过程,不断模拟病毒传染的战场。第四,在模拟战场中不断演变不同的抗敌战术。最后,鉴定不同的抗病毒靶点,筛选药物以及疫苗。
邓攀:那么病毒学研究都取得了哪些成果,是否已经让人类占得上风?
魏磊:我们以乙型肝炎、丙型肝炎病毒研究为例,来看一下病毒学研究所取得的成果。丙型肝炎病毒感染是第一个也是目前唯一一个被治愈的慢性病毒感染,这是一个史诗级的过程。上世纪70年代,很多病人在输血后得了肝炎,当时已经发现了甲型、乙型肝炎的存在,因此有一部分人认为是由这两种肝炎病毒造成的,也有一部分人推测是非甲非乙肝炎,但不清楚是否由病毒引起,也不知道是否有传染性。为此,该领域的第一位诺贝尔奖得主做了一个实验,将这种肝炎病人血液的感染因子注射到大猩猩体内,大猩猩也得了肝炎。之后他又通过一系列实验,预测这个传染源可能是病毒,也就是意识到了有“敌人”入侵。
1989年第二位诺贝尔奖得主的工作是确定了这个“敌人”为丙肝病毒。那时还没有PCR( 聚合酶链式反应)技术,也无法对肝炎病毒的核酸(遗传物质)进行扩增。这位诺贝尔奖得主提取了患者血液中的核酸后,以“借腹生子”的方式,借细菌的能力扩增核酸,并放到类似发现青霉素时的平板中培养细菌,这些菌斑中要么有宿主核酸,要么有病毒核酸。但如何确定哪一个含有病毒核酸,并对其进行基因测序呢?面对如同大海捞针的难题,这个团队巧妙地使用了逆向思维方式,利用病人感染后产生的抗体,在100万个菌斑中找到了一个带有病毒蛋白质的物质,在测序后第一次得到了一个未知的核酸序列。这些工作让我们知道了丙型肝炎是一种 RNA 病毒,并发现丙肝病毒与其它病毒具有同源性,比如登革热和黄热病的病毒。这个成果警醒了研究黄热病病毒的病毒学家,让他们可以将已经积累的病毒研究经验应用到丙型肝炎上。
接下来,有科学家重构出了大概有一万个核苷酸的丙肝病毒序列,并试图重建细胞体系和病毒感染过程,但很长时间都没有使病毒在细胞内成功复制,直到第三位诺贝尔奖得主出现。他之前一直从事黄热病研究,利用黄热病病毒研究经验重新审视了丙肝病毒结构,发现了之前未被鉴定出的序列,但病毒在细胞中的复制还是失败了。所以,他们又将目光锁定在了病毒序列上,认为这个长链序列上可能发生突变导致它失去作用。然后,又通过复杂的基因序列比对,最终在2006年成功构建了整个序列,并在细胞中开始复制。当然,除了这三位诺奖得主的团队,还有很多研究者科学家们为丙型肝炎的基础研究做出了杰出的贡献,这是一个大领域取得的胜利。
之后的十年时间,相关研究就进入到了靶点鉴定、药物筛选的阶段。科学家们发现了 NS5A、NS5B 和 NS3 三个靶点,并制成了三种蛋白酶抑制剂药物。2015年丙型肝炎治愈率已经达到95%。
三位对丙肝病毒发现做出重要贡献的诺贝尔奖获得者(图片来源从左到右:美国国立卫生研究院官网,阿尔伯塔大学官网和洛克菲勒大学官网)
乙型肝炎的研究过程跟丙型肝炎基本同步:1965年发现,1981-1986年左右制作出疫苗,又研发了一系列药物,能够抑制乙型肝炎病毒的 DNA 聚合酶。但这些药物只是能抑制病毒复制,不能治愈乙型肝炎。迄今为止,乙型肝炎的治愈率仍小于5%。其中一个很重要的原因是一个叫做 cccDNA 的乙肝病毒基因组。现有的乙肝药物能通过抑制病毒聚合酶来抑制病毒的复制,然而它们无法清除 cccDNA。一旦停药,cccDNA 仍然可以作为模板生产出新的病毒聚合酶,促进病毒复制,导致乙肝复发。所以要治愈乙肝,首先要攻克 cccDNA 的难题,这也是我现在重点研究的方向之一。
邓攀:从1970年到2015年,人类经历了几代人的努力,集合众多领域的聪明才志,跨跃半个世纪才终于基本治愈了丙型肝炎。而在乙型肝炎的研究上,人类算是取得了半个胜利。回顾这漫长的研究历程,我们是否可以总结一些经验,指导未来的病毒学研究?
魏磊:首先是跨领域专家的合作。整个研究的过程中有很多不同领域的科学家参与,包括临床医学学家、病毒学家、生物信息学者,还有化学专家、结构生物学者进一步设计药物,以及很多临床试验来完善。
第二是跨领域知识的融合。丙肝的整个研究过程借鉴了很多其他病毒方向的研究,比如在药物研发时,利用了艾滋病病毒的药物库来筛选。同时,现在丙肝病毒治愈之后,反过来对艾滋病病毒,甚至是新冠病毒的研究也有很好的指导作用。比如新冠病毒的蛋白在表达的时候,与丙肝很像,同样是一个长串的蛋白质连在一起来表达,也需要有蛋白酶把它解离成单个的蛋白来行使功能。这个蛋白酶很关键,丙型肝炎病毒研究的重点就是对蛋白酶抑制物的设计,因此新冠病毒的药物设计也是按照这个方式快速完成的。另外,还有两种新冠药物并不是直接从新冠病毒研究中发现的,其中一种是在筛选抗埃博拉病毒的药物时发现的。现在,大数据分析、人工智能已经开始在病毒研究的所有领域发挥重要作用,未来肯定会是这个“游戏”的改变者。
邓攀:确实,AI 技术在跨领域的研究中已经开始发挥作用,微软亚洲研究院的许多AI模型也在物流、航运、金融、电信、医疗等行业中得到应用,为企业数字化转型贡献一份力量。那么,在推动病毒学发展方面,在您所说的“认知敌人入侵、鉴别敌人是谁、重新模拟战场、发展不同抗敌战术,以及研发疫苗和抗病毒药物”五个阶段中,AI 可以在哪些方面发挥作用?将 AI 应用在病毒学、传染病防控等领域,是否还存在一些难点?
魏磊:首先,在病毒研究的第一步,很多情况下我们都需要找到病毒与某种疾病的关系,人类行为与疾病的关系等,这些都可以理解为寻找潜在规律,而大数据分析、人工智能,在这方面有无限潜力。例如,之前有人发现,某国际电商平台上熏香蜡烛的销售差评率跟新冠疫情暴发有着正向关系。现在看起来它是符合逻辑的。很多新冠患者即使没有明显的症状,也可能出现嗅觉或味觉功能减弱,因此认为熏香蜡烛香味太淡,从而给出差评。这些潜在的联系,是通过大数据分析挖掘出来的。此外,对于动物病毒的监测也非常重要,因为现在很多传染病,包括新冠病毒都是人畜共患病。因此,我们也可以利用 AI 建立一套机制体系,提前对动物疾病进行监测,形成一种预警机制。
其次,在病毒身份鉴定上,大数据、生物信息学的作用是无可置疑的。我们有非常多的基因测序数据,包括体液测序、环境测序,其中一个大问题是,虽然我们有能力发现很多病毒序列,但怎样区分出来哪一些是真正对人类有危害的呢?这就需要借助计算机的能力来进行分析。
还有在药物研发阶段,未来人工智能必将发挥重要作用。确定药物靶点之后,如何才能找到低毒性、高效率的药物抑制剂?这在传统研究中很具挑战,但AI却可以辅助从头设计。比如,筛选药物先导分子,AI 是否能做得更好?几年前,药物研究领域就已经有了自己的 AI 团队,来研究包括免疫型、代谢型癌症在内的多种疾病。
此外,AI 对个体健康也有很多帮助,例如使用 AI 技术监测心率、体温、咳嗽等个人健康状况等。我想重点强调的是,人类与病毒的抗争会永远进行下去。在整个过程中,我们需要多学科共同的力量,需要医学、计算机科学、化学、生物学等多学科专家共同努力,需要 AI、大数据等新兴技术的帮助。
邓攀:很多流行病,比如艾滋病、埃博拉、肺结核、疟疾等,持续威胁着全球人类的健康安全。微软作为一个全球顶尖的科技公司,也非常想为传染病的预防和治疗做出一些贡献。您刚才提到临床上的检测、监测、药物研发,这些已经是我们在着手做的事情。我们还非常希望推进一些跨学科的基础科学研究,比如AI助力病毒学的基础研究,帮助人们了解您刚才提到的这些病毒学基础问题。对于跨学科合作,对于希望从事 AI+生命科学研究的人才,您有什么建议?
魏磊:跨学科合作是非常有意思和有意义的事。我本身的专业并不是病毒学,最初我的专业是结构生物学、生物化学方向,博士阶段是遗传学。可以看到,我本身就是一个跨学科的受益者。不同的学科背景、研究方法,能够更好地促进我们对新问题的理解,将自己的知识糅合进来,从而推进这个领域的进步。
跨学科已经是现在科学发展的一个主流,不同学科的科学家之间要加强对话,从自己的领域出发催生新领域,或者用跨界知识给自己的领域带来新的光芒。在跨学科交流中,会产生很多新的灵感以及新的思路。这就好像是医院里的无影灯,它无影是因为光从不同的角度照射进来,对跨学科融合来说,不同角度的交流越多,我们认知的阴影才能越来越少。整个过程,充分交流肯定是第一步。与不同思想的人交流,我们会不断吸收更多知识,形成更新的见解。
对跨学科合作,魏磊博士有什么感悟?
邓攀:对于很多在校学生来说,不管他们就读于什么专业,“发论文”的压力和“没论文”的焦虑总是会伴随着他们。您的博士研究经历似乎比较“非典型”,您发表过非常多高质量的文章,但这些文章都集中在您博士即将毕业和毕业后的那几年,可谓是“厚积薄发”。能否给年轻的科研学者们提供一些职业发展上的建议。
魏磊:回看整个硕士、博士、博士后生涯,我最重要的一个认知是每个人的“开窍”是需要时间的。在科学研究中,一个人成长“开窍”可能需要3-4年左右的时间,经历这个时间,你就会明确你的目标。还有就是要尊重事实,让科学说话,不能为了发论文而去强行让科学符合你的需求,要将自己作为一个科学实验的解读者,先打好基础,才能有更好的科学能力,这是一个水到渠成的事情。我认为决定一个人未来的最大因素就是基础能力,这是你最后能走多远的关键。
负面情绪每一个人都会有,关键是如何调整。首先要意识到有情绪很正常,感到悲伤、沮丧、压力大是正常的。其次,要有能够交流的对象、朋友,在交流的过程中你会意识到大家的困惑是相似的。还有就是,我们可以适当做一些运动来调节情绪,我就比较喜欢散步式走路,在熟悉的地方不断发现新的美好。当然,不同人的爱好也不一样,无论是看书、看剧还是其他,只要轻松的活动都可以帮助缓解压力。