对话 I 论道机器学习的未来

2020-09-17 | 作者:微软亚洲研究院

编者按:近期在微软研究院举办的机器学习前沿论坛中,微软剑桥研究院院长 Christopher Bishop 与微软全球资深副总裁 Peter Lee 进行了一场精彩的炉边对谈,分享了各自对机器学习研究和前沿问题的思考与展望。本文为大家节选、整理了此次对话。


Christopher Bishop(左)与 Peter Lee(右)线上对话

Christopher Bishop:很高兴能与 Peter Lee 交谈。首先祝贺你成为微软研究院的负责人。你可以谈一下为什么微软选择把科研和技术孵化放在同一个屋檐下?

Peter Lee: 谢谢 Chris。我认为在某种程度上,这个问题是非常核心的。在过去的几年里,我们的研究、由研究驱动的想法、甚至是研究人员自身,都已经越来越多地参与到了微软创造新技术、新工程、新业务线和新产品的过程中了。我认为这是对行业发展方式的直接回应。所以当你看到诸如硅在云计算中的应用、保密计算、或者大规模 NLP 预训练模型的应用强度时,你会意识到所有的这些事情从根本上都需要研究驱动,而且需要研究者的思维模式和世界观。所以和微软的科研在一起,可以让我们更能捕捉到新奇的想法,让微软的技术孵化有更多的可能性。

从某种角度来说,特别是从微软研究院来说,我认为这个方式是振奋人心的。我们有很多同事,比如微软研究院新体验与新技术部杰出工程师 Doug Burger 博士等,他们在创造非常重要的新的机遇;或者有些同事,他们一开始是研究人员,后来领导了工程团队,现在又回到了研究领域,这种研究领域和公司商业之间的相互影响,正变得越来越重要。所以我们试图创建一个组织来最大化其中的优势是合乎逻辑的。

当然还有另外一个因素,我希望这个机构可以帮助整合微软的所有研究,从而更好地建立微软研究院的影响力和领导力。

Christopher Bishop:我同意你的想法,我认为这是一个非常令人兴奋的发展。事实上,当你开始担任这个职位的时候,你还有另外一个不同寻常的开始,就是专注到公司对新冠疫情的应对上,思考科技如何帮助世界对抗这次疫情。能分享一些你的经历和项目吗?

Peter Lee:当然可以。我记得那是一个周四,包括 Satya 在内的几位公司高管与我探讨了,接下来要集中精力协调微软可以如何通过科技帮助应对新冠疫情。这很有难度,因为如何让你的想法被听到、被看到,如何招募以及调动资源,都不是容易的事。我们解决这个问题的方式之一,就是通过我们每年都会举办的骇客松(Hackathon)活动的一个平台,号召大家加入并提出自己的想法。如果你有一个想法,那么就可以把它写下来,让大家知道,并招募想要参与这个项目的人员。之后我们建立了一个虚拟团队,其中大部分的人来自微软研究院,由这些科研人员对所有项目进行筛选,整个活动过程非常棒。活动结束时,有1100名微软员工参与了此次活动,共成立了186个项目,有几十个项目被挑选了出来,其中一些产生了巨大的影响。

有一个项目是直接应对医院和诊所所面临的危机的。该项目构建了一个建立在 Bot Framework 上的 AI 聊天机器人技术 Microsoft Health Bot。要知道疫情期间,人们会涌向热点地区的急诊科咨询、就诊,或者打电话给医院的呼叫中心,这使得医护人员不堪重负。Microsoft Health Bot 可以智能地提供建议,进行实时的健康咨询。我们与疾病控制中心(CDC)合作,在 CDC 官方网站上面向全美用户推出了这一机器人服务。目前为止,全球已有2,100多家医院和诊所部署了这种医疗机器人服务。迄今为止,已有3,900万人使用机器人对自己的症状进行评估。使用了该医疗机器人服务的多数医疗机构表示,其急诊部、呼叫中心和远程医疗服务有关新冠肺炎的就诊或问询数量降低了至少30%。

另一个项目则与诊断有关。我们与生物技术公司 Adaptive Biotechnologies 合作,利用机器学习技术参与了 T 细胞对新型冠状病毒的深入分析,并将所有数据公开发布在 Immune Code 数据库中,以期促进基于 T 细胞的新诊断方法、新药物疗法和新疫苗的研发工作。除此之外,我们还有许多与公共健康相关的项目,比如,分析下一个热点地区在哪里,各个国家的弱势群体在哪里,重症监护病房、呼吸机、个人防护装备的供应配备的如何等等。所以我认为我们都应该为有很多这样的项目而感到自豪。微软的反应确实产生了影响,并且还在不断地持续下去。在我们整个骇客松活动中,有超过三分之一的参与者和超过三分之一的项目来自微软的研究部门。我认为这很神奇,在应对新冠疫情方面,微软的科研确实在一个前沿和中心地带。

Christopher Bishop:你能和我们分享一下你对微软在医疗健康领域的战略吗?或者说为什么微软要涉足医疗领域?

Peter Lee:微软在医疗健康领域不仅涉及到科研,还有商业的业务,Azure 云计算平台,以及相关的实践和设备。

我对这个问题的思考可以分为三个阶段:相关性,价值和转变。它们是分阶段出现的。当 Satya 希望我们接手医疗健康方面的工作时,第一项就是相关性的问题。我所说的相关性是指医疗健康领域的利益相关者是如何理解微软可以提供的东西的,我们要如何与医疗健康行业、医疗服务提供商、医院、诊所、医疗系统、保险公司、供应商、生物制药行业、医疗技术公司、创业公司等等联系起来。相关性就是指我们必须弄清楚如何获得他们,因为这样可以让我们更加深入的进入到合作与伙伴关系,开始学习更多。

在微软内部也存在相关性,因为医疗健康是每个人都会直接接触到的领域之一,每个人都有自己的观点。这种经历往往受到人们与医院医生和护士的个人接触的影响,但很大程度上我们会忽略背后更大的医疗健康体系。所以我们必须努力赢得内部的信誉和相关性。要做到这一点,就意味着我们也要在微软内部找到合适的合作伙伴。

第二个阶段是价值,这主要和数据、人工智能相关。现在,围绕着所谓的互操作性问题,医疗数据正在发生巨大的变化,人们试图让医疗数据以标准化的格式去到所需要的地方,并使其更容易受到机器学习和数据分析的影响。因此,我们做了大量的工作来发展 Azure, Dynamics 和 Microsoft 365,让它们使用健康数据的语言。所以你会听到 FHIR 等,这些是健康数据的新标准。人工智能也是非常基础和重要的。大量的健康数据是非结构化的文本,所以 NLP 和机器阅读就变得非常重要,计算机视觉也可以帮助真正理解医学影像、理解分子、理解人类基因组、了解免疫系统和免疫体等。所有这些问题从根本上来说,都是机器学习和人工智能问题。这是我们一直关注的领域。当然,为每一个东西建立技术堆栈然后再把它们变成产品是一个很大的挑战。

举一个例子,全球医疗健康市场估计大约是7.5万亿美元,这是什么意思呢?比如,与我们合作密切的公司 Optum 是处理医疗索赔数据的,他们会将这些数据从医疗健康提供者传递给支付者,然后将支付者的汇款在返回给提供者。所以数据流往返在美国的医疗系统中是一个非常重要的功能。在这种双向的过程中,大量的数据分析将有助于相关业务的发展。Optum 是美国医疗系统中第二大提供这种服务的公司,所以这样的利基市场支撑了 Optum,而它拥有和微软一样的员工数量和年收入。因此,如果你考虑一下目前正在发生的医疗健康向云计算进行巨大转变的可能性,那么我们云计算中的医疗健康业务规模未来超过微软目前所有业务的总和不是没有理由的。当然,我们合作中最有趣的一个是和 Novartis 公司的合作,我们都很为这件事激动。

Christopher Bishop:是的,这是一个令人兴奋的机会。我想,对于微软研究院来说,这也是一种非常不同的操作模式。我有幸在微软研究院工作已经超过23年了,从历史上看,我们会做很多基础研究,有时我们会把技术转化为产品,产品会被卖出去,客户会使用它们,然后对现实世界产生影响。这是一个很长的过程,但通过这种方式我们与现实世界连接到了一起。

在与 Novartis 公司的合作中,我们直接与客户的接触是令人兴奋的,这也和在新的数据驱动的世界里的机器学习技术有关,因为我们不再考虑放之四海而皆准的技术——那种放在磁盘里,压缩、打包再发送到世界各地的技术,现在更多的是定制,针对特定的领域、特定的合作者、特定的应用程序来进行制作。因此,我们与 Novartis 紧密合作,于去年签署了合作协议,并在今年1月份正式启动。在这个合作中, Novartis 的科学家和微软研究院的科学家之间是一个对等的伙伴关系,Novartis 把制药方面的专业知识和积累的数据结合起来,我们则发挥在机器学习方面的专长,利用微软云的存储能力和非常强大的计算能力。我们会共同应对一些非常艰巨的挑战,而这些挑战是任何一个组织都无法独自完成的。

我们所做的一件事就是思考如何将微软研究院的技术优势,应用到 Novartis 面临的一些挑战中。例如,我们几年前建立了一个关注医学成像的项目,特别着重在三维医学图像的分割,比如 MRI(磁共振成像)。它有很多应用,其中一个很重要的应用就是所谓的放射治疗计划。如果有人有一个恶性肿瘤要接受放射治疗,那么就会有一些软件优化光束的三维形状,以便于最大限度地损害肿瘤并减少对周围组织的伤害,特别是对重要器官的损害。而为了让这个软件工作,它需要一个肿瘤的三维图像,这就是 MRI 的用武之地。在那时候,放射肿瘤学家会使用 3D 扫描,然后用电脑屏幕上的手写笔,一片片地扫描这片区域,划出边界。对于一个简单的案子来说,这可能就需要20多分钟。如果转移了,有多个肿瘤,那么则可能需要几个小时。这是艰苦乏味的,而且必须要准确。

这就是我们的项目能够真正帮助放射肿瘤学家的工作流程的地方。我们的技术可以通过自动化,在几秒钟的时间内,产生分割的候选区域,然后专家可以去修改他们想要改变的任何小细节,这大大加快了这一工作进程。目前,这项技术已经被广泛应用于研究环境中,在剑桥当地的 Addenbrooke 医院(欧洲最大的教学和研究医院之一)里,这项技术在临床实践中正在进行有效地探索。

Peter Lee:因为这个医学成像应用不可能仅仅采用现有的机器学习或计算机视觉系统,甚至是现成的算法。为了使该应用程序良好地工作,我们必须专门开发一些新的东西。而且,这确实需要一个世界级的研究机构来做这样的事情。

Christopher Bishop:是的。我认为正是深度研究和现实应用的交集让很多研究人员兴奋不已。我们有机会直接影响现实世界,在医疗健康领域拯救生命,当然我们首先要解决一些非常困难的研究问题才能实现。所以,至少对我来说,深度研究和现实世界影响的结合是非常令人兴奋的。

我们与 Novartis 合作的另一个很好的例子是关于他们的核心业务的,也就是创造新药、新疗法,这实际上意味着发现新的分子。有趣的是,数据的性质与许多其他应用程序相当不同。比如成像,图像往往是固定的大小,或者你可以重新采样到固定的大小。神经网络总是以相同的格式,相同的维度来获取数据。但是分子很有趣,因为很明显它们在大小,形状和结构上都是不同的,所以你不能用一个简单的分子展示,然后把这个当作神经网络的输入信息,因为它的结构是可变的。在微软研究院,一些图形神经网络技术已经处于领先地位,这些技术解决了如何利用机器学习,并将其应用到数据上的问题,这些数据具有可变的大小和结构,比如分子。这是一个很好的例子,它把微软研究院的深入研究,与 Novartis 公司在理解结构和分子之间的关系以及它们的生物活性上的专业知识,结合在了一起。在这个项目中,很难想象任何一个小组能够单独完成这么好的工作,但是我们合作的时候,就可以做一些非常独特和非常有趣的事情。

Peter Lee:我认为一个有趣的科学挑战是——你不能指望解决一个问题,仅仅是基于数据或仅仅通过我们对化学过程的理解,这真的需要两者的结合。

Christopher Bishop:确实。我认为关于医疗健康最有趣的事情之一,是对现实世界产生影响,而且有了造福社会的机会。我也认为,医疗健康确实把焦点放在了很多深层次的挑战,机器学习的研究挑战上。

我们已经谈了很多关于新冠疫情的话题了,当然,这场全球疫情的另一个重大影响是远程工作和在家办公的惊人转变,以及远程协作技术的使用,比如微软 Teams 的使用。

Johannes Gehrke 是微软的技术院士,他最近加入了我们,成为了我们在雷德蒙的研究负责人。在此之前,Johannes 负责微软 Office 的大型工程工作,特别是人工智能和微软 Teams 的可扩展性方面。我认为 Johannes 是一个理想的人选,来和我们分享他对生产力变化的看法以及支持这种变化的技术,更具体地说是,机器学习如何进一步帮助我们的现实生活。

Christopher Bishop(右)与 Johannes Gehrke(左)线上交流

Christopher Bishop:我们很高兴你加入了微软研究院。你认为机器学习在生产力、工具和技术方面能发挥什么作用呢?

Johannes Gehrke:我想首先看看音频和视频堆栈,了解哪里存在旧的控制理论,我们是否可以用机器学习来代替。我们即将推出的噪声抑制,基本上就是用机器学习代替了一个旧的堆栈选项噪声抑制器。进步真的很惊人。这也是机器学习研究发挥重要作用的一个很好的例子,但是发表的论文和实际应用之间还是有很大差距的,所以我们必须做更多的工作来让模型表现得更出色,同时也要适应我们实际看到的各种各样的噪音。所以在我看来,基本上整个控制平面,甚至音频/视频堆栈的数据平面都可以用机器学习代替。

其次,可能会有非常有趣的面向用户的特性。试想,我们有一个功能,我可以举起我的手,但当结束讲话时,人们忘记放下来了。所以我认为有很多面向用户的功能,我们可以根据微妙的信号减轻互动的程度,在现实世界中交流的时候,我们通常能看到这种信号,但是在虚拟的环境中,我们是做不到的。

Christopher Bishop:我觉得这很有趣,看看机器学习是如何变得无处不在的。就像你说的,在这些更传统的问题上现在已经被机器学习所解决了,而且它们在很多时候都更加有效,因为它们被调整到了特定的数据或特定的环境中使用,而不是通用的。我认为这是当今机器学习的一大前沿。

Peter Lee:Chris,让我们回到你身上,在过去的30多年里,你是机器学习领域的先驱之一。在你从事这一行的30多年里,你认为这个领域是如何变化和发展的?

Christopher Bishop:我认为这30多年来最大的转变是这个领域的重点。老实说,在这30年的前20年里,机器学习并不是真的那么很有效,虽然有很多令人兴奋的事情,每个人都知道机器学习是前途无限的,这很吸引人。但现实是,那时许多机器学习系统的性能还不足以在现实世界中使用。可能有一些间隙中的应用程序,但大多数都没有真正实现它们的承诺,也不令人兴奋。当然,在过去的十年里,这种情况发生了改变,特别是随着深度神经网络和深度学习的发展,以及大规模数据集和大量计算的扩展。

我们所处的世界中,机器学习的应用有上千种。今天大多数人都已经使用了几个,甚至可能都不知道。机器学习正变得无处不在,这意味着,尽管我们仍持续强烈关注机器学习在准确性方面的表现,但我们总是想让它更准确。因为当我们在现实世界中使用机器学习时,它带来了一系列的新挑战。我把这看做是围绕着机器学习工作核心问题的隐蔽性问题。我认为由于数据集的偏见,预测结果中就会有隐藏的偏见,比如公平问题,可解释性问题,因果关系的问题,如果我们真的想对结果的偏见进行干预的话,那么还有很多工作要做。20年前是没有人会攻击一篇论文的,但是现在一旦你把东西放到网上,有数亿人在使用互联网,那么就会有敌对的人,出于各种不同的原因会有人以各种各样的方式攻击它。我们不得不担心这些问题。

在某种意义上,我不认为我们会得到所有的答案,但通过类似此次机器学习前沿论坛这类交流活动,我们肯定会触及许多关键问题,并听到一些非常有趣的前沿观点。关于我们现在看到的趋势,我认为是非常令人兴奋的。其中一个,我认为是相当明显的,就是缩放。今天机器学习工作做得这么好的一个原因是因为我们已经学会了缩放,缩放数据集的大小,缩放学习算法的大小,缩放参数数量方面的模型。当然,为了能够在大数据集上训练大模型,我们必须扩大计算机的规模,而这一趋势看来还将继续下去。例如,当我们思考自然语言模型的发展时,我们并没有意识到我们已经达到了某种渐近线。所有的迹象都表明,更大的数据集、更大的模型,更多的计算,将让我们看到性能上越来越多的改进,越来越多的新属性。这真的很了不起。对该领域的一个真正的挑战是如何保持这个趋势,我们如何继续看到这些机器学习性能的大规模突破。我认为这是一个非常重要的趋势,而且将继续下去。

另一个与机器学习相关的是数据。数据是机器学习的核心。当我们试图让机器学习扩展到越来越多的领域,比如我们讨论了很多在医疗健康方面的例子,以及其他领域的,收集数据、收集可用的数据,会给社会带来巨大的潜在好处。但是很多数据非常敏感,非常个人化,比如医疗数据,就是一个很好的例子。所以从隐私和安全的角度来看数据,我们也需要多多注意这方面的发展。我认为这是一个令人兴奋和重要的前沿领域。在为云机器学习提供保密性方面,微软在很多方面都处于领先地位。我们是第一个部署数据加密技术的云提供商,不仅在数据通过互联网传输和存储的时候,而且在数据进入处理器的时候都是加密的。所以解密只发生在处理器内部,这意味着即使数据中心里有物理访问芯片的人,他也只能看到加密的数据进出芯片,无法获得数据。这是非常高的安全性和私密性。

我们知道机器学习不仅受益于更多的数据,而且受益于不同的数据。有时,你可以将多个数据集放在一起,你得到的不仅仅是部分之和。但问题在于,不同的组织,不同的人,如何把他们的数据放在一起,汇集这些数据来进行机器学习,而不是简单地让其他人或其他组织直接访问这些数据。机密的机器学习提供了这种可能性,数据可以整合,但只能在芯片上解密。它在芯片中被用来训练一个机器学习模型,然后这个机器学习模型或者它的预测结果被提供给数据提供者。由于它是在汇集的数据上训练的,所以它更有效,更有能力,但在任何阶段,任何实体都不能访问其他实体的数据。事实上,微软在任何阶段也都无法访问这些数据。所以我认为隐私与机器学习的交叉将是未来几年一个非常重要的领域。

Peter Lee:这很有趣。正如你之前所说,确实改变了很多。这也让我们回到了我们谈话的开始——为什么要把科研和技术孵化结合起来。

Christopher Bishop:是的,我认为把科研和技术孵化结合在一起是非常自然的。由于机器学习的普遍性,这意味着机器学习不仅会出现在许多不同的地方,而且它正在以我们从未见过的新方式影响着社会。

Q&A

Q:由于医疗健康数据是敏感且隐私的,因此在维护隐私与解释方面如何实现两者间的平衡?是否有关于安全的多方计算研究来维护数据隐私?

Christopher Bishop:我认为在让数据增值和保护数据隐私之间存在着一种博弈。对于这个问题并没有一个放之四海而皆准的答案,但我们在微软研究院做的一些研究确实是旨在找到这个问题的核心并解决这个问题。

当数据处于静止状态或从一个地方传输到另一个地方时,保护数据是非常容易的,因为它是加密的,但要从数据中获得价值,就需要对它进行解密。所以这种安全计算的思想是只在芯片上解密数据,而真正的目标则是:即使有人在数据中心里,即使他们有所有的密码,即使他们有芯片,可以测量输入输出的信号,但他们仍然无法看到数据,他们只会看到随机噪声和加密的数据。这就是我们的目标。

当你想把来自不同来源、不同人群、不同提供者的数据进行聚合并建立相关模型时,机器学习会特别强大,因为这些模型通常比仅根据单一数据源训练的模型更好,但仍有需要研究的问题。微软研究院开发的技术现在已经部署在了 Azure 上。微软是世界上第一家将这项技术应用于云计算的公司。针对那些仍悬而未决的问题,我们在这个领域还有很多研究要做。

还有一个同态加密的问题,也很有趣,我把它看作是一种互补的技术。它能提供非常非常高的安全性和私密性,但它可能缺乏机密计算所提供的通用性和伸缩性。所以我认为现在,机密计算看起来是一个非常实用的技术,而且已经应用在真实的场景中,但在这个领域还有很多工作要做。

Peter Lee:关于研究,我还想到了另一个方面,因为即使我们认为一个普遍的同态加密部署在现在的产品上是没有必要的,但它也会极大地影响我们的思考。它让我们对整个问题以及如何处理这个问题有了不同的思考,所以它给了我们更多的空间去创造。

Q:Peter,能分享一下微软在人工智能公平性上做的努力吗?

Peter Lee:当然,有很多方面。之前聊天的时候,在我的阅读清单上我贴出了一篇论文,是对偏见的分析,以及 NLP 训练的模型。当然,退一步说,我们所有的技术人员都在寻找工具。在工具方面,我们正在非常密集的研究和开发像 SHAP 和 LIME 这样的框架,这让我们有能力创建模型,分析不同种类的偏见。如果你想问一个问题,假设这个模型对年龄有偏见,亦或对老年人、种族或者性别有歧视,SHAP、LIME 以及类似类型的框架让你能够向模型询问这些问题,进行分析,并了解这些问题是不是真的。这实际上已经开始产生影响了。这是一方面,只是一般的政策。但随后,我们应该如何以负责任的方式来行动、思考、进行研究和部署技术,在某种程度上,这确实让我们看到了随着技术发展,技术用最道德的方式产生最积极的社会影响的可能性。所以我们尝试专注于这些具体的工具上,研究人员和开发者可以使用这些工具来思考这些技术对我们政策的影响。