对话微软CTO Kevin Scott:人工智能的未来之路
2022-12-07 | 作者:微软亚洲研究院
如今,从为软件开发人员生成代码到为图形设计师绘制草图,由大型语言模型驱动的人工智能系统正在改变人们的工作和创作方式。微软执行副总裁兼首席技术官 Kevin Scott 认为,未来,无论是帮助应对气候变化及儿童教育等全球挑战,还是彻底变革医疗健康、法律、材料科学甚至科幻小说等领域,这些人工智能系统的复杂度和规模都将继续增长。
近期,Kevin Scott 就人工智能对知识工作者的影响以及人工智能下一步发展等话题分享了他的看法,核心观点包括:
- 人工智能大模型和生成式人工智能的发展将继续提高人们的生产力、创造力和满意度。
- 人工智能将助力实现科学突破,并帮助世界解决一些重大挑战。
- 随着人工智能模型的平台化,以及微软继续以负责任的方式为客户推动人工智能的进步,云、基础设施投资和以极其负责任的方式发展人工智能变得至关重要。
下面就让我们一起来看一看 Kevin Scott 对人工智能未来之路的展望吧!
问:在你看来,今年人工智能领域最重要的进步有哪些?
Kevin Scott:当我们进入2022年时,我想人工智能领域的几乎每个人都期待在接下来的12个月左右的时间里能发生引人瞩目的大事。现在,这一年马上就要结束了,即使当初的期望颇高,回顾我们在人工智能领域各个方面取得的创新规模依旧令人兴奋。科研人员和其他同行们为推进前沿技术所取得的成果,仅在几年前都几乎是无法想象的。而几乎所有这些都是人工智能大模型飞速发展的结果。
今年有三项成果让我印象最为深刻。首先是 GitHub Copilot 的发布,这是一个基于大型语言模型的系统,它能将自然语言提示词转化为代码,给开发人员的工作效率带来了非常积极的影响。未来的发展将在很大程度上取决于我们编写软件的能力,因此 GitHub Copilot 史无前例地让更广泛的人群可以拥有编码技能,这一点非常了不起。
第二个是 DALL∙E 2 等生成式图像模型广受欢迎且变得更易使用。素描、绘画以及掌握所有的平面设计、插图和艺术工具都需要相当高超的技能。像 DALL∙E 2 这样的人工智能系统尽管不能把普通人变成专业的艺术家,但它给了很多人视觉表达的能力,一种他们从未想过自己会拥有的全新超能力。
我们还看到,人工智能模型变得越来越强大,并为其所要解决的问题带来了更多实质性的收益。纵观今年整个科技行业,我认为蛋白质折叠方面的研究非常出色,包括微软与华盛顿大学蛋白质设计研究所大卫·贝克实验室利用 RoseTTAFold 所做的项目,以及利用一系列先进的人工智能技术帮助其开展变革性的工作。任何能对科学和医学有增效作用的事情对世界都是有益的,因为我们面临的最大、最棘手的问题就在这些领域中。
2022年是一个令人印象深刻的科技大年。我认为明年会更好。
问:你认为接下来几年,人工智能技术在哪些方面会产生最大的影响?
Kevin Scott:我可以很有把握地说,2023年将会是人工智能领域有史以来最激动人心的一年。之前我也曾真心实意地相信2022年是有史以来最令人激动的一年。创新的步伐一直在快速向前。
前面我已经谈到了 GitHub Copilot,但这也只是人工智能大模型潜在能力的冰山一角,如果把同样的理念外推到各种不同的场景中,那么我们就可以帮助到编程以外的其他脑力劳动。整个知识经济将会见证人工智能如何帮助人们解决工作中的重复性问题,并让工作更愉快、更有成就感。这将适用于几乎所有的工作,比如设计新分子来创造药物、根据 3D 模型设计制造“配方”,或者是单纯的写作和编辑。
例如,我一直在使用一个我基于 GPT-3 为自己构建的实验系统,来帮助我完成一件从十几岁起就想做的事情——写一本科幻小说。我的笔记本上写满了我为设想中的书编写的概要,描述了书中的大致内容和这些故事将发生在什么样的宇宙中。如果我用传统方式写书,一天能写2000个字,我就会觉得自己很不错了。但有了这个工具,我就可以打破僵局,我经常可以一天写出6000个字,这对我来说已经很多了。与之前相比,这是一个更加充满活力的过程。
这就是“一切皆有副驾驶(copilot for everything)”的梦想——当你做任何类型的认知工作时,都会有一个“副驾驶”坐在你身边,它不仅可以帮助你完成更多的工作,而且还能以新颖有趣的方式增强你的创造力。
问:这种生产力的提高显然也会提升满意度。为什么这些工具能给工作带来更多乐趣?
Kevin Scott:我们所有人都需要使用工具来完成工作。其中一些人非常乐意获得、掌握这些工具,并且弄清如何以超级有效的方式用它们来做事。在很多情况下,人们已经有了全新、有趣且从根本上比以前更有效的工具。我们做过一项研究,发现使用无代码或低代码工具对用户的工作满意度、总体工作量和员工士气产生了80%以上的积极影响,特别是对那些处于相对早期阶段的工具,这是一个巨大的好处。
对于一些员工来说,这实际上是在强化工作的核心流程,它会让你加速。就像穿着一双更好的跑鞋去跑步或参加马拉松。我们发现这正是开发人员使用 Copilot 时的体验,据他们反馈,Copilot 可以帮助他们保持心流状态,并且在面对曾经看起来枯燥重复的任务时依然头脑清醒。当人工智能工具可以帮助人们消除工作中的苦差事,也就是那些重复的或令人讨厌的或妨碍他们做真正喜欢的事情的工作,毫无疑问这会提高满意度。
就我个人而言,这些工具让我可以比以前更长久地处于心流状态。创意流的天敌是分心和思维停滞。例如,当我不太清楚该如何解决下一个问题,或者下一问题是“我得去查一下这个问题,我不得不从正在做的工作中切换出来,去解决一个从属性问题。”这些工具越来越多地为我解决了这些从属性问题,我则可以一直保持在心流状态中。
问:除了 GitHub Copilot 和 DALL∙E 2 之外,人工智能还以其他方式出现在了微软的产品和服务中。那么下一代人工智能如何改进 Teams 和 Word 等现有产品?
Kevin Scott:这是一个人工智能不为人知的故事。迄今为止,人工智能带来的大部分益处都分散在1000种不同的地方,你甚至可能都没有意识到你获得的产品体验中有多少来自机器学习系统。例如,在 Teams 视频通话功能的系统中,所有这些参数都是通过机器学习算法学习的;音频系统有抖动缓冲器使沟通顺畅;屏幕上显示的模糊的背景效果也是机器学习算法在起作用。有十几个机器学习系统协同工作,才让我们的交流体验变得更加愉快。而整个微软公司的产品和服务都是如此。
我们已经将机器学习的应用从几个地方扩展到遍布不同产品的上千个场景,从 Outlook 电子邮件客户端的运作、Word 中的文本预测、必应(Bing)搜索的体验,到用户在 Xbox Cloud Gaming 和 LinkedIn 中看到的信息流是什么样的,无处不在的人工智能正在让这些产品变得更好。
过去两年发生了很大变化的一件事是,曾经我们需要为所有产品针对每项任务专门定制一个模型,现在一个模型可以用在很多地方,因为它们拥有了很强的泛化性。能够投资于这些随着规模扩展而变得更强大的模型,然后让所有构建在模型之上的东西同步受益于你所做的改进,这是十分了不起的。
问:微软通过 AI4Science 和 AI for Good 等倡议持续推进人工智能的研发。人工智能领域最让你兴奋的是什么?
Kevin Scott:我们的社会现在面临的最具挑战性的问题都在科学领域。如何治疗那些难以治愈的复杂疾病?如何为下一场大流行病做好准备?如何为逐渐老龄化的人口提供负担得起的高质量医疗?如何帮助更多的孩子接受他们未来所需的技能教育?如何通过开发技术来抵消碳排放产生的一些负面影响?我们正在探索如何将人工智能中一些令人兴奋的发展成果用于解决这些问题。
这些基础科学应用中的模型具有与大型语言模型相同的规模扩展特性。当你建立一个模型,让它进入某种自监督模式,它就可以从模拟中学习,或者通过自身观察特定领域的能力来学习,然后得到的模型可以让你显著改变所应用领域的表现,无论你是在做计算流体力学模拟,还是药物设计的分子动力学研究。
这其中蕴含着巨大的机遇。这意味着我们能找到更好的药物,意味着也许我们可以找到解决碳排放问题的新催化剂,意味着全面加快科学家和其他有着远大想法的人们努力解决全社会最严峻挑战的速度。
问:计算技术和硬件的突破如何促进人工智能的进步?
Kevin Scott:我们在人工智能领域看到的几乎所有最新进展背后的根源,是我们验证了模型规模的重要性。事实证明,基于更多数据和更多计算能力训练出来的模型具有更丰富和更通用的能力。如果想继续推动这一进步——需要明确的是,目前我们还没有看到扩大规模所带来的好处的边界,我们要做的是尽可能优化和扩展计算能力。
两年前,微软推出了第一台 Azure AI 超级计算机,在今年的 Build 开发者大会上,我曾说我们现在拥有多个超级计算系统,而且我们非常确信这些系统是当今全球规模最大、功能最强的 AI 超级计算机。我们和 OpenAI 使用这些基础设施来训练我们几乎所有最先进的大模型,其中包括微软的图灵(Turing)、Z-code 和 Florence 模型,以及 OpenAI 的 GPT、DALL∙E 和 Codex 模型。最近,我们还宣布与英伟达(NVIDIA)的合作,打造一台结合了 Azure 基础设施和英伟达 GPU 的超级计算机。
这其中的一些进展就是通过使用越来越大的 GPU 集群实现大规模强力计算而取得的。然而,更大的突破或许在于软件层,它优化了模型和数据在这些巨型系统中的分布方式,既可以训练模型,又可以让这些模型为客户提供服务。如果我们希望将这些大模型作为人们可以用来创作的平台,那么它们就不能只被世界上极少数拥有足够资源来建造巨型超级计算机的科技公司所使用。
因此,微软对一些软件进行了大量的投入,例如用 DeepSpeed 来提高训练效率,用 ONNX Runtime 来加速推理。这些软件针对成本和延迟进行了优化,可以帮助我们让这些人工智能大模型更容易为人们所用,也更有价值。我为我们的这些技术团队感到自豪,因为微软在这一领域确实处于行业领先地位,而且我们对所有这些成果都进行了开源,以便其他人也能够不断提升。
问:与这些进步相伴的是人们对“人工智能将影响就业”的担忧。你如何看待人工智能和就业的问题?
Kevin Scott:我们生活在一个异常复杂和宏观经济历史性变革的时代,展望未来5到10年,我们需要全新的生产力形式,让所有人都能够继续享受进步。我们希望将这些人工智能工具打造成平台,人们可以使用这些平台来构建业务和解决问题。我们相信,这些平台可以让更多的人使用人工智能。而有了这些平台,我们就能解决更多的问题,就会有背景更加多元的人们参与到技术的创造中来。
此前,人们需要大量的专业知识才能开始人工智能的实例化。但现在你可以调用微软 Azure 认知服务和微软 Azure OpenAI 服务,并在这些服务的基础上构建复杂的产品,而你不必是 AI 方面的专家,也不需要从零开始训练自己的大模型。
随着所有这些巨型人工智能系统的不断增长和演进,我想我们可以预期,这些进步将从根本上改变工作的性质,每个领域被影响的程度会有所不同,在某些情况下甚至还会创造出大量以前没有的新工作岗位。回顾过去可以看到,历史上重大的技术范式转变都伴随着相同的情况:电话、汽车、互联网。我认为就像这些例子一样,我们需要用新的方式思考工作和技能,并专注于确保我们有足够的人才且接受过培训,能够承担起真正关键的工作。
问:与人工智能技术相关的另一个担忧是技术被滥用和误用的可能性。微软正在采取哪些具体措施来确保其人工智能工具和服务是以负责任的方式开发和使用的?
Kevin Scott:我们一直非常严肃地对待这个问题。微软的人工智能系统必须通过“负责任的人工智能(responsible AI)”流程,而且我们还在继续改进这个流程。我们会与一个由多学科专家组成的团队一起仔细审查正在进行的工作,确保我们充分了解可能发生的所有潜在危害,并尽可能降低它们的负面影响。例如,改进用于训练模型的数据集、部署限制有害内容生成的过滤器、集成拦截敏感主题查询的技术帮助防止不良行为者的滥用,或者应用可以返回更有用和更多样化响应和结果的技术。我们为人工智能系统制定的计划还包括在发布后尽快发现并减轻任何我们没有预料到的危害。
另一个非常重要的保护措施是有意识的迭代部署。我们所做的大部分工作都是针对具有广泛能力的模型。我们将这些模型托管在我们的云中,并通过 API 或我们的产品提供给公众。任何开发者都可以访问 API,但他们必须遵守服务条款才能使用,如果他们违反了服务条款,那么他们的访问权限将被取消。对于其他产品,我们可能会先向一些有明确用例设想的客户提供有限的预览版。与这些早期客户的合作将帮助我们确保负责任的人工智能保障措施能够在实践中发挥作用,以便我们能够在更大的范围内推广应用。我们坚信安全和责任是重要的,希望我们能为整个行业提供一些激励。为此,微软将通过我们的“负责任的人工智能标准与原则(Responsible AI Standard and Principles)”,与业界共享在开发某些解决方案时应用的全部资源和专业知识。
*正文中所有图片以及封面图左右两侧图片均利用DALL∙E 2生成。