韩东起：从理论物理到神经科学和人工智能，迈向学科交叉的新方向

2024-01-17 | 作者：微软亚洲研究院

编者按：从对物理现象的探索到对生物本质的研究，从托卡马克可控核聚变到认知神经机器人，微软亚洲研究院研究员韩东起为什么会做出如此大跨度的科研转向？从冲绳科学技术大学院大学（OIST）到微软亚洲研究院，从实习生到研究员，是什么原因推动他坚持长期主义研究？从人工智能驱动的神经科学研究，到脑启发的神经网络和具身智能机器人，他所从事的研究对全球社会又有着怎样的意义和价值？

今天，让我们通过科学匠人韩东起的故事一起来感受跨学科研究的魅力。

做基础研究，还是做应用研究？或许是许多科研人员都曾面临的选择。然而，对即将毕业的韩东起来说，他却“贪心”地希望自己以后能够兼顾基础研究和应用研究。

通过多方面了解，韩东起选择了微软亚洲研究院作为实现自己愿望的初步尝试，并在博士毕业前成为了微软亚洲研究院（上海）的一名实习生。半年的实习，让韩东起亲身感受到了研究院不仅致力于各种基础研究创新，而且还积极推动与产业界的合作，并为创新成果的应用创造一切可能的机会。这为他后来正式加入研究院埋下了一颗种子。

“微软亚洲研究院为研究人员搭建了一个能够结合基础研究和工业应用实践的平台。在这里，我既可以和世界一流的研究人员合作，探究智能的原理和方法，也可以将人工智能技术应用于医疗健康等领域。这也是我博士毕业后选择加入微软亚洲研究院的主要原因之一。这里可以说是我科研职业生涯的最佳起点。”韩东起说。

韩东起

从人工智能与脑科学交叉研究中，探索智能的本质

近年来，人工智能等计算机技术与其他学科的交叉融合日益紧密，微软亚洲研究院也一直积极布局相关研究，并不断加大投入力度。而上海这座海纳百川的城市，拥有众多知名学府和顶尖医疗机构，为人工智能在医疗健康领域的跨界探索提供了良好的环境。因此，人工智能与脑科学等医疗健康领域的交叉研究也成为了微软亚洲研究院（上海）的重要研究方向之一。

韩东起博士毕业于日本冲绳科学技术大学院大学（OIST），主要从事认知神经机器人，即机器人与脑神经科学方面的研究。作为神经科学家，韩东起的加入为微软亚洲研究院的人工智能与脑科学交叉研究团队带来了全新的专业力量。

韩东起（第二排左二）与团队同事合影

韩东起当前的研究主要集中在两个方向：人工智能与脑科学，以及人工智能在医疗健康领域的应用。在他看来，人工智能与神经科学的交叉研究不仅有着重要的理论意义，也有着广泛的应用价值。“无论是脑机接口，还是人机交互，都需要我们对人类的认知和感受机制有更深入的了解，这样才能设计出更自然、高效的人机交互系统。”韩东起表示。而在医疗健康领域，目前全球有约10亿人受神经系统疾病的影响。人工智能与大脑的研究，可以为医生和患者提供更多信息，从而更好地理解、预防和治疗这些神经性疾病。

“人工智能与脑科学之间有着千丝万缕的联系，它们都是在探索智能的本质和运行机制，两者有许多共同的问题和挑战，同时也可以相互借鉴、启发。”

事实上，人工智能的很多技术都受到了人脑神经网络的启发，比如多层感知器、长短时记忆网络等。这意味着我们可以通过研究人类或动物的认知功能，如学习、记忆、决策，来增强人工智能的能力。当前人工智能面临的一个严峻挑战是“灾难性遗忘”现象，即模型在学习新数据时会忘记之前学到的信息，但人类大脑却不会出现这样的问题。韩东起和同事们希望通过研究人脑来帮助人工智能克服这类难题。

另一方面，人工智能强大的数据处理和建模能力，可以推动神经科学的研究和应用。人脑大约有1011个神经元和1015个神经连接，要想有效地处理如此庞大的数据量，可能就需要用人工智能来建模人脑的工作原理和计算方法，验证神经科学理论的有效性。

目前，韩东起和同事们已经在相关研究上取得了一些成果。在一项研究中，他们主要关注两种不同的人类行为：习惯性行为（habitual behavior）和目标导向性行为（goal-directed behavior）[1]。以人类行走为例，习惯性行为是无需刻意思考的自动化行为，比如下班回家的路线选择；而目标导向性行为则是需要考虑目的和结果的有意识行为，比如领结婚证时要如何到达民政局。这两种行为模式可以解释很多生物行为特征，然而人们目前仍不清楚人脑是如何在这两种行为中做出选择，以及两种行为是如何相互影响的。

习惯性和目标导向性行为的计算建模

韩东起说：“我们团队用深度学习和机器学习理论进行建模，来探究两种行为的特性和神经机制，为认知科学和心理学研究提供了支持。同时，通过对这两种行为的研究，我们也能够从中汲取灵感，进而设计新的人工智能算法。”

韩东起和同事们的另一项研究是基于对大脑神经回路结构的模拟，提出了一种新型神经网络 CircuitNet[2]。人脑神经元连接具有局部密集和全局稀疏的特点，即相邻的神经元在同一个神经核团内紧密连接，但在不同脑区之间稀疏连接，微软亚洲研究院的研究员们希望探究这种连接模式的原理和优势。韩东起从实习期间就参与到了这个研究项目中，最终在全组同事的共同努力下 CircuitNet 破壳而出，相关论文也成功入选了 ICML 2023。

CircuitNet 的模型结构

作为一种更加节能、高效的神经网络架构，CircuitNet 能够以更少的参数取得更好的性能。据估算，人脑的平均功耗仅不到20瓦，而人工智能大模型如 GPT-4 的功耗却高达数百上千瓦。未来，韩东起和同事们将在 CircuitNet 的基础上，继续探索人脑节能的奥秘。

此外，韩东起还致力于深度强化学习和具身智能（Embodied AI）的研究，希望让人工智能可以更好地学习和决策，实现智能机器人与真实世界的交互。“现在的人工智能大模型主要用于内容生成，比如文字、图像，生成的结果就是最终的状态。而具身智能机器人输出的则是动作，在与真实世界交互的过程中会存在很多不确定性，例如机器人画一幅画可能会出现各种状况——画错了、笔断了、笔被拿走了，这些都会影响最终的输出结果。这些动作的选择对于机器人来说是非常复杂的，而我们可以借鉴人脑的决策原理，加速具身智能的实现。”

跨学科的思想碰撞为跨领域研究带来新灵感

韩东起一直对世界充满了好奇心，对科学研究有着广泛且浓厚的兴趣。他的本科专业是理论物理，在他看来，物理是一门极具挑战性的学科，它不仅要求学习者具备严谨的逻辑思维，还要有扎实的数学功底、实验设计和数据分析的能力，这些都能有效地提升一个人的综合素质。此外，物理科学也是很多现代科技的基石，应用范围十分广泛。

韩东起博士求学期间与老师和同学们合影

在物理领域，韩东起本科期间主要感兴趣的研究方向是托卡马克（一种可控核聚变装置）中物理参数的探测[4]。“核聚变是一种充足、高效、清洁的能源，一旦我们掌握了它，将给人类带来不可估量的收益。”实现可控核聚变是他最初的科研理想。但是，经过一段时间的学习，他发现，制约可控核聚变落地的并不是基础物理理论的突破，更多的是工程实践上的问题。这意味着，他所学习的理论物理无法直接推动理想的实现。而在托卡马克的研究中，韩东起接触到了机器学习技术，这让他萌生了转换专业的想法。于是在攻读博士学位期间，他选择了认知神经机器人专业。

跨学科学习意味着很多工作都要从零开始，在博士一年级时，韩东起就学习了很多新的基础课程，包括基础神经科学、机器学习、机器人控制自动化技术，以及认知科学、心理学等跨学科知识。虽然跨学科的学习过程十分艰辛，但他也从不同学科知识的碰撞中激发出了很多新的想法，为人工智能与脑科学的研究带来了优势。

在强化学习和具身智能的研究中，韩东起会代入物理学的思维方式，把物理实验中的严谨思维（例如常用的测量统计方法）和逻辑推理训练的方法引入到人工智能的研究中。

“跨学科学习的好处，不仅仅体现在知识的跨领域应用，更体现在逻辑思维的借鉴和启发上。比如，在解决神经网络机器学习的问题时，传统的机器学习思维，往往首先考虑的是数据量和模型规模。神经科学的训练则可以让我们从人类或动物大脑的角度出发，以更具拓展性和灵活性的方式来思考问题。”韩东起说。

跨领域合作：用前沿技术解决实际问题

除了跨学科的基础研究之外，韩东起和同事们还与国内外高校、医疗机构展开了跨领域的合作，将前沿技术应用于解决实际问题，寻求更好的解决方案。

韩东起所在团队与复旦大学联合开发了一种仿人眼视觉的机器视觉人工智能模型[3]，目标是提高计算机视觉系统的节能性。“在合作中，我们发现人类视觉和计算机视觉有很大的差异，人眼视觉中心的分辨率远高于边缘分辨率，而且人脑是用脉冲（spike）来传输信号的，脉冲神经网络也是大脑的一个特征。”为了探究人类视觉的优势，联合研究团队使用脉冲神经网络建模了一个视觉系统，可模拟不均匀的视觉分辨率和大脑脉冲信号传输。这个模型在完成视觉任务的同时，在理论上可以实现百倍的能效优化，能够以更少的能耗处理相同的视觉任务。

仿人眼脉冲神经网络进行视觉搜索任务示意图

在与韩国科学技术院合作的机器人项目中，双方的研究员们尝试使用可穿戴的、非侵入式设备读取人的脑电波信号，让机器人能够更准确地理解人的意图。“比如，当一位老人伸手指向厨房，机器人就要判断老人是不是饿了或者想要拿什么东西，又比如，指向桌子，桌子上有一瓶水和一盒纸巾，他到底需要哪一个？”韩东起说，“韩国科学技术院在神经科学领域积淀深厚，而我们则能够提供更优秀的人工智能算法。通过将脑科学的模型与人工智能技术结合，我们可以从多角度的研究和实践来帮助机器人更好地完成任务。这种跨领域的合作研究为双方带来了新的研究思路。”

从对游戏的钻研到对科研的坚持

工作之余，韩东起有着丰富多样的兴趣爱好。他喜欢徒步旅行以及羽毛球等体育运动，对各类电子游戏也情有独钟。“我从小学就开始玩电子游戏，后来一段时间，我迷上了一款需要很大耐心且挑战无上限的游戏。只有通过屡次失败和反复练习，我才能有一点进步。这种持续的自我提升给了我很强的成就感，也磨练了我的心态，使我更具耐心和毅力去面对生活中的各种困难。”他说，“这也影响了我的研究风格——进行长期持续性的研究。现在，研究院又给我提供了一个多元、包容的研究环境，让我能够与不同背景、不同专业和不同性格的同事一起，热情、高效的合作和交流，这使得我在长期主义研究的道路上得到了更多支持，也有了更多志同道合的伙伴。”

相关链接：

[1] Synergizing Habits and Goals with Variational Bayes
https://osf.io/preprints/psyarxiv/v63yj

[2] CircuitNet：A Generic Neural Network to Realize Universal Circuit Motif Modeling
https://proceedings.mlr.press/v202/wang23k/wang23k.pdf

[3] Energy-Efficient Visual Search by Eye Movement and Low-Latency Spiking Neural Network
https://arxiv.org/abs/2310.06578

[4] In situ relative self-dependent calibration of electron cyclotron emission imaging via shape matching
https://doi.org/10.1063/1.5038866