边江:在研究院的七年“技痒”,探寻大模型助力AI与产业融合之道

2023-07-31 | 作者:微软亚洲研究院

编者按:基础科研的创新为技术落地应用提供了动力,而来自真实世界的业务需求则为基础科研提供了灵感和方向。当人工智能进入大模型时代,什么样的技术创新才能更好地落地于产业?对此,微软亚洲研究院资深首席研究员边江有着切身的体会和独特的见解。自2016年重回微软亚洲研究院后,边江一直专注于人工智能的快速开发和应用,助力行业企业提高生产效率,加速智能转型。在加入微软亚洲研究院的第七个年头,边江将面临哪些新“技痒”?


微软亚洲研究院资深首席研究员边江

微软亚洲研究院资深首席研究员边江

身处第四次工业革命的进程中,机器学习、深度学习等人工智能技术已成为公认的核心驱动力。近几年,在各大研究机构的努力下,人工智能技术已取得众多突破性成果,并在产业中落地生花。

多年来,微软亚洲研究院在探索计算机基础科研创新的同时,也在持续推动人工智能技术与现实产业场景的融合,通过与各行业合作伙伴的联合研究,目前已经让 AI 在智慧金融、物流运输、医疗健康、能源与可持续性发展等行业场景中得到应用。这些项目的成功,离不开微软亚洲研究院资深首席研究员边江和同事们多年的努力。从出走创业,到回归七年,边江一直奔走在创新技术与产业融合的第一线。

带着创业视角重回微软亚洲研究院

学术界是边江职业生涯的起点。在美国佐治亚理工学院完成计算机科学博士学业后,边江加入了美国雅虎研究院,负责雅虎首页内容推荐和垂直搜索模块的研究和优化工作。但异国的漂泊终究难抵对故土的深情,没多久,他选择了回国发展,加入微软亚洲研究院继续从事推荐算法相关的研究。

2013年,各行各业掀起了一轮创业热潮。怀揣着“科技改变世界”的梦想,边江短暂地离开了熟悉的科研圈,加入了一家新成立的算法推荐新闻资讯公司,成为其初创团队的一员,将一腔热血投入到产业界中,期望可以将实验室的创新技术应用到现实场景中。

“相比纯粹的学术研究,我更喜欢将技术应用到实际产业的过程。除了发表论文和在公共数据上做实验之外,产业界还要考虑更多的实际问题。做产品需要系统性的思维,包括对数据的考量、KPI 的设定等,比如如何弥补模型优化和产品实际上线之间的差距,这其中存在许多新的挑战。”边江说。

创业的几年间,边江在将机器学习技术应用于产品实践方面积累了丰富的经验。而扎实的学术功底加上创业实战经历,让边江得到了众多科技公司的青睐。但在比较了若干机会之后,边江还是选择了回归微软亚洲研究院。“无论是产业界,还是在学术界,我一直都对前沿技术很感兴趣,微软亚洲研究院一直走在新技术研究与探索的前沿,并已经发展成为了一个横跨产、学、研的机构,给科研人员提供了更广阔的舞台。重新回到这里,让我可以探索新技术从想法到研发,再到产业落地的全过程。而且研究院拥有众多顶尖的人才,我也能够与这些优秀的同事和实习生合作,一起做出更有影响力的研究成果。”边江说。

身处AI大模型时代浪尖,科研方向也需应势而变

重返微软亚洲研究院后,边江主要聚焦于机器学习、深度学习技术的研究,他和团队陆续将这些技术成功应用到了物流、金融、医疗等行业。例如,在物流领域,他们与东方海外航运(OOCL)合作,通过深度学习和强化学习技术大幅优化了航运网络运营;在金融领域,他们探索出了金融 AI 通用技术平台 Qlib,帮助金融 AI 研究者和从业者使用更先进和多样的人工智能技术来应对更复杂的金融挑战;在医疗领域,他们训练的新冠疫情(COVID-19)预测模型被美国疾控中心采用,其表现优于全球其它四十多家科研机构的预测模型。边江和团队还与医疗健康服务提供商美国哈门那公司(Humana)合作,基于深度学习技术构建了健康预测模型,帮助用户及时了解自身的健康状况,获得个性化的医疗服务。

边江(第二排右三)与团队部分成员合影

边江(第二排右三)与团队部分成员合影

2023年是边江回到微软亚洲研究院任职的第七年。在这期间,边江见证了人工智能技术发展与产业化的起伏变化。如今,随着基础大模型的成熟,人工智能赋能产业发展又迎来了新的机遇。面对新一轮的人工智能应用浪潮,边江与团队成员也在重新思考产业界的新需求,定位新的科研方向,并确定了从智能决策、工业数据智能、差异化隐私安全和智能认知学习四个方向着手,深化人工智能技术的应用研究。

在之前与东方海外航运的合作研究中,边江和团队使用了多智能体强化学习来优化航运网络,但在实际工业界的智能决策中,外部环境时刻变化,智能体要如何适应这种变化是一个问题。对此,边江团队积极探索环境强化学习(Situational RL),从而让强化学习模型可以更好地适应外界环境的变化。

与此同时,边江与团队还在积极探索将大语言模型(LLM)和强化学习结合,以构建更强大的智能决策能力。一方面,他们在探索通过基于 LLM 的预训练方法构建可以从交互环境中获取常识知识的世界模型(World Model),凭借预训练世界模型的能力,使决策智能体适应不同的工业场景。另一方面,团队也在研究如何集成 LLM 与在线学习的能力,在无需承担大量训练或微调成本的前提下,实现决策智能在工业控制场景中更强的泛化能力。

与纯学术研究相比,将工业数据应用到深度学习时,数据质量和特性等方面都存在较大的差异。比如 COVID-19 和 Humana 预测模型都有独特的数据特性,其中 COVID-19 模型预测的美国各大州数据具有空间关联性,即一个州的新冠确诊和死亡趋势与另一个州有相关性,而在 Humana 模型的数据中,既有病人定期检查信息这样的有规则数据,还有用户吃饭、运动等不规则数据。另外,在工业环境下,还会遇到数据缺失的情况。面对这些挑战,如何利用深度学习挖掘数据中的规律,是边江与团队的重要研究方向之一。

随着基础大模型的成熟,边江与团队正在进一步探索构建具有跨领域数据知识的工业基础大模型,使其能更有效处理工业数据中的数值和结构化信息。借助新的工业基础大模型,边江和团队期望创建工业数据智能与解决方案的新范式。

而在与工业界合作伙伴的交流中,边江也发现企业对隐私安全的需求越来越高。隐私安全一直是学术界重点关注的问题,也是微软亚洲研究院持续探索的一个方向。如何在利用好个体数据的同时保护个人隐私也是边江和团队未来关注的重点之一。

另外,微软亚洲研究院机器学习组在智能认知的研究上也取得了诸多成果,包括机器翻译、语音识别、自然语言处理等。边江希望将这些技术融入数字虚拟人(Digital Human)中,创造更逼真的虚拟人。目前,边江团队已在以文本或声音驱动的虚拟人面部口型(talking face)和音乐生成(music generation)方面取得了进展。

以产业创新中心为平台,加速技术与产业融合

除了带领机器学习组推进相关科学研究,边江还是微软亚洲研究院产业创新中心(Industry Innovation Center)的负责人。作为微软亚洲研究院产、学、研融合创新的平台,产业创新中心以研究院前沿研究与技术转化的丰硕成果与丰富经验为基石,聚集了一批既擅长技术创新又具备行业知识的“接地气”的计算机科学家和工程师,致力于发展与企业的战略合作,面向真实世界的关键场景,通过联合技术创新,实现共同发展,引领产业未来。

边江表示,产业创新中心希望从三个方面推动人工智能技术与产业的快速融合:一是在工业应用场景基础上探索最先进的人工智能技术,并将人工智能技术真正应用于工业界,赋能工业界;二是将创新的技术转化成云服务和开源项目,赋能更多的产业客户;三是为微软研究院搭建一个与业界沟通交流的平台,帮助研究人员从产业界中发现新的研究课题,也让产业界了解最新的技术发展动态。

微软亚洲研究院产业创新中心所涵盖的研究领域

微软亚洲研究院产业创新中心所涵盖的研究领域

具体而言,产业创新中心计划聚焦四个领域。在供应链领域,从物流、零售和制造业切入,利用智能决策进行供需匹配预测,帮助企业实现从生产、仓储,到运输物流的全产业链资源优化。在能源领域,从生产端助力风能和太阳能等清洁能源的生产趋势预测,最大化能源网络效率;从消费端帮助企业减少资源消耗,构建智能楼宇、绿色数据中心等,实现节能减排;并在两者之间,通过电池性能和生命周期预测以及充放电策略等研究,优化新能源储存方式。在金融领域,利用深度学习识别洗钱和欺诈行为,帮助金融机构更好地识别诈骗或洗钱团伙;同时模拟金融投资市场,助力金融从业人员预测极端的市场动荡,做好风险控制。而在医疗健康领域,边江和团队将推动机器学习在慢性病方面的应用,帮助进行病程预测,例如根据糖尿病病人的饮食、运动行为,预测血糖变化,采用更好的胰岛素治疗方案等。此外,他们还将提升模型的泛化性,将模型推广到更多慢性病的诊断与辅助治疗场景中。

当然,将前沿技术应用到行业中并不是一件容易的工作,对此边江深有体会。基于已有的与行业企业合作的成功经验,边江认为将创新技术与产业更好地融合有两个关键因素:一是需要有大量掌握产业知识的科研人员参与其中,这些科研人员要真正深入到实际的业务场景中,下沉到真实的数据里,了解行业面临的真正问题。同时,因为基础科研和技术落地应用之间的关系并不是简单的线性模式,而是一个复杂的双向生态系统,这就需要行业企业从上至下全面接受智能化转型,支持创新技术与业务的融合,真正做到学术界和产业界的共同创新。

“AI 在学术研究领域已经进入文本、图像、语音等多模态数据的大一统和大模型时代,大模型背后所蕴藏的数据表示能力、知识能力、逻辑推理能力为更强大的数据理解、优化决策、场景生成与模拟提供了新的可能性。而在产业界,经过此前的摸索,很多行业和企业已经建立了自己的数字化平台,并积累了大量的行业数据,为 AI 落地应用提供了基础。这些学术与产业的最新发展趋势预示着 AI 驱动的产业数字化转型将迎来新的爆发阶段。”边江说。

标签