谢幸:做经得起时间检验的研究,打造负责任的人工智能

2023-08-09 | 作者:络绎科学

最近几年,人工智能(AI)技术发展迅猛,特别是在视觉、语音识别、阅读理解、机器翻译等单个任务上逐渐达到、甚至超过人类的水平。

2022年11月底,OpenAI 发布 ChatGPT,再次掀起了人们对大语言模型关注的热潮。一直以来,大语言模型被视为通往通用人工智能的必然发展阶段,这让人们再次看到通用人工智能的曙光。

技术发展的同时,我们也必须看到其所带来问题,正如微软总裁布拉德·史密斯(Brad Smith)在《工具,还是武器?》一书中提到,当一个技术或工具能力非常强大时,它所带来的帮助和危害同时是巨大的。

目前,ChatGPT 运转的 GPT 模型的参数已经逾1万亿。当模型变得越来越大以后,随之带来的是计算的急剧增加。在传统的隐私保护模式下,其内存、计算和通信开销都不可接受。

此外,模型的复杂度也逐年增加,保障模型的鲁棒性、正确性和可解释性显得愈发困难。因此,如何应对和解决大语言模型可能带来的危害成为研究者们的重点研究方向之一。

谢幸是微软亚洲研究院的资深首席研究员、空间数据挖掘领域的先驱之一。为确保以负责任和符合人类价值观的方式使用人工智能,其团队致力于“社会责任人工智能(Societal AI)”的研究方向,以保证技术和大模型应用的公平性、可靠和安全、隐私和保障、包容性、透明度和责任。

他们通过设计有效的隐私保护方法,来保护用于大模型训练或微调的隐私数据,以及通俗易懂的模型解释方法,来帮助用户理解大模型的工作原理。并且,着力消除或减轻用于训练大模型的数据中固有的社会偏见和仇恨,从而让大模型在不断变化的环境中更加安全和鲁棒。

谢幸的研究在全球产生了深远的影响,截至目前,他共发表400余篇学术论文,h-index 为103,共被引用40000余次,其中8篇论文被引次数超过1000。凭借在深入理解人类自身行为规律的基础上,建立人与机器之间的信任关系,致力于人工智能技术规范发展、使计算技术变得更友好和负责任,谢幸成为 DeepTech 2022 年“中国智能计算科技创新人物”入选者之一。

DeepTech 2022 年“中国智能计算科技创新人物”入选者谢幸(来源:DeepTech)

DeepTech 2022 年“中国智能计算科技创新人物”入选者谢幸(来源:DeepTech)

为 AI 与人类和谐共存奠定基础

当大模型的尺寸呈指数级上升时,我们如何确保 AI 能够在未来与人类是和谐共存的关系呢?谢幸表示,其团队将从五个方面来建设社会责任人工智能,包括价值观对齐、数据及模型安全、正确性或可验证性、模型评测、跨学科合作。

第一,保证 AI 价值观与人类价值观对齐,也就是需要确保 AI 在与人和社会合作时,秉承和人类相同的价值观。

第二,保证训练 AI 的数据以及人工智能模型的安全,包含隐私、版权、知识产权等。大语言模型或 AI 很容易受“越狱”等欺骗,去完成未被设计的任务,因此需要防范安全风险。

最近,该团队与国内外多所知名高校的法学专家团队围绕版权进行了深入探讨。随着 AI 能力的提升,它能够生成图像、视频,或者将文稿润色成为一篇论文或文章。因此,当 AI 和人类共同完成内容时,如何来定义版权以及如何划分 AI 和人类的贡献成为关键的难题。

谢幸表示:“我们与很多法学专家交流,他们对于版权的定义也有很多不同的意见。但我相信通过版权的定义来保护训练数据和作者们的版权,对未来创造性的工作肯定会有巨大的影响。”

第三,正确性或可验证性。很多时候 AI 会生成一些错误的信息,也就是人们常说的“一本正经地胡说八道”,如何保证 AI 的输出是可以验证的、是正确的也是谢幸与团队关注的研究方向之一。

第四,模型评测。由于现在大模型的能力越来越强,传统的 AI 的模型评测并不适用于现在的 AI 模型。为此,该团队正在试图提出一个全新的评测方式框架,以评测 AI 真正的能力。

第五,与社会科学的跨学科合作,包括法学、社会学、心理学、传媒、经济、教育等,共同研究 AI 未来的发展最终目标。据介绍,该团队最近与心理学相关专家及团队正在进行深入的研究探索,通过借鉴心理评测领域积累的经验,更好地评测 AI 未来的能力。

“在过去,心理学领域开发了非常专业的评测方法,来评测人类的核心能力,包括创造力、辩证思维、解决复杂问题的能力等。我们讨论后发现,这种方式和理念也适用于 AI。”谢幸表示。

时间是最好的试金石

谢幸博士于2001年7月加入微软亚洲研究院,现任微软亚洲研究院资深首席研究员,中国科学技术大学兼职博士生导师,微软-中国科大联合实验室主任。

微软亚洲研究院一直鼓励跨学科、国际化的交流以及前瞻性方向的合作。回顾过去二十几年的研究生涯,谢幸坦言,团队的研究方向随时代的趋势经过了几次调整和转变。“因此当我们在看到一些技术的发展趋势后,会马上尝试在这个趋势到来之前进行深入探索。”

他回忆道:“我记得我加入微软时用的还是诺基亚的非智能手机,但很快就出现了各种智能设备,大家逐渐意识到手机不仅是打电话的工具,还能做很多其他的事情。”基于此,他在微软亚洲研究院做的第一个项目是如何让用户在移动设备上更好地浏览内容,包括视频、图像和网页。

2003年2月,谢幸在微软研究院技术节上展示移动内容浏览的技术

2003年2月,谢幸在微软研究院技术节上展示移动内容浏览的技术

随着技术的发展,越来越多的传感器被加入到移动设备中,能力也越来越强,例如 GPS。因此从2006年开始,谢幸带领团队围绕着用户的位置数据做了一系列研究,例如通过这些数据理解用户的兴趣爱好、出行规划,然后从用户扩展到群体,再扩展到城市。他解释说道:“我们去理解一个城市的人群是怎么样移动、怎么样出行的,他们的节奏是什么样的,当时我们在时空数据挖掘方向展开了一系列的研究。”

有一句话叫“时间是最好的试金石”。谢幸团队的多项研究于十几年前发表,并在最近陆续获得了多项时间检验奖(Test of Time Award)。“这几个研究实际上都围绕着更好地去理解用户位置数据的方向展开,回头来看,这些研究都经受住了时间的检验,这也更坚定了我们对前沿技术探索的信心。”他说。

谢幸团队获得的时间检验奖证书

谢幸团队获得的时间检验奖证书

2021年7月,《在物理世界知识指导下驾驶》(Driving with Knowledge from the Physical World)获得了 ACM 数据挖掘中国分会(SIGKDD China Chapter)颁发的时间检验奖。该团队通过对出租车轨迹数据的深入研究,进而摸索出交通模式和驾驶员的行为模式,设计了一种为用户提供定制化导航路线的服务[1]。

发表于 KDD 2012 的论文《基于人类移动规律和兴趣点的城市功能区域发现》(Discovering Regions of Different Functions in a City Using Human Mobility and POIs)获得了 KDD 2022 时间检验奖。KDD 会议被认为是反映业内“最前沿数据领域研究风向”,被誉为“全球数据挖掘最高级别的学术会议”之一。在这篇论文中,作者们基于大规模人群移动数据以及地图兴趣点数据,提出了一种基于数据的城市功能分区自动发现方法,从而帮助人们更深入地理解不断演化的大城市[2]。

在移动数据领域的国际学术会议 IEEE MDM 2023 上,谢幸团队于2010年发表的论文《一种基于交互式投票的地图匹配算法》(An interactive-voting based map matching algorithm)获得了时间检验奖[3]。在该论文中,为解决用户 GPS 轨迹语义理解中面临的低采样率挑战,研究人员研发了一种地图匹配算法。该算法是在交互投票基础上实现的,根据真实轨迹数据集上的实验,算法大幅地提高了匹配性能。

后来,该团队重点研究的方向为社交网络数据和个性化推荐,更加深入理解人类用户。最近,他们聚焦于社会责任人工智能方向,从对人类自身的深入理解方向调整为对人和 AI 同时进行深入理解,从而让 AI 在未来与人和谐相处。

谈及 AI 发展的未来,谢幸表示,未来是人和 AI 共生的社会,AI 会完成很多从前人类做的事情,它会辅助人类完成具有创造力或挑战性的工作,例如现在科学家已经开始借助 AI 辅助进行科学研究等。“我们希望未来 AI 可以发展为一个安全的工具和助手,它的价值观与人类是对齐的,而且它的产出是可以信任的,是人类可控的助手。”

参考资料:

1. Jing Yuan et al. Driving with Knowledge from the Physical World. ACM SIGKDD international conference on Knowledge discovery and data mining, 2011s, 316–324 https://doi.org/10.1145/2020408.2020462

2. Jing Yuan et al. Discovering Regions of Different Functions in a City Using Human Mobility and POIs. ACM SIGKDD international conference on Knowledge discovery and data mining, 2012, 186–194 https://doi.org/10.1145/2339530.2339561

3. Jing Yuan et al. An interactive-voting based map matching algorithm. IEEE MDM 2023. https://doi.org/10.1109/MDM.2010.14

标签