微软学者 | 潘玲:无限风光在险峰,坚持做有价值的工作
2021-05-26 | 作者:微软亚洲研究院
2020 年,在“微软学者”奖学金的评选中,潘玲凭借扎实的科研基础、科研能力与丰硕的学术成果,得到了面试官的一致认可,成为同年全亚洲十二名“微软学者”之一。
三年很短,记忆幕幕鲜活,收获的每个成就、历经的每段挫折,都牵动着今日的自我。三年也很长,足够曾经生涩的女孩,决定自己愿意为之奋斗一生的科研方向。对潘玲来说,获评“微软学者”就是最好的时光注脚。

潘玲在美国夏威夷参加 AAAI 2019 会议
深入方向:结缘 MSRA 机器学习组
潘玲与微软亚洲研究院的缘分,也早早开始于 2018 年的夏天。为了进一步探索强化学习方向,在黄隆波副教授的推荐下,潘玲进入微软亚洲研究院机器学习组,跟随微软亚洲研究院高级研究员陈薇进行了为期九个月的实习,这帮助潘玲更加坚定了自己科研路上的“心之所向”——深度强化学习。
“除了我的导师黄隆波副教授,陈薇老师也是我这个‘小白’在强化学习道路上的一位领路人。”谈及在微软亚洲研究院的这段经历,潘玲不无兴奋。进入研究组的第一周,陈薇就安排潘玲在下一周的组会上分享论文。当时的潘玲既忐忑又兴奋,既担心自己是否可以很好地完成这个任务,也为这个来之不易的学习机会而开心。最终,还是新人的她,认真准备之后,顺利地做了第一次论文分享。
在潘玲看来,强化学习小组充满学习和进步的活力,她在这里体会到了和在交叉信息研究院同样的老师领路、同辈互相学习的温暖与力量。在每周的组会上,同组的研究员、实习生会分享领域内最新的、有价值的研究进展;在每两周一次的一对一会议中,她可以与 mentor 陈薇一对一交流,获得她对自己科研进展的具体建议,再进一步充实、提升自己的科研工作。同组的实习生也会充分交流、分享自己的科研想法,如果一位同学在研究中遇到困难,所有同学都会主动帮忙出谋划策,构想不同的改进方法。
数学背景的陈薇有着敏锐的洞察力和严谨的科研态度,这让潘玲受益匪浅。一篇文章完成后,陈薇会认真、细致地审阅和修改,大到讲述故事的框架,小到每一句话的措辞文法,陈薇都会提出相关的建议。潘玲回忆:“陈薇老师让我认识到机器学习文章中故事的重要性。除了提出有效的方法以外,也要能逻辑清晰地将故事展现给大家。这样,别人能够更清楚地认识到,你的问题与结果的重要性,以及方法的有效性。”
在清华大学交叉信息研究院的学习以及在微软亚洲研究院的实习工作,让潘玲的科研累积如春日种子萌发般飞速增长。在这个过程中,潘玲不仅掌握了科研的方法,培养了对科研问题的品味,更重要的是,确定了自己热爱并要一直坚持的“深度强化学习”这一研究方向。

潘玲的微信截图:陈薇参加会议时
会在微信群里直播与每个实习生相关的科研内容
愈战愈勇:无限风光在险峰
在潘玲看来,所研究的深度强化学习方向是解决时序决策问题的一种普适框架。深度强化学习有广泛的应用场景,和我们在生活中遇到的很多问题都息息相关,如单智能体强化学习可以应用于游戏、推荐系统、计算机视觉、自然语言处理等领域,而多智能体强化学习能够应用于涉及多个智能体协同操作的场景,例如交通灯配时调节、机器人合作等场景。她希望能够设计出高效的强化学习算法来改善人们的生活,并将科研重点放在深度强化学习以及多智能体强化学习的鲁棒性、高效性和实用性。
在热爱的驱动与持之以恒的努力下,潘玲取得了丰富的科研成果:在导师黄隆波副教授的指导下,潘玲提出的关于 softmax operator 在强化学习的文章获得了 NeurIPS 2020 会议评委的一致好评,并收获了 9 分和 8 分两个高分,其算法效果甚至超越数个名校的强化学习科研大组的成果;在刚刚结束的牛津大学访问中,潘玲与合作导师 Prof. Shimon Whiteson 研究组研究了多智能体强化学习中重要的鲁棒性问题,提出的算法在多智能体强化学习的通用基准任务上取得了顶尖的效果,并能进一步拓展到于星际争霸游戏中。
然而,潘玲的科研之路其实并没有那样一帆风顺。对她而言,被拒稿是科研生活中的常态。时至今日,她仍记得博士阶段第一次被拒稿的经历:凌晨十二点多,她在电脑前等待着论文投稿的结果,收到的却是拒信,沮丧的她在当天十二点半收到了导师黄隆波副教授的邮件,导师一如既往地相信她的工作与成果,这对她而言是莫大的安慰和鼓励。
潘玲被 IJCAI 2020 接收的论文同样让她印象深刻。文章的科研想法诞生于潘玲在微软亚洲研究院实习时的一次组会,会后,她就分享的论文和陈薇讨论,对一个在强化学习领域内长时间没有得到解决的开放问题提出了新的方法,很快就完成了这个问题的研究。然而,潘玲这篇论文前后被拒稿五次,很长一段时间内,她收到的拒信都是关于这篇论文的。大约两年后,这个研究才得到认可,登上 IJCAI 2020 国际会议的舞台(接受率 12.6%)。
不过,潘玲认为被拒稿并不一定是坏事。拒稿让她能够放慢步调、静心思考,帮助她认识到什么样的研究问题是真正重要的、是能够推动领域发展的,进而找到有价值的关键问题。收到的拒稿意见有时也能为她提供“大牛”的建议,她能够从中学习、摸索,进一步提高自己研究工作的质量。

潘玲在清华大学交叉信息研究院 2020 年科研年会
暨博士生学术论坛作学术报告
平稳心态:非宁静无以致远
作为 2020 年“微软学者”奖学金获得者中唯二的女性之一,潘玲没有太注意到性别带来的不同。在她看来,计算机科学领域的男性和女性在硬性科研实力方面基本没有区别,只是在心态、情绪、身体素质方面有一些区别,比如遇到的女性 mentor 工作风格比较细致,以及收到拒稿通知时,身边的女同学可能更容易沮丧一段时间。对此,潘玲平时非常注重在空闲时间进行运动,以保持良好的身体素质和心情。
科学界的女性偶像给潘玲带来了很多力量,斯坦福大学的 Prof. Chelsea Finn 是潘玲从事强化学习研究的学习榜样:“ Prof. Chelsea Finn 的研究工作质量都非常高,这也可以反映男性和女性的科研能力没有太大区别”。她希望自己获评“微软学者”奖学金能够鼓励到其他女性申请者:“在计算机科学领域,刻板印象比较严重,所以这个领域的女同学比较少,反过来又加深了这种刻板印象。但我坚信大家同样优秀,希望未来会有越来越多女同学加入科研行列。”
未来,潘玲将在科研之路上深耕。她将继续对深度强化学习以及多智能体强化学习在理论分析、算法设计以及实际应用方面的研究,与微软亚洲研究院的密切交流也让她打算与研究院机器学习组深入合作。在 2021 年“微软学者”奖学金申请开始之际,潘玲希望,每位走在科研路上的同学都能找到自己热爱且重要的研究方向,相信自己在做的是有价值的工作,让科研工作在正向循环中发展。她对申请人给出了诚挚的祝愿:“保持自信、热爱,找到真正感兴趣的、重要的研究方向并为之恒久努力,相信好运将伴随你。”