20 天,600 篇论文,6 组导师带领 30 名学生淬炼科研能力

2020-10-15 | 作者:微软亚洲研究院

编者按:20 天时间,阅读 600 篇论文,在论文阅读认知模型的指导下,9 位顶级导师带领 30 名学生完成这个“不可能的任务”。乘阅读之风、借工具之势,破科研之浪,证实有效的科研训练模式已锻造形成,这样直击本质的训练范式定将催生出丰硕的科研成果。

30 名学生,20 天时间,阅读 600 篇论文,这听起来像一个“不可能的任务”。

这是微软亚洲研究院专为实习生们打造的一场科研训练——“沈老师带你肝论文”。在论文阅读认知模型的指导下,30 名学生在 9 位顶级导师的带领下分为 6 个小组,他们每人每天阅读 1 篇论文并回答经由系统设计的问题,每三天一场的导师分享、最后的学生展示敦促他们不断思考、反思、汇总、改进,更有不断迭代的专属论文阅读工具让参与者更高效地总结与交流。

 

本次科研训练模式总结

 

所谓论文阅读的认知模型,可概括为阅读论文的四个层次、三个阶段与十个问题。它们由沈老师——美国国家工程院外籍院士、清华大学高等研究院双聘教授、微软公司前执行副总裁沈向洋博士总结提出,期待以此为理论指导,帮助学生锻炼思维方式,建立起阅读认知模型,从而实现读“好”论文,“读好”论文

 

 

方法典籍在手,训练体系完备,总教头沈向洋博士坐镇指挥,师生队伍迅速集结!Wormpex AI Research 副总裁兼首席科学家华刚博士挑选出 600 篇来自 CVPR 2020 的论文,微软科研一线的中坚力量与学术新星——微软亚洲研究院首席研究员王井东、高级研究员陈栋、高级研究员闻芳、主管研究员杨蛟龙、主管研究员胡瀚,及微软云计算与人工智能事业部首席研究经理袁路、高级研究员陈冬冬等组成强大导师阵容,克服地域、时差、技术的限制,为学生提供手把手指导。

You are how you read,这不是一场简单的阅读训练。依托于沈向洋博士提出的方法论,微软亚洲研究院学术合作总监马歆说,“这场训练,也是微软亚洲研究院的人才培养理念的一次重要实践,一以贯之的是我们培养顶尖计算机科研人才的目标。”学会阅读论文只是提升科研能力的第一步,以此为出发点,还将继续解决阅读和写作之间的脱节,切实提升学生的选题和科研能力,这也正是沈向洋博士发起本次科研训练的初衷。

 

完成核心任务,获取论文阅读通关密码

 

7 月 18 日的开班仪式正式吹响了集训号角,受新冠肺炎疫情影响,“沈老师带你肝论文”暑期科研训练班全程线上在进行。在之后的 20 天时间里,每位学生需要每天阅读一篇论文并回答精心设计的“论文十问”,这也是本次阅读训练的核心任务

 

7月18日 开班仪式云合影

 

600 篇论文来自 CVPR 2020,基本契合导师和学生计算机视觉领域的科研背景,但其中也不乏他们不熟悉的方向。为什么不能自己挑选论文?为什么要读自己研究方向之外的论文?王井东解答了其中奥秘,“我们希望给同学们提供锻炼和提升的机会,跳出自己熟悉的研究领域,往往是进步的机会,有可能得到新的灵感。这也切合科研的本质,科研就是要把不懂的东西搞懂,把不会做的东西做出来。”

要按时、保质、保量地完成核心任务并非易事,但想将自己的思维认知模式淬炼成型,适当的阅读压力是必须的。“每三天的导师分享,既是学生论文阅读任务完成情况的检查点,也是导师们针对前一段时间内学习情况的总结与反思。”马歆介绍了整个科研训练周期中各项安排的巧思,“每位导师发现的问题往往是普适的,他们的分享可以集中、高效地解答疑问、攻克难点。”

六场导师团队的分享干货满满。王井东提供 4 个“锦囊”,指导学生如何回答“十大问题”;袁路提供“速读—精读—研读”的路径指导;陈栋关注新的研究领域的论文阅读方法论;“Reading (Research) as Communication”,陈冬冬鼓励小组合作;杨蛟龙指导提升“展示功力;胡瀚强调培养位置思维的重要性。回答问题的方法论指导——阅读能力的提高技巧——研究思维的科学培养,他们分别从不同角度分享提升阅读能力的“制胜绝招”。更有领域大牛 Sing Bing Kang 带来特邀报告,从科研题目选择、写论文到 rebuttal,他全方位地将阅读与写作构连了起来。

在本次科研训练的最后三天,还设置了集体汇报展示环节,每位学生挑选一篇论文,回答好与之相关的“十个问题”。这个环节一是为学生提供分享成果、相互交流的平台,二是敦促他们按时、保质、保量地完成训练任务。
沈向洋博士对同学们的“结课分享”印象深刻,“我看到了我们的学生在阅读能力方面的提升。”王井东还透露了这个环节的更深层用意,即检验学生的“阅读品味”。导师一直强调读“好论文”的重要性,但学生眼中的“好论文”究竟是怎样的?标准是否和导师相同?学生进行汇报展示的论文是他们选择后的结果,能一定程度上体现他们对“好论文”的理解。

 

支线辅助,六大导师各自出招

 

在完成主线任务的同时,30 名学生还被分为 6 路纵队,由 6 组导师分别带领。领衔导师各自出招,设置“支线任务”,全方位提升小组成员的战斗指数。

各个小组内部需要进行阶段小结,学生汇报展示,回答短阶段内阅读的论文的“十个问题”,导师及时总结指导。这一过程一般以 2 至 3 天为周期,胡瀚小组则每日进行。

对学生而言,要每天阅读并通过展示“讲好”论文的压力确实不小,但这样的训练强度也确实带来了颇为显著的效果。来自胡瀚小组的吴侃同学反馈,“大家最初经常控制不好时间,讲篇论文至少要二三十分钟,但到训练后期,我们更能抓住论文重点,在规定时间内讲清楚一篇论文”。另外,大家还普遍摸索出适用的展示模式,从而让自己的表达更有逻辑。

沈向洋博士认为,阅读、写作和展示,这三件事情有内在的逻辑关联。通过在规定时间内展示论文,深入浅出地讲好“论文故事”,能帮助学生抓住和突出论文重点,自行组织逻辑,听者的反馈也能帮助学生掌握展示技巧,进而提高论文阅读能力。

陈冬冬也同样看重展示的效果和作用。在最后阶段的集体汇报展示之前,他还提前组织成员在组内进行两轮展示预演,经过“一轮预演—指导讨论—修改精进—二轮预演”的过程,提前暴露问题、解决问题。成员们普遍反映,“这样的过程使自己在最终汇报展示时更能切中要害,讲清论文。”

另外,陈冬冬在安排阅读论文的篇目上也另有心思,他组织成员提前完成每天阅读一篇论文的“基础作业”,之后让所有成员一齐阅读 4 篇相同的论文,“初衷主要是想在组内深度探讨某一个特定领域的一系列论文,对比分析,希望让大家体会小组讨论在深度阅读中的关键作用”,这也正契合和实验了他主题分享中强调的“小组”的重要性。

袁路在论文分配上也别有设计,他将大领域论文均分给小组成员,再对子领域论文归类分组,成员各自认领一个子领域,保证每位成员阅读的领域有所重叠又有区别

科研训练期间,袁路和陈冬冬身在美国,但丝毫未因时差问题减少投入。陈冬冬说,“我深知读博的艰辛,只希望能帮师弟师妹们少走弯路,不因挫折丧失对科研的热情,否则真是非常可惜”。

王井东和杨蛟龙则邀请“外援”加入小组“指挥作战”,与成员形成一一对应关系,保证每位导师都有充足的时间和精力阅读论文,以便为成员提供更为准确、有效的指导。对于导师们研究领域之外的,尚没有足够信心理解、掌握的论文,王井东甚至还邀请论文的原作者加入指导,“这也是为了最大程度上保证给学生传递的信息准确、到位”。

“外援”和论文作者的加入无疑壮大了导师团队,导师之间的“相互切磋”也让他们自身获益匪浅。

他山之石可以攻玉,陈栋鼓励小组成员多多涉猎,不要在领域内固步自封。“邂逅”新的研究领域,能够帮助学生扩大研究视野,找到自己的兴趣所在。

20 天的披荆斩棘,改变的不止学生。拆分、打磨、复盘,帮助学生构筑认知模型的同时,导师自己也在完善阅读论文的方法论。

杨蛟龙表示,自己原来的一些混沌、未组织的论文阅读的模式、习惯或者技巧,通过这次跟学生交流的实践、发现学生的问题并给出指导的过程进行总结、优化和具像化了。“以前是野路子,现在更有体系了”,胡瀚同样这样概括自己的变化。

在人才培养模式和教学方式的精进上,导师们也有了新的思考。王井东表示,自己不再困囿于如何教会学生具体的知识,而是从中转变思路,和学生交流方法论和逻辑。袁路则补充,学生论文阅读能力参差不齐,设置小组区别指导是有必要的。陈冬冬从中深刻感受到学术传承的重要性,“真心希望各高校实验室能够建立起学术传承的传统。”

导师们体验各有不同,但在这次阅读训练的必要性和有效性方面,他们已然达成共识,“这种体系化的阅读很有成效,适合推广” “值得作为微软亚洲研究院培养新学生的必修课程”

 

装备升级,“打怪升级”得心应手

 

在这场与诸多困难博弈的征程中,如果说“模版阅读”方法论是核心武器,那论文阅读课程辅助工具(Beta)则是帮助提升武力值的升级装备。

这个装备由微软云计算与人工智能计算机视觉研发工程总监谢育涛业余时间开发,旨在达成两大目的:一是方便读者之间的交流,摆脱阅读论文“读不懂又没人问”的窘境;二是学习快速阅读论文的方法,帮助读者克服“被海量论文淹没”的挑战。

“每一篇论文都有一个属于自己的社区,参与社区的是所有对这篇论文感兴趣的人,包括作者本人”,这是这款工具的设计理念。

 

围绕论文形成的“学术社区”

 

基于学术论文知识图谱,网页可以完整地展示论文的真实有效数据,例如标题、作者、发表期刊、摘要、PDF 链接、References 等。另外,网站内还增设社区讨论功能,用户可以自行发布话题、回复讨论。这也正达成了前面提到的第一个目的:方便读者之间的交流

在围绕论文形成的学术社区中,用户能够通过阅读其他用户对十个问题的回答快速了解论文的大意和重点,从而达成第二个目的:快速阅读论文

谢育涛了解到这个工具的必要性后他自告奋勇,利用业余时间完成开发。为了尽快应用到这场阅读训练,网站先行上线,功能、设计、细节根据需要和反馈逐渐增加完善,期间几乎保持日更的频率,终于在训练结束前大致完成了工具的 Beta 版。

该工具在这次应用尝试中还很大程度上解决了线上模式造成的互动障碍。学生可以通过“我的任务”进入论文列表,查看导师布置的待读论文;导师可以直观看到所有学生的论文阅读情况。点击任何一篇论文即可进入详细页面,包括“标题/摘要”部分和“十个问题”部分,方便学生对应回答问题,完成每日任务。学生之间还可以互相浏览作业,以供交流借鉴。

师生“肝”论文,育涛“肝”工具。虽然凌晨奋战、读不懂、回答不清楚时有发生,但 20 天过后,无论是参与者还是工具都已升级到 2.0 版本。

论文阅读速度提高、回答问题的准确性提高、科学的阅读习惯逐渐养成……根据学生反馈,这 20 天的阅读训练确实有效锻炼了他们的论文阅读技巧,另外,他们还从中获得了一种提高科研能力的通用范式,“在回答问题的过程中我学会了如何将论文思路以清晰的语言写下来”“与导师和小组成员交流汇报及提问过程中,我的交流水平改善了” ……可以说,这场训练带给他们的改变是全方位的。

训练结束一周后,“肝”完全程的闫坤同学特地重新无意识地阅读一篇论文,以对比自己前后的阅读行为,“速读一遍,大约过了半个小时,我想这篇文章已经成功由一个‘大西瓜’变成了一串‘葡萄’,我也找到了这串葡萄的枝头,可以轻松地拎起它,然后随意品尝各个部分的鲜美了。”放下论文,他发现导师们分享的篇章字句不时地跃出脑海,潜移默化的改变已然发生了。

毋庸置疑,拆分、打磨、复盘,这个训练过程正在帮助学生构筑自己的认知模型,假以时日,如果多加练习,达到“庖丁”那“以神遇而不以目视,官知止而神欲行”的境界便指日可待了!

阅读训练暂时告一段落,但持续的阅读、学习和科研才是之后的主题。借沈向洋博士的话与大家共勉,“学习和做研究将是一辈子的旅程。对学生来说,最重要的是享受读书学习和做研究的过程。当你读的书多了,做的实验多了,你就知道自己进步了,并看到了自己认知模式的拓展。这也正是生命的快乐。

借由论文阅读汲取新的科研灵感,通过导师指导带领学生们乘阅读之风、破科研之浪,新的一轮科研训练已在微软亚洲研究院自然语言处理组再度起航,而这样直击本质的训练范式也定将催生出丰硕的科研成果。

标签