实习派 | MSRA明日之星闪耀计算机视觉顶会CVPR

2017-08-17 | 作者:微软亚洲研究院

灿烂灼热的阳光倾泻在白金色的沙滩上,一股股热浪自地面升腾而起,撞击着人们裸露的皮肤。摇曳婆娑的椰树下,是热情奔放、永不疲惫的草裙舞……七月的夏威夷群岛会让你想到什么?一次难忘的假日之旅还是一段金色的休闲时光?

来自微软亚洲研究院的陈冬冬和李柏依可能会给出与大多数人不同的答案。这两颗明日之星从北京出发,远赴夏威夷,为的不只是那里美丽的自然风光,更是一场学术盛宴——计算机视觉领域顶级会议CVPR。

What is CVPR?

CVPR全称为International Conference on Computer Vision and Pattern Recognition(计算机视觉及模式识别大会),是近年来计算机视觉领域全球最具影响力、内容最全面的顶级学术会议,由专业技术学会 IEEE(电气和电子工程师协会)主办。CVPR涵盖的问题包括但不限于:图像基本处理、物体识别与检测、图像高级语义理解、人脸、优化方法、Correspondences求解、相机定位及SLAM(三维地图构建)。

今年的CVPR于7月21日至7月26日在夏威夷欧胡岛的国际会议中心盛大举行。来自五湖四海的学者齐聚一堂,共同分享、讨论最新的话题和计划。作为领域内权威会议,今年的 CVPR在论文数、参会人数等方面均创历史新高。 据官方统计,今年共收到有效提交论文 2680 篇,其中 2620 篇论文经过完整评议,最终总计 783 篇被正式录取(占总提交数的 29%)。与会人数更是达到了历史高峰4950人。

夏威夷欧胡岛国际会议中心

大会主会集中在7月22至25日,会议安排非常自由灵活。每一篇被录取的文章都有两小时的Poster陈列时间,评审会挑选部分文章额外给予4分钟的短报告或传统的12分钟长报告。

除了主会以外,大会还设置了22个Tutorial和44个Workshop,时间为7月21日和26日。Tutorial会邀请不同方向的牛人讲解自己当前的工作以及该方向的发展前景;Workshop则需要参与者围绕某一特定小主题,分享自己最新的研究成果。

7月23日傍晚,微软全球执行副总裁沈向洋被邀请在大会上发表主题演讲。他回顾了微软研究院25年的计算机视觉研究史以及研究院对计算机视觉领域的贡献,并介绍了微软利用计算机视觉系统和技术开发的三款产品:微软Pix,HoloLens和认知服务。

微软全球执行副总裁沈向洋在大会上发表主题演讲

而微软亚洲研究院的新生代明日之星们,也有机会在如此高规格的顶会上大放光芒。陈冬冬与李柏依就是群星中的两颗。

陈冬冬:图像风格迁移

陈冬冬,微软亚洲研究院与中国科学技术大学联合培养博士在读,导师袁路,主要研究方向为深度学习和图像生成,曾在CVPR/ICCV/3DV 发表论文。他的论文被正式收录,因此要在自己的Poster展位上,向所有前来交流的学者们介绍自己的工作。

对于很多参加国际学术会议的中国科研工作者而言,语言障碍始终是一个不得不面对的难题。何况这次参加CVPR,是陈冬冬的顶会“首秀”,展示当天,一丝紧张的情绪浮在他的心头。“当时比较担心英语卡壳,不过还好有廖菁,袁路两位导师来到现场帮忙站台,整个过程还算比较顺利。”

从左到右为:廖菁、陈冬冬、袁路

陈冬冬展示了自己在图像风格迁移上的最新工作 Stylebank: An Explicit Representation for Neural Image Style Transfer。 针对之前风格迁移算法只能处理单一风格以及训练耗时的问题,他对图像的风格提供了一种更加显式的表达“风格基元”(StyleBank),不仅使得单模型能够处理多种风格,还能实现对新风格的快速增量学习。目前,该技术已被运用到微软Pix中,轻松一键,用户变身艺术家。

微软Pix

外行看热闹,内行看门道,相同方向的研究者,往往能提出一针见血的问题。陈冬冬原本担心他们的问题太有挑战性,会让自己无力应对,未成想大家交流顺畅深入,相谈甚欢。Poster展示过程顺利,结束时的一个小插曲却给了陈冬冬“致命一击”—— “隔壁不知情况的师妹以为袁路老师是我‘师弟’!顿时受到一万点伤害,”他笑道,“当然我‘师弟’开心得不行。”

李柏依:图片去雾

李柏依是华中科技大学在读研究生,目前在微软亚洲研究院实习,导师彭秀莲,主要研究方向为计算机视觉。

李柏依

在本次会议的Workshop中,李柏依介绍了自己最新的工作——End-to-end Dehazing Neural Network。这项工作首次用神经网络完全实现“输入为雾霾图片,输出为去雾图片,中间不需要任何传统方法得到的先验信息”。在更进一步的延伸性工作中,她提出了新的想法:将去雾与物体检测二者结合,考虑低层次任务和高层次任务(物体检测任务)的联合训练,从而提升雾霾天气下针对车辆、行人的物体检测性能。

雾霾天气下的物体检测

“虽然参加的是Workshop,但毕竟是第一次做大会展示,什么经验都没有,”柏依回想到,“第一版PPT真的是槽糕透了。使用了多种字体,排版也非常冗杂,同时信息量不足。”幸好,李柏依得到了研究院两位导师彭秀莲与许继征的指导。大到展示的整体内容,小到ppt的字体与版面设计,导师都亲身指导,并在她参会过程中时时发微信鼓励。此外,同门小伙伴的大力帮助也帮助李柏依缓解了紧张的心情,整个过程进展非常顺利。

最终,李柏依的工作受到了广泛的关注,并在题为“Dealing with Reality: Low-Quality Visual Data Processing and Analytics”的Tutorial上被重点提及,得到了不错的反响。柏依表示,此行最大的收获便是听了很多优秀报告,结识了很多有思想的老师与同学。同行的工作给她留下了深刻的印象,比如 Joint Multi-Person Pose Estimation and Semantic Part Segmentation,该工作展示了行为识别和语义部分分割这两个任务在复杂多人图片中的互补性,同时公开了一个有行为和部分分割两种标注的数据集——Pascal-Person-Part。

标签