新闻中心

排序方式

从FairMOT到VoxelPose,揭秘微软以“人”为中心的最新视觉理解成果

利用计算机视觉技术对场景中的人进行智能分析是当前最重要的研究问题之一,但挑战仍未被完全解决,比如遮挡、运动模糊、尺度变化、光照变化、适应新场景的问题等。微软亚洲研究院在该领域提出了一系列新的思路和方法,包括已转化入微软产品的多目标跟踪算法 FairMOT,多摄像机多人三维姿态估计算法 VoxelPose 等等,这些算法在多个测试数据集上都取得了良好的实验结果。

发布时间:2020-06-29 类型:深度文章

萨提亚·纳德拉与沈向洋CVPR对谈:那些未来可期的计算机视觉研究与应用

6月16日,CVPR 2020 大会以全球连线的形式如期开幕。在大会的首场主题演讲中,微软公司 CEO 萨提亚·纳德拉与微软公司前执行副总裁沈向洋进行了一场精彩的炉边对谈,分享了对计算机视觉、人工智能研究与应用前景的思考与展望。本文为大家整理了完整的文字实录。

发布时间:2020-06-18 类型:深度文章

CVPR 2020丨图像超清化+老照片修复技术,拯救你所有的模糊、破损照片

也许你曾从橱柜里翻出家人们压箱底的老照片,而它们已经泛黄发脆,甚至有些褪色;也许你在拍照时不慎手抖,只好把糊成一片的照片都丢进“最近删除”。而微软亚洲研究院在计算机视觉顶会 CVPR 2020 发表的两项黑科技——基于纹理 Transformer 模型的图像超分辨率技术,和以三元域图像翻译为思路的老照片修复技术,将能让这些照片奇迹般地恢复如初。同时,图像超分别率技术将于近期上线 PowerPoint,未来也将有更多图像修复技术集成进微软 Office 产品中。

发布时间:2020-06-12 类型:深度文章

CVPR 2020丨微软亚洲研究院精选论文一览

CVPR 2020 即将于6月14-19日在线上召开。微软亚洲研究院在本届 CVPR 共有25篇论文发表,本文汇总了部分精选论文,涵盖姿态估计、动作检测与识别、分割与检测、底层视觉等领域。

发布时间:2020-06-11 类型:深度文章

CVPR 2020丨动态卷积:自适应调整卷积参数,显著提升模型表达能力

轻量级卷积神经网络能够在较低的计算预算下运行,却也牺牲了模型性能和表达能力。对此,微软 AI 认知服务团队提出了动态卷积,与传统的静态卷积(每层单个卷积核)相比,根据注意力动态叠加多个卷积核不仅显著提升了表达能力,额外的计算成本也很小,因而对高效的 CNN 更加友好,同时可以容易地整合入现有 CNN 架构中。

发布时间:2020-06-08 类型:深度文章

CVPR 2020丨基于记忆增强的全局-局部整合网络:更准确的视频物体检测方法

在视频物体检测任务中,由于相机失焦、物体遮挡等问题,仅基于图像的目标检测器很可能达不到令人满意的效果。针对此类问题,微软亚洲研究院提出了基于记忆增强的全局-局部整合网络(Memory Enhanced Global-Local Aggregation, MEGA),它可以在只增加非常小的计算开销的前提下,整合大量的全局信息和局部信息来辅助关键帧的检测,从而显著地提升了视频物体检测器的性能。在广泛使用的 ImageNet VID 数据集中,此方法达到了截至目前的最好结果。

发布时间:2020-05-26 类型:深度文章

CVPR 2020丨Variational DropPath:提高3D CNN时空融合分析效率的秘诀

时空融合(Spatiotemporal fusion)是三维卷积神经网络(3D CNNs)的关键要素,它决定了网络前馈过程中每一层如何提取、融合空间信号和时间信号。目前已有的时空融合分析方法囿于过大的网络训练开销,仅能对有限数量的融合策略进行网络级别分析。微软亚洲研究院将时空融合策略嵌入到预先定义的概率空间,从而能够对任意多种融合策略进行网络级评估,而不必分别训练它们,极大地提高了针对时空融合策略的分析效率。

发布时间:2020-05-25 类型:深度文章

CVPR 2020丨更准确的弱监督视频动作定位,从生成注意力模型出发

爆发式增长的海量热门视频正在对视频处理技术提出更高的要求,弱监督学习因此越来越重要。针对弱监督动作定位中的关键问题,微软亚洲研究院提出了一种新的思路,从特征表示的角度捕捉上下文和动作片段的区别,进一步提高了动作定位效果。

发布时间:2020-05-08 类型:深度文章

CVPR 2020丨MaskFlownet:基于可学习遮挡掩模的非对称特征匹配

在光流预测任务中,形变带来的遮挡区域会干扰特征匹配的结果。在这篇 CVPR 2020 Oral 论文中,微软亚洲研究院提出了一种可学习遮挡掩模的非对称特征匹配模块,它可以被轻松结合到端到端的基础网络中,无需任何额外数据和计算开销地学习到遮挡区域,从而显著改进光流预测的结果。

发布时间:2020-04-29 类型:深度文章