新闻中心

排序方式

自注意模型学不好?这个方法帮你解决!

上周,微软亚洲研究院高级研究员胡瀚在 B 站分享了 ECCV 2020 论文“解耦自注意模型”。针对自注意模型中的退化现象,论文提出了解耦自注意模型,有效避免了这一退化现象,并证明了其在多种视觉识别任务中广泛有效,包括语义分割、物体检测、动作识别等。

发布时间:2020-09-15 类型:深度文章

ECCV 2020 | 对损失信息进行建模,实现信号处理高保真还原

信号在我们的日常生活中随处可见,例如:声音、图像、视频等。然而在信号的传输或存储过程中,往往会面临信号失真、质量变差等问题。今天这篇文章就来探讨一下信号处理中的信息丢失问题,其中包括微软亚洲研究院机器学习组与北京大学在 ECCV 2020 上发表的 Oral 论文《可逆图像缩放》(Invertible Image Rescaling)等工作。

发布时间:2020-09-04 类型:深度文章

ECCV 2020 | 微软亚洲研究院精选论文摘录

ECCV(European Conference on Computer Vision)是计算机视觉领域的三大顶会之一。今年的 ECCV 大会于8月23日至28日在线上举行。微软亚洲研究院在本届大会上有21篇论文入选,本文精选了其中6篇有代表性的为大家进行介绍。

发布时间:2020-08-25 类型:深度文章

ECCV 2020 | OCRNet化解语义分割上下文信息缺失难题

图像语义分割一直都是场景理解的一个核心问题。针对语义分割中如何构建上下文信息,微软亚洲研究院和中科院计算所的研究员们提出了一种新的物体上下文信息——在构建上下文信息时显式地增强了来自于同一类物体的像素的贡献,这种新的上下文信息从语义分割的定义出发,符合第一性原理思维,在2019年7月和2020年1月的 Cityscapes leaderboard 提交结果中都取得了语义分割任务第一名的成绩。相关工作“Object-Contextual Representations for Semantic Segmentation”已经被 ECCV 2020 收录。

发布时间:2020-08-20 类型:深度文章

王井东:下一代视觉识别的通用网络结构是什么样的?

2020 年 8 月 7 日,由中国计算机学会(CCF)主办的第五届全球人工智能与机器人峰会(CCF-GAIR 2020)在深圳正式开幕。在本次大会第二天的「视觉智能•城市物联」专场上,微软亚洲研究院首席研究员王井东博士分享了其在新一代视觉识别网络结构上的研究成果。

发布时间:2020-08-17 类型:深度文章

从FairMOT到VoxelPose,揭秘微软以“人”为中心的最新视觉理解成果

利用计算机视觉技术对场景中的人进行智能分析是当前最重要的研究问题之一,但挑战仍未被完全解决,比如遮挡、运动模糊、尺度变化、光照变化、适应新场景的问题等。微软亚洲研究院在该领域提出了一系列新的思路和方法,包括已转化入微软产品的多目标跟踪算法 FairMOT,多摄像机多人三维姿态估计算法 VoxelPose 等等,这些算法在多个测试数据集上都取得了良好的实验结果。

发布时间:2020-06-29 类型:深度文章

萨提亚·纳德拉与沈向洋CVPR对谈:那些未来可期的计算机视觉研究与应用

6月16日,CVPR 2020 大会以全球连线的形式如期开幕。在大会的首场主题演讲中,微软公司 CEO 萨提亚·纳德拉与微软公司前执行副总裁沈向洋进行了一场精彩的炉边对谈,分享了对计算机视觉、人工智能研究与应用前景的思考与展望。本文为大家整理了完整的文字实录。

发布时间:2020-06-18 类型:深度文章

CVPR 2020丨图像超清化+老照片修复技术,拯救你所有的模糊、破损照片

也许你曾从橱柜里翻出家人们压箱底的老照片,而它们已经泛黄发脆,甚至有些褪色;也许你在拍照时不慎手抖,只好把糊成一片的照片都丢进“最近删除”。而微软亚洲研究院在计算机视觉顶会 CVPR 2020 发表的两项黑科技——基于纹理 Transformer 模型的图像超分辨率技术,和以三元域图像翻译为思路的老照片修复技术,将能让这些照片奇迹般地恢复如初。同时,图像超分别率技术将于近期上线 PowerPoint,未来也将有更多图像修复技术集成进微软 Office 产品中。

发布时间:2020-06-12 类型:深度文章

CVPR 2020丨微软亚洲研究院精选论文一览

CVPR 2020 即将于6月14-19日在线上召开。微软亚洲研究院在本届 CVPR 共有25篇论文发表,本文汇总了部分精选论文,涵盖姿态估计、动作检测与识别、分割与检测、底层视觉等领域。

发布时间:2020-06-11 类型:深度文章

CVPR 2020丨动态卷积:自适应调整卷积参数,显著提升模型表达能力

轻量级卷积神经网络能够在较低的计算预算下运行,却也牺牲了模型性能和表达能力。对此,微软 AI 认知服务团队提出了动态卷积,与传统的静态卷积(每层单个卷积核)相比,根据注意力动态叠加多个卷积核不仅显著提升了表达能力,额外的计算成本也很小,因而对高效的 CNN 更加友好,同时可以容易地整合入现有 CNN 架构中。

发布时间:2020-06-08 类型:深度文章