新闻中心

排序方式

机器推理系列第五弹:文本+视觉,跨模态预训练新进展

机器推理要求利用已有的知识和推断技术对未见过的输入信息作出判断,在自然语言处理领域中非常重要。此前我们介绍了机器推理系列的概览,机器推理在常识问答、事实检测、跨语言预训练、多轮语义分析和问答任务中的应用,本文作为该系列的第五篇,将介绍微软亚洲研究院在跨模态预训练领域的研究进展。

发布时间:2020-01-14 类型:深度文章

AAAI 2020 | 时间可以是二维的吗?基于二维时间图的视频内容片段检测

当时间从一维走向二维,时序信息处理问题中一种全新的建模思路由此产生。根据这种新思路及其产生的二维时间图概念,微软亚洲研究院提出一种新的解决时间定位问题的通用方法:二维时域邻近网络 2D-TAN,在基于自然语言描述的视频内容定位和视频内人体动作检测两个任务上验证了其有效性,并在 ICCV 2019 中的 HACS Action Localization Challenge 比赛中获得了第一,相关技术细节将发表于 AAAI 2020 论文“Learning 2D Temporal Adjacent Network for Moment Localization with Natural Language”。本文将对这一研究进行深入解读。

发布时间:2019-12-16 类型:深度文章

NeurIPS 2019丨是呆头伯劳鸟还是南灰伯劳鸟?深度双线性转换帮AI准确区分

双线性特征在学习细粒度图像表达上效果很好,但计算量极大,无法在深层的神经网络中被多次使用。因此,微软亚洲研究院设计了一种深度双线性转换模块,能够深层地将双线性表达应用在卷积神经网络中,来学习细粒度图像特征。这项工作发表在了 NeurIPS 2019 上。

发布时间:2019-12-03 类型:深度文章

ICCV 2019 | 递归级联网络:基于无监督学习的医学图像配准

目前,深度学习正广泛应用于医学图像配准领域。无监督机器学习方法能够广泛利用临床中产生的大量原始、无标注医学图像,然而现有算法对于变形大、变化复杂的图像配准的学习效果较差。微软亚洲研究院在 ICCV 2019 发表的论文中,提出一种深度递归级联的神经网络结构,可以显著提高无监督配准算法的准确率。

发布时间:2019-11-05 类型:深度文章

AI换脸鉴别率超99.6%,微软用技术应对虚假信息

近日社交网络上爆红的一款换脸应用,让许多普通用户体验到了跟爱豆同框、与偶像飙戏的快乐,也因数据使用带来的问题陷入了舆论的漩涡——除了用户隐私保障,如何辨别和处理换脸应用所制造的合成照片、合成视频是新型科技产品带来的新挑战。

发布时间:2019-11-01 类型:深度文章

ICCV 2019丨基于跨视角信息融合的三维人体姿态估计

现有的多视角三维人体姿态估计通常先估计二维人体姿态,再将二维提升为三维,因此一旦二维姿态估计不准确,将让三维姿态估计结果产生很大误差。为了进一步减小误差,微软亚洲研究院在 ICCV 2019 发表的一篇论文中,提出了基于跨视角信息融合的 3D人体姿态估计方法(Cross View Fusion for 3D Human Pose Estimation)。

发布时间:2019-10-30 类型:深度文章

ICCV 2019丨微软亚洲研究院精选论文解读

ICCV 2019 正于10月27-11月2日在韩国首尔举行。微软亚洲研究院有15篇论文入选本届 ICCV,内容涵盖空间注意力机制、图像深度估计、医学图像配准等多个前沿主题。本文将为大家介绍其中的5篇论文。

发布时间:2019-10-29 类型:深度文章

ICCV 2019丨 RepPoints: 替代边界框,基于点集的物体表示新方法

现有的物体理解方法几乎都是基于边界框的表示方法,难以描述物体更加细粒度的几何信息。在即将召开的 ICCV 2019上,微软亚洲研究院的团队发表论文 “RepPoints: Point Set Representation for Object Detection”,介绍了一种基于点集来替代边界框的物体表示新方法,能够学习到更丰富、更自然的物体表示。

发布时间:2019-10-24 类型:深度文章

基于关系网络的视觉建模:有望替代卷积神经网络

最近两年,自注意力机制、图和关系网络等模型在NLP领域刮起了一阵旋风,基于这些模型的Transformer、BERT、MASS等框架已逐渐成为NLP的主流方法。这些模型在计算机视觉领域是否能同样有用呢?近日,微软亚洲研究院视觉计算组主管研究员胡瀚受邀参加VALSE Webinar,分享了他们最近的一些相关工作。他们的研究以及同期的一些其它工作表明这些模型也能广泛地用于视觉基本元素之间关系的建模,包括物体与物体间、物体与像素间、以及像素与像素间的关系,特别是在建模像素与像素间关系上,既能与卷积操作形成互补,甚至有望能取代卷积操作,实现最基本的图像特征提取。

发布时间:2019-07-12 类型:深度文章