排序方式

视觉物体跟踪新进展:让跟踪器读懂目标语义信息

视觉物体跟踪(Visual Object Tracking)是视频分析任务中的一个基础问题。从2016年起,深度学习和卷积神经网络开始被大量运用在物体跟踪算法中。其中,全卷积孪生网络成为了近两年最炙手可热的框架,但它训练出的网络主要关注外观特征而无视语义信息,会让跟踪器犯一些匪夷所思的错误。由此,微软亚洲研究院网络多媒体组提出使用双重孪生网络进行视觉物体跟踪的方案SA-Siam,不仅能够关注语义和外观信息,且加入注意力模块使网络关注特定的语义信息,在VOT任务的权威数据集上效果良好地实现了“能跟住”、“不跟错”和“实时跟”的目标。

发布时间:2018-09-13 类型:深度文章

ECCV 2018 | 迈向完全可学习的物体检测器:可学习区域特征提取方法

物体检测是计算机视觉领域的重要问题之一,现今大部分计算机视觉应用都依赖于物体检测模块,例如无人车应用中对于周围环境的感知,安防支付等应用中的人脸识别,新零售应用中的商品识别等等的第一步都是提取图像或视频中的感兴趣物体,也就是物体检测。

发布时间:2018-08-30 类型:深度文章

段子手之间的battle,微软AI来做裁判

近日,在位于纽约州詹姆斯敦的国家喜剧中心,一场新型互动展览吸引了众多参与者,其中的压轴环节Laugh Battle是一项要求参与者相互讲段子逗笑对方的奇特比赛。在大家玩的不亦乐乎的同时,你一定想不到——这项比赛的幕后裁判,竟是微软Azure认知服务。

发布时间:2018-08-07 类型:深度文章

CVPR 2018:GAN、自动驾驶等技术和应用正强势来袭

计算机视觉领域的顶级会议CVPR 2018上个月在美国盐湖城举办。微软亚洲研究院实习生鲍建敏参与了这次CVPR 2018之旅,为我们带回了本次大会上新鲜出炉的计算机视觉前沿研究和他的参会成果分享。

发布时间:2018-07-26 类型:深度文章

基于交错组卷积的高效深度神经网络

卷积神经网络在近几年获得了跨越式的发展,虽然它们在诸如图像识别任务上的效果越来越好,但是随之而来的则是模型复杂度的不断提升。越来越深、越来越复杂的卷积神经网络需要大量存储与计算资源,因此设计高效的卷积神经网络是非常重要和基础的问题,而消除卷积的冗余性是该问题主要的解决方案之一。那么如何消除卷积的冗余性呢?前不久,微软亚洲研究院视觉计算组资深研究员王井东博士做客“AI科技大本营”,为大家讲解发表在 ICCV 2017 和 CVPR 2018 上的研究——基于交错组卷积的高效深度神经网络。

发布时间:2018-07-04 类型:深度文章

华刚:教计算机“看”世界

在计算机科学领域中,计算机视觉研究人员担任着一项基础性的任务——他们让机器学会“看”世界。这正是微软首席研究员华刚博士和他的团队所做的事。随着私人机器人、自动驾驶汽车和无人机等设备我们在日常生活越来越常见,让机器拥有视觉能力是非常重要的。在这个访谈中,华刚博士将为我们介绍计算机视觉研究在图像识别、视频理解和计算机艺术方面的最新进展。

发布时间:2018-07-03 类型:深度文章

数据驱动设计:从学习特征到学习算法

人工智能许多问题的本质是搜索一个函数的最优解,那么如何确定一个最佳的搜索策略就成为了研究者们想要解决的问题。本文中,微软亚洲研究院视觉计算组研究员辛博和David Wipf向我们介绍了如何通过学习的方法找到最优搜索策略:将数据驱动的特征衍生到数据驱动的算法设计,让算法学会优化或学会如何学习。这一概念对机器学习领域不仅有很重要的理论价值,还产生了很多实际作用。这项工作入选了NIPS 2017口头报告(Oral)。

发布时间:2018-02-27 类型:深度文章

书单 | 计算机视觉的修炼秘笈

微软亚洲研究院计算机视觉组资深研究员王井东博士为大家推荐计算机视觉领域的经典书目,书单分为综合篇、几何篇、机器学习篇和经典读物四大类。

发布时间:2018-02-06 类型:深度文章

梅涛:深度学习为视觉和语言之间搭建了一座桥梁

视觉和自然语言处理长期以来是两个独立的课题,而深度学习技术的出现建立了计算机视觉和自然语言处理之间的连接,为Image QA及Image Caption带来了突飞猛进的发展。在本文中,来自微软亚洲研究院的资深研究员梅涛将带领大家回顾视觉与语言领域的研究进展。

发布时间:2017-07-13 类型:深度文章