新闻中心

排序方式

基于关系网络的视觉建模:有望替代卷积神经网络

最近两年,自注意力机制、图和关系网络等模型在NLP领域刮起了一阵旋风,基于这些模型的Transformer、BERT、MASS等框架已逐渐成为NLP的主流方法。这些模型在计算机视觉领域是否能同样有用呢?近日,微软亚洲研究院视觉计算组主管研究员胡瀚受邀参加VALSE Webinar,分享了他们最近的一些相关工作。他们的研究以及同期的一些其它工作表明这些模型也能广泛地用于视觉基本元素之间关系的建模,包括物体与物体间、物体与像素间、以及像素与像素间的关系,特别是在建模像素与像素间关系上,既能与卷积操作形成互补,甚至有望能取代卷积操作,实现最基本的图像特征提取。

发布时间:2019-07-12 类型:深度文章

CVPR 2019 | 基于密集语义对齐的行人重识别模型:有效解决语义不对齐

行人重识别(Person Re-identification),也称行人再识别,旨在利用计算机视觉技术实现基于图片或视频的行人匹配和检索。深度学习的发展极大地推动行人重识别性能的提升。然而在实际应用中,行人图片面临诸多问题,如行人图片分辨率低、人体姿态和拍摄视角差异大、障碍物遮挡等。很多因素会导致不同图像在空间上语义不对齐,进而影响行人重识别的性能。为此,微软亚洲研究院和中国科学技术大学在CVPR 2019上共同提出了行人重识别模型DSA-reID,尝试借助密集语义提升行人重识别的性能。

发布时间:2019-07-05 类型:深度文章

对话港科大教授权龙:为什么三维重建才是计算机视觉的灵魂?

在“全民计算机视觉”的今天,其发展历程却鲜少有人追溯。梳理研究的过去将能让我们更好地探索未来。权龙教授为我们介绍了三维重建的历史发展与应用前景,也为大家在研究学习、职业选择等方面给出了一些实用建议。

发布时间:2019-06-25 类型:深度文章

CVPR 2019 | 微软亚洲研究院7篇精选论文解读

计算机视觉顶会CVPR 2019于6月15-21日在加州长滩举行。微软亚洲研究院共有21篇论文入选本届CVPR,覆盖了姿态估计、对象检测、目标跟踪、图像编辑、3D形状生成、高效CNN等多个计算机视觉领域的热门话题,本篇文章选择了其中7篇进行介绍。

发布时间:2019-06-18 类型:深度文章

微软发布Windows Vision Skills预览版,轻松调用计算机视觉API

微软近期发布了Windows Vision Skills预览版,目前包含物体检测、人体骨架检测、情感识别等API。有了Windows Vision Skills,无需了解复杂的计算机视觉知识,你就可以轻松调用API解决一些计算机视觉问题。

发布时间:2019-06-13 类型:深度文章

CVPR 2019 | 告别低分辨率网络,微软提出高分辨率深度神经网络HRNet

对于视觉识别中的区域层次和像素层次问题,分类网络(如ResNet、VGGNet等)学到的表征分辨率比较低,在此基础上恢复的高分辨率表征空间区分度仍然不够强,使其在对空间精度敏感的任务上很难取得准确的预测结果。为此,微软亚洲研究院视觉计算组提出高分辨率深度神经网络(HRNet),对网络结构做了基础性的改变,由传统的串行连接高低分辨率卷积,改成并行连接高低分辨率卷积,通过全程保持高分辨率和对高低分辨率表征的多次信息交换来学到丰富的高分辨率表征,在多个数据集的人体姿态估计任务中取得了最佳的性能。

发布时间:2019-05-21 类型:深度文章

全息显示、空间锚点以及计算机视觉的未来

从世界上第一台计算机到我们今天生活中不可或缺的智能手机,计算机的形态发生了天翻地覆的变化。在未来的某一天,我们能不能将计算机像戴眼镜一样戴在头上?微软混合现实设备HoloLens为我们揭示了一种新的可能。在这篇文章里,Marc Pollefeys教授为我们讲述了HoloLens背后的黑科技与他对未来计算机的愿景。

发布时间:2019-04-19 类型:深度文章

CVPR 2019分享会论坛实录丨2019最值得期待的计算机视觉问题有哪些?

4月2日,微软亚洲研究院创研论坛CVPR 2019论文分享会在清华大学圆满落幕。20余位论文作者在分享会现场进行了报告宣讲,30多篇论文进行了海报展示与交流,还有一场精彩的圆桌论坛,就计算机视觉领域值得关注的前沿问题、发展方向、人才培养等热点话题进行了讨论。

发布时间:2019-04-10 类型:深度文章

微软全新视频索引器:机器帮你轻松看懂视频

如何对海量的视频进行索引标记?微软的研究人员在Azure视频索引器中增加了“多模态主题推断”功能。利用基于监督深度学习的模型,以及无监督的维基百科知识图谱,使得视频索引器可以理解媒体文件中的内部关系,准确高效地提取视频中的关键词,帮助用户更好地挖掘内容的价值。

发布时间:2019-02-01 类型:深度文章

一文尽览近似最近邻搜索中的哈希与量化方法

最近邻搜索算法能够帮助人们在海量数据中快速搜索到有效内容,但是想要将其应用于实际,则需要解决如何缩短搜索时间的问题。本文将为大家介绍两种减少搜索时间的方法。基于哈希的近似最近邻搜索的方法通过设计和优化哈希函数,减少计算的次数,从而缩短搜索时间。基于量化的近似最近邻搜索方法则通过聚类把向量集聚成若干类,每类里面的向量用对应的类中心来近似。

发布时间:2019-01-11 类型:深度文章