计算机视觉

更多文章

基于递归注意力模型的卷积神经网络:让精细化物体分类成为现实

微软亚洲研究院多媒体搜索与挖掘组的研究员们提出“将判别力区域的定位和精细化特征的学习联合进行优化”的构想,搭建了基于递归注意力模型的卷积神经网络结构:它可以更精准地找到图像中有判别力的子区域,采用高分辨率、精细化特征进行描述,提高物体分类的精度。

观点 | 计算机视觉,路在何方
“微软亚洲研究院创研论坛——CVPR 2017论文分享会”上,来自国内外计算机视觉领域学术界、工业界的优秀代表们携各自在CVPR 2017发表的最新研究和技术观点进行了分享,交流。而在此次活动上由微软亚洲研究院主管研究员罗翀主持的圆桌讨论环节中,五位计算机视觉领域的资深专家就目前计算机视觉领域研究中的热门问题给出了各自的见解。

Microsoft Pix:让iPhone拍出自带大师范儿的照片

微软专为iPhone和iPad打造的基于人工智能技术的相机应用Microsoft Pix最近推出了一项新功能,可以自动为随手拍摄的照片增加艺术化风格,模仿陈列在阿姆斯特丹、巴黎和纽约的著名画廊里的绘画杰作及艺术摄影作品。

可变形卷积网络:计算机新“视”界

如何适应图像中复杂的几何形变问题是物体识别的主要难点,也是计算机视觉领域多年来的核心问题。近日,微软亚洲研究院视觉计算组公布了一篇题为“Deformable Convolutional Networks”的论文,在卷积神经网络中引入了学习空间几何形变的能力。

从洪荒到智能——数据驱动的材质属性建模发展历程

机器学习早在10年前就在计算机图形学中被应用,那时,被称之为“数据驱动”方法。今天,来自微软亚洲研究院网络图形组的董悦博士,将基于数据驱动方法,以材质属性建模为例,为我们介绍数据驱动图形学的发展历史。早年间图形学中的机器学习是什么样的?

以数据的名义——浅谈三维几何的处理与分析(下)

三维形状的不同表达和CNN有着不同的结合方式。研究员们希望发明一个对输入鲁棒的三维CNN网络,用来处理纷杂的三维数据。在基于体素的3D CNN基础上,利用八叉树结构压缩存储,并且只在八叉树节点上进行CNN运算,实现了基于八叉树的卷积神经网络,提高了计算效率和信息传播效率,优化了内存占用。

以数据的名义——浅谈三维几何的处理与分析(上)

分析与处理三维形体是计算机图形学中的一个基本任务与研究方向,我们为大家分享来自微软亚洲研究院网络图形组主管研究院刘洋博士的系列文章《以数据的名义--浅谈三维几何的处理与分析(上)》,探讨如何从数据中学习噪声与三维数据之间的复杂关系。

寻亲四余载,微软科技点亮孩子的回家路

2015年,“回家”应用程序在微软举办的 “骇客马拉松”中诞生,它通过微软人脸识别应用程序编程接口寻找走失儿童。同年12月, 微软开始与“宝贝回家”志愿者协会合作,通过人脸识别技术帮助寻找走失儿童。在未来,微软将不断优化“回家”程序,希望帮助更多家庭找回走失的孩子。

从线到面——绘制草图轻松构建三维模型

图形学中有一类构造复杂的三维物体通用方法,绘制界面与造型。用户只需绘制简单、粗糙的线框草图,计算机便能构造符合用户期望的完整三维形状。今天,我们将为大家介绍微软亚洲研究院在促进绘制造型技术表达力和易用性方面取得的进展。

AI 创造艺术风格化:从图片到视频

“AI修图黑科技,Geek也能艺术范”一文介绍微软亚洲研究院关于图片风格化的技术新成果。今天,我们将为大家介绍风格迁移背后的相关技术,详细解读微软亚洲研究院视觉计算组的研究员和实习生们发表的三篇关于艺术风格化的论文。

AI修图黑科技,Geek也能艺术范

去年,艺术画风格的图片处理工具Prisma风靡全球的社交网络,人们可以通过应用让生活照片变身大师级风格图片。近期,来自微软亚洲研究院视觉计算组的三篇论文为我们带来了一些关于图片风格化的技术革新。当风格转移问题转化为图像类别问题能带来什么效果?

行为识别:让机器学会“察言观色”第一步

让机器人“察言观色”是不少电影里出现的场景,那么这项技能是如何实现的呢?微软亚洲研究院副研究员兰翠玲博士带你走进机器察言观色的第一步——行为识别,细说如何通过智能监控和人机交互等方式让机器与人类心有灵犀。

透过视频看世界

人工智能离不开感知,而视觉是我们最主要的感知。而人的感知、学习、认知和活动有80-85%是通过视觉介导的,可见对计算机视觉对人工智能发展的重要性。曾文军博士带我们探讨了视频数据分析理解的应用场景和技术要求、技术发展现状和瓶颈,以及对未来技术发展的展望。

如何做好计算机视觉的研究?

如何在方兴未艾的计算机视觉领域做出一番成就?微软亚洲研究院资深研究员华刚博士的本篇分享从研究本身与计算机视觉领域两个方面,对做好计算机视觉领域的研究提出了自己的建议。

首席研究员童欣:从交互到智能的网络图形

早在15年前,当时的微软亚洲研究院院长沈向洋及副院长郭百宁就决定在研究院里成立互联网图形研究组。15年后的今天,随着互联网的飞速发展,从2D图形到三维内容,图形学研究正向自然世界和虚拟世界间提供更自然的界面和交互方式。

微软识花:精细物体识别是怎么做到的

微软亚洲研究院携手中科院植物所推出“微软识花”app,其智能花卉识别和知识系统将成为你的“花儿百宝箱”。只需拍摄花儿照片或选取手机图库中的花儿图片,由中科院植物所专家标定的庞大花卉数据库将快速、精确地识别花儿,并通过花语、药用价值等信息,讲述关于花儿的小秘密,让你一秒变身识花达人!

Seeing AI:计算机视觉十年磨一剑,打造盲人的“瑞士军刀”

Seeing AI项目通过计算机视觉和自然语言处理来描述一个人的周边环境、朗读文本、回答问题,甚至能够识别他人的面部表情。作为一套视觉辅助工具,Seeing AI让视障人士也能更好地欣赏这个世界的美好。

快速找到手写笔记?你要的就是它!

如何快速找到手写笔记?这个问题可能困扰过很多手写爱好者们。记在笔记本上的笔记合上就再也找不到了怎么办?OneNote不久前推出的手写识别功能就能帮你解决这个问题!记完笔记,拍照上传,之后就能借用OneNote的搜索功能轻松找到哦!这项看起来神奇又简单的功能背后的核心技术便是手写识别OCR。

计算机的“眼”进化到哪一步了

微软全球执行副总裁沈向洋在Ignite 2015大会上做了关于人工智能的主题演讲。在演讲中,作为一名深耕于计算机视觉领域长达25年的研究人员,他讲述了最初进入这个领域进行探索的原由,并与我们分享了微软近期在计算机视觉方面的最新进展。

刷新神经网络新深度:ImageNet计算机视觉挑战赛微软中国研究员夺冠

在美国东部时间12月10日上午9时,ImageNet计算机视觉识别挑战赛结果揭晓——微软亚洲研究院视觉计算组的研究员们凭借深层神经网络技术的最新突破,以绝对优势获得图像分类、图像定位以及图像检测全部三个主要项目的冠军。

用线条解码甲骨文的秘密

不久前,微软亚洲研究院主管研究员王长虎博士论文中就如何通过针对甲骨文线条特征来识别甲骨文进行了阐述。目前论文中提出的算法在甲骨文识别中已经非常精准,远超普通用户对甲骨文的识别能力,这一结果让人十分振奋!

动静之间,从视频到语言

不久前,在中国最重要的科幻小说大奖,第26届“银河奖”颁奖典礼上,出现了与以往不同的颁奖嘉宾——微软人工智能机器人小冰不仅成为国内首个机器人颁奖嘉宾,而且还引发了现场众多科幻作家与科幻迷对人工智能的思考。

OCR:慧眼读世界

把手机摄像头对准菜单上的法语菜名,屏幕上实时显示出翻译好的中文菜名;将全世界图书馆的藏书转化为电子书;街景车游走于大街小巷,拍摄街景的同时也从街景图像中自动提取文字标识,让地图信息更丰富更准确……这些场景的背后有一个共同的关键技术——OCR (Optical Character Recognition),光学字符识别。

微软研究员在ImageNet计算机视觉识别挑战中实现里程碑式突破

近期,微软亚洲研究院视觉计算组所开发的基于深度卷积神经网络(CNN)的计算机视觉系统,在ImageNet 1000挑战中首次超越了人类进行对象识别分类的能力。

计算机视觉:让冰冷的机器看懂这个多彩的世界

长时间来,让计算机能看、能听、能说一直是我和计算机界同行们孜孜以求的目标。耕耘在计算机视觉领域十余年,赋予计算机一双慧眼,让它也能看懂这个多彩的世界,一直是激励着我在这条充满挑战的道路上前行的重要力量。虽然计算机暂时还无法像电影中所展现的那般智能,但已经取得了很多令人惊喜的成绩。