排序方式

大咖云集!微软年度科研盛会在关注什么?

微软研究峰会2022将于10月18日至20日在线举行。在为期三天的会议中,每天都将以一个主题演讲开启并展开深入讨论,包括探讨深度学习对科学发现的潜在影响;如何利用技术使医疗更精准、更普惠;基础技术的发展如何使未来的云计算成为可能。三大主题将带你共同开拓科技的无限可能!

发布时间:2022-09-23 类型:深度文章

微软年度科研盛会Research Summit 2022开启注册!

当前,我们正在经历一波又一波计算机技术的突破,这些突破几乎改变了我们生活的方方面面。人工智能让我们的开发和创造方式产生了变革,人类语言技术彻底改变了医疗专业人员的工作流程,深度学习加速了我们理解和预测从原子到星系规模的自然现象的能力。与此同时,云计算的基础也在历经着一场彻头彻尾的重塑。

发布时间:2022-09-15 类型:深度文章

像编辑文本一样编辑语音,可能吗?

编者按:如今在各种社交网络平台上发布的视频,因拍摄便捷、可实时分享、互动交流等特点而深受大众喜爱。视频深刻影响和改变了人们观察世界、记录生活和表达情感的方式。然而,现在市面上许多视频或音频剪辑软件为了满足用户需求尽管拥有丰富的功能,但操作却很复杂,很多简单的剪辑任务都还需要在软件中逐帧对照确定剪切时间点。对于以语音为主要背景声音的视频,如线上会议录像、演示视频、vlog 等,如果我们能通过编辑文本的形式,直接编辑音视频中的语音内容,让音视频的编辑自动根据文本完成,那么将大大降低音视频的编辑难度,提高创作者的效率。为此,微软亚洲研究院的研究员们研发了一个基于文本的语音编辑系统。本文将详细介绍这个基于文本的语音编辑系统和研究员们研发的语音合成及填充词检测技术。

发布时间:2022-09-15 类型:深度文章

通用多模态基础模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统”

编者按:近年来,基础模型(foundation models,也被称为预训练模型)的研究从技术层面逐渐趋向于大一统(the big convergence),不同人工智能领域(例如自然语言处理、计算机视觉、语音处理、多模态等)的基础模型从技术上都依赖三个方面:一是 Transformers 成为不同领域和问题的通用神经网络架构和建模方式,二是生成式预训练(generative pre-training)成为最重要的自监督学习方法和训练目标,三是数据和模型参数的规模化(scaling up)进一步释放基础模型的潜力。

发布时间:2022-08-30 类型:深度文章

邓攀的“贪心”算法:从生物跨界到计算机是什么体验?

编者按:科研之路并非繁花似锦,很多时候是在一条没有脚印的道路上探索未知。科研之路应该怎么走?如何抓住机遇实现转弯?微软亚洲研究院主管研究员邓攀在以《人生的“贪心”算法》为题的演讲中,分享了自己从本科毕业到现在一路走来的经历与收获。从生物跨界到计算机,邓攀是如何做到“内心有谱,丝毫不慌”的?遇到机会,她又是如何竭尽全力把握住每一个可能的?一起来看邓攀怎样编写了自己人生的“贪心”算法吧!

发布时间:2022-08-18 类型:深度文章

微软亚洲研究院与CCF携手十六年,打造国际化学术共同体

编者按:从1992年到2022年,微软扎根中国30年,与中国的信息产业共同发展壮大。而伴随着微软在中国的不断成长,微软亚洲研究院也已发展成为具有世界级影响力的计算机基础和应用研究机构。能够取得这样的成绩,除了微软亚洲研究院一直对科研秉持“长期主义”、持续创新突破外,也离不开与全球顶级高校、科研机构及企业的合作。其中,微软亚洲研究院与中国计算机学会(CCF)的合作已有十六载,双方不断推动领域内的交流合作,营造新型健康的学术生态体系,一起见证了中国科技行业的繁荣。

发布时间:2022-08-10 类型:深度文章

“推荐系统” 值得一读的五本书

编者按:随着科学技术的飞速发展,数据资源呈现海量化、多元化的特征,但人们的生活也面临着信息冗余和过载的问题。如何在网购时挑选到心仪的商品?如何在出行中找到吃喝玩乐的推荐?如何在纷繁的资讯中找到感兴趣的内容…… 在大数据时代,人们日常的工作休闲都离不开推荐系统(Recommender Systems)的助力。

发布时间:2022-08-05 类型:深度文章

AI、机器学习在材料科学研究中能发挥哪些作用?

编者按:近年来,越来越多的实践证明,AI 是一项可以用于发现规律的关键技术,除了工程技术领域,AI 也为自然科学提供了新的科学发现工具。科学家们利用 AI 技术、基于大量高通量数据分析,不仅能加速实验进程,甚至还可以从数据中总结和发现尚未被人类知晓的科学规律。微软亚洲研究院很早就看到了这一趋势,并在过去几年中,陆续开展了 AI+生物学、AI+环境科学、AI+物理学等方向的研究。

发布时间:2022-08-05 类型:深度文章

如何高效、精准地进行图片搜索?看看轻量化视觉预训练模型

编者按:你是否有过图像检索的烦恼?或是难以在海量化的图像中准确地找到所需图像,或是在基于文本的检索中得到差强人意的结果。对于这个难题,微软亚洲研究院和微软云计算与人工智能事业部的研究人员对轻量化视觉模型进行了深入研究,并提出了一系列视觉预训练模型的设计和压缩方法,实现了视觉 Transformer 的轻量化部署需求。目前该方法和模型已成功应用于微软必应搜索引擎,实现了百亿图片的精准、快速推理和检索。本文将深入讲解轻量化视觉预训练模型的发展、关键技术、应用和潜力,以及未来的机遇和挑战,希望大家可以更好地了解轻量化视觉预训练领域,共同推进相关技术的发展。

发布时间:2022-07-28 类型:深度文章

文档智能多模态预训练模型LayoutLMv3:兼具通用性与优越性

编者按:企业数字化转型中,以文档、图像等多模态形式为载体的结构化分析和内容提取是其中的关键一环,快速、自动、精准地处理包括合同、票据、报告等信息,对提升现代企业生产效率至关重要。因此,文档智能技术应运而生。过去几年,微软亚洲研究院推出了通用文档理解预训练 LayoutLM 系列研究成果,并不断优化模型对文档中文本、布局和视觉信息的预训练性能。近期发表的最新的 LayoutLM 3.0 版本,在以文本和图像为中心的任务上有了更加出色的表现,让文档理解模型向跨模态对齐迈出一大步!

发布时间:2022-07-26 类型:深度文章