新闻中心

排序方式

IJCAI 2018:聚焦强化学习的学习效率

7月16日至19日,人工智能顶级会议IJCAI在瑞典斯德哥尔摩郊外的国际博展馆召开。本次IJCAI大会共收到投稿3470篇,相比去年有37%的增长,最后共接收710篇,其中46%的通讯作者来自中国,华人在人工智能浪潮中的力量可见一斑。

发布时间:2018-08-14 类型:深度文章

ICML 2018 | 模型层面的对偶学习

很多人工智能任务都具有对偶的性质,例如中文到英文翻译和英文到中文翻译、语音识别和语音合成等。基于此,微软亚洲研究院在2016年提出了对偶学习,利用任务互为对偶的特点从无标注的数据中进行学习。事实上,对偶性不仅存在于数据层面,也存在于模型的层面。因此微软亚洲研究院在ICML 2018上提出了一个全新的角度——在模型层面来研究对偶学习。模型层面的对偶学习能够利用一个模型来解决一组对偶任务,该方法在神经机器翻译和文本分析两个任务上都被验证了其有效性。

发布时间:2018-07-10 类型:深度文章

分布式深度学习新进展:让“分布式”和“深度学习”真正深度融合

近年来,作为人工智能发展迅速的领域之一的深度学习在NLP、图像识别、语音识别、机器翻译等方面都取得了惊人的成果。但是,深度学习的应用范围却日益受到数据量和模型规模的限制。如何才能高效地进行深度学习模型训练?微软亚洲研究院机器学习组主管研究员陈薇和她的团队基于对机器学习的完整理解,将分布式技术和深度学习紧密结合在一起,探索全新的真正合二为一“分布式深度学习”算法。

发布时间:2018-07-06 类型:深度文章

基于交错组卷积的高效深度神经网络

卷积神经网络在近几年获得了跨越式的发展,虽然它们在诸如图像识别任务上的效果越来越好,但是随之而来的则是模型复杂度的不断提升。越来越深、越来越复杂的卷积神经网络需要大量存储与计算资源,因此设计高效的卷积神经网络是非常重要和基础的问题,而消除卷积的冗余性是该问题主要的解决方案之一。那么如何消除卷积的冗余性呢?前不久,微软亚洲研究院视觉计算组资深研究员王井东博士做客“AI科技大本营”,为大家讲解发表在 ICCV 2017 和 CVPR 2018 上的研究——基于交错组卷积的高效深度神经网络。

发布时间:2018-07-04 类型:深度文章

ICML 2018 | 训练可解释、可压缩、高准确率的LSTM

长短时记忆网络(LSTM)是序列建模中被广泛使用的循环结构,LSTM利用门结构来控制模型中信息的传输量。但在实际操作中,LSTM中的门通常都处于“半开半关”的状态,没有有效地控制信息的记忆与遗忘。为此,微软亚洲研究院机器学习组提出了一种新的LSTM训练方法,让模型的门接近“二值化”——0或1,可以更准确地去除或者增加信息,进而提高模型的准确性、压缩比以及可解释性。

发布时间:2018-07-03 类型:深度文章

“可解释性”OR“准确性”?压缩深度神经网络模型让你两者兼得

在机器学习的世界里,准确性和可解释性总是不可兼得:复杂的模型准确但令人费解,简单的模型容易理解也容易出错。微软研究院首席研究员Rich Caruana在他数十年的职业生涯中花了很多精力来探索这个问题,在这个访谈中,他为我们分享了一个更精简、更可解释的“压缩”模型,使“黑匣子”般的机器学习过程更加透明。

发布时间:2018-06-12 类型:深度文章

ICLR 2018论文 | Learning to Teach:让AI和机器学习算法教学相长

4月30日至5月3日,ICLR 2018(International Conference on Learning Representations 2018 )在加拿大温哥华进行。此次大会上,微软亚洲研究院机器学习组发表了最新研究成果“Learning to Teach”,他们探索出一种新的让机器学会自动化教学的方法,进而提升数据利用率和模型性能。

发布时间:2018-05-03 类型:深度文章

现代罗塞塔石碑:微软提出深度学习框架的通用语言

微软近期提出了深度学习框架的通用语言——repo1.0,我们希望通过构建这一深度学习框架“罗塞塔石碑”,让研究者们能够在不同框架之间轻松运用专业知识,并且实现不同开源社区之间的合作。文中讲解了基准深度学习框架的训练结果和相应的经验教训,并给出了repo1.0 完整版GitHub地址。

发布时间:2018-03-20 类型:深度文章

深度学习引擎的终极形态是什么?

1月17日,院友袁进辉博士回到微软亚洲研究院做了题为《打造最强深度学习引擎》的报告,分享了深度学习框架方面的技术进展。报告中主要讲解了何为最强的计算引擎?专用硬件为什么快?大规模专用硬件面临着什么问题?软件构架又应该解决哪些问题?以下是报告的核心内容整理,希望能对你有所帮助。

发布时间:2018-01-23 类型:深度文章

借助机器学习提高CRISPR基因编辑准确率

基因编辑技术CRISPR就像是一种纳米级的“针线包”,可以在特定位置上对DNA进行剪切和修改。为了使CRISPR的操作更加准确,研究员们开发出了一套借助机器学习来让CRISPR减少“脱靶效应”的计算工具——Elevation。目前,Elevation以及另外一款用于预测在靶效应的补充工具Azimuth一起发布在微软Azure上供大家免费使用,同时也以开源的形式向公众开放。

发布时间:2018-01-12 类型:深度文章