新闻中心

排序方式

渣画质视频秒变清晰,“达芬奇”工具集帮你自动搞定

编者按:是否时常“考古”一些老电影、老动漫来回忆旧日时光?你是否也有一些珍贵的录像,带你重温过去的美好?然而,我们已经习惯了高清体验,回头再看曾经的旧影像,画质或许“渣”的让人不忍直视。在这个多媒体内容爆发的时代,人们对视频内容的需求愈加强烈,视频素材的创作、增强及再创作技术也有了大幅提升。尽管利用现有的视频修复工具,视频编辑者也能让视频变得更高清,但其前提条件是需要有超高性能配置的电脑,并付出视频时长几倍甚至几十倍的时间成本,即便如此,结果可能仍不尽如人意。

发布时间:2022-06-23 类型:深度文章

CVPR 2022 | 一键解锁微软亚洲研究院计算机视觉领域前沿进展!

编者按:国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一。微软亚洲研究院也在4月成功举办了 CVPR 2022 论文分享会。今天,我们为大家精选了8篇微软亚洲研究院被 CVPR 2022 收录的优秀论文,带你探索计算机视觉领域的热点前沿!欢迎感兴趣的读者阅读论文原文。

发布时间:2022-06-22 类型:深度文章

NaturalSpeech模型合成语音在CMOS测试中首次达到真人语音水平

编者按:AI 合成语音如今已经屡见不鲜,然而在用户听来却不能让人产生与真人对话和阅读般的沉浸感。不过,微软亚洲研究院和微软 Azure 语音团队近日联合推出的全新端到端语音合成模型 NaturalSpeech,在 CMOS 测试中首次达到了真人说话水准。这将近一步提升微软 Azure 中合成语音的水平,让所有合成声音都惟妙惟肖。

发布时间:2022-06-10 类型:深度文章

ACL 2022 | NLP领域最新热门研究,你一定不能错过!

编者按:作为自然语言处理领域的国际顶级学术会议,ACL 每年都吸引了大量学者投稿和参会,今年的 ACL 大会将于5月22日至5月27日举办。值得注意的是,这也是 ACL 大会采用 ACL Rolling Review 机制后的首次尝试。在此次会议中,微软亚洲研究院有多篇论文入选,本文精选了其中的6篇进行简要介绍,论文主题涵盖了:编码器解码器框架、自然语言生成、知识神经元、抽取式文本摘要、预训练语言模型、零样本神经机器翻译等。欢迎感兴趣的读者阅读论文原文。

发布时间:2022-05-19 类型:深度文章

3D视频会议系统VirtualCube:相隔万里也如近在咫尺般身临其境

编者按:常言道:“眼睛是心灵的窗户”,眼神交流所传达的信息也可以进一步提升人们的沟通效果。然而,随着视频聊天、视频会议逐渐成为常态,大家不禁要问,我们有多久没有与同事、朋友、家人确认过眼神了?

发布时间:2022-05-18 类型:深度文章

非自回归生成研究最新综述,近200篇文献揭示挑战和未来方向

编者按:近年来,由于并行的快速推理能力,非自回归生成在自然语言处理、语音处理等领域展示出了其特有的优势,并日益成为生成模型的研究热点。为了促进非自回归生成模型的发展,微软亚洲研究院与苏州大学的研究员们共同撰写了综述论文“A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond”,回顾了非自回归生成在神经机器翻译以及其他任务中的发展,并对非自回归生成的未来提出了展望。

发布时间:2022-05-13 类型:深度文章

ICLR 2022 | 微软亚洲研究院深度学习领域最新研究成果一览

编者按:ICLR(International Conference on Learning Representations)是国际公认的深度学习领域顶级会议之一,众多在人工智能、统计和数据科学领域以及计算机视觉、语音识别、文本理解等重要应用领域极其有影响力的论文都发表在该大会上。今年的 ICLR 大会于4月25日至29日在线上举办。本届大会共接收论文1095篇,论文接收率32.3%。今天,我们精选了其中的六篇来为大家进行简要介绍,其中研究主题的关键词包括时间序列、策略优化、解耦表示学习、采样方法、强化学习等。欢迎感兴趣的读者阅读论文原文,一起了解深度学习领域的前沿进展!

发布时间:2022-04-26 类型:深度文章

WWW 2022 | 一文解读互联网技术国际顶会最新方向

编者按:国际万维网会议(Proceedings of the ACM Web Conference,简称 WWW)是互联网技术领域最重要的国际会议之一。今年的 WWW 将于4月25-29日在法国里昂以线上会议的形式召开。本届会议共收到了1822篇长文投稿,论文录用率为17.7%,微软亚洲研究院也有多篇论文入选。今天我们为大家精选了其中的六篇进行简要介绍,研究主题关键词包括个性化新闻推荐、图异配性建模、多层推荐推理、日志解析、基于因果学习的可解释推荐、增量推荐算法等,欢迎感兴趣的读者阅读论文原文,一起了解互联网技术领域的前沿进展!

发布时间:2022-04-19 类型:深度文章

如何亿点点降低语音识别跨领域、跨语种迁移难度?

编者按:随着深度学习的不断发展,语音识别技术得到了极大的提升,同时为人们的日常生活提供了许多便利。然而,一个语音模型的训练并非易事,因为语音数据天然存在着获取难、数据标注耗时昂贵的问题,而且还会面临模型漂移、标注数据不足等难题。因此,迁移学习技术对于语音数据非常重要。为了解决语音识别的跨领域和跨语言问题,微软亚洲研究院机器学习组和微软(亚洲)互联网工程院提出了跨领域和跨语言语音识别的 CMatch 和 Adapter 方法。这两项技术是如何提升模型迁移学习性能的?他们又利用了哪些创新技术?让我们从今天的文章中来获得答案吧。

发布时间:2022-03-31 类型:深度文章

如何将学术经历整合为求职简历?CS求职必备的5个小技巧

走出校园初次求职,表述简洁的职位要求或许会让你一头雾水,不知从何下手。如何将你的学术经历“翻译”为适用于产业界招聘的语言?这篇微软研究员 Alaina Talboy 博士的手记将手把手教你读懂招聘潜台词,并将自己的经历进行精确匹配。

发布时间:2022-03-31 类型:深度文章