研究团队

研究团队

北京研究组 工程与基础架构组 Engineering Foundation Group 工程与基础架构组汇聚了众多优秀的工程师、项目经理和设计师,旨在…

北京研究组

工程与基础架构组
Engineering Foundation Group

工程与基础架构组汇聚了众多优秀的工程师、项目经理和设计师,旨在构建微软亚洲研究院各研究团队之间共享的基础架构,以推动各个领域的创新研究,并助力研究院快速推进具有全球影响力的前沿研究和开源项目。

专注领域:以数据为中心的工程领域的关键挑战;面向未来的设计产品交互;更智能、更安全和更节能的研究基础架构。

异构计算组
Heterogenous Extreme Computing Group

异构计算组致力于推动面向终端设备的AI部署和推理技术发展,从而让用户可以随时随地获得高质量、可负担、可靠的AI服务。异构计算组的研究涵盖从AI算法设计到设备端部署运行的全流程。

研究方向:面向端侧设备(手机、可穿戴设备、物联网设备)的AI模型设计(可伸缩、轻量、低能耗模型设计等),AI推理系统和编译器设计(高性能算子生成、异构硬件推理加速、能耗控制等),AI加速器自动化设计(针对稀疏模型、超大模型的推理加速器等),端云结合的AI持续学习(针对具体部署场景的AI模型优化等),探索更多AI技术与用户应用的结合(游戏、渲染、虚拟等)。

智能云端系统组
Intelligent Cloud and Edge Group

智能云端系统组致力于研究云端一体的人工智能基础架构及其关键系统问题,以提供高效、易用、跨平台的人工智能训练和部署技术。小组的多项研究成果发表在OSDI、NSDI、ATC等顶级学术会议,其中主要成果均以开源项目的形式对外开放(如NNFusion、Antares、Tutel等),部分技术也被应用在诸如Xbox、Bing、Office等微软产品线中。

研究方向:深度学习编译框架、新型人工智能加速硬件的优化、面向新型负载(如图神经网络、MoE、科学计算等)的系统设计、新型智能场景(如游戏、多媒体等)的软硬件协同优化等。

智能多媒体组
Intelligent Multimedia Group

智能多媒体组致力于通过基础理论研究的突破及算法和系统技术的创新,构建无缝且高效的多媒体应用和服务。研究主要涉及多媒体系统的核心问题,如智能多媒体内容的感知、处理、分析、服务、以及通用性。目前,智能多媒体组的研究重点是通过视频理解与内容生成,为智能云和智能边缘的多媒体服务提供前沿技术。

研究方向:检测、跟踪、分割、人体姿势估计、行为识别、定位制图、场景理解、多模态分析、语音处理、视频生成等。

网络图形组
Internet Graphics Group

网络图形组致力于推进三维可视计算与交互技术的发展,旨在打破真实世界与虚拟世界的界限,突破三维内容生产的瓶颈,从而使每个人都可以轻松便捷地创作三维内容,利用VR和MR技术丰富和扩展人类的工作与生活。

网络图形组与微软产品部门在图形图像算法、图形平台系统和图形内容捕捉等方面有着广泛的合作。

研究方向:基于深度学习的渲染与可视内容生成、三维几何建模与处理、三维人体与表情动作捕捉与生成、VR与MR系统等。

机器学习组
Machine Learning Group

机器学习组在理论、算法、应用等不同层面推动机器学习领域的学术前沿发展,在“排序学习”领域的先锋性研究促进了机器学习与信息检索之间的融合,并推动其成为各大搜索引擎和推荐系统的核心技术。机器学习组在顶级会议和期刊上发表了数百篇高质量论文,相关技术也被广泛应用在微软产品中,贡献了上百项技术专利。机器学习组发布了LightGBM、Qlib、MARO、FOST、MASS、Muzic、LightLDA、Multiverso、微软图引擎等知名开源项目。机器学习组还致力于将技术应用在现实场景中,借助AI技术帮助企业实现数字化和智能化转型。

研究方向:深度学习、强化学习、分布式机器学习和机器学习理论等。

多媒体计算组
Media Computing Group

多媒体计算组致力于推进多媒体技术与计算技术的演进。通过有效理解及虚拟化网络中计算设备的输入与输出,实现诸如人—机—云的智能交互和资源的无缝共享等新的计算体验。通过探索人工智能在实时、智能、完全沉浸式会议和在线协作体验方面的潜力,实现基于神经网络的端到端多媒体处理与通信框架。

研究方向:音视频处理与分析、多媒体内容生成、音视频压缩与通信、计算机视觉、用户界面、多媒体系统等。

多模态计算组
Multi-Modal Computing Group

多模态计算组主要从事多媒体理解和人工智能的基础研究与应用实践。

研究方向:图像和视频的内容理解和生成、基于三维结构的物体识别、以及社交多媒体分析等。

多模态交互组
Multi-Modal Interaction Group

研发以语音识别与合成、光学字符识别与文档图像理解、数字墨水分析与识别、手势识别等为代表的先进多模态交互技术与业界领先产品解决方案是多模态交互组一直坚持的使命。目前的研究聚焦于视觉文档智能方向,研究课题涵盖通用光学字符识别(OCR)、通用数学表达式识别(Math OCR)、通用表格理解、通用文档图像版面分析、通用信息抽取以及文本图像合成等。相关技术已经在微软多个重要产品中部署应用,包括Azure Read认知服务、Azure表单识别服务和Power Platform中的AI Builder等,赋能客户解锁图片与PDF文档中的有价值信息,实现流程自动化、知识挖掘以及其它产业相关文档智能应用。

研究方向:多模态交互技术

“从天马行空的思考,到创新发明,到以任务为导向的研究,再到应用到现实世界中——这就是我们的研究精神,也是激励着我们每天早上走进研究院的动力。”

——微软全球资深副总裁、微软研究院负责人Peter Lee

自然语言计算组
Natural Language Computing Group

自然语言计算组专注于自然语言处理、多模态人工智能和通用人工智能领域的理论、模型、算法和应用的研究和创新。在自然语言处理、机器学习和人工智能顶级会议和期刊上发表了数百篇高质量论文,并对微软产品做出了重要贡献,包括基础预训练模型、必应搜索、广告、Windows、Office和Azure等。

研究方向:自然语言理解与生成、机器翻译、智能问答、语音处理、代码智能、文档智能、多模态理解与生成、大规模预训练模型等。

网络与基础设施组
Networking Infrastructure Group

网络与基础设施组从事计算机网络各个方面的基础研究,包括但不限于研究构建智能云基础架构和机器学习网络的新范例。我们强调分析和实证方法,建立运行系统以验证理论结果并完善实验工作的系统原理。

研究方向:云计算、分布式机器学习、数据中心网络、无线和移动系统等。

社会计算组
Social Computing Group

社会计算组主要从事计算机科学与社会学、心理学、认知科学等领域结合的跨学科研究,旨在基于用户在各种异构平台上产生的大规模行为数据,深入理解用户,并为用户提供负责任、智能和个性化的在线服务。

社会计算组聚集了众多在社会计算、普适计算与数据挖掘等领域有深厚积淀的专家,并与微软产品团队有着广泛的合作关系。

研究方向:推荐系统、图数据挖掘、隐私保护、鲁棒机器学习、负责任的语言理解与生成、可解释机器学习等。

系统研究组
Systems Research Group

系统研究组围绕计算系统方向开展基础和应用研究,使命是探索现代计算工具、平台和信息基础设施在设计和实现中所需的新原则,为工业界和学术界的相应领域提供领先的设计思路及系统实现。系统研究组长期致力于高水平的系统研究与实践,曾先后获得过系统及相关领域顶级会议如OSDI、EuroSys、ICSE的最佳论文奖,多项研究成果已在Bing、Azure、Office等微软产品中得到应用。系统研究组还与国内外研究机构长期合作,共同创立了ChinaSys以促进中国在系统相关领域的发展。

研究方向:新型存储系统、面向新型计算设备的编译架构、新型工具链、大规模异构系统的管理等。

可信系统研究组
Trustworthy Systems Research Group

可信系统研究组专注于研究构建安全、可靠、有数据和隐私保护能力、可验证、负责任、向善、普惠、可持续发展的计算机系统所涉及的关键科学和技术问题。可信系统研究组的基础研究和产品转化工作涵盖云、区块链、IoT、Web、AI等方向,并不断将研究拓展到新兴系统和应用上。如今,计算机系统与每个人的日常生活深度交织,已成为人类社会和经济运行不可缺少的核心基础设施,是人类应对全球重大卫生、环境、安全、发展等问题时的重要工具,我们的愿景是通过可信系统的研究工作,推动微软的产品以及整个计算机产业更好满足由此带来的新需求和新挑战。

研究方向:云、区块链、IoT、Web、AI等

视觉计算组
Visual Computing Group

视觉计算组的研究涵盖了计算机视觉研究领域的整个范畴:从数学理论到现实应用,从物理系统到软件开发,从低层次的图像处理到高层次的图像理解。视觉计算组汇聚了计算机视觉领域众多优秀的研究员和工程师,相关研究成果已经对许多重要应用产生了深刻影响,例如人脸检测、追踪、识别,图像搜索,物体检测、追踪、识别,以及机器人避障和导航等。

研究方向:计算机视觉理论与应用

上海研究组

人工智能与机器学习组(上海)
AI/ML Group (Shanghai)

人工智能与机器学习组(上海)专注于机器学习领域的理论研究和应用,致力于推动深度学习基础技术的发展,并将最新的机器学习技术应用于医疗健康和可持续发展等领域,解决真实场景中的问题,例如病理性语音、语言和行为的分析、脑电信号处理、生物医疗知识图谱挖掘以及基因序列分析。

研究方向:神经网络结构设计、图神经网络、序列学习、强化学习、矢量图识别和特定领域的语言和语音处理等。

系统组(上海)
System Group (Shanghai)

系统组(上海)专注于研究适用于人工智能和实时视频流等新兴计算密集型任务的高效技术。我们的工作包括基于硬件成本预测的高能效DNN模型设计和架构搜索,稀疏和动态模型的深度学习框架和编译器改进,基于Kubernetes的AI平台的资源调度等。同时,系统组(上海)致力于实现视频算法和通信系统的协同设计,以在非理想网络和有限计算能力的约束下最大限度地提高服务质量(更高的视频质量,更低的响应延迟等),降低服务成本。

研究方向:高效深度学习系统、神经网络增强的视频流系统、云和边缘计算领域的广泛研究(如矢量数据库,资源虚拟化等)。

无线组(上海)
Wireless Group (Shanghai)

无线组(上海)主要从事新型无线通信和传感技术的开发及应用,旨在通过创新技术,在 5G 时代加快通信传输速率、降低延迟和扩大无线覆盖。同时,无线组(上海)还利用无线信号实现无线感知并开发各种感知应用,包括健康监测、环境传感、物联网设备的新用户界面等。未来,无线组(上海)将进一步应用无线技术加速人工智能/机器学习系统,应用人工智能/机器学习系统发展智能无线网络。

研究方向:无线通信、传感技术

研究中心

科学智能中心
AI for Science Asia

微软研究院科学智能中心(成立于2022年7月)致力于通过在机器学习和自然科学交叉领域取得新的基础性研究进展,彻底改变人类理解自然世界以及与自然世界互动的方式,展现机器学习与自然科学交叉融合的诱人新能力。微软研究院科学智能中心是一个全球团队,成员来自英国、中国和荷兰等多个国家。这些成员由机器学习、计算物理、计算化学、分子生物学、软件工程和其他学科领域的世界级专家组成,同心协力解决该领域中一些最紧迫的挑战。

研究方向:面向自然科学的人工智能模型、基于人工智能的科学计算、基于人工智能的科学发现。

产业创新中心
Industry Innovation Center

产业创新中心致力于发展与企业的战略合作,在真实世界的关键场景中,通过联合技术创新,实现共同发展,引领产业未来。产业创新中心以微软亚洲研究院前沿研究与技术转化的成果和经验为基石,聚集一批既擅长技术创新又具备行业知识的“接地气”的计算机科学家和工程师,聚焦智能金融、供应链优化、能源转型、医疗健康等产业的核心需求,帮助其实现价值重塑。

研究方向:智能预测、决策优化、异常检测、数字仿真等。

理论中心
Theory Center

微软亚洲研究院理论中心致力于为大数据和人工智能技术提供基础理论支持。通过加强跨学科跨方向的交流合作,以更具原则性和系统性的基础研究建立坚实的计算和人工智能的理论框架,从而推动大数据和人工智能技术的健康发展。

研究方向:数据驱动的优化、深度学习和强化学习理论、动态学习理论、可信计算理论、网络信息传播理论及算法等。