新闻与深度文章

编者按:当 AI 智能体走出实验室,在真实世界中执行任务时,只有知识还远远不够。但如今的许多智能体即使拥有正确的信息,可在实际操作中仍频频失误,任务完成率令人堪忧。微软亚洲研究院的研究员对此提出了一个新方法 UI-Evol,旨在帮助计算机使用智能体(Computer Use Agent)进化知识,使智能体不仅“知道该怎么做”,还要真正“做得到”。在该方法的加持下,智能体在实际执行能力、稳定性和可靠…

编者按:2022年11月,ChatGPT 的诞生开启了人工智能的新纪元。在过去几年的时间里,人工智能在全球的医疗健康领域有怎样的应用?未来又有哪些机遇?近日,在微软研究院最新一期的播客节目中,微软联合创始人、盖茨基金会主席比尔·盖茨及 OpenAI 研究负责人 Sébastien Bubeck 与微软全球资深副总裁、微软研究院院长、微软全球研究与创新孵化负责人 Peter Lee 对此进行了探讨,…

编者按:当前,大语言模型在代码生成领域已展现出惊人的能力,但能否胜任真实软件开发中的“新增功能实现”任务,仍是一个关键未解的问题。对此,微软亚洲研究院与北京大学联合发布了首个专注于仓库级新功能实现的基准测试 FEA-Bench,填补了评估体系中的重要空白。该测试集构建于真实开源项目的 pull request (合并请求),覆盖1400多个高质量任务,系统评估了主流大模型在复杂工程任务中的表现。F…

编者按:在传统的机械设计和制造流程中,参数化 CAD 文件一直是概念与制造之间的关键桥梁。然而,工程师们长期以来一直被复杂的 CAD 特征树和繁琐的建模流程所困扰。近年来,随着大语言模型(LLMs)的飞速发展,AI 在多个领域展现了其强大的能力。本文将介绍三项微软亚洲研究院的最新研究——FlexCAD、CADFusion 和 CAD-Editor。它们分别从统一建模框架、视觉反馈机制和自然语言编辑…

编者按:当人工智能遇上创意设计,一场视觉革命正悄然展开。人工智能图像生成技术为人们提供了无限的灵感源泉。然而,从实验室走向实际应用,从激发灵感到完美创作,在编辑自由度和可控性需求日益增长的当下,人工智能生成图像的技术仍然面临诸多挑战。 微软亚洲研究院的研究员们在文本生成图像领域的两项最新研究成果,为促进相关技术的实际应用开辟了新的道路——匿名区域 Transformer (Anonymous Re…

编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉。 6月10日至17日,全球计算机视觉领域的顶尖学术盛会 CVPR 在美国田纳西州纳什维尔举办。我们通过两期“科研上新”为大家带来多篇微软亚洲研究院入选 CVPR 2025 的精选论文解读。第一期分享的内容主要围绕生成模型与扩散技术等方向的研究…

编者按:在 MBTI 测试风靡的当下,人们热衷于探寻自己究竟是充满活力的“快乐小狗”,还是敏感细腻的“流泪猫猫”。当大模型逐渐成为人们生活中不可或缺的助手时,你是否会好奇:这些大模型有着怎样的特性,或者说,它们秉持何种不同的价值观? 微软亚洲研究院最新发布的 Value Compass Benchmarks(价值观罗盘评估中心),可以帮助用户以更科学、系统和可靠的方式,对大模型的价值观展开评估。同…

编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉。 6月10日至17日,全球计算机视觉领域的顶尖学术盛会 CVPR 将在美国田纳西州纳什维尔举办。我们将通过两期“科研上新”为大家带来多篇微软亚洲研究院入选 CVPR 2025 的精选论文解读。第一期的分享内容是主要围绕生成模型与扩散技术等方向…

编者按:在视觉多模态大语言模型的快速发展中,幻觉问题一直是研究者们关注的焦点。模型生成与输入图像不一致甚至虚假的内容,不仅影响用户体验,也阻碍了多模态技术在实际场景中的落地。对此,微软亚洲研究院和香港中文大学的联合研究团队从直接偏好优化(DPO)入手,提出了 On-Policy Alignment (OPA)-DPO 算法,可通过确保训练数据与初始策略(reference policy)的一致性,…