CVPR 2023 | 掩码图像建模MIM的理解、局限与扩展
2023-06-20
编者按:掩码图像建模(Masked Image Modeling, MIM)的提出,为计算机视觉模型训练引入无监督学习做出了重要贡献。得益于 MIM …
2023-03-14
编者按:近日,由微软亚洲研究院提出的 Roll-out Diffusion Network (RODIN) 模型,首次实现了利用生成扩散模型在 3D …
2022-07-28
编者按:你是否有过图像检索的烦恼?或是难以在海量化的图像中准确地找到所需图像,或是在基于文本的检索中得到差强人意的结果。对于这个难题,微软亚洲研究院和…
无限视觉生成模型NUWA-Infinity让视觉艺术创作自由延伸
2022-07-22
编者按:此前,微软亚洲研究院提出了多模态模型 NUWA,它可以基于给定的文本、视觉或多模态输入生成图像或视频,并支持多种视觉艺术作品创建任务,包括文本…
2022-06-23
编者按:是否时常“考古”一些老电影、老动漫来回忆旧日时光?你是否也有一些珍贵的录像,带你重温过去的美好?然而,我们已经习惯了高清体验,回头再看曾经的旧…
CVPR 2022 | 一键解锁微软亚洲研究院计算机视觉领域前沿进展!
2022-06-22
编者按:国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一。微软亚洲研究院也在4月成功举办了 CVPR 2022 论文…
Swin Transformer迎来30亿参数的v2.0,我们应该拥抱视觉大模型吗?
2022-03-17
编者按:2021年,获得 ICCV 最佳论文奖的 Swin Transformer,通过在广泛的视觉问题上证明 Transformer 架构的有效性,…
2022-03-03
编者按:此前我们曾提出了一个问题:从文字脚本生成创意视频一共分几步?微软亚洲研究院的开放领域视频生成预训练模型给出了答案:只需一步。现在,我们追问:除…
NeurIPS 2021 | 物体检测与分割的零标签视觉学习
2021-12-01
编者按:随着自监督学习的研究逐步深入,迁移学习的范式已经广泛应用于视觉学习的各个领域,大量的视觉任务都通过使用自监督预训练和有监督微调的方式来部署任务…
ICCV 2021 | 带你了解微软亚洲研究院CV领域前沿进展
2021-10-13
2021年计算机视觉领域顶级会议 ICCV 于10月11日至17日在线上正式召开。此次大会共收到6236篇投稿,其中1617篇论文被接收,接收率为25…