强化学习算法研究实习生
组别简介:
我们关注深度强化学习在算法,应用,以及理论中的研究。在算法研究方面,我们的研究兴趣包括但不限于distributional RL,offline RL, causal RL,imitation learning,non-stationary RL, Bayesian RL, generalization in deep RL等研究方向。在应用研究方面,我们关注与微软的产品业务相关的各种实际应用问题,包括但不限于RL for game playing & testing,RL for logistics, RL for congestion control。在理论研究方面,我们关注deployment efficient RL和tiered RL等研究问题。在过去的几年里,我们在顶级国际会议和期刊上发表了多篇论文,与微软的产品部门保持着密切的合作并且转化了核心技术。我们的研发的麻将 AI 系统 Suphx 成为首个在国际知名专业麻将平台 “天凤”上荣升十段的 AI 系统,其实力超越该平台公开房间顶级人类选手的平均水平。我们既关注如何把deep RL的能力发挥到极致,并且在实际的应用中取得巨大的成功,比如Suphx以及各种RL应用研究;也关注如何从实际应用场景中抽取新的抽象研究问题,在顶级国际会议和期刊上发表高质量的研究工作。
工作职责:
任职要求:
工作时间要求
能获得导师许可并保证至少三个月的实习。
请务必下载并填写申请表(申请表链接:https://www.msra.cn/wp-content/uploads/2017/07/internship_application_form.xlsx)并将其与完整的中英文简历(PDF/Word/Txt/Html形式)一同发送至:MSRAih@microsoft.com 和 lizo@microsoft.com,邮件标题中注明:深度强化学习组_强化学习算法实习生。
要了解更多“明日之星实习生计划”,请访问:https://www.msra.cn/zh-cn/connections/academic-programs/tomorrowstars