微软中科大独家创新实践项目任务发布,前沿科研课题等你来挑战!
2021-03-18 | 作者:微软亚洲研究院
对前沿科研课题热情满满,却找不到项目来展现自己的实践才能?
微软中科大创新实践项目,将为你提供最佳的学习成长机会,让你对科研的困惑得到系统化的解答!
通过参与实践,你能够快速了解感兴趣的科研方向,理解掌握相应的基础知识和常用技术手段,以完成编程任务为导向,切实提高动手实践能力,还可以和师兄师姐导师们展开交流,开拓思路和眼界,加深对科研工作的思考!
微软中科大创新实践项目是由微软亚洲研究院与中国科学技术大学合作组织,面向中科大大三本科生的科研实践项目。项目计划于 2021 年 4 月至 6 月间开展,在项目中,同学们将与项目导师和微软亚洲研究院的研究员们共同完成一系列前沿科研课题,学习在机器学习、自然语言处理、计算机视觉、以及人工智能系统等领域的最新研究进展。
时间安排
4 月 7 日
实践项目报名截止
4 月 8 日-4 月 13 日
实践项目开题(线上)
4 月 14 日-5 月 26 日
实践项目开展
5 月 27 日
提交实践项目结题报告
5 月 28 日-6 月 4 日
结题报告评审,评语反馈,证书颁发
▼
具体项目内容如下
快来看看适合你的方向吧!
融合知识的新闻推荐
项目描述
通过本项目,同学们可以系统地了解如何搭建一个融合知识的新闻推荐系统,并学习自然语言处理与推荐系统领域的前沿研究进展。
项目导师:谢幸
涉及领域:社会计算
2. Tagme, https://github.com/marcocor/tagme-python
3. Stanford-NER, https://nlp.stanford.edu/software/CRF-NER.shtml#Citation
4. A Survey on Deep Learning for Named Entity Recognition, https://arxiv.org/pdf/1812.09449.pdf
5. A Survey on Recent Advances in Named Entity Recognition from Deep Learning models, https://www.aclweb.org/anthology/C18-1182.pdf
- 硬件要求:每个学生须有一台单卡 Linux-GPU-Server 一周以上的使用时间,以进行代码调试与模型训练
- 具备机器学习与数据挖掘基础知识;
- 良好的代码编程能力
- (1)调研、梳理命名实体识别(NER)和实体链接(knowledge entity linking)的前沿研究现状,撰写总结汇报;
- (2)基于公开工具包,搭建一个实用的 NER 接口,输入为新闻文本,输出为其包含的知识实体;
- (3)参考开源代码,动手实现并训练一个 NER 模型;
- (4)结合文本和知识实体,训练一个融合知识的个性化新闻推荐模型。
搭建医学文献的英文-中文翻译系统
项目描述
机器翻译的训练需要依靠可靠的双语语料对,而医学领域则相对缺乏足够的语料。目前的通用领域机器翻译已经取得了不错的结果,本项目旨在构建一个可以在生物医学文献中使用的机器翻译系统,从英文文献翻译到中文文献,从而帮助更快速的了解文献的知识。
具体而言,本项目要求从现有的文献网站中爬取足量的文献数据,并尝试构造双语训练数据,通过监督、半监督等技术构建机器翻译系统。本项目希望学生能够了解和掌握实用的机器翻译任务的整体构建流程。
通过本项目,同学们可以系统地了解如何搭建一个完整的机器翻译系统,并学习自然语言处理与深度学习领域的前沿研究进展,以及特定领域的语料获取,训练方法构建等。
项目导师:刘铁岩
涉及领域:机器学习
2. biomedical translation: http://www.statmt.org/wmt20/biomedical-translation-task.html
3. fairseq: https://github.com/pytorch/fairseq
4. Attention is all you need, https://arxiv.org/pdf/1706.03762.pdf
- 硬件要求:每个学生须有一台单卡 Linux-GPU-Serve 一周以上的使用时间,以进行代码调试与模型训练
- 具备机器学习与深度学习基础知识;
- 良好的代码编程能力
- (1)了解、调研机器翻译领域现有的先进技术模型,规划医学机器翻译系统构建的整体流程方案;
- (2)从biorxiv网站中爬取pdf文献,并利用pdf抽取工具对pdf文献的title和abstract,introduction进行抽取,作为需要翻译的文献内容;
- (3)从互联网资源中挖掘可利用的英文到中文的翻译语料,构建训练语料库;
- (4)参考现有的技术方案,提出监督或者半监督等机器翻译训练方法,并尝试构建机器翻译模型;
- (5)参考已有的开源代码工具,动手实现并训练一个可以从英文翻译到中文的医疗文献翻译系统,并对biorxiv爬取的title,abstract,introduction进行翻译查看结果;
- (6)项目总结,撰写整体的实验报告,包括流程方案的整理报告,实验训练的时间统计,部分翻译结果展示(不少于10篇文档)等;
深度学习优化理论与实践
项目描述
通过本项目,可以理解并掌握神经网络的基础知识,常用优化算法的分析手段。更进一步地,可以分析并理解优化算法和神经网络结构之间的相互影响,实践编程实现能力。
项目导师:陈薇
涉及领域:机器学习
- 硬件要求:须有一台单卡 GPU server 两周时间,对实验进行观察
- 具有扎实的数学基础
- 具备代码编程实现能力
- (1)调研常用的随机优化算法(SGD, Adaptive methods)以及它们的理论分析方法;
- (2)神经网络(包括普通前馈网络和卷积神经网络)的宽度和深度对前向传播和反向传播的影响;
- (3) 分析前向信号与反向信号的统计特征,以及不同优化算法参数与神经网络宽度/深度的相互影响,特别是当宽度或深度渐近到无穷时;
- (4)在标准数据集上验证,并尝试加入规范化层和残差链接对优化算法的影响
人工智能系统
项目描述
项目不要求同学完成一个完整的深度学习系统设计和实现。而是要求同学们根据个人兴趣学习人工智能系统这门课程的一章或者几章 (链接见下)来了解计算机系统架构的相关问题,然后完成相应课程实验中的一个。
通过该项目,同学们可以一窥前沿系统设计和实现的大致方法,为以后从事计算机系统和网络相关的研究工作打好基础。
参考链接:https://github.com/microsoft/AI-System
项目导师:杨懋
涉及领域:计算机系统和网络
- 硬件要求:大部分可选项目最低仅需一台PC,某些项目需要多台具有 GPU 的PC/Server,硬件要求示例如下:
https://github.com/microsoft/AI-System/tree/main/Labs/BasicLabs/Lab1
- 掌握编程语言: C/C++, Python;
- 熟悉机器学习基本原理、计算机组成原理;
- 了解计算机体系结构,具备计算机网络基础知识
https://github.com/microsoft/AI-System/tree/main/Labs
经典三维点云重建方法的实践与比较
通过本项目,同学们可以系统了解三维点云重建中的重点课题和算法、掌握经典算法的使用、学习如何构造评测集和掌握算法评测的流程,并为未来基于数据驱动的三维重建打下基础。
项目导师:童欣
涉及领域:计算机图形学
2. A Benchmark for Surface Reconstruction, http://vgc.poly.edu/files/berger/recon_bench/paper/tog.pdf https://github.com/fwilliams/surface-reconstruction-benchmark
3. [Software] MeshLab and it python library, https://www.meshlab.net/ https://github.com/cnr-isti-vclab/PyMeshLab
4. [C++ Library] CGAL https://www.cgal.org/ https://doc.cgal.org/latest/Manual/packages.html#PartReconstruction
- 一台 Windows 或 Linux 计算机(无需 GPU )
- 良好的 C++ 或 python 混合编程能力;良好的阅读英文文献能力
- 阅读阶段:阅读综述文献和特定算法文献。(1 周)
- 编码阶段:基于给定的若干开源算法库,在给定的数据集上,评测不同的算法及参数。(2 周)
- 总结阶段:结合评测结果,撰写并提交评测报。(1 周)
评测算法包含:Screened Poisson Surface reconstruction, Scale-Space Surface Reconstruction, algebraic point set surface.
感知三维的二维图像对抗生成模型实现
扩展项目:基于 pi-GAN 实现 GAN inversion,进而将训练好的 pi-GAN 应用在对真实图像进行视角编辑、三维重建等任务。
通过本项目,学生可以学习对抗生成模型的基本知识并了解领域内最新最前沿的研究成果,提升编码能力、算法理解能力以及问题分析能力;在算法改进或应用方面有突破性发现可向国际顶级会议投稿。
项目导师:童欣
所在组别:计算机图形学
- 硬件要求:每个学生须有一台多卡 Linux-GPU-Server
- 良好的 python 编程能力
- 良好的阅读英文文献能力
- 具备基础的机器学习的知识。
你自己的图形学项目 DIY
通过本项目,学习研究的基本过程,体验研究的流程,并对图形学一个题目有更多的了解
项目导师:童欣
涉及领域:计算机图形学
- 硬件要求:一台PC
- 良好的编程能力
- 良好的阅读英文文献能力
多物体实时跟踪
参考资料:
GitHub - ifzhang/FairMOT: A simple baseline for one-shot multi-object tracking
项目导师:曾文军
涉及领域:计算机视觉
- 硬件要求:须有一台单卡 GPU server (NVIDIA 2080 card +) 两周以上的使用时间,以进行代码调试与模型训练
- Python / Pytorch / Image processing / CV background
视频人体关键点检测
通过本项目,同学们可以系统地学习卷积神经网络、人体关键点检测、视频处理等基础知识,熟悉人体关键点检测的前沿研究以及(附加)解决前沿课题。
项目导师:王井东
涉及领域:计算机视觉
2. https://arxiv.org/abs/2006.15480
3. https://github.com/HRNet/deep-high-resolution-net.pytorch
4. https://github.com/HRNet/HRNet-Bottom-Up-Pose-Estimation
5. https://github.com/HRNet
- 硬件要求:每个学生须有一台 4 卡 Linux-GPU-Server 两周以上的使用时间,以进行代码调试与模型训练
- 具备计算机视觉和深度学习的基础知识
- 良好的编程能力,如 python
- (1)调研人体姿态估计前沿研究现状,撰写总结汇报;
- (2)熟悉并训练提供的单图人体关键点估计模型;
- (3)直接应用训练好的单图人体关键点估计模型到单人视频;
- (4)思考解决检测结果在连续帧中不连贯的问题;
- (5)附加:多人视频人体关键点检测
数字人像传送门
在项目实施中,可以充分利用参考资料中已有的预训练模型,因此本项目对于 GPU 等硬件的需求不高。可以用已有的预训练模型产生我们需要的输出,例如利用在 MSCOCO 上训练的 DeepLab 分割模型得到人像,利用 PlaneNet 生成单幅图像的三维模型,最后用 Deep Harmonization 形成人像与背景的融合。同学们也可以用自己调研到的方法做出更好的结果。
通过本项目,同学们可以对机器学习与机器视觉算法有直观的了解,并掌握其基本原理,通过自己构建的系统可以获取成就感,并培养科研兴趣。
项目导师:吕岩
涉及领域:多媒体计算
2. http://vision.cse.psu.edu/courses/CompPhoto/SingleView3d.pdf
3. https://openaccess.thecvf.com/content_cvpr_2018/papers/Liu_PlaneNet_Piece-Wise_Planar_CVPR_2018_paper.pdf
4. http://www.scan-net.org/
- 硬件要求:一台单卡 Linux-GPU-Server 一周以上的使用时间,用以加深对预训练模型的理解,或自己训练模型。
- 快速深度学习网络框架
- 视觉技术文档搜索调研能力
- 基本图像处理技术
- 熟悉三维透视理论,包括三维、二维坐标之间的转换。
- (1)项目的分步设计和调研,需要同学们找到每个模块相应的技术和文献。
- (2)项目基本步骤实现,可以得到一个简单的传送门输出。
- (3)助教会提示每个模块的更精细算法,根据完成情况加分。每个同学的时间弹性合理实现,使得这个项目生成更精致的效果
- 最终提交一个结题报告和相应的代码文件。
报名方式
符合条件的申请者请填写下方申请表:
https://jinshuju.net/f/a2Ufaq
或扫描下方二维码,立即填写进入申请!