分享到微博 分享到人人 分享到LinkedIn 分享到Email
微软发布升级版认知工具包,加速深度学习研发

微软今天在开源平台正式发布了2.0版本的认知工具包(Microsoft Cognitive Toolkit,曾用名为CNTK),该工具包曾在微软内部被广泛使用,帮助实现了人工智能领域多个突破。

微软认知工具包2.0完整版用于生产级和企业级的深度学习工作负载,包括了测试版发布以来累积的几百项新功能,简化了深度学习过程,能够与更广泛的AI生态系统实现无缝整合。

更新的2.0版本增加了对Keras的支持,这个用户友好型开源神经网络库受到深度学习应用开发者的广泛欢迎。为Keras编写的代码现在可以直接利用认知工具包所提供的性能和速度,而无需对代码本身进行任何更改。工具包针对Keras的支持功能目前正在公开预览中。

微软认知工具包支持NVIDIA最新版本的深度学习SDK以及高级图形处理单元(GPU)架构(例如NVIDIA Volta),可以加速训练进程。

自从认知工具包测试版于2016年10月发布以来,此项技术已被全球各地的公司和组织用于神经网络的创建和训练,让这些系统模拟科学家推测的人脑学习方式来学习和执行特定任务。

切萨皮克湾

​例如,位于马里兰州安纳波利斯市的切萨皮克(Chesapeake)保护区正在使用这个工具包来创建和训练一个神经网络,它能够以更快的速度创建分辨率为1米的最新土地植被数据集,用于安排整个切萨皮克湾的植被恢复及保护工作。保护区横跨六个州和华盛顿特区,面积约为64,000平方英里。

切萨皮克保护区

​新数据集所含信息量是现有分辨率为30米的数据集的900倍。如果不借助人工智能,需要花费数个月的时间来录入数据、处理图像。新的神经网络将工作流压缩成了一个简单的算法,能够在几分钟内生成这样一张地图。项目合作方表示,这项人工智能技术可以应用于国家级乃至全球性的环境保护工作。

Airdoc是中国的一家医疗智能创业企业,目前这家公司正在使用微软Azure云服务、认知服务和认知工具包来研发一项技术,旨在通过患者视网膜照片快速、准确地检测糖尿病性视网膜眼底病变,而这种糖尿病并发症如果得不到适当治疗可导致患者失明。

起初,微软的研究员和工程师开发微软认知工具包用于加速深层神经网络和其它机器学习模型的训练过程,这些网络和模型被应用于必应视频搜索,以及取得突破进展的、可媲美真人的对话语音识别系统等应用。

后来,微软的研究员们意识到,这些工具也可用于满足人们日益增长的人工智能应用需求,例如语音理解和图像识别。小到初创企业,大到主流科技公司、政府机构、非营利组织和学术机构,这些需求无处不在。

于是,研发团队对这些工具进行了调整,一方面可以让仅具备基本编程技能的技术爱好者在笔记本电脑上即可使用;另一方面也允许高技能开发者进行全面定制以生成新的工具,借助存储于多台最新GPU服务器的海量数据集,加速训练各自的深层神经网络。

除了对Keras的支持外,一同发布的新功能还包括用于模型评估的Java语言绑定,以及对已受训模型进行压缩的新工具——经过压缩的模型即便在智能手机等资源受限设备上的图像识别等应用中也可实时运行。

微软认知工具包是微软​普及人工智能计划的一部分。除了认知工具包外,开发者还可借助微软认知服务和Azure云服务来获取一整套云计算应用,例如易于使用和部署的机器学习应用编程接口(API)。

“起初,人们手工编写各自的数学函数,用私人代码创建各自的神经网络,并设法亲自录入数据进行训练。而现在,面对庞大的数据量,复杂的算法,以及针对不同GPU、CPU和设备进行优化的高昂代价,人们各自独立编写一整套系统已经不太现实,他们需要微软认知工具包这样的工具。” 微软合作伙伴工程经理Chris Basoglu表示。​​​​