微软人脸识别技术领跑业界权威测试

2018-12-17 | 作者:微软亚洲研究院

上班签到、手机解锁、无人超市、公共安防……似乎一夜之间人脸识别技术就成了最红的“黑科技”。“刷脸时代”已经到来,于万千人海中精准辨识人脸,持续提高人脸识别算法的精准度和场景适应性,是业界当下关注的重点。

人脸识别技术和应用的发展突飞猛进,如何客观地评测人脸识别算法?由美国国家标准与技术研究院(简称NIST,National Institute of Standards and Technology)组织的人脸识别测试(简称FRVT,Face Recognition Vendor Test)就是目前业界最权威的测试之一。

NIST FRVT测试分两种:

一对一人脸比对(简称1:1):验证一张人脸是否为已知脸。目前业内算法相对成熟。常见应用有手机解锁、人/证比对、公司门禁等场景。

一对多人脸识别(简称1:N):从N个人中找到目标人。其应用场景更多、更复杂,比如不用刷卡的人脸识别闸机,智能零售中的VIP、二次到店识别,从安防视频中识别逃犯等等。因此,1:N比1:1的难度大,因为每一次人脸查找都会多N倍失误的风险。

2018年,NIST组织了为期一年的1:N算法专项比赛——FRVT 1:N 2018 Evaluation。该比赛分三个赛程,目前比赛已进入第三赛程。与往届1:N测试相比,此次测试数据规模扩大到了千万人的级别,参赛队伍需要应对实际场景中人种、性别、年龄、光线、姿态、清晰度等等多种变化。比赛共吸引了来自全球的45支人脸识别技术队伍参与,其中也包括多个国内人脸识别领域的知名公司,如商汤、旷视等。微软亚洲研究院人脸技术团队代表微软公司参与了此次比赛。

在11月22日公布的第二阶段的测试报告(点击“阅读原文”,查看官方报告)显示,今年参赛队伍的整体水平有很大的提高,有28支队伍提交的算法超越了2014年比赛中性能最好的算法。其中,微软提交的算法在所有127个测试算法中被评为最准确或接近最准确的算法,该算法相比于2014年NEC提供的最准算法,将错误率减少了20倍。本届比赛的难度相比往届提高了不少,NIST在报告中指出其数据库从原来的160万人扩大到了1200万人。在如此超大规模数据库的情况下,微软亚洲研究院提交的算法首位命中率可达99.81%。正在进行的第三赛程比赛结果官方预计将于2019年初公布。

作为一个实用指数非常高的比赛,NIST FRVT主要比拼的是各个参赛团队以下三方面的能力:一,理论模型和算法;二,数据量,谁的训练数据多,谁的系统自然更加‘见多识广’;三,计算资源,GPU、神经网络等等。

为此,微软亚洲研究院人脸技术团队进行了以下工作,以进一步提升人脸识别技术的多方面性能:

扩大人脸数据库,提高数据质量。NIST没有公开其测试人脸数据库,参赛队需自行负责训练数据。训练数据越全面越好,在年龄、性别、种族等方面都要力争均衡。微软亚洲研究院人脸技术团队通过各种人工+机器的方式清洗、标注数据,大大提高了数据质量。

内部测试Benchmark。根据NIST的思路,微软亚洲研究院人脸技术团队搭建了一个包含数十个国家的人脸数据的测试系统对模型选优。搭建该测试系统并不简单,其中,增加高质量观测数据是重中之重。该测试使得微软的算法在不同的维度上表现更加均衡。

充足的计算资源保证择优。除了训练数据以外,模型的网络结构和损失函数共同决定了算法的好坏。微软亚洲研究院人脸技术团队通过大量实验选择最合适的网络结构和深度及各项参数。同时,微软公司内部充足的计算资源也保证团队更好地完成了这个任务。

团队合作。参赛期间,微软亚洲研究院人脸技术团队得到了微软必应(Bing)团队的通力合作和位于美国的微软认知服务产品团队的大力支持。不仅如此,在人脸技术团队内部,几位年轻组员在加入微软不久就很快地成为技术骨干,团队整体、无间地配合对技术的提升非常重要——数据收集与清理、Benchmark测试分析、训练框架底层优化、算法迭代,这些工作环环相扣,需要团队成员齐心协力。

微软亚洲研究院人脸技术团队

微软亚洲研究院人脸技术团队由算法研发工程师(RSDE, Research Software Development Engineer)和研究员们共同组成。团队开发的人脸算法已经在诸多微软的产品上得到了应用,包括:Windows 10 Hello 人脸登录、微软认知服务 Face API,Xbox、Office、必应搜索、微软小冰、Seeing AI等等。

近日,微软公司总裁施博德(Brad Smith)在其博客文章中表示,除了不断提升人脸识别技术之外,微软还注意到业界需要对人脸技术的滥用问题进行更广泛的研究和讨论,并认为2019年业界就必须开始通过法律来规范人脸技术,“良好的初步规范制定将可以让人脸技术在保护公众利益的同时继续更好地发展”。