图灵奖得主John Hopcroft谈人工智能教育

2019-05-29 | 作者:微软亚洲研究院

编者按:5月10日,“中国高校人工智能人才国际培养计划”2019国际人工智能专家论坛暨2019微软新一代人工智能开放科研教育平台合作论坛在微软亚洲研究院召开。论坛上,图灵奖得主John E. Hopcroft以“人工智能教育”为题,从历史与现状出发解读了当前人工智能教育面临的问题,并对更好的解决方案进行了深入探讨和展望。


John E. Hopcroft,图灵奖得主,美国科学院、美国工程院、美国艺术与科学院三院院士,中国科学院外籍院士

很高兴今天能来这里演讲,我想谈谈教育和我们正在经历的一些革命。我们经历了农业革命、工业革命,如今正在经历一场信息革命。这些革命都对人类生活和社会产生了深远的影响,信息革命对人类社会的影响堪比农业和工业革命。

首先我想谈谈教育的必要性。这张图展示了人类历史上已发生的一系列革命,从智人的进化开始。智人是人类的祖先,他们在真正进化成人类前的大约一百万年就存在。

在智人第一次进化时,他们以采集和狩猎为生,又过了数千年,农业出现了,团体开始形成,社会也随之建立,农业革命对人们的生活产生了巨大的影响。但在农业革命和工业革命之间,教育的需求非常少,儿童只向父母学习,而且通常是向父亲学习耕种。

但随着工业革命的到来,农业自动化开始了。教育突然变得重要起来,包括高中教育和部分大学教育。在美国,工业革命前从事农业的人口高达98%,而工业革命后,从事农业的人口只剩3%,大量人口涌向了制造业。

而在信息革命之后,仅仅接受大学教育是否足以让一个人找到一份好工作?我认为,未来的工作必然要求复杂的教育。我们还要反思更多的问题,包括信息革命将在何时发生?工作人口将占总人口数的多少?找到一份好工作需要哪些知识和技能?社会将如何保持稳定?如果25%的人口就能满足所有商品和服务的生产,那么如何让其余的人口从事有意义的活动?这些问题将对社会非常重要。

我认为信息革命的推动者正是机器学习。我们正在这个领域取得许多进展与突破。在过去,我们通过大量数据来训练机器,但现在,我们开始想办法在没有训练数据的情况下开展机器学习。

我想给你们讲一个我女儿的故事。四岁的一天,她坐在沙发上看一本书,我指着书里各种各样的照片告诉她图里的物品是什么,其中一张是消防车。一天我们出去散步,她看见街上有一辆消防车,她说:“爸爸,一辆消防车!”我们人类从成千上万图片中学习,就像我女儿,起初要从许多照片中学习,现在她通过一张照片学到了什么是消防车。图像识别也是同样的,比如,街上的照相机能告诉你走进商店时有谁路过,商店里还可能有一个屏幕,能够识别出你并展示你喜欢的产品。

这就是世界的变化。有了语音识别,我们交谈的对象就不仅限于人。如果你在开车,你可以和车说话。而有了自然语言处理,我们可以识别出哪些网络评论是水军发布的,又比如当要通过一项美国法律时,我们把法律公布出来征求意见,人们发表了数万条意见,而你不需要逐一阅读,我们可以用计算机程序把它们分类,告诉人们是正面还是负面的,然后你再去阅读。

此外,自动驾驶的汽车和卡车正在替代一些普通车辆,美国有300万卡车司机,这些工作和制造卡车的600万个工作岗位都将消失。当我还是个孩子的时候,电梯里有电梯操作员,因为我们不知道如何自动让电梯上下楼层。而一旦我们将这项工作自动化,这些职业就消失了,而且不会再回来。

信息革命也会带来相似的影响。在今天的汽车厂里,汽车都在流水线上自动装配,通常只有少量员工在看仪器,而在二十到三十年前,组装汽车需要大量劳动力。除了将体力工作自动化,今天我们也将语音识别、面部识别等更多智力任务自动化,比如当我在Delta航空公司办理登机手续时,他们正在用面部识别减少登机牌的使用,在医学诊断方面,某些情况下机器将比人类更精准,等等。

一个重要的转机出现在2012年的ImageNet大规模视觉识别挑战赛。ImageNet数据集包含120万张图片、1000种类别标签。在2012年以前,视觉识别的误差率约为25%,但在2012年,AlexNet在准确率上进步了10%。这是一个巨大的飞跃,此后人们把这项技术应用到了医药、商业和制造业中。预计今年的错误率会下降到4%以内,而一个受过训练的人类的准确率约为5%,深度学习在视觉识别上已经能够比人类做得更好。

正因如此,我们将非常需要教育,尤其是计算机科学教育。对学生来说,机器学习的基础理论、概率论与数理统计等知识都非常重要,因为我们面临海量的数据,你必须知道怎样做才能获得有意义的答案。除此之外,我认为还有两件点非常重要,那就是隐私和安全。

接下来我想谈谈中国的教育,中国政府十分了解增加教育投入的重要性。要让中国的企业持续发展,提高人们的生活水平,就必须提高教育水平,培养更多的人才。

现在中国教育面临的一个问题是,大约20年前,家长们开始意识到,他们的孩子需要大学文凭才能找到一份好工作。因此在过去20年里,中国大学生以每年100万的速度高速增长,这意味着中国每年都要开设50所康奈尔大学规模的学校,教学人员也从30万增长到100万。

从社会稳定的角度来说,我认为这是对的,而现在他们正在将关注点转移到提升教育质量上。这是一个巨大的转变,但也存在很多问题。比如,现在的高校青年教师在申请科研基金和发表论文方面有很大的压力,因为这些都是评价指标。政府也在想办法解决这些问题,比如将评价标准改为教学水平,由国际专家对教师的专业声誉做出评价等等。

我主持了一个国际咨询委员会,向国务院总理提供改善中国教育的建议。我们认为改变中国大学校长的评估标准是十分重要的。我们也开始评估中国前50所大学的计算机科学教育,招募了约40名优秀教师旁听这些大学的计算机课程并评分,评估指标包括讲座内容、是否吸引学生等。除此之外,大学获得的专业奖项数量也能侧面反应计算机科学的课程质量。我们也为优秀教师提供了高额的奖金以鼓励教学和科研。

我们也正在创建研究中心。现在的教师将会再工作30年,重要的是,新教师要真正专注于教学和职业发展。例如,每所大学的博士生名额都有限,新上任的助理教授常常要争取博士生名额。我们的做法是为青年教师提供有竞争力的薪资,要求他们每学期开设一门课程,并以教学水平和国际专家的专业认可作为晋升标准。另外,我们认为不应该只根据论文发表数量获取推荐信,而应该问推荐人这样几个问题,比如“这位教员做了哪些事?为什么这些事很重要?”

值得注意的是,现在许多学生对教育的关注点局限于狭义的技术教育,这使他们能在职业生涯的开端找到一份好工作,但他们有40年职业生涯,还需要许多其他的知识和技能。大多数学生未来会去公司工作,这意味着他们需要团队合作,所以在学校里设立要求团队合作的课程是必要的。一些学生可能会去政府部门工作,那么他们最好对历史、社会学和相关学科的知识有所了解。

因此,我们建议高校实行灵活的选课设置,比如学生必须自由选修三门人文科学或社会科学课程,但不具体规定是哪些课程,让学生自由选择。在美国教育中,本科招生通常不会将学生录取到一个具体的系,而是录取到工程、艺术、科学等学院,在完成第一年的学习、初步了解各个专业后,才会让学生选择专业。但这也导致了不同专业的不同规模,在康奈尔大学,通常10%的学生会选择计算机科学,而我们学院只有40名教员(全校共1500位教师),承担了整个学校10%的教学任务。

不过,随着其他院系拥抱数字时代,他们能与我们共同承担一部分教学任务,因为数字化不仅仅在计算机科学领域发生。我们需要理解正在发生的一些变化。在我的职业生涯中,计算机科学曾是一门内生性很强的学科。而今天我们在增强计算机的应用性,我们对编译器、编程语言、算法、数据库充满兴趣,各个学院也正在探索计算机应用,计算机科学开始变得很像应用数学。

我也想谈谈应用和基础研究,这里有一个重要的问题。大学的使命是培养下一代人才,而不仅仅是做研究。

在二战后,美国做了一个基础性的决定。他们先定义了基础研究和应用研究,这个定义与研究的基础程度无关,与研究的动机和目的有关,如果是根据国家或者公司的需要而进行的研究,就是应用研究,目的是解决一个非常具体的问题,而且通常不会产生基础层面的创新;基础研究则是研究者出于好奇而进行的研究。美国决定在大学里只做基础研究,不做应用研究。所以在20世纪60年代,美国大学放弃了应用研究。例如,斯坦福大学创建了斯坦福国际咨询研究所,并将所有的应用研究转移到该研究所,现在除了“斯坦福”的名字之外,两个机构没有任何关系。类似的还有麻省理工学院与林肯实验室。基础研究的重要性在于,人们出于好奇对不同的方向进行自由探索,而且在基础研究的过程中,偶尔会有人离开,去业界创造一个全新的产业,进而创造数百万个就业机会,所以这个决定是美国进行的最好的投资之一。

当我得到国家科学基金会的资助时,我不一定要做资金规定范围内的研究,因为他们的主要目的是资助我培养下一代的研究人员。在资助结束时,大学必须给出一份报告说明资金去向,但我不必告诉他们我做了什么研究,因为他们不关心细节,他们感兴趣的是下一代人才的培养。

大家可能会问,如果不在意研究成果,那为什么我们要招聘教师并根据研究质量对他们进行评估呢?因为一名教师的职业生涯大约是40年,我们希望他们在整个职业生涯中保持活跃,与该学科领域的变化和发展保持同步。所以当我们评估一名教师时,我认为我们不应该只根据研究成果来进行评估,而要去看他们是否好奇,是否在探索新的方向,研究兴趣是否广泛,以及是否能在40年的职业生涯中都保持活跃。

最后,感谢给我这个演讲机会,谢谢。

标签