培养一个人类医生至少需要八年,那么人工智能呢?

2016-12-02 | 作者:微软亚洲研究院

一位普通患者的非典型住院之旅

去年,微软亚洲研究院的资深研究员闫峻在北京一家医院做了一场外科手术,手术前后,他在医院住了十天。但当他躺在病床上,想安安静静看上几本书,或者干脆好好补个长觉时,却不断被各种嘈杂的声音打扰。如果你也曾在医院待过一两天,你几乎不会错过这样的场景:忙不过来的医生和不断追问的家属,手忙脚乱。

闫峻躺在病床上,研究者的好奇心让他试图用技术的眼光寻找原因。闫峻分析:“医生资源十分有限,他没有办法将他的知识表达给所有的患者,而由于信息不对称的存在,患者是安全感不够的。患者需要得到医生的专业解释和帮助,这样心里才会有底。”

“提高生产力”这个概念几乎对于每一个微软员工都熟捻于心。当这位微软亚洲研究院的研究员结束了他十天的医院之旅,走出医院时,一个利用已有的人工智能技术帮助医院医生提高生产力的计划在他的脑海里也逐渐萌芽。

知识挖掘与人工智能

闫峻是微软亚洲研究院数据挖掘与企业智能化组的负责人,今年是他在研究院工作的第10个年头。早在2003年,闫峻在北大读博士的第二年开始就以实习生的身份加入了微软亚洲研究院,彼时亚洲研究院刚成立五年,国内互联网和计算机技术发展迅猛。闫峻在博士期间的研究方向是模式识别,其实就是现在广义的机器学习。

近几年,人工智能俨然成为了计算机领域最火热的研究方向,这背后离不开机器学习、大数据和云计算等的共同作用。社会上关于人工智能的讨论始终不绝于耳,人工智能威胁论、人工智能奇点论等等。但无论媒体如何鼓吹,人工智能领域的研究专家基本上都会给你同样的答案:真正的人工智能离我们还很遥远。

目前,人工智能已经能够在一些如图像识别、语音识别、实时翻译等特定的任务上表现优异,但在更深层次的思考、总结、联想、创造等等方面的进展十分有限。此前计算机战胜人类顶级围棋棋手加强了研究者们用机器学习构建计算机智能的信心,诚然,机器学习目前也被视为是通往人工智能一条近路之一。

事实上,知识的挖掘和知识的表述是人工智能里最基础的问题。我们怎么衡量一个人是“智能”的?一方面,我们会说这个人的脑子很灵活,反应很快。另一方面我们会说这个人有很多经验,懂很多知识。对应到人工智能的研究上来,也就是我们需要人工智能本身拥有很多的背景知识,也需要他有很强的推理能力、理解能力和判断能力。目前,闫峻所在的数据挖掘与企业智能化组主要的研究方向便主要聚焦于知识的挖掘,表示与计算,具体来说就是研究如何从不同的数据来源里挖掘出知识,帮助人工智能的其他算法在具体的场景中完成一些特定的任务。

这一次,闫峻想借用自己的研究成果,为医生培养他们自己的人工智能助手,辅助医生完成一些他们无暇顾及的任务,并为患者提供更多的人文关怀。最终的目的是希望这个人工智能医生助手兼学徒有一天能够顺利出师,能像一个真正的医生一样耐心细致的回答病人的疑惑,协助病人的康复,缓解目前的医疗资源紧缺的局面。

培养一个人类医生至少需要八年,那么人工智能呢?

闫峻在病假后的第一次午饭时,就和研究院的同事们聊起了这次住院经历。让他意外的是,几乎每一个同事——甚至比他年纪小很多的90后年轻研究员都表达了强烈的同感,他们的父母或者亲人都或多或少的经历过同样的事情。在那天的午饭上,数据挖掘与企业智能化组的研究员们提出了一个创造性的想法:为医生构建一个人工智能医生助手!

对于人工智能医生助手而言,技术上最关键的一环就是让计算机学会一些必要的医学知识。这恰恰是闫峻博士所在的数据挖掘与企业智能化组所专攻的。闫峻习惯将机器学习知识的过程与人类学习知识的方式相类比,将这个过程分为四个阶段。“就像指导你的孩子一样学知识。” 闫峻形容道。

第一个阶段是人类婴儿出生到上学之前的这个阶段。这个阶段孩子还没有很强的读写和分析问题的能力,更多地是从他的父母或者身边的环境中学习一般性的知识(common sense knowledge),例如糖是甜的,天是蓝的。这种让计算机学会一般性的知识是较为基础的研究工作,机器会从不同的数据源里面学到一些基本的事实和一些基本的关系。与之对应的,不久前数据挖掘与企业智能化组还发布的Microsoft Concept Graph和Microsoft Concept Tagging模型就试图让计算机掌握部分常识。

第二个阶段则是小孩进入学校开始读书直至大学毕业的阶段。这个过程其实人们主要的学习方式是读书,学习书本上的知识。人们在读书的过程中会不断地分析、总结、归纳,将一些知识进行整合和关联,形成系统性的知识体系,我们称之为知识图谱(knowledge graph)。因此在这个阶段,让机器拥有阅读能力是一个非常重要的课题。研究员们让计算机阅读了大量医学学生的必学书目,让计算机从这些文本中获取作为医生助手最基础的医学知识作为储备,并为下一步进医院“实习”做好准备。

第三阶段则是研究生阶段,你会有一个导师,而你学习的方式已经不再是被动的接受书本知识,而是主动地从他人——你的导师那里学习知识了。这种学习方式中师生间有很多互动,学生会主动询问老师解决办法,从机器学习的角度来理解就是“主动学习”。到了这个阶段,研究员们就将这位人工智能助手送到医院的具体某个科室,选择一位医生作为它的“师傅”。进行简单的“拜师仪式”之后,机器人将成为某位医生的学徒。对于机器学徒不懂得问题,会在聚类总结后向导师主动询问来获取知识。

除了主动提问,跟人类的拜师学艺没有什么区别,计算机向师傅学习的最便捷的方式,就是从医生的匿名诊疗记录入手。这里暗藏着医生的经验知识,在医疗信息化的今天,每一位医生看过的病人信息都会以电子化的形式记录下来,包括病人的症状,各项检查结果以及医生的治疗方案。通过对病例的通读与学习之后,这位虚拟学徒便会对这个科室有一个大体的认识,包括常见症状以及诊疗方案等。但这并不意味着这位人工智能助手可以成功出师了,它还需要最后一个阶段的学习。

最后一个阶段人们通常称之为“增强学习”。很显然,知识的更迭日新月异,人们在走出象牙塔之后发现还需要不断地学习此时的学习更多地会依赖于自己经验的积累以及不断的试错。此前AlphaGo所采用的增强学习就是源自这类思想,它会不断尝试各种下法,观察不同的决策带来的可能性,并以此进行经验总结,从而指导他与真人下棋时的决策。在这个阶段,研究员们才让这位“助手”在监督无风险情况下有选择地与患者进行接触。搜集反馈,提升自己的经验和能力。所有的知识学习阶段都是在“终身学习”的框架下不断迭代的进行。

“培养一个医生至少需要八年,但是计算机几乎不眠不休、不吃不喝,并且过目不忘,所以这个学习过程毫无疑问可以大大缩短。” 闫峻博士虽然没有给出一个具体的时长,因为这个很大程度上与人工智能医生所处的科室关系很大,但可以确信的是,培养一个人工智能虚拟医生助手的成本远远低于培养一个真正人类的医生助手。

做些医生做不到的事情

那么,人工智能医生助手究竟能帮医生和病患们做些什么呢?

目前,这项关于人工智能医生助手的医疗项目已经与多家医院和医疗机构合作进行试点,由微软亚洲研究院提供算法和解决方案,对接医院需求,医生与研究员一起从事临床实验。研究员们为每个医生各自搭建了属于他们的人工智能助手。这位医生助手会以微信服务号等多种不同的形式协助医生,并贯穿在治疗前、治疗中和治疗后的整个就医体验中。

其实在许多疾病的治疗,特别是外科手术中,大部分患者遇到的问题是很类似的,机器人可以记忆并理解这些常见的问题,辅助医生事先向患者提问,搜集患者的有用信息,并给出初步的诊疗方案供医生参考,甚至能让患者在与医生见面之前提前做好必备的检查,这样就能大大缩短病人实际面见医生的时间和流程,在有限的时间里,直接切入关键问题。

除了治疗前的提前沟通和治疗途中的有问必答之外,人工智能助手还能做些医生很难细致的面面俱到的事,例如患者随访,收集医疗大数据,增进对病患的人文关怀。

“在和医生合作的过程中,我们发现医生看病的过程跟机器学习也十分相似。” 闫峻博士说。患者介绍病情即提供了机器学习算法的特征维度,接下来,医生根据患者的病情提供治疗方案,即进行预测,这很像训练机器学习的一个算法模型。但最重要的是,医生还需要了解这个治疗方案是否合适、患者有无并发症等问题,如果没有这一反馈,就无法得知医生的预测结果是否成功、没有机器学习需要的重要的数据标注,也就很难用此数据提高整体医疗水平。

“这其实就是一个患者随访的过程。” 闫峻说道。

闫峻在这次与医院的合作过程中认识了不少医生朋友。他了解到,每位医生每年的患者量非常巨大,对每一位患者都进行长期跟踪随访几乎是不可能的,“有的医生平均一年可能做上千台手术”。从学术科研的角度来看,真实有效随访的医疗大数据量很少,影响医疗水平的提高;而从患者的角度来说,由于离开医院后很难得到后续的提醒和关怀,也影响整体的就医感受。

微软亚洲研究院的研究员们也很快为这个问题提供了解决方案。研究员为医生们在各自的人工智能医生助手提供了一个后台,医生能在机器人的后台上设置一些规则、随访问题,例如治疗效果如何、是否有并发症等。在患者给出回复后,计算机便会通过自然语言处理技术来理解患者的回答,并将其变成知识库中的一部分,用来做数据分析。当患者有不理想的治疗结果反馈时,机器人也会及时地将这一信息通知医生。这样医生就能第一时间联系病人进行进一步的治疗,杜绝潜在的风险。特别是对于外地来省会医院等治疗的病人,由于路途遥远,这种自动化定期随访将方便他们与医生构建长期联系的机制。

“这个医疗项目本质上是提升医生和患者之间的沟通效率,让两者能够相互信赖。” 闫峻博士总结道。通过人工智能医生助手,患者在就诊前就可以事先和机器人做一些简单的沟通,大概了解可能的治疗方案,什么时间去医院比较合适,在本地治疗还是需要去更高级的医院。患者能够通过这种前期沟通的方式一定程度上消除这种信息的不对等,患者在治疗过程中有任何疑惑也能得到及时的回答。在治疗之后,患者还能得到医院的长期关怀,研究员们还为这个机器人加入了一些很人性化的功能,例如提醒病人什么时候需要吃药,吃药的剂量;或者在患者生日和特殊节日时,发送祝福,祝愿患者身体健康等。这些对于计算机而言十分简单的任务,对于工作繁重的医生来说却几乎不可能面面俱到的完成。而从医院的角度来看,也可以收集真实的医疗大数据,帮助医院提升整体的医疗水平和科研水平。

最大的困难是没有困难

困难重重。这个词可能是很多人第一次接触到这个项目时的想法。但出人意料的是,闫峻博士却不觉得这个项目有什么“最大的困难”。

对于学术界的人来说,如果想做这样一个项目,最大的困难可能来源于对资金的支持。而对于工业界的人来说,你很难说服自己的老板去做一个和整个公司的商业目标不是完全契合的项目。但这两种困难,对于微软亚洲研究院这样一个十几年如一日深耕计算机基础科研的机构来说,是几乎不存在的。

“我觉得在这里做研究最好的事情是我们没有太多的后顾之忧,也没有什么资金的压力。你只需要证明你做的这件事情本身是有价值的,那就没有人会阻拦你。如果说困难,困难都是研究上面的具体问题,例如数据量太大导致训练算法的过程耗时太久等等。但这种问题是每一个做研究的人都会碰到的。”

类似于人工智能医生助手这类的研究项目在微软还有很多。帮助视觉障碍患者重新“看见”周围世界的Seeing
AI项目,帮助渐冻症患者用眼睛驾驶轮椅的Eye Gaze
Wheelchair项目,用机器学习技术寻找艾滋病毒的核心蛋白计划,利用计算机视觉和机器学习识别癌症病理切片……正是因为有这么多心怀善意与正能量的酷炫极客们正在用技术来改善身边每一个人的计算体验,这个世界才会越来越美好。

目前,这个人工智能医疗助手项目还处于试验的早期阶段,相关的技术还在根据试验的结果不断完善。至于下一步的计划,闫峻博士表示:“希望能将这项技术真正应用到临床上,让每一个医疗环节都能多一份信赖。”

与此相关,为了更好的了解医生和患者的实际需求,也为了有更多的人工智能技术能够服务于中国的医疗健康问题,微软亚洲研究院与中文信息学会语言与知识计算专业委员会联合组织了知识图谱与智慧医疗论坛,于今日在成都展开讨论。期待专家学者们能够为医疗信息化、精准医疗等问题提供更高效,更贴近民生的解决方案!

作者简介

培养一个人类医生至少需要八年,那么人工智能呢?

​ 闫峻

微软亚洲研究院的资深研究员

微软亚洲研究院数据挖掘与企业智能化组的负责人