IBM研究院发布2019预测:2019年,值得信赖的人工智能将成为焦点
2018年底,。在IBM Think 2019上,IBM研究院专场介绍了在推进人工智能、扩展人工智能和构建可信人工智能方面的工作,并提出了“AI就是新IT”的观点。实际上随着人工智能全面嵌入信息基础架构,人工智能与信息基础架构之间的界线已经越来越模糊。打造可信人工智能,就是构建可信的信息基础架构,进而为未来的数字经济打下坚实的基础。
激活人工智能的网络效应
MIT数字经济研究计划(MIT INITIATIVE ON THE DIGITAL ECONOMY,MIT IDE)是MIT Sloan管理学院发起的研究项目,旨在研究如何在数字经济时代发展繁荣。MIT教授MICHAEL SCHRAGE在2016年发起了一个IDE研究方向:网络效应,即亚马逊、阿里、Google、Apple、Facebook、Uber、Airbnb等平台的真正成功之道。今天,AI就是下一个平台。
什么是“网络效应”?简单理解:用户的参与越多,就能迅速产生更高的价值和有价值的体验;创造的价值越多,就会产生更多的用户以及创新的用途。对于AI来说,“网络效应”更加明显。AI与谷歌搜索一样,使用的人越多其性能就越好。但相对谷歌搜索来说,AI面临的一大问题就是可信任性。由于今天的人工智能更多是以开源软件的形式为各企业、政府和组织机构所使用,而人工智能算法本身也是“黑盒子”,因此要引发AI的“网络效应”还欠缺信任机制。
Google、Facebook、Amazon、IBM以及Microsoft在2016年发起成立了Partnership on AI。作为一家非赢利性组织,Partnership on AI旨在汇集全球不同的声音,以保障AI在未来能够安全、透明、合理地发展,让世界更好地理解AI的影响。截止2018年底,Partnership on AI共有来自13个国家的80余家成员,除创始成员外还包括苹果、Intel、埃森哲、nvidia、三星、百度等巨头以及超过50家非赢利性组织成员。
作为Partnership on AI的创始成员之一,IBM长期以来一直关注人工智能的安全、透明、可信赖以及合理发展。通过积极的呼吁以及促进各方对话,IBM研究院对2019年的人工智能预测之一为:2018年,许多组织通过建立道德咨询委员会来应对数据泄露和消费者隐私问题,增加了对“信任支柱”(算法公平性、可解释性、稳健性、透明度)的研究投入,以及为社会福利部署AI做出了更多的努力;在2019年,将看到这些努力会成为公司如何构建、训练和部署AI技术的核心。
构建可信的人工智能
IBM特别注重将对AI的信任研究转化为实际产品和平台,同时强调鼓励技术团队的多样性和包容性,以确保充分的声音和观点指导技术进步。
当前,对于AI可能存在的安全、透明、偏见等普遍性问题,很容易造成人们对于AI的不信任。IBM认为,这在很大程度上是因为所创建和被开发出来的AI服务,缺乏相应的开发说明。因为基于深度神经网络的AI算法,其算法本身是一个“黑盒子”,难以用数学的方式说明算法到底是怎么来的、如何运行的以及结果能否确定等,因此IBM研究院提出了Factsheets for AI services(AI服务的说明)。
就像营养药的药品说明一样,AI服务的说明文档十分重要,但也需要遵循一定的文档规格,例如需要说明AI服务的算法是如何创建、测试、训练、部署和评估的。IBM认为,对于AI服务说明文档的标准化和及时发布,有助于业界建立对于AI服务的信任。IBM研究院向2019年ACM美国计算机协会FAT*专业会议(专注于算法的公平、可靠和透明主题)提交了论文,论述了AI供应商应该如何提供一致性说明来增强对AI服务的信任,并提供了初步的建议,包括系统运行、训练数据、底层算法、部署测试和结果、性能指标、公平和可靠性检查、目标用例、维护及再训练等内容。
IBM认为一个可信任的AI系统,需要遵循几个基础原则:公平性(Fairness),即AI系统应该采用不带偏见的数据集和模型,从而避免对于特定群体的不公平;健壮性(Robustness),即AI系统应该安全和可靠,不会被篡改,也不会受被“污染”的训练数据集影响;可解释性(Explainability),即AI系统所提供的决策或建议,应该能够被用户和开发者所理解;可追踪(Lineage),即AI系统的开发、部署、维护等可被追踪,能够在生命周期范围内被审计。
除了提出“AI服务说明”文档的基础原则、初始规格及内容建议外,IBM认为后续值得的研究包括如何把“AI服务说明文档”自动化的嵌入AI软件的构建、开发和运行环境中,这样就不需要人工撰写这些说明文档了。此外,“AI服务说明文档”还可自动化的发布到基于区块链的网络上,这样“AI服务说明文档”就不可被篡改。
当然,IBM在可信任的AI系统方面,还进行了很多研究,其基本的思想就是通过算法和软件,自动化的在AI系统里构建“信任”。例如,IBM在2018年9月发布了AI Fairness 360(AIF360)开源工具,专门用于检查数据集、机器学习模型、最新的算法等是否具有偏见。初步发布的AIF360 Python包带有9种算法,由算法公平性研究社区所开发,用以减轻算法中的偏见。
因果建模让人工智能更加深刻
目前基于深度神经网络算法的AI系统,其原理主要是相关性。也就是训练出一个神经元模型,可以模拟一个数据集的轨迹,这在很大程度上是建立了两个系统之间的相关性。通常这种算法在处理较为确定的问题时比较容易成功。例如模拟和预测图像、语言、语音等,因为图像、语言和语音相对固定,比如一种语言往往只有几种到几十种发音、几千到几万词汇等。
但是在现实的商业应用中,人们期望用AI算法解决更多的开放性问题,就像人脑可以处理很多未知或缺乏经验的问题,因此人们也期望建立更加通用的人工智能系统。这个时候,就需要引入人脑所具备的归纳推理能力,也就是建立数据集之间的因果关系,而不仅仅是相关性。在IBM研究院的2019 AI预测中提到:对现实世界中因果结构的直觉,是人们日常行为和判断不可或缺的,但今天大部分人工智能方法基本上都缺乏对因果关系的深刻应用。
因果推理方法,使AI开发者能够从数据中推断出因果结构,有效地选择干预措施来检验推定的因果关系,并通过利用因果结构的知识做出更好的决策。在2019年,IBM期望因果建模技术成为人工智能世界的核心技术。
因果建模技术(Casual Inference)是归纳推理算法(Inductive reasoning)的一个部分,在过去20年得到了迅速的发展。归纳推理算法是研究如何从局部推理到全局、从过去推理到未来、从特例推理到常规、从可被观察现象推理到未被观察现象等。例如,从听到弹钢琴音乐的声音,推理出有人在弹奏弹琴。因果建模技术因其具有归纳推理的能力,是医药、流行病学和公共健康等领域AI系统的核心目标。
今天,因果建模技术能够解决当前机器学习和AI系统的很多问题,包括机器学习模型的解释、机器学习过程/模型的公平性、基于数据的决策等。针对AI系统的解释、公平、决策理解等,因果建模技术对AI系统能够进行很好的补充。
如今,IBM正在创造下一波基础人工智能技术,从今天的“窄”AI步入“宽”AI的新时代。“宽”AI的特点是能够更广泛地学习和推理,整合不同模式、不同领域的信息,同时更具有可解释性、安全性、公平性、可审计性和可扩展性。未来,在“宽”AI的基础上还将走向通用AI。此外,IBM研究院还AI领域进行了大量前瞻性研究工作,包括对量子计算的研究以及把量子计算应用于处理AI计算任务等。