过去5年,人工智能的发展正出现突破,而2015年已成为人工智能技术标志性的一年。相对于以往,计算机正越来越聪明,而学习速度也越来越快。
谷歌高级研究员杰夫·迪恩(Jeff Dean)表示,人工智能的发展正在加速。为了庆祝过去一年的发展,制定未来一年的发展蓝图,迪恩和许多知名人工智能研究人员本周前往蒙特利尔,参加了神经信息处理系统大会。这一大会从1987年开始,由于人工智能的兴起,过去几年已成为硅谷公司必参加的会议。
2013年,在神经信息处理系统大会上,Facebook CEO马克·扎克伯格(Mar Zuckerberg)公布了该公司在人工智能方面的计划,即成立人工智能实验室。另一家名为DeepMind的创业公司展示了能学习计算机游戏的人工智能系统。该公司随后被谷歌收购。
本周大会上将有许多问题需要讨论。而今年人工智能研究取得的长足进步是由于一系列原因。一方面,云计算基础设施正越来越强大,成本不断降低,这意味着研究人员可以更方便地处理更复杂的信息。此外,研究人员正在获得多种数据集合,以及免费或廉价的软件开发工具。在这些工具的帮助下,以往研究成本高昂的神经网络正变得更普及。
科技行业巨头,例如谷歌、Facebook和微软,在这一过程中扮演了重要角色。这些公司运营着自主的人工智能实验室,在这一领域完成了许多重要研究,并将研究成果公开给学术界。今年,谷歌的研究者在《自然》杂志上发表学术论文,介绍了一种无需人工介入即可自行学习玩Atari游戏的人工智能系统。Facebook开发了一种方式,帮助计算机向盲人描述图像。微软展示了Skype Translator服务,能自动将一种语言语音翻译成另一种语言。IBM则表示,人工智能将是最重要的增长领域。
创业公司也在人工智能的发展过程中带来了许多贡献。Preferred Networks开发的人工智能系统已被用在日本工业机器人公司发那科的产品中,而Indico Data Labs则与Facebook研究人员合作,教会计算机如何为人类面孔涂色。
计算机目前可以更好地识别照片。2012年,多伦多大学的一个研究团队在全球图像识别技术大赛中获胜。这一团队随后全员加入谷歌,而该团队的技术已被谷歌和其他公司广泛采用。到2015年,基于该团队深度学习技术的人工智能系统正变得更准确。在测试中,错误率已下降至约5%,与人类的表现类似。
许多公司正在拥抱人工智能,而谷歌是其中的佼佼者。2012年,谷歌还只在有限的项目中应用人工智能技术,而目前人工智能技术已经深入至谷歌的数千个项目中。
另一方面,创业公司也在积极接受人工智能。结构化数据提供商CrowdFlower表示,企业目前需要越来越多的数据,去进行人工智能研究。另一家创业公司DifffBot则在使用人工智能优化自动化数据收集工具。
人工智能研究的一个重点在于教会计算机自主思考,自主优化对普通问题的解决方案。其中一种方式是向计算机提供真实世界的简化版本,例如电子游戏中简化的环境,随后要求计算机自主探索这一环境,并记录结果。谷歌的Atari项目就是这样一个案例。不过,人工智能的可能性不止于游戏:类似的软件可以指导人工智能计算机,帮助它们更快地学习新事物,例如医学诊断、环境科学,以及优化的个性化推荐等。
谷歌的迪恩表示,人工智能近期的发展是一种进化。“目前,我们正在实现真正的进化。以往,动物没有眼睛,而现在它们有了眼睛。”他表示,“这将带来巨大的改变。以往计算机并没有很好的视觉,而目前它们可以张开自己的眼睛。”
附加:类脑计算机的现在与未来
发轫于1956年的人工智能,曾试图赋予计算机更多的类人智能,但至今仍未成功,更谈不上具有自主学习、想象创造等人类智能的高级特征。不过,近年来,“类脑计算”却从理念走向实践,正走出一条制造类人智能的新途径。所谓“类脑计算”,是指仿真、模拟和借鉴大脑神经系统结构和信息处理过程的装置、模型和方法,其目标是制造类脑计算机。
A.类脑计算机可能吗
人们往往会质疑:大脑奥秘尚未揭示,我们还不了解智能背后的基本原理,怎么能制造出具有“大脑智能”的类脑计算机呢?
笔者认为,这一质疑存在的问题,是没有分清“类脑”的两个层次:结构层次的仿真和功能层次的模拟。类脑计算机的“类”是从结构层次仿真入手,即采用光电微纳器件模拟生物神经元,以及神经突触的信息处理功能,网络结构仿照大脑神经网络。在仿真精度达到一定范围后,类脑计算机将具备生物大脑类似的信息处理功能和系统行为,包括“灵感涌现”等高级智能。简言之,类脑计算机不是等待理解智能或心智的机理后再行模拟,而是绕过这个更为困难的科学问题,通过结构仿真等工程技术手段间接达到功能模拟目的。
实际上,科学发现和技术发明从来就是相互作用的复杂过程,不是“前者决定后者”的简单关系。中国“四大发明”都是技术实践成果,并无科学发现作为前提。近代科技史上,飞机和空气动力学是另一个鲜活案例。19世纪经典流体力学已经形成,但并未出现指导飞机设计的空气动力学。1903年莱特兄弟发明飞机,1908年冯·卡门专赴巴黎目睹飞行表演后,才下决心“要不惜一切代价去研究风以及在风中飞行的全部奥秘,总有一天我会向法尔芒讲清楚他的飞机为什么能上天的道理”。
脑科学与类脑计算机的关系也是如此。人脑虽然是迄今已知的最为复杂的结构,规模庞大,但仍然是一个复杂度有限的物理结构:拥有约一千亿个神经元,每个神经元通过数千甚至上万个神经突触和其他神经元相连接。采用神经科学实验手段,从分子生物学和细胞生物学层次解析大脑神经元和突触的物理化学特性,理解神经元和突触的信号加工和信息处理特性,并无突破不了的技术障碍。随着探测手段的不断改进,大脑解析日益精细,而神经元和突触作为信息处理单元为解析精度设定了下界,因此大脑解析是一个能够实现的工程技术问题。
2008年,美国工程院把“大脑反向工程”列为本世纪14个重大工程问题之一,近年来各国“脑计划”也将大脑高精度解析列为重要内容进行支持。我们不应再纠结于大脑意识原理是否突破,而应该在大脑解析仿真最新进展基础上,争取在制造类脑计算机方面先行突破,一旦类脑计算机能够产生部分类脑功能,揭示大脑智能奥秘也就为期不远了。
B.类脑计算的技术路径
类脑计算技术路线总体上可分为三个层次:结构层次模仿脑,器件层次逼近脑,智能层次超越脑。近十年来,国内外在这三个层次已经取得不少阶段性成果。
所谓“结构层次模仿脑”,是将大脑作为一个物质和生理对象进行解析,获得基本单元(各类神经元和神经突触等)的功能及其连接关系(网络结构)。这一阶段,主要通过神经科学实验采用先进的分析探测技术完成。
1952年,英国科学家霍奇金和赫胥黎提出了以两人命名的HH方程,精确刻画了单个神经元放电的非线性动力学过程,这是神经元信息处理的标准数学模型。近年来,国内的相关探测手段也快速进步。例如北京大学生物动态光学成像中心主任、哈佛大学终身教授谢晓亮领衔的生物动态光学成像中心,可以通过单分子光谱观察细胞内部的动态生理过程。2014年,华中科技大学骆清铭教授牵头的“单细胞分辨率的全脑显微光学切片断层成像技术与仪器”荣获国家技术发明二等奖,在神经细胞尺度上实现了脑皮层的结构解析。国际上,2014年6月,美国国立卫生研究院发布美国脑计划12年规划,重点支持新的大脑解析探测技术,目标是绘制出堪比“人类基因图谱”的“人类大脑动态图谱”。相关进展表明,对人类大脑结构的解析有望在十年内获得重大突破。
谓“器件层次逼近人脑”,是指研制能够模拟神经元和神经突触功能的微纳光电器件,从而在有限的物理空间和功耗条件下构造出人脑规模的神经网络系统。这方面的代表性项目是美国国防部先进研究项目局(DARPA)2008年启动的“神经形态自适应可塑性可扩展电子系统”(即突触),其目标是研制出器件功能、规模与密度均与人类大脑皮层相当的电子装置,功耗为一千瓦(人脑为20瓦),IBM和多所大学获得一亿多美元资助。2014年8月7日,IBM在《科学》上发表文章,宣布研制成功TrueNorth神经形态芯片,内含一百万个神经元和2.56亿个突触,这项成果入选“2014年十大科学突破”。德国海德堡大学在神经形态芯片研制方面已有十多年积累,今年3月,他们在一个8英寸硅片上集成了20万神经元和5000万突触,采用这种“神经形态处理器”的计算机已经成功运行,其神经元采用模拟电路实现,功能比IBM方案更接近生物神经元。
类脑计算研究的目标是制造出类脑计算机,其硬件主体是大规模神经形态芯片,这种芯片主要包括神经元阵列和突触阵列两大部分,前者通过后者互联,一种典型连接结构是纵横交叉,使得一个神经元和上千乃至上万其他神经元连接,而且这种连接还可以是软件定义和调整的。类脑计算机基础软件除管理神经形态硬件外,主要实现各种神经网络到底层硬件器件阵列的映射,这里的“软件神经网络”可以复用生物大脑的局部甚至整体,也可以是经过优化、乃至全新设计的神经网络。
所谓“智能层次超越脑”,属于类脑计算机应用软件层次的问题,是指通过对类脑计算机进行信息刺激、训练和学习,使其产生与人脑类似的智能甚至涌现出自主意识,实现智能培育和进化。刺激源可以是虚拟环境,也可以是来自现实环境的各种信息(例如互联网大数据)和信号(例如遍布全球的摄像头和各种物联网传感器),还可以是机器人“身体”在自然环境中探索和互动。在这个过程中,类脑计算机能够调整神经网络的突触连接关系及连接强度,实现学习、记忆、识别、会话、推理以及更高级的智能。
C.类脑计算研究在北京
中国在类脑计算相关研究有十来年的研究历史了。北京大学微电子研究院从2006年开始研制神经形态器件,2012年实现了神经突触模拟器件,响应速度比生物突触快百万倍,而单元体积只有生物突触的十万分之一,在光学突触方面也有突破。在类脑信息处理和计算模型方面,北京大学机器感知与智能教育部重点实验室和数字视频编解码技术国家工程实验室在视觉信息编码和识别方面具有深厚积累。北京大学今年还成立了由生命科学学院、信息科学学院、工学院、心理学系、基础医学部等开展学科交叉研究的“脑科学与类脑研究中心”。
北京大学是我国类脑研究蓬勃发展的一个缩影。今年以来,清华大学成立了跨七个院系的“类脑计算研究中心”,从基础理论、芯片、软件系统展开全方位研究,中国科学院自动化研究所成立了“类脑智能研究中心”,中国科学院计算技术研究所研制出世界上首款深度学习处理器芯片,中国传媒大学脑科学与智能媒体研究院和北京印刷学院等单位在神经系统高效模拟、神经形态器件印制等方面也有很好的工作基础。
今年以来,北京市科学技术委员会对脑科学和类脑计算进行了密集调研,制定了“北京脑科学研究”专项规划,并于9月1日正式对外发布。“脑认知与类脑计算”作为专项两大重点任务之一,沿着“结构仿真、器件逼近和功能超越”这条技术路线,布局了三个层次、九个方面的科研任务:建设支撑类脑计算基础研究开发和产业创新的四大基础性公共平台(大脑解析仿真平台、认知功能模拟平台、神经形态器件平台和类脑计算机系统平台),开发两款类脑计算处理器芯片(类脑处理器和机器学习处理器)并投入实际应用,希望研制类脑计算机软硬件系统,在视听感知、自主学习、自然会话三大类脑智能方向取得突破并实现规模应用。这一专项的目标是依托首都类脑领域科研优势,在类脑计算理论基础研究、类脑计算机研制和类脑智能三方面取得理论研究和关键技术的重要突破,初步形成自主可控的类脑计算机产业链,将北京建设成为全球有重要影响力的类脑计算科技创新中心和产业化中心。
目前,集中北京地区大学、研究机构和企业优势研究力量的十多项类脑计算研究项目已经全面展开。这里以笔者参加的“大脑初级视觉系统解析仿真平台研究和应用验证”项目为例。这个项目汇聚了信息科学和生命科学交叉的研究团队:视觉损伤与修复教育部重点实验室负责测量视网膜各类神经节细胞在多种视觉刺激的发放模型,数字视频编解码技术国家工程实验室负责开发高逼真视网膜仿真软件,生物医学中心采用双光子成像研究灵长类初级视皮层神经机制,定量生物中心则从神经网络仿真和动力学分析方面进行软件模拟,通过生物实验和计算机仿真进行交叉验证,实现对生物视觉系统视觉信息处理和加工过程的精确重构。预计这项研究不仅能深化对生物视觉系统信息处理过程的认识,还有望启发新的高效视频编码方法和对象检测识别算法,并通过新一代视觉芯片支持智能机器人和无人机等产业发展。
就像飞机发明对空气动力学的提出起到了巨大促进作用一样,类脑计算机作为生物大脑的模拟仿真系统,也将对揭开意识之谜发挥重要作用。需要特别说明的是,由于类脑计算机的器件速度是生物神经元和突触的百万倍以上,一旦通过涌现方式产生智能,后果难以预料,对人类来说可能是天使,也可能是魔鬼,因此,相关的伦理和风险研究也要同步展开。