2017年中国电机工程学会年会能源互联网专题研讨会于11月23日在广西南宁国际会展中心召开。
ABB(中国) 有限公司首席技术官刘前进博士出席会议,并发表了题为《智能运维-机器学习在资产健康管理中的应用》的主旨演讲。
以下为发言内容:
刘前进:上个月接到组委会的邀请做个报告,问我讲什么题目,当时脑瓜一热说讲讲机器学习的工作,因为这几年ABB我们在做数字化变革,过去三年讲了非常多的架构、方案、平台的构建,所以我想讲点不一样的,我的题目是机器学习在电力产品中的应用,这是我最近的工作,特别是结合智能运维。
过去的三年我们讲了ABB的平台,去年底和今年初在美国和中国分布发布了平台,这是工信部之前的白皮书26号工业互联网之一,最大的背景是我们看到物联的成本越来越低,我们做了一个小的盒子一百美金,当时开发项目的时候,上海一个客户说2013年用的手机,我简单做几个APP,中间有十多项传感器,我一个一个拿出来,每个传感器就几块一个,这个数据怎么用,不知道。我就想到这能不能使用在工业上,这是当时的一个背景。
第二个背景很简单,因为计算能力越来越强,从最早的CPU、GPU,对大的数据提前处理,挖掘出特殊的信息,这是一个很特别的点。
第三个背景,我们带宽越来越强,最早3G的时候几十K很了不起了,后来几十M,到了5G的时候会怎么样,这是我们在2014年讨论对ABB战略性转型阶段。过去一年多我们在原有的7千万的联网设备进行整合,有7万套的系统平台,还有6千多台解决方案,还有几十个云平台,这是当时的方案。
所以,讲到历程的时候,这是我们的构架,提到这个平台的时候也很多,从学术界的圈子里的方向,一个是机器人,我讲得比较多,两个月前我们干了一件事,在意大利,我们开发的机器人取代了指挥,指挥非常惊讶,说不可思议,动作的平滑度,在女高音讲《我的父亲》中,有一个高音,机器人的手随着节奏给予对应的指挥,这是非常好的例子。但是我在想,机器学习跟我们的能源、电气如何结合,这是今天的内容。
机器学习给我们带来的影响是什么,我们的专业知识在座的各位大部分是电气工程背景,和大数据怎么融合,能够产生新的方案,为什么在推出平台的时候,我们跟微软合作,跟IBW合作,最近在跟华为测试平台等事。为什么还需要行业的专家参与,因为将这个平台应用到行业的时候确实需要非常多的工业知识,没有这些很难产生业务价值。所以,机器的计算能力非常强,从认知上没有达到人的水平。如果我们把这么一个强计算能力,通过数据所产生的模型以外的知识,和我们专业知识整合,甚至专家的知识来结合,应用到各个领域当中会产生对应的价值回归。
机器学习,我简单提一下,对机器学习来说从过去十几年之后,其实有很大的提高,特别是在处理大数据的时候,这是人所不具备的,如何一个人处理几百台变压器、在线变压器产生的数据,这是通过一个人做不到,但是通过计算机,通过互联网的平台是可以做到的,基于学习可以不按照规则的变成就可以从数据中挖掘合理的信息。但它不是万能,你给的是垃圾信息,出来的信息也是垃圾的,也不是实时的,需要有不断的学习过程,也需要人的介入,因为在数据的标签行为中,也在你最后的实施过程中,都需要有人的介入,这必然打上人的标签,这个算法本身有提高的过程。行业背景知识很关键,我讲边际计算有惠普找我一起看看怎么做,因为没有行业背景,你不知道标签,你纯粹学是学不到内容的,这是非常关键的点,得到结果如何用专业的角度解释,也有可能有价值,但是怎么用,客户不可能买单,背景很专业。
数据背景和重要性,今天中午吃饭的时候提到一点,电网公司说数据比较多,这些数据真不算多,数据质量是不能达到我们的目标,就像我们做调度自动化的时候,我们会做动态分析,你的表是有误差的,可能多方面影响,如果把一个非常大的偏差数据放到计算中,最后的结果一定会带来很大的差别。多样性是指各种多结构的数据,从运营的角度来说,数据随着产品的生命周期不同的形态,不仅仅是正常的设备给你的信息也有限。所以,能不能得到一个设备,生命周期的权限,没有商家的配合你也做不到。为什么在不同学术讨论的时候,他们说我们也不相信深入学习在工业中很大的使用,有可能是一个热度,会随着时间下降。有一个新的说法,宽度学习,可以融合起来达到效果。
无论如何,当你做一个机器学习的时候会做分类、异常检测和回归,接下来怎么跟运维结合。我们做了地区的体检,大小箫条,汇总一下,最后看看设备怎么整改。从数据来说,有一些小的特征你可以实现,我们叫早期缺陷探测。这怎么跟结合我们的题目,我们对一个物理模型与数据分析的优点,有一些无法预测的运营状态,有一些东西是现在模型无法描述的东西,这个时候需要结合,改善模型,解决问题的因素。
有两种方式,有监督学习,根据历史的数据做个预测,建模流程中,这个大家不用拍,因为网上非常多,用好工具和用工具是不一样的。讲到非监督学习之前,我的建议是如果能用监督学习最好不用非监督学习,因为非监督学习在数据中心没有合适的标签,你需要对数据进行分解,比如我们对这么一组数据,我们假设绝大多数的设备是好的设备,这是不对的。我们假设所有的设备是好的,只有个别设备是非健康的,算法的过程中,有很多想法,以及怎么做,比如把数据如何规划,如何把数据降维。哪怕只有几十个检测量,每分钟检测一组,一个月下来数据量非常大,如何把这么大的数据量进行处理,而且还能够映射回去,这是需要技巧的,这需要在数据分析的专家来了解和配合运作。
接下来我举几个例子,这在整个圈子里是第一手,讲风机的场景,2014年的时候,我们有南方、北京、岛上、海上的,拿到不同数据,把对应的数据进行迁移,进行分析,把它的故障种类进行分类,开始训练开始培训,推完之后我们做判断,我们在预测暴风点发生的时候,这么一个时间段内我们预测早期的信号,我能够在1700当天可以检测出82%的故障,这算高吗,其实提不提高不是关键点,我看到软件和百度也在提,也是80%—90%。但是有前提条件,第一你预了多少,第二,不知道价值的前提下给你装传感器,所以我们不用传感器,直接用机器检出,我们在HV也发表了文章。
第二个例子,针对断路器的健康评估,涉及到热、材料、电厂的计算等工作,这些工作跟各个材料有直接的关系。需要对这些数据和运营数据结合起来,我在电网找运营数据,如果有部分的场景,可以导出来,最后定出一个指标,叫做健康指数,根据指数给出第一层的数据。所用的开发类型、故障种类、检测信号做出评估,最后检测类达到90%多,这是非常高的,差几点不关键,而是检测出一家是在执行,不断往前推测。所以,90%多是非常理想的结果。作为一个用户,如果你接受用继续学习来解决现有的问题的时候,你应该也有心理接受纠错的问题。所以,我们把程度设到最低,因为大家不希望被打扰,哪怕可以少报,但是不能误报,这是需要你到到场参与行动地
我们针对变压器所做的机器学习案例,在过去二十年中,我们已经积累了很多数据,不叫继续学习,应该是AI中的专业模型,对对应的类型分类,我们可以考虑不同类型的场景,对不同的因素进行学习。去年我们在北美的时候,有一个厂子,已经有了设备,有一些小异常也一直在运行,结果这个设备就断了,厂子不得不替工。把算法和实际运行的平台结合,对现有传感的结合,整理出相应的设备数据、客户平台。对数据要聚合、抽样,最后给出短路、热、绝缘、配件等。我最后举个实例,第一个是变压器的例子,这在国内已经有很多人使用了,变压器中间有在线的有色谱等等, 将数据输入之后,我们有专门的条差工具。2014年做了一个项目,这个项目在意大利电网开始使用了,因为英文还不错,而且资产健康不错。资产健康针对开发远程服务,客户不会24小时一个服务团队在那里,我们针对现有的标杆对应相应的传感器。这个工作可以通过视频让大家了解一下,这已经是我们前年拍的了,这个服务中心在厦门。
这是我们整个内容,在客户刚发现问题的时候我们可以在现场第一手解决问题,解决客户的问题才是工业互联网最终所带来的价值,谢谢大家。