文献标识码:A
DOI:10.16157/j.issn.0258-7998.2018.S1.029
0 引言
随着深度神经网络的推广,以深度学习技术为代表的人工智能技术在各行各业得到了前所未有的发展,近期国家发改委发布了新一代人工智能发展规划,国家电网公司更发布了关于新一代人工智能技术在电力行业的发展应用。为推动电网的生产方式变革,提升大电网生产运行水平,促进国家电网公司瘦身健体、提质增效,提升业务创新能力,需要开展以深度学习为代表的电力人工智能基础共性技术、模型优化训练方案以及现有研究成果对电网巡检、用电客服以及安全监控等重要领域服务技术的研究,全方位推动以深度学习为代表的新一代人工智能技术在电网的应用普及。
冀北电力公司信息通信专业作为承担冬奥赛区电力供应的重要支撑部分,全力推动建设全业务泛在电力物联网“一网”,打造全景全息智慧智慧平台“一平台”,以张家口“零碳冬奥”为契机,大力推进以全业务数据中心为基础,以深度学习技术为代表的人工智能技术的“二次水平化”,支撑全景全息智慧。同时基于国网云打造数据平台,深化深度学习、机器学习技术,多数据源综合分析,支撑全业务云上运行。
1 深度学习的概念
1.1 深度学习的背景
从被认定为全球人工智能研究起点的1956年达特茅斯学术会议到2017年期间,国外以Facebook、Google、Microsoft、斯坦福等公司和学校为代表进行了深度学习在图像、语音以及文本等方面的应用,以CNN和RNN为两大方向的深度神经网络在图像识别、语音识别、机器翻译等方向取得了很大的成功。国内百度、科大讯飞、Face++、南京大学等企业和公司分别在无人驾驶、语音识别、深度神经网络压缩以及级联学习等方面取得了显著成绩,比如ShuffleNet很大程度上推动了深度神经网络在移动端的应用;周志华教授提出的gcForest模型以传统决策树为基础,结合级联学习将传统模型拟合能力提上了新的高度。在过去的十余年中计算机视觉以及自然语言处理领域都得到了很大的成功,甚至在某些应用上已经超过人类,比如人脸识别、围棋等。
1.2 深度学习的原理分析
通过对人脑皮层处理信息的方式进行抽象、归纳和仿真,提出了神经网络(Neural Network)的概念。没有经过处理的信息(声音、图像以及文本信息)被输入到输出层的“输入单元”,输出层的“输出节点”到输入的信息被映射。映射算法是基于用户自定义的,例如,输入图像中有CAT,输入音频材料中有“hello”。深度学习是通过多层级神经网络提取并且表示信息数据,实现监控、分类等复杂任务的算法体系。深度学习算法中深度神经网络作为核心部分,在输入层和输出层之间包含了多个隐藏层,使得深度学习算法可以完成许多复杂的数据分类工作。
1.3 深度学习的实现过程
深度学习算法需要通过大量的数据进行训练,这一点类似机器学习算法,例如,比如想非常准确地识别素材中的“CAT”,那么需要使用成千上万的图片来训练并识别它。训练采用的数据越多,算法模型的精度就越高。包括国内BAT等很多大公司不惜一切代价争夺第一手用户数据,甚至争先提供免费的服务以换取用户使用数据。可以说测试数据越多,可以采用的深度学习算法算法就越多,那么为用户提供的服务就越高效,也就能越来越吸引用户使用它的服务,这就形成了慢慢良性的竞争循环,使得在人工智能的赛道上取得领先地位。
2 深度学习的主要网络模型
2.1 自动编码器
自动编码器(Auto Encoder)最开始作为一种数据的压缩方法,其特点有:(1)跟数据相关程度很高,这意味着自动编码器只能压缩与训练数据相似的数据,这个其实比较显然,因为使用神经网络提取的特征一般是高度相关于原始的训练集,使用人脸训练出来的自动编码器在压缩自然界动物的图片时表现就会比较差,因为它只学习到了人脸的特征,而没有能够学习到自然界图片的特征;(2)压缩后数据是有损的,这是因为在降维的过程中不可避免地要丢失掉信息。
自动编码器可以学习输入原始数据的隐式特征,即编码(Coding),学习到新的特征可以用来重新形成原始输入数据,即解码(Decoding),如图1所示。从非常直观的角度来看,自动编码器(AutoEncoder)可以实现特征的缩减,有点类似于主成分分析(PCA),但却远强于PCA的性能。这是因为神经网络(Neural Network)可以自动提取非常有效的新能力。自动编码器(AutoEncoder)作为一种无监督的深度学习模型,也可以用来产生不同的训练样本的新数据,因此自动编码器是一种生成算法模型。
2.2 卷积神经网络
卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(Convolutional Neural Networks-简称CNN)。CNN中主要有两种类型的网络层,分别是卷积层和池化/采用层(Pooling)。卷积层的作用是提取图像的各种特征;池化层的作用是对原始特征信号进行抽象,从而大大减少训练参数,另外还可以减轻模型过拟合的程度。CNN之所以流行,这将归功于算法的特殊网络设计,CNN是由卷基层及次采样层交叉堆叠而成的。当前向计算开始时,输入数据经常利用多个卷积核开展卷积方式计算,从而形成多个不同的特征图,特征图的维度属性对比输入的维度属性已经有所下降,再通过次采样层进行纬度降低,经过多次的卷积计算降低纬度后,再通过全连接层,从而到达输出网络的目的。
CNN的结构基本分为两层。第一层是提取特征层。所有神经元的输入数据与连接的前一层的宿主数据接受域连接,目的用于提取局部特征。特征映射常常利用影响函数结果的验证函数作为CNN的激活函数,激活函数(Activation functions)对于人工神经网络模型去学习、理解非常复杂和非线性的函数来说具有十分重要的作用。它们将非线性特性引入到我们的网络中。其主要目的是将ANN模型中一个节点的输入信号转换成一个输出信号,使得其具有位移和不变形的特性。此外,由于映射表面上神经元的共享机理,参数的数量在网络自由选择中逐渐减少。在CNN中都有一个计算层在每个体基后面,用于局部平均和二次特征提取,这是由于其独特的二阶特征提取结构导致了降低特征分辨率的优势。
2.3 循环神经网络
循环神经网络(recurrent neural network,简称RNN)背后的思想就是使用序列信息。在传统的神经网络中,我们认为所有的输入(和输出)彼此之间是互相独立的。循环神经网络之所以称之为循环,就是因为它们对于所有序列中所有元素都执行完全相同的任务,输出的结果依赖于输入的计算结果。另一种思考循环神经网络的方法是,RNN存在记忆,记忆可以捕获迄今为止所有已经计算过的信息。与CNN不同,RNN主要在序列方面存在优势。RNN与传统的神经网络模型有区别,RNN的每层隐藏层神经元之间都存在着相互连接的关系。该结构的具体表现为神经网络会对前面的输入信息进行记忆并应用于当前的输出信息,因此特别适合于计算数据序列类型的数据,此外,采用RNN和CNN相结合使用,非常适合处理样本数据之间的相关性问题。
典型的RNN结构如图2所示,对于RNN来说,是一个非常重要的理念,每次RNN的输入结合模型的当前状态给出一个输出,从图中可以看出这个规则,图片左边是RNN的神经元,右边是按时间轴展开后的情况。两条消息分别输入输出两条消息,每条消息处理隐藏状态,这是一个非常有效的表示方法,用于延长同一神经元的时间,对比CNN来说可以保存更多的参数。
3 深度学习在电力信息化的研究现状
虽然深度学习已经在图像识别以及自然语言处理等方面取得重大突破,但在电力系统中信息化技术的研究与应用还比较少,近年来,国家电网公司对人工智能技术在输变电线路巡检图像故障识别和自然语言处理等领域进行了深入的研究,现阶段在输电线路图像物体识别、定位以及图像主题识别等方面取得了很好的成绩,比如输电线路鸟巢识别准确度≥95%,电网客服领域应用人工智能技术在语音导航、少数民族语言分析、语音识别以及智能化工单质检等方面取得很大成果,项目成果能够快速进行客服中心工单质检,并很大程度上改善了客服导拨系统等。
3.1 直升机、无人机输电线路巡检视觉分析
目前,国家电网公司共有华北、东北、华东、华中、西北、华南地区6个区域电网,截至2016年年底,国家电网公司35 kV及以上输电线路回路长度达175.6万公里,其中,220 kV及以上输电线路长度64.5万公里。根据相关数据显示,我国电力行业作为一个整体一年投资约1 000亿元人民币,费用包括硬件设施是73%,传输设备在国家电网建设的比重是越来越大,比例的扩大电网巡逻的工作也越来越多,100公里的巡逻工作需要巡逻人员20个工作日完成,且巡线人员担负着巨大的人身安全风险,因此直升机、无人机巡线方式越来越受到电网公司的重视。
输电线路巡检普遍存在:图像视频背景复杂性、多干扰因素(光照、遮挡、尺度及旋转等)、相对运动随机性及相似目标难判别,缺陷难表达,和深度模型泛化能力弱等难点问题。通过采集设备的相关特征量作为训练集合,得出最终的判断模型用于检测,智能算法包括支持向量机、BP神经网络等神经网络算法,而深度学习可以利用电力信息通信设备中大量无标签的数据,对深度神经网络进行初始化权值,得到更好的数据支持。
3.2 变电站视频监控视觉分析
虽然电网公司变电站内自动化遥测系统具有在线监测报警功能,但主要集中在自动化传感器的报警数据分析上。视频检测主要是辅助装置。随着监测点的增多,传统的视频监控暴露出诸多不足:过度依赖对异常的人工检测和对异常视频数据的自动判断。智能视频监控技术可以克服上述缺点。它是一种自动视频分析技术在现有的数字视频监控系统中的应用。通过对高清摄像机拍摄到的摄像机图像序列进行自动分析,无需人工检测,能够实现自动定位、识别和跟踪动态场景中的目标。基于此分析,变电站视频监控视觉分析系统给出可疑行为或异常的实时警告。
现有的国家电网公司变电站监控图像计算机识别方法都是采用“对监控图像进行预处理—人为设计提取特征—提前计算人工特征—采用深度学习模型”的方法,从而利用卷积神经网络(CNN)等算法对变电站视频监控画面进行识别,提高变电站监控图像中异常状况智能识别的准确率和鲁棒性。
3.3 信息通信机房视频监控视觉分析
电力系统信息通信运维作为电网企业的核心业务之一,对保障电网信息通信设备的安全与健康,支持智能电网的安全运行起着异常重要的作用。电网企业关于“智能化运维(AIOps)”的需求越来越强烈,需要利用人工智能技术(AI)实现电力信息通信设备运维的数字化和智能化。作为电力信息通信运维的重要内容之一,信息通信机房基础设施运维为电力营销、调度、运行、检修等重要业务提供了基础的信息通信保障。
对信息通信机房设备的监控可以归结为目标检测问题,而目标检测是计算机视觉领域里面一个非常重要的研究方法。目标检测的任务主要用于:针对视频或者截取画面,分析出某一个特定物体在图片中的具体方位;可以将目标检测分解为物体定位和物体识别问题。卷积神经网络是深度学习里面场景的数据网络模型,它由很多层隐层组成,每一个隐层提取不同深层次的特征数据在训练数据中,最后全连接层连接起来隐层的特征和表示图像类别信息。卷积神经网络(CNN)具有局部感受野,池化采样和权值共享等特点,利用这种技术可以有效减少神经网络的复杂程度,降低神经网络训练复杂程度和测试时间。通过采用深度学习算法可以使得目标检测的误检率大大降低。
3.4 电力资产管理和智能化运维
电力行业是资产密集型产业,资产总量庞大、分布广泛,传统方法无法有效管理,将难以支撑电网的运行和发展;电网网络庞杂、设备点多面广、运行特征各异,传统的运维检修方法难以对设备状态进行精准评价和针对性地投资、改造和运维。
通过基于深度学习算法的人工智能技术,可以实现对电力设备状态数据、环境数据、历史数据的深度挖掘,实现电力设备的健康状态综合评价与诊断;给出针对性的运维方案和投资建议,实现故障处理方案的辅助决策,将事后处理变事前预防;利用智能化的手段进行资产运维,对电力资产进行状态实时感知、监控和自动处理,提高工作效率;提高偶发事件预测和辨识水平,包括故障和地址、自然灾害等;实现电力资产的全面监测、实时在线、科学管理和智能运维。
3.5 营业厅智能机器人
针对当前电力营业厅内服务人员专业人员逐步减少、人员知识结构要求高、高端服务人员运行管理成本较高等现实问题,通过采用智能机器人、随机学习、深度学习、图像视频辩识等人工智能技术,构建营业厅智能机器人应用系统。实现系统与用户对话交互式业务办理,结合用电申请/业扩图文资料、视频感知及方案辅助核查技术,完成客户用电业务咨询和业扩报装的自助办理、供电方案辅助审核,实现营业厅服务的智能化、无人化或少人化,将极大提高电力营业厅工作效率和服务水平,展现国网公司一流企业的形象定位。
应用深度学习、数据智能分析技术,实现营业厅业扩报装资料的自动输入、申请材料和供电方案辅助核查提高业扩报装供电方案核查质量,减少企业员工劳动强度。
4 深度学习在电力信息化的展望
4.1 深度学习在异构集群上的计算和优化
深度学习任务在异构集群上的计算和优化技术,在模型训练方面,提高资源利用率,优化任务调度方案和资源配置管理;在任务推理方面,构建深度神经网络模型处理框架,设计网络模型在异构平台和嵌入式终端上的移植方法,从而实现低功耗并且高效率的推理方案。
4.2 人工智能深度学习平台研究
研究人工智能平台深度学习技术解决具体实际业务问题,根据数据全量样本和自学习机制,更好发现知识找出数据潜在规律,发挥数据最大价值,改变传统基于人的经验判断和专家规则方式研判模式,在提供实效性前提,提高预测和分析能力。如:基于自然语言处理的舆情风险管控监测,通过人工智能的语义分析,改变基于传统正则表达式的数据内容爬取,降低数据复杂性带来的计算成本同时提高内容含义精准性;如:图像识别模型算法识别输电线路图片和视频发现杆塔和线路数据样本规律,发现线路和杆塔上的异物、外力破坏、设备备件损坏、线路弧垂等异常并告警,降低现阶段通过手机APP拍照、视频回传到运检指挥中心由人工核查的冗余工作,降低人工成本同时提高设备异常识别率,降低电网风险发生机率。如:用神经网络进行并行处理、非线性映射、自适应能力和鲁棒性、学习和记忆等固有性质,改变IEC三比值法和传统特征气体分析法,有效提高故障识别准确率,降低设备损耗节约电网公司设备资产。
4.3 计算机视觉
计算机视觉在电力领域的应用主要集中在电力巡检和监控影像的目标识别与缺陷检测。但目前技术尚未达到满足生产需求的精度与效率。可从电力影像资源库、电力影像多目标检测与缺陷识别、电力视觉芯片、虚拟/增强现实交互、三维重构等方面开展相关研究,研发基于电力影像的智能辅助标注技术、研发基于领域知识和深度学习的电力信息通信设备检测与计算机视觉缺陷识别算法,形成设备级电力信息通信视觉模块,实现实时电力信息通信设备识别和缺陷检测。
4.4 自然语言处理
基于已有的专业知识和全系统以文本形式存在的运行和操作规则、调度指令和报告、营销档案等语料,研究基于电力文本的新词发现技术和语意网络挖掘技术,构建电力主题词表;研究电力语音文本特征提取、电网设备本体建模、电力行业知识加工和推理等技术,分领域逐步行成电力行业知识图谱,先期构建调控、运检、营销、信息通信等领域知识图谱,支撑信息通信调度机器人、电网设备智能运维和智能客服等应用;最终,形成新一代电网企业智能搜索和智能问答解决方案。
4.5 智能机器人
电力机器人,是面向电力巡检、服务、作业和调控等应用场景的机器人。当前电力机器人上处于实现“单一模式的自动化重复动作”阶段,不能满足公司对其自主智能行为的需求。智能机器人在电力AI算法封装,具备自主行为、自主学习、自主识别、人机协作等核心技术。
5 结论
在冀北电力公司大力发展张家口零碳冬奥的背景下,深度学习可以结合自身特征提取以及模型拟合方面的优势,针对当前人工智能与电网智能化水平结合不紧密等问题,如深度学习企业级服务能力不足、数据驱动支撑新一代电网能力不足,建设全业务泛在电力物联网尚需人工智能技术推进等问题,做出一个科学的决策方案。
另外,还可以利用深度学习在机器学习以及人工智能方面的优点,结合全业务数据中心的电网数据,开展大数据处理、数据分析挖掘、统一数据模型以及数据安全等技术研究和应用需求及业务模型研究,支撑多专业大数据工作。
参考文献
[1] 曹渝昆,何健伟,鲍自安.深度学习在电力领域的研究现状与展望[J].上海电力学院学报,2017,33:341-346.
[2] 魏海宏,刘新. 基于深度卷积神经网络的离线手写签名鉴定[J].网络安全技术与应用,2018(3):40-41.
[3] 梁苗苗.基于深度学习的智能聊天机器人的研究 [D]. 杭州:浙江理工大学,2017.
[4] 肖仕昶.基于计算机视觉的感兴趣人群属性分析系统 [D]. 广州:华南理工大学,2017.
作者信息:
那琼澜1,万 莹1,张子健2,杨艺西3,赵庆凯1,李环媛1
(1. 国网冀北电力有限公司信息通信分公司,北京 100053;
2. 国网冀北电力有限公司,北京 100052;
3. 国家电网公司信息通信分公司,北京 100761)