学界 | 利用AI精确重建多模光纤传输图像,该技术或可改变医疗和通信行业
2018-08-18
近日,来自瑞士联邦理工学院的一组研究人员在美国光学学会的高影响因子期刊 Optica 上发表文章报告其研究成果。他们利用深度神经网络对经过多模光纤传输的数字图像进行精确重建,在长达一公里的光纤上实现了 90% 的准确率。图像经过光纤传输后输出的是散斑图,人眼无法辨认其内容,该研究小组利用深度神经网络模仿人脑学习过程,把模糊难认的散斑图转换成可识别的数字图像,该神经网络还能够处理因环境对光纤的扰动而造成的失真。该研究有望改进内窥镜成像等医疗程序和通信应用。
多模光纤输出的图像散斑图(speckle pattern)输入到深度神经网络的隐藏层,并被重建为数字 3。(图源:Demetri Psaltis, Swiss Federal Institute of Technology Lausanne)
一个研究小组创造性地使用神经网络来模拟人脑处理图像的过程,并且报告了其对在长达一公里的光纤上传输的图像进行精确重建的研究工作。
研究人员在美国光学学会(OSA)高影响因子期刊「Optica」上报告了他们的研究,他们训练一种被称为深度神经网络的机器学习算法,基于数字图像传输到光纤远端所生成的散斑图来重建数字图像。该研究可以改进用于医学诊断的内窥镜成像,提高光纤通信网络的承载信息量,或者提高光纤的光功率。
瑞士联邦理工学院的 Demetri Psaltis 称:「我们使用现代深度神经网络架构从光纤的杂乱输出中检索出输入图像。」他与同事 Christophe Moser 一同领导了这项研究。他补充道:「我们证明了,在长达 1 公里的光纤上完成这个过程是可能的。」并且将该工作称作「一个重要的里程碑」。
解码模糊图案
光纤通过光传输信息。多模光纤比单模光纤具有更强的信息传输能力。它们具有许多通道(被称为空间模式,因为它们具有不同的空间形状),这些通道可以同时传输不同的信息流。
尽管多模光纤非常适合传输基于光的信号,但要用它传输图像还存在一些问题。来自图像的光穿过所有的通道后,从另一端传出的是一种人眼无法解码的散斑图。
为了解决这个问题,Psaltis 和他的团队决定使用深度神经网络,这是一种运作方式与人脑类似的机器学习算法。深度神经网络可以赋予计算机识别图像中物体的能力,还能帮助改进语音识别系统。输入数据通过几层人工神经元进行处理,每层神经元在进行一个小运算后将结果传递给下一层神经元。机器通过识别与输入相关的输出模式来学习识别输入图像。
参与该项目的博士生 Eirini Kakkava 解释道:「如果我们思考一下神经网络的起源(即人脑),就会发现它的工作机制很简单。当一个人盯着一个物体看的时候,大脑中的神经元就会被激活,这个过程表示对一个熟悉的物体进行识别。我们的大脑之所以能够做到这一点,是因为它在我们的生活中会接受同一类物体的图像或信号的训练,这改变了神经元之间连接的强度。」为了训练一个人工神经网络,研究人员基本上遵循相同的处理过程,教会神经网络识别某些图像(在本文中指手写数字),直到它能够识别之前从未见过、但与训练图像属于同一类别的图像。
从数字中学习
为了训练系统,研究人员使用了一个包含 20000 个手写数字样本的数据库,所有样本是 0-9 的数字。他们选择了其中的 16000 个样本作为训练数据,留出 2000 个样本作为验证集,剩下的 2000 个样本则用来测试已验证的系统。他们用激光照射每一个数字,并且将光束通过大约有 4500 个通道的光纤传输到远端的相机上。他们用一台计算机测量输出光的强度是如何在捕获到的图像中变化的。他们为每个数字收集了一系列实例。
尽管为每个数字收集的散斑图对人眼来说都差不多,但神经网络能够辨别出其中的细微差异,并识别出与每个数字相关的光强度模式。测试表明,该算法对在 0.1 米长的光纤中传输的图像达到了 97.6% 的识别准确率,在 1 公里长的光纤中达到了 90% 的识别准确率。
这是一种更简单的方法
研究小组的另一位成员 Navid Borhani 说,与其它需要对输出进行全息测量的方法相比,这种机器学习方法能够更简单地重建通过光纤传输的图像。该神经网络还能够处理因环境对光纤的扰动而造成的失真,例如温度波动或气流引起的光纤移动,这些扰动会增加图像的噪声,而这种情况会随着纤维长度的增加而变得更糟。
Psatis 表示:「深度神经网络具备检索通过多模光纤传输的信息的卓越能力,这将有利于内窥镜成像等医疗过程和通信应用。」通信信号通常需要穿越若干公里的光纤,并且可能失真,而他们的这项技术可以修正这一现象。医生可以使用超薄光纤探针收集人体内的神经束和动脉图像,无需复杂的全息记录仪,也不用担心操作时移动幅度过大。Psatis 说:「呼吸或血液循环造成的微小运动会导致通过多模光纤传输的图像失真。」而他们创建的深度神经网络方法是处理这种噪声的高效解决方案。
Psaltis 和他的团队打算通过生物样本测试这项技术,看看是否和识别手写数字一样有效。他们希望利用不同类型的图像进行一系列研究,以探讨这项技术的可能性和局限性。