摘 要:设计了基于事件相关电位(ERP)的脑-机接口(BCI)系统,根据ERP中P300的特性,分别对比输入字符的形式及颜色,并在此基础上采用不同的实验参数进行了多次实验。对采集到的脑电信号(EEG)使用叠加平均、独立成份分析(ICA)、Fisher线性分类器来进行分析处理。实验结果表明,输入方式及实验参数会对P300的时域特性及识别率产生较大的影响。
关键词:脑-机接口;事件相关电位;P300;独立成分分析;Fisher线性分类器
脑-机接口BCI(Brain-Computer Interface)为人脑与外界事物进行信息交流和控制提供了一种全新的通道,随着人们对大脑的研究越来越深入,可以不使用语言或动作,直接通过脑电信号来表达想法或者操纵设备。BCI系统一般由三部分组成:对脑电信号的采集;对脑电信号进行处理;将处理之后分类正确的控制信号输出,实现对外围设备的控制。事件相关电位ERP(Event-Related Potentials)是脑电图EEG(electroencephalogram)中的一种,当外加一种特定的刺激,作用于感觉系统或脑的某一部位,在给予刺激或撤销刺激时,在脑区引起的电位变化[1]。ERP中的P300电位是脑-机接口中广泛使用的信号。浙江大学的陈卫东等人设计的基于P300电位的BCI系统实现对虚拟手臂的控制;瑞士洛桑联邦理工学院(EPFL)实验室为残疾人设计出基于P300的BCI控制系统[2]。
如何让BCI系统贴近生活,设计出更为简单实用的BCI系统,就显得比较重要了。在日常生活中,人们对于密码并不陌生,本文设计的基于ERP的新型输入系统,为密码输入提供了一种更为安全的方式,不用手就可以实现密码的输入。由于好的数据是无可替代的[3],通过实验范式设计来产生较好的刺激效果就显得尤为重要。本文通过变换输入字符的形式及颜色,对不同实验参数进行多组实验。对采集到的EEG进行叠加平均,将P300从EEG背景噪声中分离出来,然后利用独立成份分析ICA(Independent Component Analysis)来剔除眼电,用Fisher线性分类器进行分类,对实验结果进行分析比较来选出最佳的刺激输入形式。
1 实验范式
1.1 字符的形式及颜色
用于密码输入的字符形式可以选择阿拉伯数字(0、1、……9)(以下简称数字)或者大写的数字(零、壹、……玖)(以下简称汉字)。人们一般非常熟悉阿拉伯数字;大写的数字,普及率不及阿拉伯数字,但是在一些特殊的场合,如银行还是会经常用到。并且相对于拼音文字,汉字是更为彻底的视觉文字,其脑机制更注重视觉加工[4]。除了字符形式的对比外,又进行了字符颜色(黑色、红色)的对比。黑色是较为普遍的颜色,红色能够引起人们较为强烈的反应。本文共设计了四组实验:黑色数字、红色数字、黑色汉字及红色汉字。
1.2 实验参数
实验过程中,准备阶段屏幕上将会呈现1 s的“+”,之后随机出现的字符即为目标字符,持续呈现1 s,随后一轮10个字符随机闪烁出现,重复多轮,当出现与目标字符相同的字符时,要求被试者默数一次。每个字符出现的概率相同,且满足偏差刺激概率小于30%;标准刺激概率大于70%。综合考虑参考文献[5-6]之后,初步设定字符闪烁方式亮暗时间/s的组合取为[0.1,0.3],[0.15,0.3],[0.2,0.3],[0.1,0.4],[0.15,0.4],[0.2,0.4];字符重复次数的取值为10,13,15,20;连续无间隔训练的目标字符个数为8,10,15,18。实验过程中发现:亮暗时间太短,被试者的眼睛会很快进入疲劳状态,个别被试者还会流眼泪;如果亮暗时间太长,被试者容易走神,刺激效果不明显;随着目标字符数目的增多,实验所需的时间就会越久,被试者的注意力会下降。在咨询被试者的基础上,分析采集到的数据,最终确定实验参数为:字符闪烁方式为亮0.15 s,暗0.4 s;训练一个目标字符过程中,每个字符随机重复闪烁13次;测试完8个目标字符之后,被试者可以适当休息。
1.3 脑电信号采集
实验采用VC++中的MFC编写信号的采集存储等处理程序,实现19导(FP1,FP2,F3,F4,C3,C4,P3,P4,Po7,Po8,F7,F8,Oz,T4,T5,T6,Fz,Cz,Pz)EEG的同步采集。通过银-氯化银电极制作的电极帽采集EEG,经过数字放大器(中科新拓公司,UEA-24BZ)放大,采样频率定为100 Hz,30 Hz低通滤波。由4名女性、3名男性参与实验,平均年龄是24.7岁,对颜色可以正常识别,视力矫正到正常,右利手。在实验之前,被试者已明确自己的任务,保持头皮干净,情绪稳定,身体状况良好。实验室温度控制在25℃左右。采用单极导联,耳电极为参考电极。测试期间被试者要精神放松,注意力集中,尽可能减少眨眼及肢体运动。待实验结束,咨询被试者默数的目标字符出现次数,以此来判断被试者注意力的集中程度。
2 数据处理
2.1独立分量分析
对每名被试者的各组数据分别进行分析,ICA在去除眼电干扰方面有比较强的优势,不需要依赖于数据的任务标签,就可以在无监督的模式下进行,得到更多独立的信号源,较为真实地反映大脑的源活动,确保各个分量尽可能的独立,绘制出相应的独立分量的空间模式图。观察图像,若在前额FP1、FP2处,颜色越红就表明眼电干扰越大,在随后的处理当中,要在尽可能地保留原始数据的基础上,适当地剔除这些干扰明显的量。
2.2 P300的波形分析
对同一被试者所采集的四组数据进行分析,分别绘制出在Oz处目标字符与非目标字符在刺激之后0.7 s内的波形图,如图1所示,此被试者比较熟悉汉字中的大写数字,P300电位的峰值都出现在0.4 s附近。在同为数字刺激时,在图1(b)中目标字符相对于非目标字符波形的起伏较大,刺激的效应较为剧烈。在同为汉字刺激时,在图1(c)图中目标刺激的最大峰值更为明显,而图1(d)中的波形较为杂乱,对最大峰值有干扰。综合四幅图像来看,图1(b)中红色数字的刺激效果是最好的,在目标刺激的起始阶段,波形较为平稳,P300的峰值集中出现在目标刺激之后的0.2~0.5 s之间。
当被试者对于汉字中的大写数字不熟悉时,汉字试验中,目标字符刺激所产生的P300电位峰值会向后延迟,出现在0.5 s之后。推测其中的原因可能是:当被试对于比较熟悉的图片时,反应快一些;当出现不熟悉的图片时,反应会慢一些,这样目标字符刺激产生的P300电位会向后面有些许的延迟。
2.3 正确率分析
同一个被试者,两周内要完成四组实验。所采集到的数据为:黑色数字组共96个字符;红色数字组共96个字符;黑色汉字组共99个字符;红色汉字组共98个字符,分别进行分类。取刺激之后0.7 s内的数据作为分类特征,进行10次8折交叉验证,分别对四组实验的样本数据分类。绘制出字符闪烁重复次数与正确率之间的关系,如图2所示。
字符在重复闪烁6~9次之后,会达到一个较为平稳的正确率,随着字符闪烁重复次数的增多,并不能提高相应的正确率。所以在设计实验范式时,可以适当地减少字符闪烁的重复次数,缩短实验时间,最终提高输入系统的效率。在图2(a)、(b)中,红色数字的正确率比黑色数字的正确率高;图2(b)、(d)中,红色数字的正确率要比红色汉字的正确率高很多,即在四组实验当中,红色数字的分类效果最好。
综上可知:在图1中,红色数字的波形效果是最好的,目标刺激之后的初始阶段波形较为平稳,在0.2~0.5 s内,P300峰值最大;在图2中,红色数字的分类正确率最高。鉴于人们对于阿拉伯数字的熟悉程度远远高于数字的大写汉字,及对于此密码输入系统的推广,确定出红色数字为最佳的刺激方式。
本文所设计的基于ERP的BCI新型输入系统,通过分别对比输入字符的形式及颜色,采用不同的实验参数进行了多次实验,将脑电信号的处理结果进行比较,确定出了实验范式的最佳刺激方式及合理的实验参数。
在数据采集过程中,由于实验室的条件有限,不能做到完全隔音,以后需要在更加严谨的实验环境中进行。被试者在面对不停闪烁的字符时,很容易疲劳,眨眼是无法避免的,所以要尽量克服BCI任务的枯燥感,减少被试者的疲劳程度,使采集到的数据尽可能干净。今后的工作中,在利用Fisher分类时,还可以挑选出对P300起关键作用的通道或者仅选择刺激之后的0.2~0.6 s之间的数据进行分析,降低数据的维数,进一步提高BCI系统的效率。
参考文献
[1] 赵仑.ERPs实验教程(修订版)[M].南京:东南大学出版社,2010.
[2] HOFFMANN U, VESIN J M, EBRAHIMI T, et al. An efficient P300-based brain-computer interface for disabled subjects[J]. Journal of Neuroscience Methods, 2008, 167 (1):115-125.
[3] (美)STEVEN J.LUCK著.事件相关电位基础[M].范思陆,丁玉珑,曲折,等,译.上海:华东师范大学出版社,2008.
[4] 张学新,方卓,杜英春,等.顶中区N200:一个中文视觉词汇识别特有的脑电反应[J].科学通报,2012,57(5):332-347.
[5] POLICH J. Updating P300: An integrative theory of P3a and P3b[J]. Clinical Neurophysiology, 2007, 118(10): 2128-2148.
[6] DUNCAN C C, BARRY R J, CONNOLLY J F, et al. Event-related potentials in clinical research: Guidelines for eliciting, recording, and quantifying mismatch negativity, P300, and N400[J]. Clinical Neurophysiology, 2009,120(1)1883-1908.