3.2 生理计算理论
本节将对生理计算领域常用的生理信号进行简单的介绍,并且介绍常用的信号采集设备,以及对这些信号的处理、特征提取、分类识别的常用方法等。
3.2.1 生理学概念
最早监测生理指标的方法是直接观察,即在胸部放置一只“耳朵”来听心脏有节奏的跳动。20世纪初,用于放大生理信息的专用机械和电子设备开始出现,随着计算机的普及,有很多生理传感器被开发出来以利用其进行数据处理和分析。
心理生理学家已经研究了80多年可监测的生理信号,试图了解身体对不断变化的心理和身体状况的反应。现代生理传感器检测人类神经系统三个区域的活动:中枢神经系统(CNS)、躯体神经系统(SNS)和自主神经系统(ANS)。中枢神经系统包括大脑和脊髓,躯体神经系统与肌肉控制有关,自主神经系统控制和协调身体的主要腺体和器官[15]。
随着科学家对人体的了解不断深入,以及生理传感器技术的发展,人类对人体生理信息的采集越来越多样。下面介绍几种在生理计算领域常用的生理信号。
1.脑电信号
脑电信号是存在于人体大脑皮层的一种自发性、节律性的电活动,放置在头皮上的电极可以测量这种大脑皮层或表面的电活动。脑电信号可以用来监测清醒大脑的警觉状态,是一个有用的可用性指标,特别是在评估安全关键系统时。例如,高频β波(14~30Hz)与高度警觉状态相关,α波(8~13Hz)表示放松警觉状态,δ波(1~3Hz)与困倦相关。通过在用户完成任务时监测脑电信号,有可能测量任务参与度[9]或任务难度,并找出用户注意力不集中的时刻[10]。研究表明,随着任务变得越来越困难或要求越来越高,头皮正面部位的θ波(4~7Hz)会增加。而且,任务难度增加,α波会受到抑制[12,13,18] 。
除了监测连续的、振荡的脑电信号,我们还可以在大脑中寻找对特定刺激的离散的、可重复的电反应。这些电反应被称为事件相关电位(ERPs)。与离散的心理事件、闪光刺激或行动准备(准备移动脚或手)有直接关系的这些信号已经被证明是可靠的输入控制信号,可以作为无须手控制的应用系统的输入信号。
2.肌电信号
通过将两个电极放置在皮肤合适的肌肉上,可以记录与肌肉的活动有关的电活动。得到的电信号可以用来推断肌肉的状态是完全收缩、部分收缩还是完全放松。
因为肌电信号显示了肌肉活动最细微的迹象,所以是运动准备的良好指标。由于肌肉张力的增加可能预示着负面影响,所以肌电信号已经被作为评估虚拟环境中用户存在感的潜在指标。
对肌电信号的心理生理学研究表明,面部肌电信号对愉快和不愉快刺激的反应是一致的,尤其是眉毛的肌肉结构。这种监控前额表情的能力提供了一个有用的可用性指标。
3.眼电信号
眼电信号是眼角膜和视网膜之间电位差的量度,可以通过位于眼睛周围的电极来测量。眼电信号提供了关于眼睛移动位置和速度变化的信息。基于头部的静态位置,使用眼电信号可以定位眼睛的x、y坐标,这也是基于视频的眼睛跟踪系统很受欢迎的原因。但是无论使用哪种方法,眼睛运动捕捉都可以提供关于视觉注意力分配给用户界面哪些组件的重要线索,并可作为设计更精细的用户界面的参考。
基于视频的眼睛跟踪设备是测量瞳孔反应的好方法。圆形和放射状肌肉纤维可控制瞳孔的收缩和扩张。瞳孔大小对情绪刺激做出反应,无论是积极的还是消极的,都为情感计算应用提供了另一个潜在的有用的参考依据。瞳孔大小的变化也可能与心理刺激的呈现时间相关。
眼电信号传感器也可用于测量眨眼。眨眼率和持续时间的测量产生了关于任务需求和疲劳程度的有意义的信息,使其成为界面评估和可用性测试的一个很好的指标。此外,眨眼可以用作切换信号,相当于点击按钮,无须用手控制鼠标。
4.心电信号
心电信号是与心肌收缩相关的电事件的量度。心率(HR),也即对心脏跳动速度的测量,通常用一分钟心跳的次数(bpm,beat per minute)来表示。心理刺激和体育活动都会增加心率。例如,当接口任务由于认知需求、时间限制或不确定性而具有挑战性时,心率通常会增加。
心率以前曾被用来评估电脑游戏的刺激效果,最近已经被整合到电脑游戏中,根据检测到的玩家心率变化,实时改变挑战水平。除了像挑战这样的心理过程,一系列身体活动也会影响心脏。心率的控制代表了体温调节、血压控制和呼吸模式影响的融合。研究人员试图通过对心脏周期数据进行快速傅里叶变换(FFT)来提取这三种影响。这项研究已经确定了一种被称为0.1Hz窦性心律不齐的中频成分(或心率变异性HRV的中频成分)。这种成分被认为是对实验室任务和现实生活活动的心理反应。
5.呼吸模式
当一个人吸气和呼气时,胸部的隔膜会膨胀和收缩。这种呼吸活动的速率和深度可以用固定在胸部周围的带状传感器来测量。呼吸速率可以量化为每分钟呼吸的次数。就呼吸速率作为可用性指标而言,值得注意的是,呼吸速率随着任务需求而增加,当互动任务很困难或要求很高时,呼吸会更长、更深。还有研究声称,呼吸模式可能反映情感的二分性,如平静-兴奋和放松-紧张。
6.电活性/皮肤电
如果在皮肤上放置两个电极,并通过它们驱动一个小的恒定电流,则皮肤可以被看作是一个可变电阻。电极两端产生电压,欧姆定律的应用可以用来计算皮肤的有效电阻。
电活性可以体现人体对情感刺激做出的反应,如音乐、观察到的暴力、色情刺激等,可以用来实现系统反馈的自适应调节。这项措施也涉及脑负荷的测量,手指、手掌、前臂和脚底是测量电活性的活跃部位。因此,必须考虑记录这种电活性的手段,以及它如何影响个人的正常运动或行为。
7.血压
血压是心脏泵血的力量的量度。血压的测量也反映了血液流经动脉的阻力特性。静息血压水平受到多种人自身因素的影响,如有氧健身、情绪状态等。有研究建议通过综合心电信号和血压信息来区分处于挑战状态和威胁状态的人,对于关键应用体验的评估和计算机游戏的设计,这些信息特别有用。
从前面的描述中可以发现,直接采集得到的生理数据的特性并不明显,作为计算机的输入源,生理信号远不如我们过去使用的数据源可靠。生理信号受很多因素的影响:①个体的生理特征。每个个体的生理特征都是独一无二的,正常的心理生理活动的潜在范围必须考虑到性别、年龄和健康状况等。②环境因素。大多数心理生理参数容易受到环境影响,如温度和湿度的变化等。③行为影响。心脏活动(心率/血压)也可能受到吸烟、姿势和时间等因素的影响。这些可变因素妨碍了生理信号作为输入源的可靠性。然而,随着上下文感知技术的发展,人们可以利用对探测到的用户环境的信息,来实现生理数据的标准化。
3.2.2 生理信号采集手段
在明确了生理信号的发生原理后,信号的测量是一个非常重要的过程,生理信号采集设备的发展也经历了一段巨变。
近几十年来,心理生理学分析的研究发展迅速,利用脑电图、心电图和皮肤电导等心理生理指标来评估用户在各种环境下的认知和情感状态。针对不同背景的人,根据他们的教育背景、兴趣和灵感来使用心理生理分析。为了记录人机交互过程中的用户体验或心理效应,人们进行了各种各样的研究,利用心理生理学数据中的实时特征来获取受试者的心理状态。
在心理生理学中,为了记录心理生理信号,有三种测量方法:问卷、信号读取和行为分析[19]。
问卷评估了参与者[20]对自我心理和生理状态的反省和自我评价,是最常用的记录自我评价的方法。使用问卷的优点是其为用户主观体验的一种表达,然而这种方式也存在很多缺陷,比如人为的错误、偏见反应、对问题的误解或调查的规模不够大等[21]。
信号读取与生理反应相对应。这些生理反应是通过一些仪器来测量的,仪器可以读取诸如心率、体温、肌肉紧张、脑信号、皮肤电导等身体事件。使用这些措施的好处是,它们提供了准确的反应。由于它们很容易出现身体活动和外界因素混合影响的情况,所以信号读取后的噪声去除也是一个非常重要的步骤。
行为分析包括观察和行为的记录,如面部表情、眼球运动等[20]。这些反应易于测量,主要用于与注意力和情绪相关的实验[22,23]。
在心理生理学中,通常需要对生物信号进行复杂的交互分析。心理生理分析的应用很广泛,比如通过压力检测实现测谎的功能,通过测量短期情感反应(感觉、情绪、性格等)[24]来监测实验对用户的影响等。情感反应被认为是一种基于环境和情绪本能的心理状态。这些反应是自发的,持续几分钟,因此很难识别。心理生理学分析中常用的经典情感状态有愤怒、蔑视、厌恶、恐惧、快乐、中性、悲伤和惊讶等。研究人员可以利用这些信号来推断人的情感状态。另外,研究人员还可以利用心理生理学信号来估计参与者的认知状态。这些信号被用来分析低阶认知过程(如简单的视觉检查)和高阶认知过程(如注意力、记忆、语言、工作负荷等)[25]。不同的信号来源用于不同的心理生理分析,如心电信号(ECG)、皮肤电导(GSR)、脑电信号(EEG)、肌电信号(EMG)、呼吸速率(RR)、皮肤温度(ST)、面部表情等。
为了采集和记录上述的心理生理信号,各种各样的新技术在过去被用于电极的设计中。目前人体生理信号采集技术已经从湿电极升级到干电极,氯化银/银是这些生物反馈传感器最常用的电镀材料。除氯化银/银外,传感器还使用了金、铝、不锈钢和镍、钛等其他金属的混合物[26]。湿电极需要电解凝胶来增加传导,但会给参与者带来不适。因此,对于涉及实时记录的应用,应首选干电极[27]。
随着技术的发展,这些传感器技术逐渐成熟,并有公司生产了可以同时采集多种生理数据的设备。常用的生理信号采集设备,如美国BIOPAC公司生产的多导生理记录仪,它是目前世界上应用广泛、功能强大的电脑化多导生理记录仪,产品分为MP系列16通道研究型多导生理记录仪及Student Lab系列4通道学生实验型多导生理记录仪,可以完成以下生理信号测量:心电、脑电、肌电、眼电、胃肠电、诱发电位、神经电位、细胞电位、有创血压、无创血压、dP/dt、体温、肌张力、呼吸波、呼吸流速、组织血流速度、血管血流量、氧气含量、二氧化碳含量、血氧饱和度、无创心输出量、光电脉搏容积、皮肤电阻、电刺激等。另外,对于脑电,还有Neuroscan EEG/ERP记录系统,它为脑科学的研究提供了很好的技术和研究平台。
3.2.3 生理信号分析
在了解了生理学上有哪些常见的生理信号以及采集设备后,我们需要知道如何对这些信号进行处理与分析。下面针对人机交互领域应用比较广泛的几种生理信号的处理、特征提取、分类识别的过程进行简单的介绍。
1.肌电信号
肌电信号虽然是非常微弱的,但是它蕴含着很多与肢体运动相关联的信息[28]。通过表面电极可以检测到用户肌肉收缩的意图。显然,截肢者或残疾人能够在不同水平的静态肌肉收缩或动态肢体运动中产生可重复但逐渐变化的肌电信号模式。这些模式可用于控制系统,即所谓的肌电控制系统(MCS),以控制康复设备或辅助机器人。
肌电信息采集方式分为两种。第一种方式是针电极肌电信号,以针形电极为引导电极,将其插入肌肉内部,直接在活动肌纤维附近检测电位信息。这种采集方式干扰小、定位性好、易识别,具有良好的空间分辨率和较高的信噪比。但是这种方式会给人体带来创伤,不宜同时测量多路信息。第二种方式是表面电极肌电信号,它是从人体皮肤表面通过电极记录神经肌肉活动时发出的生物电信号。这种方式具有较大的检测表面和较低的空间分辨率,记录的信号为一定范围内肌纤维电活动的总和。这种采集方式虽然无损伤性,但是容易受到外界干扰。
因为第一种采集方式对人体是有伤害的,所以一般都采取表面电极肌电信号采集方式。表面电极肌电信号(MES)是通过放置在用户肌肉上的皮肤电极来收集的,电极通常配有微型前置放大器,以区分感兴趣的小信号。信号经过标准的肌肉电仪器放大、滤波、数字化,最后传输到识别模块。
识别模块由三个部分组成:活动段检测、特征提取、分类识别。由放置在人手臂皮肤表面预定位置上的表面肌电信号传感器同步获取多通道表面肌电信号数据,经由活动段检测方法标定每一个动作执行时对应信号流的起止点,再通过特征提取后进行分类识别,动作的识别结果可以转化为控制指令,作为人机交互的输入。
(1)活动段检测。从连续采集的多通道肌电信号数据流中提取出对应于动作执行时的信号,称为活动段。活动段检测的任务是确定手势动作表面肌电信号的起点和终点位置。已有的表面肌电信号活动段提取算法有短时傅里叶方法、自组织人工神经网络方法、移动平均方法等。
(2)特征提取。由于大量的输入和信号的随机性,将一个时间序列的肌电信号直接输入分类器是不切实际的。因此,序列必须映射到一个更小的维向量,它被称为特征向量。这就决定了任何模式识别问题的成功与否与特征的选择和提取效果有直接的关系。肌电的特征可分为三类:时域、频域和时频域[29]。针对特征提取效果的评价有两种方法:结构分析和现象分析。在结构分析中,特征是基于物理和生理模型来评估的,在信号产生过程中考虑。在结构分析中,可以使用数学模型生成的合成信号来评估所选特征,如偏差、方差和对噪声的灵敏度水平。现象分析方法对信号进行了粗略的解释。这种方法有时被称为经验方法,主要根据分类性能的比率及其鲁棒性来评估特征。
特征提取常用的方法有时域分析方法、频域分析方法、时频分析方法。
时域分析方法由于计算相对简单,并且是基于信号振幅、周期、形状等特征的,因此是肌电分类中最常用的方法。将肌电作为一个零均值随机信号,振幅可以定义为一个信号的时变标准差(STD),它与主动运动单元的数量和激活率成正比。振幅由特征表示,表示信号能量、激活水平、持续时间和力,受到电极位置、组织厚度、肌肉纤维中运动单元的分布、肌肉传导速度和用来获取信号的检测系统等因素的影响。为了判断幅值特征的质量,将信噪比(SNR)定义为一个段内样本的均值除以其标准差,这个比率是测量信号振幅的随机波动,更高的信噪比可以产生更好的特征。当力量或姿势改变时,时域分析方法不再是一种有用的测量方法。常用的肌电信号时域特征有积分肌电值、过零点数、方差、肌肉电信号的时序模型(自回归模型、滑动平均模型、自回归滑动平均模型)和肌肉电信号直方图。
频域分析主要用于研究肌肉疲劳,并推断活动单元的变化。信号频谱受两个因素的影响:低频范围(40Hz以下)的发射率和高频范围(40Hz以上)[30]中沿肌纤维运动的动作电位形态。它是时变的,直接取决于收缩力、肌肉疲劳和电极间距离。在持续的随意收缩过程中,即使没有肌肉状态的随意改变,肌电信号也应被视为非平稳信号。频域分析方法有两种常见的做法:求取功率谱的平均功率频率和中值频率。
时频分析方法将时域和频域结合起来,同时分析时域和频域的信号。对于表面肌电信号的分析,常用的时频分析方法有短时傅里叶变换、Wigner-Ville变换、Choi-Williams分布及小波变换等。
特征提取需要根据这些特征来对数据进行分类识别。
(3)分类识别。提取的特征需要分为不同的类别,以识别所需的运动模式。由于肌电信号的性质,我们有理由认为某个特征值会有很大的变化。此外,还有一些外部因素,如电极位置的变化、疲劳和出汗,这些都会导致信号模式随时间的变化。分类器应该能够最佳地处理这种变化的模式,并防止过度拟合。分类应该足够快,以满足实时约束。一个合适的分类器必须能够有效地对新的模式进行分类,而在线训练可以长期稳定地保持分类性能。常用的分类算法有神经网络、模糊推理等。
许多文献强调了神经网络在肌电分类中的成功。神经网络的主要动机源于使用人工智能(AI)通过学习来执行任务的愿望。神经网络的优点是它既能表示线性关系,又能表示非线性关系,并能直接从被建模的数据中学习这些关系。它还满足实时约束,这是控制系统的一个重要特征。基于识别的肌电控制作为开发实时模式的先驱,Hudgins等人[29,31]使用多层感知器(Multi-Layer Perceptron,MLP)神经网络对时域特征进行分类。它能够区分四种类型的肢体运动,错误率在10%左右。最近,Zhao等人[32]应用MLP神经网络基于信号的时间尺度特征和熵来识别六种运动模式,平均正确率约为95%。
利用模糊推理进行生物信号处理和分类具有许多优点。生物信号并不总是严格可重复的,有时甚至是相互矛盾的。模糊推理能够容忍数据中明显的矛盾。模糊推理能够发现数据中不易检测的模式。此外,在模糊推理方法中,医学专家的经验可以被纳入处理和分类。由于它的推理方式,将这种不完整的但有价值的知识整合到模糊推理中是可能的。模糊推理方法利用不精确、不确定和部分真实的容忍度,实现易于处理的、健壮的和低成本的分类解决方案。
在分类识别之后,系统得到了确定的指令,再将指令输入控制设备中,就完成了肌电控制的单向流程。肌电控制应该提供高度的直观和灵活的控制,并提供高水平的性能。肌电控制中可控性的三个重要方面是系统的准确性、执行控制的直观性以及系统响应时间。
系统的准确性对于用户意图的真实实现至关重要。它必须尽可能地高,尽管很难定义一个可接受的阈值,但因为没有明确的临床尝试解决这个问题,所以准确性是开发多功能控制器的关键因素,可以通过从肌肉状态中提取更多的信息,并采用能够利用这些信息的强大分类器来提高准确性。此外,增加用于数据收集的活动肌肉的数量,开发包含丰富信息的特征集,可以提高系统的准确性。
实际应用中,直观性的缺乏源于用户当前的知识和执行操作所需的知识之间的差距。它可以通过增加用户的知识来实现,也可以通过减少执行操作所需的知识来实现。前者需要大量的培训,而后者需要开发强大的智能用户界面。因此,肌电控制应该能够学习肌肉的激活模式,以一种自然的方式来驱动运动。它们需要在运行过程中对不同的条件具有足够的健壮性,并且在面对新的数据或模式时具有很高的效率。直观性减轻了使用者在长期操作和自然的日常工作中的心理负担。
2.脑电信号
大脑皮层内众多神经元细胞自发性、节律性的电活动产生了脑电信号,通过监测脑电信号中不同频率、幅值和波形的电位变化就可以获取到人的情绪、思维等心理活动信息。随着传感技术和计算机技术的快速发展,脑电信号在越来越多的领域中得到广泛应用,从最初在临床医学上用于疾病的诊断和治疗,到如今越来越多地研究通过对人脑电信号的提取和分析实现脑机接口(BCI),给出了一种更加直接、方便和快捷的人机交互方式。
目前的脑电信号研究已经发现,人体自发的大量节律性的脑电信号中主要包括以下几类不同频段下的信号:
① δ波。频率为1~3Hz的脑电信号,较多出现在人类的婴幼儿时期,成年人在正常状态下很难被监测到。
② θ波。频率为4~7Hz的脑电信号,幅值为20~40μV,是人类青少年时期(10~17岁)脑电信号所处的主要频段,同时与成年人的精神状态有很大关联,但成年人精神抑郁、心情低落时较易被观测到θ波,而人情绪较好时很难被观测到。
③ α波。频率为8~13Hz的脑电信号,是正常人脑电信号的基本节律,在人安静休息但保持清醒时观测最显著,一旦人受其他刺激或者发生具有目标性活动时,α波就会消失,β波替代出现。
④ β波。频率为14~30Hz的脑电信号,一般与人所进行的活动种类有关,其频率代表着人大脑皮层的兴奋程度,当人情绪亢奋或精神紧张时会显著观测到该频段的脑电信号。
⑤ γ波。频率在30Hz以上的脑电信号,同样是在人情绪强度较高时会出现。
脑电信号基本波形如图3.1所示。
应用脑电信号的第一步就是要采集脑电信号,目前应用最为广泛的方式仍然是使用脑电图仪,实际测量时根据测量电极放置位置的不同,可以得到不同的脑电图,包括深部脑电图、大脑皮层脑电图和头皮脑电图。常规的脑电测量都采取头皮脑电的测量方法,国际标准导联系统10/20电极放置法是目前最常用的电极放置标准。该标准中,16或19个电极被放置在头皮的特定位置上,如图3.2所示[33]。
图3.1 脑电信号基本波形
图3.2 10/20国际标准导联系统电极放置位置示意图[33]
表3.1为16导联采样电极放置位置与对应符号[33]。
表3.1 16导联采样电极放置位置与对应符号[33]
脑电信号的特征提取是脑电信号应用的重点。历史上,Dietch于1932年利用傅里叶变换首次对脑电信号进行了分析,此后人们将频域分析、时域分析等众多信号处理的经典方法引入脑电分析中。脑电信号的时域分析主要用来直接提取脑电信号在时域下的波形特征,如方差分析、峰值分析、相干分析、波形参数分析等,它直观性强,物理意义明确,但由于脑电信号非平稳随机信号的特点,导致直接在时域下分析困难且获取有效信息有限。频域分析方法主要包括功率谱分析、自回归参数模型谱分析、双谱分析等。功率谱分析是脑电信号分析中最常用的方法,由于脑电信号是非平稳的随机信号,在功率谱分析中对分段后的短时信号做傅里叶变换,将变换后的幅频特性平方乘以适当的窗函数,作为该信号最终的功率谱估计。虽然分段后的短时信号可以认为是准平稳的,但是这种分析方法仍然存在着分辨率差、谱估计方差大、存在边瓣等缺点。为了改善功率谱分析的这些不足,自回归参数模型谱分析被提出来,通过该方法可以得到高分辨率的谱分析结果,在脑电信号的动态特性分析中的优越性尤为明显。双谱分析则是针对功率谱分析方法会丢失脑电信号中包括相位信息在内的高阶信息的问题提出的改进方法。小波变换由于具有多尺度分析的能力,通过选取合适的基本小波,就可以使变换后的信号在时域、频域上都具有较好的特征表现能力。通过调整小波尺度,就能够提取到信号不同时间尺度下的特征。除了以上经典的特征提取方法,近年来人工神经网络分析、非线性动力学分析等现代信号分析方法也广泛应用于脑电信号的特征提取中,通过这些现代的分析方法可以提取出很多常规时域和频域下分析方法难以获取的特征信息,具有广阔的应用前景[34]。
在提取脑电信号的特征信息之后,需要根据这些信息对人体的生理和心理状态做出判断。这时一般会采用机器学习的方法对脑电信号进行分类。目前用于脑电信号分析的分类器包括有监督学习和无监督学习两种。有监督学习包括支持向量机(SVM)、贝叶斯方法、神经网络算法等,因为算法中加入了标签,因此更加有利于信号识别的准确率,使用更为广泛。支持向量机泛化能力强,全局性优化和分类效果好,特别适用于非线性、小样本类的问题,因此是脑电信号的分类问题中最常用的一种方法[35]。神经网络算法以样本信息为指导,不断修正模型中的参数权值,再利用训练出的感知器对样本进行分类[36]。而贝叶斯方法相比于其他分类算法,能够更有效地拒绝不确定样本。虽然有监督学习的分类算法具有更好的分类准确率,但是由于个体脑电信号存在差异性,而无监督学习的分类算法更加接近实际应用,同时很多与脑电信号有关的实际应用并没有明确的类别标签,在这种情况下,无监督学习的分类器也更为合适。无监督识别算法的核心在于利用样本自身向特性相近的同类样本聚集从而达到异类样本分离的目的。模糊C均值聚类算法通过寻找类别本身的固有特征,从而找出相似的样本,达到分类的目的,是一种广泛用于脑电信号处理中的无监督学习分类算法[37]。
脑电信号应用最广泛的是与医学、生理学相关的领域,最典型应用就是基于脑电波的人类睡眠研究。目前,学术界普遍将睡眠状态分为以下几个阶段。①NREM睡眠阶段S1期。入睡期,该阶段的脑电信号中,α波会降至50%以下,幅值较低的θ波增多,后期可能会出现驼峰波。②NREM睡眠阶段S2期。浅睡期,脑电信号中θ波显著增多,同时开始出现中低幅值的δ波以及睡眠纺锤波。③NREM睡眠阶段S3期。中度深睡期,睡眠纺锤波的幅值增大,频率减小,δ波含量增多,占20%~50%。④NREM睡眠阶段S4期。深睡期,睡眠纺锤波逐渐消失,δ波含量明显增多,占比超过50%。⑤REM睡眠阶段。此阶段脑电信号与S1期类似,开始时会观察到锯齿波,α波也会增多但不规则[38]。通过脑电图仪可以采集人体在睡眠时的脑电信号,这些信号经过滤波放大等预处理后就可以用于脑电信号的特征提取中。在文献[39]中,作者使用4阶Daubechies小波对脑电信号进行4层分解,然后分析4层小波中脑电信号中各个频段的信号的含量,发现各个频段小波包系数的均值和标准差在不同睡眠状态下具有显著的区别,如小波包的D2分量中包含了α频段和β频段的信息,而随着睡眠状态由浅睡眠到深睡眠的转变,D2分量的该特征也逐渐减小。通过将提取到的脑电信号各个频段的小波包系数均值和标准差作为睡眠自动分期的特征参数,输入到分类器(支持向量机)中训练,最终得到的睡眠自动分期分类结果的准确率高达85%。
由于脑电信号中存在的不同节律频段信息与情绪等心理活动有着密切的关联,因而基于脑电信号的人类心理活动研究也具有广阔前景,例如基于脑电信号的人类情绪识别。Lange二维情绪分类模型认为,情绪是由效价(Valence) 和唤醒度(Arousal)两个维度构成的。效价指的是情绪体验及其强度。唤醒度指的是与情绪活动有关的机体唤醒程度。在情绪的多系统模型中,认为情绪是不同基本元素的集合,例如快乐、厌恶、悲伤、愤怒、害怕、恐惧等。脑电信号中,不同频段信号的强度变化与人情绪变化有很强的关系,例如脑电信号中的γ波强度随着情绪亢奋程度(情绪的强度)的增大而增大,θ波能量则随着积极情绪的增强而增大,大脑右额区的α波能量会随着负面情绪(悲伤、厌恶)的增强而增大,人在害怕时大脑左前额区β波会明显上升,在高兴时大脑C4导联区域的α波强度会下降,悲伤时大脑左前额区的α波强度也会下降,在比较平和的状态下,大脑T5导联处的γ波会上升,CP5导联处的α波会下降[40]。
基于脑电信号的情绪识可以分为情绪诱发、脑电信号的采集和预处理、脑电信号中的情绪特征处理以及基于提取特征的情绪识别几个步骤。首先通过面部肌肉动作和表情、语音提示、回忆等方式可以诱发人的各种情绪,在此基础上通过脑电采集仪器采集原始脑电信号,并通过滤波和放大操作滤除噪声信号。然后通过上文所提到的特征提取方法对经过预处理后的脑电信号进行特征提取,如提取出不同事件相关电位(ERP)成分的潜伏期和幅值、脑电信号不同频段的功率谱、大脑左前额叶和右前额叶处α波能量的不对称度等特征。针对情绪与脑电信号关联的不同角度可以选择不同的特征进行提取,每一种特征提取的方法可能对某种特定的情绪识别具有优势,而多种特征的结合则可以相互补充,达到更好的情绪识别效果。提取到的特征信息将输入到情绪分类器中,实现确定情绪状态的目的。分类器的设计如前文所述,使用无监督学习的算法,如支持向量机、神经网络等能够实现更好的识别准确率。而通过无监督学习的算法对情绪进行聚类,则可以排除个体脑电信号的差异性,更加符合实际应用场景。
3.眼电信号
一些残障人士全身瘫痪,比如脑瘫、肌肉萎缩症患者等,但他们依然可以控制眼球。所以,基于眼电控制的系统在帮助残障人士的应用上有很大的优势。一个眼电信号控制系统的步骤分为信号的检测与采集、特征分析与识别。
对于信号的检测与采集,可以通过双导联的方式,将银/氯化银贴片电极置于眼睛周围检测与采集眼电信号,再通过信号放大模块、电缆驱动电路、带通滤波模块、电平转换模块、数据存储模块得到最终的信号。眼电信号可分为眨眼、扫视、凝视。当眼睛凝视时,可以采集到一条稳定的基线,当眼球上下或左右移动时,眼电位的变化与眼球移动方向以及角度呈线性关系变化。扫视是快速的移动,眨眼则是眼睑开合的动作,表现在垂直眼电信号中。
已有的研究发现,在收集了多名被试的眼球运动数据后,对各种动作的眼电信号的幅值、用时进行统计归纳。发现有意识眨眼的信号比无意识眨眼的信号幅值大,扫视运动的眼电信号有明显的脉冲信号,幅值与眨眼信号的幅值有明显差异[41]。
根据眼电信号的规律,我们可以采用阈值法限定有意识眨眼的眼电信号脉冲的条件为:脉冲宽度为200~300ms,脉冲峰值大于等于采样数据中有意识眨眼脉冲幅值最小值与无意识眨眼脉冲幅值最大值的均值。而对于扫视运动,作者采用同样的方法,根据采样数据的n个扫视运动眼电信号的脉冲幅值绝对值,设立了脉冲宽度与幅值的阈值。
4.皮肤电信号
皮肤是人体与环境接触的最大的身体器官。很多重要皮肤电信号中的过冲是由一些身体活动引起皮肤表面变化而造成的,尤其是汗腺自主神经的活动在皮肤表面的变化,反映了自主神经系统中交感神经系统的活动。根据觉醒激活理论[42],这种自主神经系统的活动变化可以反映人的心理活动。
比如在情绪识别领域,皮肤电信号会因为情绪的不同而有不同的反应。比如当一个人感到害怕或焦虑时,汗腺活动会增加,那么皮肤电传导也会增加。Kim团队使用银/氯化银电极置于手指上来检测皮肤电信号,对情绪的识别准确率达到95%[43]。Jang团队通过分析发现,皮肤导电水平和皮肤电反应的变化映射了情绪的变化[44]。
3.2.4 小结
对于生理计算系统,生理数据首先由传感器记录,然后经过数据的预处理,相关特征提取后得到特征数据,再将处理过的数据经由推断规则,比如阈值法、神经网络等转换为用户心理状态的估计值,最后系统推断出用户的状态或指令,根据用户的状态或指令进行生理计算系统的下一流程。