您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页基于fMRI的思维数据分析方法研究

基于fMRI的思维数据分析方法研究

来源:华佗小知识
计算机研究与发展 DOI:10.7544/issn1OOO一1239.2014.20120591 Journal of Computer Research and Development 51(4):773—780,2014 基于fMRI的思维数据分析方法研究 邓红霞 相 洁 。 游 雅。 李海芳 (太原理工大学计算机科学与技术学院 太原030024) (北京工业大学WIC研究院北京 100022) 。(Jg京理工大学管理与经济学院 北京 100081) (dhx9911@163.com) Analysis Method of Thinking Data Based on fMRI Deng Hongxia 。Xiang Jie ~,You Ya。,and Li Haifang (CollPge of Comput8r Science and Technology,Taiyuan University。f Technology,Taiyuan 030024) (ThP Int rn口tio al WIC Institute,Beijing University of Technology,Beijing 100022) 。(Sch00l of Management and Economics,Beijing Institute of Technology.,Beijing 100081) Abstract Recentlv,a growing number of studies have shown that machine learning technologies can be used to decode mental state from functional magnetic resonance imaging(fMRI)data.It has achieved the functional positioning of the brain activity using fMRI technology to interpret the thinking data.But how to run the specific operation of the brain’S thinking process is still unknown. The analytica1 methods to better reveal the thinking process need to be further studied.Through adopting two stimuli tasks of solving the 4×4 Sudoku problems and image emotional reaction,the thinking process data which interpret the different state of mind is gotten,and different ways of thinking data analyrsis methods are explored.The experiments proved that the feature selection methods of£一test,the feature extraction methods of the peak time and the classification algorithm of SVM are more suitable for analyzing the fMRI data,especially to two different states of mind data above。which can reveal the correct state of mind.This essay should provide the theory basis and data for promoting the fMRI technology to interpret the thinking data. Key words functional magnetic resonance imaging(fMRI);feature selection;feature extraction peak value;classification 摘要利用功能磁共振成像(functional magnetic resonance imaging,fMRI)技术解读思维数据,已经 实现大脑活动的功能定位,但是大脑的思维过程具体如何运行还不得而知;利用何种分析方法更能揭示 思维过程也待进一步研究.采用解决4×4数独问题和图像情感反应的两种刺激任务获取思维过程数 据,来分别解读不同的思维状态,探索适用于不同思维数据的分析方法.实验数据证明t-test的特征选 择方法、峰值所在时间点的特征提取的方法和SVM分类算法较适用于分析这两种不同思维状态的 fMRI数据。揭示正确的思维状态. 关键词功能磁共振成像;特征选择;特征提取;峰值;分类 中图法分类号TP18 收稿日期: 2012 07 18;修回日期:2013 03 26 基金项目: 国家自然科学基金项目(61070077,61170136);山西省自然科学基金项目(2010011020 2,2011011015—4);北京市博士后工作经费 资助项目(Q6002020201201);山西省研究生优秀创新项目(20113034) 通信作者: 李海芳(1ihaifang@tyut.edu.cn) 774 思维是人类所具有的高级生理机能,通常将思 维看作是头脑中考虑某个问题的一般过程.而头脑 中所考虑的问题可以是多种多样的,例如数字、图 形、情感、声音、颜色等等.考虑问题的多样性造就了 思维的多样性,从而探究人类的思维是一项艰巨的 任务.随着功能磁共振成像(functional magnetic resonance imaging,fMRI)的出现,人类越来越多地运 用fMRI技术去探究人脑从事各种任务的思维状态. 由于fMRI数据是一种高维的数据,因此在分 析数据时存在一定的困难,如何有效地进行数据分 析,能否找到一种有效的分析方法,对于解读人类思 维有着重要的作用.在以往的研究中,对于认知方面 的研究较多,从而出现了较多的分析方法,但是没有 一种适用于fMRI的通用的方法. Mitchell等人ll 提出了关于特征选择的两种方 法:第1种是减少体素的个数,可以选择感兴趣区域 或者一个trial中特定的一个点;另1种是减少维 数,可以进行奇异值分解、主成分分析或者成分 分析.关于特征提取介绍5种方法:第1种是选择激 活区的体素,利用的是t-test对每一个体素进行计 分;第2种是针对于体素进行训练预测,对每一个体 素进行准确率的计算,从而选择特征;第3种是选择 相邻的体素进行第2种的操作;第4种是使用方差 分析提取特征;第5种是选择在不同的类标下,反应 相同的体素.Wang等人在文献[2]中提到认知状态 的fMR1分类器有3种特征提取的方法:第1种是 计算每一个感兴趣区域中的所有体素激活的均值, 用这些均值作为特征;第2种是在每一个感兴趣区 域中选择出激活程度最大的n个体素,计算它们的 均值,用这些均值作为特征;第3种是在全脑中选择 出激活程度最大的”个体素,用这些体素作为特征. Norman等人在文献[3]中提出利用多体素的模式 进行fMRI数据分析,分析认知过程中的表征在大 脑的反应.Ramish在文献1-4]中提出了用聚类的算 法进行特征提取,并提出在fMR1分析中可以用到 神经网络、成分分析和主成分分析的方法.Cox 等人 在研究脑部fMRI数据时,提出了两种特征 选择的方法:一种是方差分析的方法;另一种是使用 功能定位的软件包正确地定位激活区域.Kuncheva 等人在文献[6]中总结了7种不同的方法:总体的激 活度、每一类的激活度、方差分析、支持向量机、递归 特征去除方法、激活度和递归特征去除方法的结合、 递归特征去除方法和序列前向选择结合.Grindrod 等人l7 使用了多因素的方差分析的统计方法选取特 计算机研究与发展2014,51(4) 征体素,同时也提取了左额叶的感兴趣区域的体素. Damon在基于fMRI的特征提取方面,通过标准的 方差分析和单因素多元方差分析、互信息比较,得出 分类准确率较高的提取方法.相洁 利用fMRI研究 4×4数独问题的大脑的认知状态中,采用了血氧含 量(blood oxygenation level dependent,BOI D)在每一 个时间点上的变化值和峰值所在时间点等特征提取 的方法. 因此,目前国外的研究主要是在认知方面,在认 知实验得到数据的基础上研究数据分析的方法,通 常是在一种实验任务得到的数据下进行相关数据分 析方法的研究,实验方法各种各样,但是没有得到一 种普遍适用fMRI数据的分析方法.国内的研究主 要是集中在尝试不同的算法在fMRI上的应用,很 少有进行不同方法的比较.在fMRI数据的分类器 中,国内较多的是选择一种分类器进行实验的分类, 最终得到分类的准确率,而研究fMR1分类器的人 也相对较少.Mitchell等人_l 作了较全面的实验,得 出了一些关于fMR1分类器性能的比较结果.其中 支持向量机(support vector machine,SVM)是一种 较好的分类算法,同时还进行了贝叶斯和回归分析 等分类器的比较.相洁等人 使用BOLD变化时间 序列作为特征值训练SVM分类器,并依此来判断 人脑正在执行的高级思维类型. 如上所述,本文采用解决4×4数独问题和图像 情感反应两种刺激任务获取思维过程数据,来分别 解读不同的思维状态,探索适用于不同思维数据的 分析方法.实验数据证明t-test的特征选择方法、峰 值所在时间点的特征提取方法和SVM分类算法较 适用于分析这两种不同思维状态的fMRI数据,揭 示正确的思维状态. 1 相关工作 1.1特征选择算法研究 本文中特征选择的目的主要是为了减少体素的 个数,采用了两种特征选择的方法:一是利用方差的 方法选择激活体素作为特征;二是利用t-test的方 法选择同一刺激实验中不同刺激任务下激活程度较 大的体素作为特征. 1)按照体素的变化情况确定激活区体素.特征 选择分为3类,以如下矩阵为例说明并定义3种类 型体素. 邓红霞等:基于fMRI的思维数据分析方法研究 0 0 0 0 0 ・・・0 19.7 19.7 19.7 19.7 19.7 … 19.7 2O2 197 218 22O 223 … 204 ● ● ● ● ● ● 1O1 101 1O1 101 101 … 101 定义1.非脑组织——第1行中所有的数据均 为0,表示在图像中不是脑结构,而是没有去除的黑 色非脑组织,见图1的非脑组织. Non.brain NOt.activated Tissue Voxels Activated Voxels Fig.1 The sample ot voxels. 图1体素样例 定义2.未激活体素——第2行中各个数字都 是19.7,没有变化且不为0,说明是脑组织,但是没 有被激活,见图1的未激活体素.最后行中各个数字 也都是一样的,同时不为零说明也是未被激活的体 素.第2行和最后l行的区别在于2个体素所处的 位置不同,或者功能不同,导致所呈现出不同的数 值,但是都是未被激活的体素. 定义3.激活体素——第3行中数字是在不断 变化的,说明这个体素在实验的过程中存在血氧含 量的变化,也就是说这个体素参加了任务,见图1的 激活体素: 为了将这部分激活区的体素选择出来,利用 统计学中的方差来选择体素.方差的定义如式(1) 所示: S :( 】一 ) +(z2一.27) +…+( 一互) ,(1) 其中,z ,…,z 代表同一体素在不同时刻的一组数 据, 代表这组数据的均值,s。是这组数据的方差, S是这组数据的标准差.方差和标准差都是表示样 本变化浮动大小,方差越大表示波动得越大,在这里 表示体素就是激活的. 2)t-test:t-test主要是用于小样本容量的2个 样本,检测2个样本问的平均值是否存在明显的差 异,可以用于多个样本之间的两两比较.t-test可以 用于单一总体的检验也可以用于两个总体之间的检 验.本文主要是进行两种不同任务之间的t-test,也 就是两个总体之间的检验. 在两个总体检验中,两个总体的均值分别为 1, 2,假设Ho"-I/1一 2;H1: l≠ 2;样本的方差表 示为 2 (”1—1)S +(n2—1)S; ‘ rr统计量为 r-1一(X--Y)一( 一 (X--Y) 一 s z√者+ s z√ + 两个总体检验主要是用于两个总体是否同时满 足相同的条件.通常是从两个总体中分别抽取出相 同数量的样本进行样本的均值和方差的计算,然后 通过抽取出来的样本进行总体的检验.如果满足原 假设则表明两个总体的样本的均值是相同的或者总 体的方差是相同的.如果均值和方差是相同的,就表 示两个样本之间的数据是相似的,也就是说在两种 不同的任务之间,体素的数值是基本没有什么变化 的,也就是体素是处于未激活状态.要选择激活状态 的体素就要选择均值和方差不相同的体素. 1.2特征提取算法研究 在经过特征选择之后,将体素的个数减少,但是 如果将每一个任务(trail)作为一个样本,则每一个 trail就组成一个矩阵,对于后面采用分类算法分类 是相当困难的.因此在进行分类之前我们要先对数 据进行特征的选取,减少数据的维数.本文所进行的 特征提取全部是基于BOLD效应[8 的,从BOLD效 应中提取所需要的特征.本文中特征提取主要是用 来降低体素的维数,定义了基于BOLD效应的5种 特征提取方法,分别是峰值、峰值所在的时间点、变 化率、累积值和最大主成分的方法. 1)峰值:在整个任务中,BOLD效应达到的最 大值,如图2所示: 0・8 一一 J入- 0・6 ,\ 人 、、 宝0.4 , 、/\ 0 ∞ , \ J , O・2 …一O.0 / 1 2 3 4 5 6 7 8 0 0.5 O.42 0.54 O.38 0.3 O.28 t/s Fig.2 The peak value of BOLD 图2 BOI D效应峰值 2)峰值所在的时间点:当血氧含量达到最大值 时所处的时间,如图3所示: 0・8 O・6 八 水 一 \ ^ \ 兮0.4 一, V\ 0 ∞ I i \ 0・2 , 一 , i 0.O , 工 一 一 o 0.7 0.5L曼 … 0.4一4上 2 0.5…t ……4;0.38 0.37…I… 0.2_8_8 … t/s Fig.3 The time of peak value. 图3峰值所在的时间点 3)变化率:最大值减去最小值,然后除以所跨 越的幅度,如图4所示: O-8 O・6 入 孚 ,:\ ^ 、、 9 0.4 一… … … ……0 ∞ \ …~… O・2 , — , i J0, : _-.~・ O.O r ’f 3 4 5 6 7;8 : O_=萌 j0 t/s Fig.4 The rate of change of BOLD 图4 BOLD效应变化率 4)累积值:在整个任务进行的过程中,所有的 BoLD值的总和,如图5所示: … ? I- …… |.I|。I… \ 碍 一 l —l r i 2 3 4 5;6 7 8 0 0.7 0.5 l0.42{0.54}0.38{0.3 0.28 t/s Fig.5 The cumulative value o{BOI D 图5 BOLD效应累积值 计算机研究与发展2014,5l(4) 5)最大主成分法:主成分分析法(principal component analysis,PCA)主要是用来将多指标的 数据转化为少数几个综合指标的数据,因此可以用 PCA进行数据降维.PcA的数学模型如式(2)(3) 所示: A一 ,A = . (2) A代表有m个样本,每一个样本有y/个指标.A 的综合指标可以表示为 fP1一 1A A 1A l P2一 2A 2A 2A (3) lP 一 A A A 其中,要求: b“+62 +…+b 一1,i一1,2,…, . (4) P ,P。,…,P 就是第1主成分,第2主成分, …,第Y/主成分.最大主成分就是指第1主成分,就 是这个成分的方差是最大的.这样主成分分析可以 运用较少的变量得到较多的信息. 1.3分类算法研究 特征选择和特征提取得是否成功需要用分类结 果来衡量,本文采用的分类算法主要是SVM算法 和决策树算法. SVM主要采用用于解决分类问题的C—SVC类 型算法,关于核函数的选择,以往的研究中多项式函 数和径向基函数的分类效果较好,本文进行了多项 式函数和径向基函数分类结果的对比,并针对于惩 罚参数和伽马参数进行参数调优.在以往研究中是 利用决策树进行fMRI数据研究的,但是相对来 说研究较少.在本文中主要运用决策树进行树的建 立,以及运用所生成的树进行数据的预测.为了得到 可靠稳定的模型,交叉验证是必不可少的.常用的 交叉验证的方法有leave—one—out、k一折交叉验证等. 在SVM和决策树的分类中本文均采用3折交叉 验证. 2 实 验 2.1实验数据的获取 实验数据来源于两种思维任务:4×4数独和图 像情感问题. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务