《SPSS统计软件应用》
实验报告册
20 - 20 学年 第 学期 班 级: 学 号: 姓 名: 授课教师: 实验教师: 实验学时: 实验组号:
目 录
《SPSS》上机实验指导书
实验一 SPSS的数据管理 ............................................................................................... 3 实验二 描述性统计分析 ................................................................................................. 7 实验三 均值检验 ........................................................................................................... 10 实验四 相关分析 ........................................................................................................... 12 实验五 因子分析 ........................................................................................................... 15 实验六 聚类分析 ........................................................................................................... 19 实验七 回归分析 ........................................................................................................... 23 实验八 判别分析 ........................................................................................................... 25
2
《SPSS》上机实验指导书
实验一 SPSS的数据管理
一、 实验目的
1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置; 2.掌握SPSS的数据管理功能。
二、实验内容及步骤:
1、定义spss数据结构。下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。 练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。
表1 大学教师基本情况调查表
问题 1姓名 2 性别 3年龄 4学历 5 工作年月 6职称 7本年度教学工作量(课时) 8 本年度公开发表论文数 9 本年度您的科研经费总额(万元) 10.您认为学校对科研人员每年的科研成果要求是否合理 11 您最常用的全文期刊数据库的名称(多选,限选2个) 12 您对学校科研管理部门的工作是否满意 (1)cnki (2)万方 (3)SpringerLink (4)EBSCO (1)非常满意 (2)满意 (3)一般 (4)不满意 备选答案 4(1)专科(2)本科(3)硕士(4)博士(5)博士后 6 (1)助教(2)讲师(3)副教授(4)教授 7 (1)0~120 (2)120~240 (3)240~320 (4)320~480 (5) 480以上 (1)合理 (2)不合理 (3)无所谓 实验内容: 1.定义spss数据结构。
下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。
3
《SPSS》上机实验指导书
实验步骤:
(1)、打开定义变量的界面启动SPSS,进入主界面,单击图6-2所示的屏幕左下角的“Variable View”选项卡,打开定义变量的表格。
(2)、输入变量名,符合变量的命名规则在“Name”列的第一个单元格输入第一个变量名,如:“xm”。
(3)、确定变量类型,单击“Type”列的第一个单元格,如图6-3所示,SPSS的默认变量类型为数值型。单击数值型变量后的“···”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他的变量类型。
(4)、设置字段值
(5)、依次按要求输入完毕即可
实验结果:
实验分析:
本实验,主要是按照要求一步一步来设置条件即可完满完成实验。
2 、高校提前录取名单的确定
某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 该校
4
《SPSS》上机实验指导书
制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。文化课成绩制定最低录取分数线:400分。 (2)个人档案中若有“不良记录”,不予录取。
(3)对西部考生和少数民族考生,给予加分优惠。少数民族考生加20分,西部考生加10分。
(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。 (5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。 练习:利用spss软件,综合利用所学 ,给出成绩排名的操作步骤。 实验内容:
2.高校提前录取名单的确定
某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 练习:利用spss软件,综合利用所学 ,给出成绩排名的操作步骤。
实验步骤: (1)
计算文化课总成绩: 打开数据文件compute.sav.变量计算 transform->compute,在弹出的compute variable对话框中,定义变量zcj, type&label中的label值设为“文化课总成绩”,numberic expression设置“语文+数学+英语+综合”,单击ok按钮。
(2)
筛选出400分以上并且没有不良记录的学生:date-select case ,在弹出的对话框中选择if condition is satisfied 单选按钮并单击if 按钮,在弹出的select case :if 对话框中,设置不良记录=0 & zcj>=400的判断条件,单击continue,选择deleted单选按钮,最后单击ok 。
(3)
计算西部考生和少数名族加分项:transform->compute,target variable选择zcj。if 条件中设置“名族=2 or 名族=3 or 民族=4”,numberic expression
中
zcj+20;If
条件中设置“名族
=5” numberic expression中设置zcj+10
5
《SPSS》上机实验指导书
(4)
计算最综成绩,并排序:transform->compute,numberic expression ,zcj奖项*10. 选择“Data→Sort Cases”命令,弹出“Sort Cases”对话框,把“zcj”变量选入“Sort by”中,并在Sort Order中选择“Ascending(降序)”选项,将学生成绩按升序排列,单击“OK”按钮。
实验结果:
选取综合成绩升序排列后的前七名即可,如图所示:录取的分别是艾甫尔513分、孙悦婷495分、张囯欣471分、果冻样462分、杨乐451分、高超438分、易仲勃434分。
实验分析:
本实验,主要是按照要求一步一步来设置条件,最后边计算有点难,就是算加分。首先要解决不留空的,不然最后没法求和。根据结果选出符合要求的即可。
三、实验小结:实验中遇到的问题及解决办法、心得体会等等...
本实验,第一小题,主要考察我们创建数据文件的结构,即数据文件的变量和定义变量的属性。老师上课时给我们演示很到位,在老师的详细讲解下,我熟悉了spss软件界面,以及一些主要组成部分,但是里面的一些具体参数还不太清楚,不过常用主要属性都掌握了,没有太大问题。
第二小问,问题就相当大了,先是选择不小于400分的,经常排除不了,后来在同学的帮助下克服了。然后在加分部分比较难 ,最开始先符合一个加一个,
6
《SPSS》上机实验指导书
但是后来发现不是,经过反复尝试,把需要加分的先列出来,最后汇总,但是没加粉的,我没计算,导致最后求和时,不能加,因为有的是空字符,而不是数字0,后来又经改进,把没有加分的同学,在相对加分位置是-表示,最后才完满完成实验。
实验二 描述性统计分析
一、
实验目的
利用SPSS进行描述性统计分析。要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。
二、
实验内容及步骤
1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。
1)打开数据文件descriptives.sav,选“数据”菜单的“选择个案”命令项,弹出对话框。选择“如果条件满足”单选按纽,点击“如果”钮,弹出对话框,输入条件:班级=1单击“继续”按纽。在“输出”栏选择“过滤掉未选定的个案”项 ,单击“确定”按钮。
2)在主菜单栏单击“分析”,在出现的下拉菜单里移动鼠标至“描述性统计”项上,在出现的次菜单里单击“描述性”项,打开对话框。从左则的源变量框里选择年龄、体重、身高三个变量进入“变量”框里。单击“选项”钮,弹出“选项”对话框,选中 均值 Std.deviation 标准差 最小值 方差 最大值 范围复选框,单击“继续”按钮,单击“确定”按钮。
3)2、3班操作类似,只需将条件改为“班级=2”、“班级=3”即可 一班
二班
7
《SPSS》上机实验指导书
。 三班:
2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别
三、练习题:
1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。
分析:
1班年龄的最大值,最小值,平均数最小,方差和标准差最大;体重的极差,最大值,最小值,平均数,方差,标准差都最小;身高的极差,最大值,最小值,平均数,方差,标准差都最小。
2班年龄的最大值,最小值,平均数居中,方差和标准差最小;体重的极差,最大值,最小值,平均数,方差,标准差都居中;身高的极差,最大值,最小值,平均数,方差,标准差都居中
3班年龄的最大值,最小值,平均数最大,方差和标准差居中;体重的极差,
8
《SPSS》上机实验指导书
最大值,最小值,平均数,方差,标准差都最大;身高的极差,最大值,最小值,平均数,方差,标准差都最大。
2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别
处 理 呋喃硝胺 甲氰咪胍 合 计 愈 合 54 合 8 未愈计 62 合44 98 20 28 126 (提示:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量――行变量、列变量和指示每个格子中频数的变量,然后用Weight Cases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。假设三个变量分别名为R、C和W,则数据集结构和命令如下):
R 1.00 1.00 2.00 2.00
分析:
卡方检验统计量的p值=0.013<0.05,拒绝原假设,呋喃硝胺治疗十二指肠溃疡有显著性影响。
9
C 1.00 2.00
0
W 54.0
44.00
8.00 20.00
1.00
2.00
《SPSS》上机实验指导书
四、实验小结:实验中遇到的问题及解决办法、心得体会等等...
1、通过本次实验,使我较好地掌握了利用SPSS进行描述性统计分析的方法,学会了频数分布(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。
2、频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
3、Descriptives过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,其功能和频数分布过程类似,主要以计算数值型单变量的统计量为主。
实验三 均值检验
一、 实验目的
学习利用SPSS进行单样本、两样本以及成对样本的均值检验。 二、 实验内容及步骤
1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。共4台机器,每台机器抽取16支产品。见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。
步骤:
(1)打开数据文件ttest1.sav,选择菜单“Analyze→Compare Means→One-Sample T Test”。弹出“One-Sample T Test”对话框。
(2)在对话框左侧的变量列表中选择变量“制动闸直径”进入“Test Variable(s)” 框;在“Test Value” 编辑框中输入过去的平均生产直径值322 选择Options,置信水平90%,单击contiue-ok
10
《SPSS》上机实验指导书
2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。数据如下: 男:82.00 80.00 85.00 85.00 78.00 87.00 82.00 女:75.00 76.00 80.00 77.00 80.00 77.00 73.00 比较在置信度为95%的情况下男女生得分是否有显著差别。 步骤:
(1) 建立表结构并输入数据 (2)
选
择
菜
单
“
Analyze
→
Compare Means
→
Independent-samples T Test”项,弹出“Independent- samples T Test”对话框。从对话框左侧的变量列表中选x,进入“Test Variable(s)”框,选择变量“group”,进入“Grouping Variable”框,点击“Define Groups”钮弹出“Define Groups”定义框,在Group 1中输入1,在Group 2中输入2。 (3)单击ok输出结果:
3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。见数据文件ptest.sav.
步骤:
打开数据文件ptest.sav. 选择菜单“Analyze→Compare Means→Paired-samples T Test”项,弹出“Paired - samples T Test”对话框。从对话框左侧的变量列表中选择变量进入Variables框。单击ok输出结果:
11
《SPSS》上机实验指导书
三、练习题:
1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。共4台机器,每台机器抽取16支产品。见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。
P值=0.295>0.1,接受原假设,即机器生产的产品均值和322在90%的置信水平下是没有显著差异。
2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。数据如下: 男:82.00 80.00 85.00 85.00 78.00 87.00 82.00 女:75.00 76.00 80.00 77.00 80.00 77.00 73.00 比较在置信度为95%的情况下男女生得分是否有显著差别。
Levene检验中sig=0.445>0.05说明总体方差相等,t统计量检验自由n1+n2-2 ,p值=0.002<0.05,在置信度为95%的情况下男女生得分有显著差别。 3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。见数据文件ptest.sav.
体重水平的P值=0.249>0.05、甘油三酯的水平的p值均小于0.05,使用该药之前和之后的体没有显著性变化,而甘油三酯的水平有显著性变化。
四、实验小结:实验中遇到的问题及解决办法、心得体会等等...
1、学习利用SPSS进行单样本、两样本以及成对样本的均值检验。 2、在分析问题前要判断是单样本T测验还是双样本T测验,在第一遍的实验过程中由于我没有分清楚这个问题导致了试压结果错误。
实验四 相关分析
一、 实验目的
学习利用SPSS进行相关分析、偏相关分析、距离分析。 二、实验内容及实验步骤
1、打开数据文件correlate1.sav, 要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。
12
《SPSS》上机实验指导书
选择菜单“Analyze→Correlate→Bivariate”,在对话框左侧的变量列表中选price,fuel efficiency使之进入“Variables”框,输出结果如图所示:
2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。选相似性测度。进行结果解释。
选择菜单“Analyze→Correlate→Distance”,在对话框左侧的变量列表中选变量身高、体重和肺活量进入“Variables” 框。在“Compute Distances”框中选择“Between variables”,作变量之间的距离相关分析。在“Measure”栏中选择“Similarities”相似性测距。输出结果如图所示
3、打开数据文件distance.sav, 文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。要求对10只叶片进行距离分析。用Euclidean distance。进行结果解释。
13
《SPSS》上机实验指导书
三 练习题:
1、打开数据文件correlate1.sav, 要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。
两变量之间的相关系数r=-0.492,呈负的低度线性相关,在T的双尾检验中p值<0.05,拒绝假设H0,汽车价格和汽车的燃油效率之间有显著线性相关关系。
2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。选相似性测度。进行结果解释。
身高、体重、肺活量彼此之间都存在中度的线性关系
3、打开数据文件distance.sav, 文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。要求对10只叶片进行距离分析。用Euclidean distance。进行结果解释。
第一次测量与第二次测量和第一次测量与第三次测量之间的差异程度接近,第二次测量与第三次测量的差异程度较大。
四 实验小结:
实验中遇到的问题及解决办法、心得体会等等...
1、通过对这一实验的学习,我学会了利用SPSS进行相关分析、偏相关分析、距离分析。
2、距离相关分析是对观测量之间和变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。
14
《SPSS》上机实验指导书
实验五 因子分析
一、实验目的:运用因子分析方法分析数据 二、内容: 1. SPSS操作 2. 因子分析
三、案例背景:现有24名同学身高、体重、坐高、胸围、肩宽、盆骨宽此6项数据,有没有可能用更少的数据说明每位同学的身体状况? 实验步骤:
1.按Analyze→Data Reduction→Factor顺序单击菜单项,打开因子分析主对话框。
2.选PoliticalEconomy、Calculus1 、ComputerCulture、Microeconomics 、Algebra 、Calculus2和VB为分析变量送到右边的Variables栏中。 3.在主对话框中单击Extraction按钮,相应的对话框中:
1)Method菜单中选Principle components项,使用主成分分析方法。 2)Analyz栏中选Correlation matrix项,分析相关矩阵。 3)Extract栏中选择Number of factors 2
4)Display栏中选择Unrotated factor solution,显示未旋转的因子结果。同样选择Scree plot,要求作出特征值的散点图。
5)Maximum iteration convagence 25,结束迭代的判据为到达最大迭代次数25.
4.主对话框中单击Score按钮。在相应的对话框中选择Save as variables ,并在Method栏中选择Rregression,要求通过回归方法计算因子得分并把因子得分作为变量保存到数据文件中。
5.单击Descriptives按钮,在对话框Statistics栏内选择Initial solution选项。
6.在主对话框中单击OK按钮执行运算。
15
《SPSS》上机实验指导书
2)
16
《SPSS》上机实验指导书
四、练习
17
《SPSS》上机实验指导书
下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。 X1 3.76 8.59 6.22 7.57 9.03 5.51 3.27 8.74 9. 9.73 8.59 7.12 4.69 5.51 1.66 5.90 9.84 8.39 4.94 7.23 9.46 9.55 4.94 8.21 9.41 X2 3.66 4.99 6.14 7.28 7.08 3.98 0.62 7.00 9.49 1.33 2.98 5.49 3.01 1.34 1.61 5.76 9.27 4.92 4.38 2.30 7.31 5.35 4.52 3.08 6.44 X3 0.54 1.34 4.52 7.07 2.59 1.30 0.44 3.31 1.03 1.00 1.17 3.68 2.17 1.27 1.57 1.55 1.51 2.54 1.03 1.77 1.04 4.25 4.50 2.42 5.11 X4 5.28 10.02 9.84 12.66 11.76 6.92 3.36 11.68 13.57 9.87 9.17 9.72 5.98 5.81 2.80 8.84 13.60 10.05 6.68 7.79 12.00 11.74 8.07 9.10 12.50 X5 9.77 7.50 2.17 1.79 4.54 5.33 7.63 3.53 13.13 9.87 7.85 2. 2.76 4.57 1.78 5.40 9.02 3.96 6.49 4.39 11.58 2.77 1.79 3.75 2.45 X6 13.74 10.16 2.73 2.10 6.22 7.30 8.84 4.76 18.52 11.06 9.91 3.43 3.55 5.38 2.09 7.50 12.67 5.24 9.06 5.37 16.18 3.51 2.10 4.66 3.10 X7 4.78 2.13 1.09 0.82 1.28 2.40 8.39 1.12 2.35 3.70 2.62 1.19 2.01 3.43 3.72 1.97 1.75 1.43 2.81 2.27 2.42 1.05 1.29 1.72 0.91 分析:
系统首先输出各变量的均数与标准差,并显示共有25例观察单位进入分析;接着输出相关系数矩阵,经Bartlett检验表明:Bartlett值 = 326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 Kaiser-Meyer-Olkin Measure of Sampling Adequacy
是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。今 KMO值 = 0.32122,偏小,意味着因子分析的结果可能不能接受。
使用主成分分析法得到2个因子,因子矩阵如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量X7与第一因子的值为
18
《SPSS》上机实验指导书
-0.884,与第二因子的值为0.21921,可见其与第一因子更近,与第二因子更远。或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。
下面显示经正交旋转后的因子负荷矩阵和因子转换矩阵。旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。
五、实验小结:实验中遇到的问题及解决办法、心得体会等等...
本次实验主要学习的是因子分析,通过本次实验,我对因子分析有了一个基本的认识,因子分析是通过变量对变量之间关系的研究,找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变了的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低。因此,因子分析属于多元统计中处理维的一种统计方法,其目的就是要减少变量的个数,用少数因子代表多个原始变量。还要分清楚谁是因变量谁是自变量。 但实验操作步骤掌握不熟练,对于实验结果的分析不是很了解,在以后还需加强。
实验六 聚类分析
一、实验目的:运用聚类分析方法分析数据 二、内容: 1SPSS操作 2聚类分析
三、案例背景:现有5名同学学科背景(1为文科,2为理科),抽象能力,形象能力,创新能力的资料,用聚类分析将其分类。 实验步骤:
1.建立数据文件。
定义变量名:钙、镁、铁、锰、铜和血红蛋白的变量名分别为x1、x2、x3、x4、x5、x6,之后输入原始数据。
2.选择菜单“分析→分类→系统聚类”,弹出聚类分析对话框。从对话框左侧的变量列表中选x1、x2、x3、x4、x5、x6,使之进入变量框;在“分群”处选择聚类类型(对变量聚类)
19
《SPSS》上机实验指导书
3.单击“统计”按钮,弹出“聚类分析: 统计量”对话框,选择“相似性矩阵”以显示距离矩阵。
4.单击“绘制”按钮,弹出“聚类分析: 图”对话框,选择“树状图”项。 5.单击“方法”按钮,弹出“聚类分析: 方法”对话框,选择“组间连接”和“皮尔森相关性” 。
6.单击“确定”按钮,得到输出结果。
20
《SPSS》上机实验指导书
四、练习
29名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。
21
编号 钙 N0. X1 1 2 3 4 5 6 7 8 9 10 11 54. 72.49 53.81 .74 58.80 43.67 54. 86.12 60.35 54.04 61.23 镁 X2 30.86 42.61 52.86 39.18 37.67 26.18 30.86 43.79 38.20 34.23 37.35 铁 X3 448.70 467.30 425.61 469.80 456.55 395.78 448.70 440.13 394.40 405.60 446.00 锰 X4 0.012
0.008
0.004
0.005
0.012
铜 X5 1.010 1.0 1.220 1.220 1.010 0.594 1.010 1.770 1.140 1.300 1.380 《SPSS》上机实验指导书
窗统
本血红蛋白 X6 13.50 13.00 13.75 14.00 14.25 12.75 12.50 12.25 12.00 11.75 11.50 分析: 在结果输出口中将看到如下计数据:
共29例样进入聚类分析,采12 技
13 14 15 系16 选17 18 分19 示20 21 的22 一23 24 合25 相
26 27 28 步,29
其
步,并之
步,合间
60.17 33.67 69.69 40.01 72.28 40.12 55.13 33.02 70.08 36.81 63.05 35.07 48.75 30.53 52.28 27.14 52.21 36.18 49.71 25.43 61.02 29.27 53.68 28.79 50.22 29.17 65.34 29.99 56.39 29.29 66.12 31.93 73. 32.94 47.31
28.55
383.20 416.70 430.80 445.80 409.80 384.10 342.90 326.29 388.54 331.10 258.94 292.80 292.60 312.80 283.00 344.20 312.50 294.70
0.001 0.914
1.350 0.012 1.200
0.918 0.017 1.190
0.853 0.001 0.924
0.817 0.008 1.020
0.7 0.022 1.190
1.320 0.001 1.040
1.030 0.012 1.350
0.6 0.000 1.150
0.838
0.012
0.012
0.000
0.018
0.004
0.024
0.012
0.016
0.048 0.006 22
0.006
11.25 用相关系数测量11.00 术。先显示各变
10.75 10.50 量间的相关10.25 数,这对于后面10.00 9.75 择典型变量是十 9.50 有用的。然后显 9.25 9.00 类间平均链锁法 8.75 合并进程,即第 8.50 8.25 步,X3与X6被 8.00 并,它们之间的 7.80 7.50 关系数最大,为 7.25 0.863431;第二 7.00
X1与X5合并,间相关系数为0.624839;第三X2与第一步的合项被合并,它们间的相关系数为0.602099;第四它们与第二步的并项再合并,其相关系数为0.338335;第五
《SPSS》上机实验指导书
步,与最后一个变量X4合并,这个相关系数最小,为-0.054485。
按类间平均链锁法,变量合并过程的冰柱图如下。先是X3与X6合并,接着X1与X5合并,然后X3、X6与X2合并,接着再与X1、X5合并,最后加上X4,六个变量全部合并。
下面用更为直观的聚类树状关系图表示,即X1、X2、X3、X5、X6
先聚合后与X4再聚合。这表明,在评价儿童营养状态时,可在微量元素钙、镁、铁、铜和血红蛋白5个指标中选择一个,再加上微量元素锰即可,其效果与六个指标都用是基本等价的,但更经济更迅速。
五、实验小结:实验中遇到的问题及解决办法、心得体会等等...
1、通过这次实验,使我学会了运用聚类分析当法分析数据。
2、层次聚类分析中的R型聚类是对研究对象的观察变量进行分类,它使具有共同特征的变量聚在一起。以便可以从不同类中分别选出具有代表性的变量作分析,从而减少分析变量的个数。
3、聚类分析的实质是建立一种分类方法,将一批样本数据按照他们在性质上的密切程度在没有先验知识的情况下自动进行分类。
实验七 回归分析
一、实验目的:运用一元线性回归与多元线性回归进行预测 二、内容: 1spss操作 2一元线形回归 3多元线性回归
三、实验背景:已知某工厂14年间的产值,用回归分析法预测未来产值。 实验步骤:
步骤一:激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数; 身高、体重分别为X1、X2,保留1位小数。输入原始数据。点击“统计”菜单选“回归”中的“线性”项,弹出“线性回归”对话框。从对话框左侧的变
23
《SPSS》上机实验指导书
量列表中选y,点击钮使之进入“因变量”框,选x1、x2,点击钮使之进入
“自变量”框;在“方法”处下拉菜单,选用“进入”法。点击“确定”钮即完成分析。
四、练习
某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。 儿童编号 1 2 3 体表面积(Y) 5.382 5.299 5.358 身高(X1) 88.0 87.6 88.5 体重(X2) 11.0 11.8 12.0 2
24
《SPSS》上机实验指导书
4 5 6 7 8 9 10 分析:
5.292 5.602 6.014 5.830 6.102 6.075 6.411 .0 87.7 .5 88.8 90.4 90.6 91.2 12.3 13.1 13.7 14.4 14.9 15.2 16.0 标准化Y预测值作变量分布图
结果显示,本例以X1、X2为自变量,Y为应变量,采用全部入选法建立回归方程。回归方程的复相关系数为0.949,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。回归方程为Y=0.0687101X1+0.183756X2-2.8576。
五、实验小结:实验中遇到的问题及解决办法、心得体会等等...
回归分析法主要用于分析自变量和因变量之间的关系,通过标准化残差正态图可以看出,身高和体重两个变量服从正态分布,则绘制的概率图为一条从纵轴零点指向右上角的直线。回归模型的拟合程度,第一列表示选择回归方法的种类,第二列表示负相关系数,其含义类似相关系数,反映的是自变量和因变量之间的密切程度。其值在0-1之间,越大表示相关程度越好。第三列表示负相关系数的平方,又称为决定系数。第四列表示调整后的负相关系数,该值是在考虑了模型中有自变量个数情况下计算的决定系数。第五列表示标准差。
实验八
判别分析
一、实验目的:运用判别分析进行分类预测 二、内容: 1SPSS操作 2聚类分析 三、实验步骤:
(1)执行
Analyze→Classify→Discriminant
命令,打开
Disciriminant Analysis主对话框。。
25
《SPSS》上机实验指导书
(2)如果需要使用部分观测量参与判别函数的推导时,可以单击Select按钮,主对话框向下延伸。
(3)单击Statistics按钮,打开统计量对话框。
(4)如果在主对话框中选择Use stepwise method选项,对话框下面的Mehod按钮才能被激活,这时单击Method按钮,打开Stepwise Method(逐步判别方法)对话框。
(5)单击Classify按钮,打开如图11-20所示的Classification(分类)对话框。。
(6)单击Save按钮,打开Save 对话框。如图11-21所示。在此对话框选择建立新变量将判别分析结果保存到当前工作文件中去。
上述各项选项选择完毕以后,返回主对话框单击OK按钮运行。
26
《SPSS》上机实验指导书
27
《SPSS》上机实验指导书
四、练习
为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如下,试作判别分析,建立判别函数以便在临床中用于筛选冠心病人。
编号 冠心病人组 编号 正常人组
舒张压胆固醇mmol/L 舒张压胆固醇mmol/L kPa x2 kPa x2 x1 x1
1 9.86 5.18 1 10.66 2.07 2 13.33 3.73 2 12.53 4.45 3 14.66 3. 3 13.33 3.06 4 9.33 7.10 4 9.33 3.94 5 12.80 5.49 5 10.66 4.45 6 10.66 4.09 6 10.66 4.92 7 10.66 4.45 7 9.33 3.68 8 13.33 3.63 8 10.66 2.77 9 13.33 5.96 9 10.66 3.21 10 13.33 5.70 10 10.66 5.02 11 12.00 6.19 11 10.40 3.94
28
《SPSS》上机实验指导书
12 13 14 15 14.66 13.33 12.80 13.33 4.01 4.01 3.63 5.96
12 13 14 15 16 9.33 10.66 10.66 11.20 9.33 4.92 2.69 2.43 3.42 3.63
分析:
典型判别方程的方差分析结果,其特征值(Eigenvalue)即组间平方和与组内平方和之比为1.2392,典型相关系数(Canonical Corr)为0.7439,Wilks λ值为0.446597,经χ2检验,χ2为22.571,P<0.0001。用户可通过判别方程的标准化系数,确定各变量对结果的作用大小。如本例舒张压(X1)的标准化系数(0.88431)大于胆固醇(X2)的标准化系数(0.82306),因而舒张压对冠心病的影响作用大于胆固醇。考察变量作用大小的另一途径是使用变量与函数间的相关系数,本例显示X1的变量与函数间的相关系数为0.62454,X2为0.54396,同样表明舒张压对冠心病的影响作用大于胆固醇。根据系统显示的非标准化判别方程系数,得到判别方程:
D = 0.6379195X1 + 0.8001452X2 - 10.7532968
依此方程,病人组的中心得分点为1.11198,正常人组的中心得分点为-1.04248。本例为二类判别,二类判别以0为分界点,若将某人的舒张压和胆固醇值代入判别方程,求出的判别分>0的为冠心病人,判别分<0的为正常人。
五、实验小结:实验中遇到的问题及解决办法、心得体会等等...
这个实验还是有一定的难度, 因为这不单单是一门学科知识,而需要一定的统计学知识,因而操作起来并没有前几个实验那么简单,在整个实验中遇到了种种困难,不过最终在实验书的指导和各位同学们的帮助还是顺利的完成了整个实验。截止此时,整个实验阶段也告一段落,虽然实验时间短暂但收获还是颇丰的,至少对spss软件有了基本了解,掌握了该软件的一些基本操作,整个实验对统计学和管理运筹学是一个补充和完善。最后还是非常感谢老师冒着严寒为我们悉心指导!
29
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务