1 / 50

SPSS在社会统计中的应用

SPSS在社会统计中的应用. 社会统计中的统计软件 SPSS基础 SPSS在社会统计学中的应用 描述性统计 ( Descriptive Statistics) 相关分析 (Correlate) 回归分析 (Regression) 均值比较与检验 (Compare Means). 社会统计中的统计软件. 统计分析软件是数据分析的主要工具 完整的数据分析过程包括: 数据的收集 数据的整理 数据的分析 统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。.

dom
Télécharger la présentation

SPSS在社会统计中的应用

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SPSS在社会统计中的应用 社会统计中的统计软件 SPSS基础 SPSS在社会统计学中的应用 描述性统计( Descriptive Statistics) 相关分析(Correlate) 回归分析(Regression) 均值比较与检验(Compare Means)

  2. 社会统计中的统计软件 统计分析软件是数据分析的主要工具 完整的数据分析过程包括: 数据的收集 数据的整理 数据的分析 统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。

  3. 统计分析软件的一般特点 功能全面,系统地集成了多种成熟的统计分析方法; 有完善的数据定义、操作和管理功能; 方便地生成各种统计图形和统计表格; 使用方式简单,有完备的联机帮助功能; 软件开放性好,能方便地和其他软件进行数据交换。

  4. 常用统计软件简介 SAS:真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。 SPSS:统计软件中的贵族 S-Plus:S语言(AT&T贝尔实验室)的后续发展 Stata:软件小巧、功能强大 以下,我们介绍的主要是SPSS。

  5. SPSS(PASW)基础 软件名称 Statistical Package for Social Science (1975-2000年) Statistical Product and Service Solutions(2000年-2009年4月) Predictive Analytics Software(2009年4月起) 软件发展 1960 年代:美国斯坦福大学三位研究生研制 1970 年代:SPSS 总部成立于芝加哥,推出 SPSS 中小型机版 SPSSX— 1980 年代:微机版( V1~3 SPSS/PC+ 3) 1990 年代:Windows 版( v5~17) 2009年4月:被IBM公司收购,改名为PASW。

  6. 第一节 描述性统计 频数分布(Frequencies) 数据描述(Descriptives) 数据探索(Explore) 交互列联表(Crosstab)

  7. 一、频数分布 在SPSS中可以很容易地得出频数分布表,平均数,标准差等。 频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。 命令选择:Analyze —— Descriptive Statistics —— Frequencies 备 注:可选入多个变量

  8. Statistics: Dispersion(离差栏): Std.Deviation 标准差 Variance 方差 Range 全距 Minimum 最小值 Maximum 最大值 S.E.mean 均值的标准误 Central Tendency (集中趋势栏) Mean 均值 Median 中位数 Mode 众数 Sum 总和 Skewness 偏度(0,1.5,0.5,-0.5) Kurtosis 峰度(0,正,负) 例:09-01

  9. 还可直接作出图形(Charts): Bar charts:条形图 Pie Charts:圆图、饼图 Histograms:直方图,只适用于连续的数值型变量。

  10. 二、数据描述分析过程 适用条件:对于定距以上变量,可以进行集中趋势和离中趋势的统计 命 令:Analyze—— Descriptive Statistics ——Descriptives 变量要求:可多选 可 选 项:Mean、Std.deviation、Minimum

  11. 三、数据探索 1、对数据进行初步考察: 检查数据是否有错误:过大或过小的数据有可能是奇异值、影响点或错误数据。一要找出,二要分析原因,三要决定是否从中剔除。 数据分布特征:许多分析方法对数据的分布有一定要求。从数据是否服从正态分布,决定他们是否可以选用只对正态分布数据适用的分析方法。 Explore :进行初步探索分析 09-03

  12. 四、交互列联表 适用条件:根据变量的层次,统计学中有各种不同的相关系数来描述,在社调中常见的两个定类(或一个定类、一个定序) 命 令:Analyze —— Descriptive Statistics—— Crosstabs 变 量:选择一个或多个变量进入Rows,Column框

  13. 对复选框的解释 (1)Chi-square,卡方检验。 Pearson Chi-square test Likehood ration Chi-square test 似然比卡方检验 Fisher’s exactly test 费雪精确检验 (2)Correlation复选框。Pearson,Spearman(只适用于数值型) (3)Nominal Data栏,适用于定类变量的统计量。Lambda复选项 (4)Ordinal Data栏:适用于定序变量的统计量 Gamma、Kendall”s tau-b、Kendall”s tau-c (5)Nominal by Interval:一个定类一个定距以上变量 Eta统计量,如收入和性别的关联性 Flag significant correlations:用星号标记有统计学意义的相关关系。

  14. 第二节 相关分析 相关分析是研究变量间密切程度的一种统计方法。对于其数值可以从小到大排列的数据才能计算其相关系数。 简单相关( Bivariate ) 偏相关( Partial )

  15. 1、对定距以上两个变量x与y的相关系数采用Pearson相关系数1、对定距以上两个变量x与y的相关系数采用Pearson相关系数 2、Spearman Kendall相关系数是一种非参测度,是根据数据的秩而不是根据实际值计算的。适合定序数据或不满足正态分布假设的定距数据。 3、偏相关系数:描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性。如:可以控制年龄和工作经验,估计工资收入与受教育程度之间的相关关系。 4、关于相关系数统计意义的检验:由于抽样误差的存在。检验的零假设——总体中两个变量间的关系为0。 SPSS只给出给假设成立的概率P值。

  16. (1)Analyze ——Correlations—— Bivariate 计算指定的两个变量之间的相关系数,可选择Pearson相关、Spearman和 Kendall Tau-b相关;同时对相关系数进行检验。 Test of Significance 是用于变量间相关的显著性检验。系统默认的是双侧检验。 Two-tailed:事先不知道相关方向 One-tailed:事先知道相关方向 例Data09-03

  17. 使用系统默认值进行相关分析:

  18. 分析:起始工资、现工资与雇员受教育水平、工作经验、职务等级之间是否存在线性关系。分析:起始工资、现工资与雇员受教育水平、工作经验、职务等级之间是否存在线性关系。

  19. (2) Analyze ——Correlations——Partial 用上例: - Controlling for.. JOBCAT PREVEXP JOBTIME SALARY EDUC SALARY 1.0000 .4399 ( 0) ( 469) P= . P= .000 EDUC .4399 1.0000 ( 469) ( 0) P= .000 P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed

  20. 第三节 回归分析 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。 回归分析作为一个严肃的统计学模型,有着严格的使用条件。因此在做回归分析之前,应该对数据进行基本的判断。如作出散点图、观察变量间的趋势等。 Analyze—Regression—Linear Dependent:因变量,只选一个 Independent:自变量,可选入多个自变量。

  21. Method:对自变量的选入方法。 Enter:强行进入法 Forward:向前选择法 Backward:向后剔除法 Stepwise:逐步进入法 (例,及解释) 先做散点图:09-03 Graphs--scatter

  22. 剩余变差:Y值对于回归直线的偏差。 回归变差:回归已知时误差减少的量。 总变差=剩余变差+回归变差 总平方和=未解释的平方和+已解释的平方和

  23. 扩展——几个自变量的线性回归示例: 如:现工资与受教育水平、初始工资、工作经验、职位之间的回归模型。

  24. 第四节 均值比较与检验 均值不相等的两个样本不一定来自均值不同的总体;两个变量均数接近的样本是否来自均值相同的总体?——两个样本某变量均值不同,其差异是否具有统计意义。 对调查样本中不同的子总体在某些变量上的平均值之间的差异情况进行比较。

  25. Means: 主要是对样本的描述统计,也直接进行比较。 One-Samples T Test:样本均值和已知 Independent-Samples T Test:独立样本均值差比较 Paired-Samples T Test:配对样本

  26. 问:检验男生和女生的学习成绩是否有显著性差异?问:检验男生和女生的学习成绩是否有显著性差异? 检验丈夫和妻子的智商是否有显著性差异? 方差齐次检验:F

  27. 一、Means过程 Analyze—Compare Means—Means 例: 09-03男女工资均值

  28. 职位不同的男女雇员工资的均值

  29. 二、单样本T检验 Analyze—Compare Means—One-Samples T Test 例:已知某地12岁男孩身高142.3cm,现测得某市120名12岁男孩身高资料。11-02 在Test中输入142.3

  30. 三、独立样本T检验 要求被比较的两个样本彼此独立,没有配对关系。要求两个样本均来自正态总体。 例:检验男女雇员现工资是否有显著性差异。09-03 Analyze—Compare Means—Independent Samples T Test

  31. 四、配对样本T检验 要求被比较的两个样本有配对关系。两个样本均来自正态总体。均值对于检验是有意义的描述统计量。 例:10个高血压患者在施以体育疗法前后测定舒张压。要求判断体育疗法对降低血压是否有效。11-03 零假设:

  32. 练习 自己在电脑上进行操作,将频数分析、交互分析、相关分析、回归分析、均数检验等熟悉一遍。

More Related