当前位置：首页> 萨尔金德《爱上统计学》读书笔记

萨尔金德《爱上统计学》读书笔记

时间：2018-10-11 14:19:40 下载该word文档

《爱上统计学》读书笔记

尼尔·J.萨尔金德的《爱上统计学》这本书主要介绍了基础统计学的范围，包括整理和分析数据的基本思路和最常用的技术。

本书分为五个部分：第一部分简单介绍了什么是统计学、描述统计和推论统计；第二部分“描述统计”的主要内容是如何在整理数据之后，对结果进行描述和理解；第三部分开始介绍如何依据假设检验和概率论的应用（正态曲线）来检验有关变量间关系的特定问题；第四部分“显著性差异——使用推论统计”是这本书的核心和重点，主要内容是理解和应用特定的统计类型来回答特定类型的研究问题，讨论了几种最常用的统计检验；第五部分旨在帮助读者继续学习，介绍了全世界最好的10个统计信息网址和一些收集数据的原则。

一．统计学是什么（或不是什么）

就一般意义而言，统计学是描述一系列可用于描述、整理和解释资料或数据的统计工具和技术。通过整理收集到的数据，做出特定的推断，将那些数据的特征应用到新的情境。

所谓的描述统计，常用于整理、描述所收集数据的特征，常见的描述统计值有众数、均值等；而推论统计通常是数据收集和汇总后的下一步，即利用较小群体（样本）的数据来推论可能的较大群体的特征。这两者可以一起发挥作用，但是具体何时使用何种统计取决于研究者需要解决的问题，本书的第二部分和第四部分就分别介绍了这两者。

二．描述统计

在这一部分的前三章，作者主要讨论了两种类型的描述统计——集中趋势（提供一组数据的最佳值）和变异性量数（测量数据之间彼此差异或不同的程度），接着介绍如何使用图形直观展示出不同的数据分布中两类测量结果的差异程度。

在第5章，作者开始使用相关系数来讨论两个连续性变量之间的关系，反映两者共同变化的程度。书中以冰淇淋和犯罪为例，说明了一个简单的原则，相关表示两个或更多变量之间存在关联：相关并不是因果关系。尽管冰淇淋消费水平和犯罪率一起增长（或下降），但并不意味着冰淇淋消费的增加会导致犯罪率的增长，这两者只是同时发生而建立起了关联的假象。在第6章，重点讨论了两个测量工具——信度和效度，信度就是一个测试或者你使用的其他任何测量工具对事物的测量可以保持一致性，测量误差越小就越可信；效度就是表示工具能够测量想测内容的程度，有效的测试是测量到了理应测量的内容。测试可能是可信却无效的，但有效的测试却不可能没有信度，对其进行重复操作的结果必然一致。

三．假设和正态曲线

第7章介绍了假设检验的重要性和性质，一个好的假设将问题陈述或研究问题转换为更适合于检验的形式。假设的主要类型有：零假设和研究假设。零假设宣称两个或多个事物之间是等同的或没有关系的，如果两个群体之间存在任何差异，必须假定这些差异是出于偶然；研究假设是变量之间有关系的明确陈述，是不等价的陈述，包括有方向研究（“多于”或“少于”）假设和无方向（“不同于”）研究假设。作者强调，零假设总是对应总体的，因此不能直接进行检验，只能被间接检验，所以在研究报告中很少看到零假设而总是看到研究假设陈述。

第8章讨论了正态曲线说明概率的所有重要方面，以及作为概率基础的基本原则。我们在处理大样本数据集（超过30个数据），并且重复的从总体中抽出样本时，曲线的数值就接近正态曲线的形状。正态曲线是具备三个特征的数据分布的形象表示，表示均值、中位数和众数相等的数值分布，没有偏度，只有一个处于中间的很好的波峰；并且以均值为中心完全对称；正态曲线的双尾是渐进的，越来越接近横轴，但是永远不会相交。另外，如果数值是正态分布的，几乎100%的数值处于均值的-3到3个标准差范围内，也可以说一定百分比的数值或落在x轴的不同数据点之间。

这章作者还介绍了标准值z值，以标准差为单位进行了标准化，是原始数据与数据分布均值的差除以标准差所得到的结果，是指偏离均值的标准差的个数。均值以上的原始数值对应的z值是正数，反之是负数。在前面正态曲线下数据值的分布一图（图8.4）中，可得知，84%的数值落在值为+1的z值之下，另外16%则是在其上。作者还在附录B的B1表中列出了不同z值对应的曲线之下的所有面积数值。查阅该表可以发现，z值的临界点1.65包含了曲线覆盖面积的45%，如果与曲线另一侧覆盖面积的50%相加，就得到全部面积的95%，也就是在x轴的这一点上留下了5%（图9.2），任何表示z值1.65或在此之上的数值就在很小的区域内，此时可以断定一个结果的出现不是由于随机因素而是与某种关系或者某种处理方式有关。

四．显著性差异——使用推论统计

第9章介绍了显著性的概念和重要性，指出了第一类错误和第二类错误，介绍了如何选择用于检验的方法和一般步骤（第10章到第16章都提及这些步骤）。显著性的含义是指两个群体的态度之间的任何差异是由于系统性因素而不是偶然性因素的影响。显著水平是不能100%确信实验中观察到的结果是由于处理因素或需要检验的因素引起的所要承担的风险，是指零假设为真的情况下拒绝零假设所要承担的风险水平。显著性并不能证明任何事情是真，而只能拒绝两者之间没有关系。如果在群体之间没有差异的情况下拒绝了零假设，就犯了一个错误，犯此类错误你可能承担的风险（或者说显著水平）就是第一类错误。

书中没有明确界定p值的定义，只以类似“p<.05”的形式出现过。P值是用来判定假设检验结果的一个参数，当原假设为真时所得到的样本观察结果出现的概率，如果p值越小，说明原假设情况发生的概率就越小，结果越显著。P值介于0-1之间，零假设认为两组样本来自同一个总体，两组数据没有差异。统计显著性通常以P<.05表示，意味着拒绝真实的零假设的概念小于.05，即只有5%的可能性是零假设为真，而你拒绝了零假设，并在群体之间实际上根本没有差异的情况下得出群体之间有差异的结论。当P值在.05以上，则没有充分证据来拒绝零假设，两组间的差异没有统计学意义。

当你无意中接受了虚假的零假设就产生了第二类错误，即两个总体之间存在着真实的差异，但你错误地得出差异不存在的结论。这种错误对样本中个体的数量特别敏感，当个体数量增加时，样本的特征就越是与总体的特征匹配，犯错的可能性就越低。

作者在第九章建立了各种工具的简易流程图（图9.1），以供我们在不同时候选用不同的检验方法。同时，还介绍了任何零假设进行统计检验时需要采用的一般步骤，包括：

1.零假设的陈述，两个群体的均值之间没有差异。确定研究假设是双侧的无方向假设（只表示存在差异，没有特定的方向）还是单侧的有方向的假设。

2.设置零假设的风险水平（显著水平），设置你可能犯错的特定风险水平，一般设置.01或.05，这完全由研究者决定。

3.选择恰当的检验统计量。每一个零假设伴随着特定的检验统计量。根据流程图（图9.1），可以得知：

当检验两个相互独立的群体在一个（或多个）变量的平均值上是否有差异，研究中每一个参与者只接受一次测试，选择独立均值的t检验；当对相同的群体在两种不同的条件下进行相同的研究，每一个参与者接受不止一次的测试，包含不同数据组均值的比较，则使用非独立均值的t检验；当需要检验两个以上的群体在一个因素或一个维度上的均值差异，选择使用方差分析，方差分析的检验统计量是F统计量；当分析不同群体在一个以上因素或者独立变量上的差异，要使用析因方差分析；当我们要检验的是变量之间的关系而不是群体之间的差异时，所要应用的合适的检验统计是相关系数的t检验；当检验两个以上变量之间的关系时，选择回归分析；当数据不符合正态分布假定或数据规模太小，最常用的非参数检验之一是卡方检验，即确定在频数分布中观察到的结果是否就是你随机预期的结果。

4.计算检验统计量。检验统计量（也叫实际值）是特定的统计检验的结果，即代入观察值进行计算。

5.使用特定统计量的统计临界值表确定拒绝零假设需要的值。每一个检验统计量都有相应的临界值，首先要根据选定的不同检验统计量确定自由度，自由度近似于样本规模。再根据自由度、愿意承担的风险水平（研究者在第2步决定的显著水平）以及单（双）侧检验，在附录B的临界值表中查找对应的临界值。

6.比较实际值和临界值。这是关键的一步，比较通过检验统计量获得的值（计算所得的值）与你预期的随机的情况下对应的值（临界值）

7.如果实际值大于临界值，不能接受零假设，也就是说，零假设的等式陈述（反映偶然性）不是差异的最有力解释，差异一定是由于处理因素引起的。

8.如果实际值没有超过临界值，零假设是最有力的解释，即差异是由于偶然因素或者其他未被控制的因素引起的。

以上就是我在读这本书时了解到的主要内容，前三个部分对于学习有关统计学的一些基础定义和理论很有帮助，书中的第四部分是主要介绍常用的统计检验方法，十分有意义和价值。

阅读全文