统计学
时间: 下载该word文档
1.3 统计数据可分为哪几种类型?不同类型的数据各有什么特点?
按照所采用的计量尺度不同,可以将统计数据分为:
(1)分类数据:特点:非数字型数据。它是对数据进行分类的结果,数据表现为类别,用文字来表述。为便于统计处理,可用数字代码来表示各个类别。
(2)顺序数据:特点:非数字型数据。也是类别,但这些类别是有序的。也可以用数字代码来表示。
(3)数值型数据:特点:是按数字尺度额量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。
分类数据和顺序数据说明的是 事物的品质特征,用文字来表述,其结果均表现为类别,统称为定型数据或品质数据;数值型数据说明的是 现象的数量特征,用数值来表现,可称为定量数据或数量数据。
1.5 举例说明总体、样本、参数、统计量、变量这几个概念
总体:是包含所研究的全部个体(数据)的集合,通常由所研究的一些个体组成。 样本:是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。 参数:是用来描述总体特征的概括性数字度量。 统计量:是用来描述样本特征的概括性数字度量。
变量:是说明现象某种特征的概念,特点是从一次观察到下一次观察结果会呈现出差别或变化。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体。我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数。而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
2.2.1.1 概率抽样的特点
概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。具有的特点:
(1)抽样时是按照一定的概率以随机原则抽取样本; (2)每个单位被抽中的概率是已知的,或可以计算出来;
(3)当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。
2.2.1.3 概率抽样和非概率抽样的比较
(1)概率抽样:依据随机原则抽选样本 样本统计量的理论分布存在 可根据调查的结果推断总体
目的在于掌握研究对象总体的数量特征,技术含量更高 (2)非概率抽样:不是依据随机原则抽选样本 样本统计量的分布是不确切的 无法使用样本的结果推断总体 特点是操作简便、时效快、成本低
适合探索性的研究,调查的结果用于发现问题,适合市场调查中的概念测试
3.4 直方图和条形图有何区别?
(1)条形图是用条形的长度(横直时)表示各类别频数的多少,其宽度(表示类别)则是固定的,没有意义;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,其高度和宽度均有意义。
(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,条形图是分开排列 (3)条形图主要用于展示分类数据,直方图主要用于展示数值型数据
3.9 制作统计表应注意哪几个问题?
(1)要合理安排统计表的结构,比如行标题、列标题、数字资料的位置应安排合理。当然,由于强调的问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出现过高或过长的表格形式。
(2)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。如果表中的全部数据都是同一计量单位,可放在表的右上角标明,