2021年首都经济贸易大学硕士研究生入学考试初试《统计学》432考试大纲
第一部分 考试说明
一、考试目的
本课程以理解统计思想为根本、讲授现代统计方法为手段,以使学生掌握收集、分析、解释数据等统计方法为目的。该考试科目主要考察考生是否扎实掌握统计学中的基本概念、基本原理、基本技能,正确体会和理解统计学的基本思想。注重考查考生应用统计学的知识和技能分析问题的能力。
二、考试范围
统计学的概念、统计数据、统计调查、数据的统计描述及展示、抽样分布、参数估计、假设检验、方差分析、相关分析、回归分析、主成分与因子分析、列联分析、聚类分析、时间序列与预测。
三、考试基本要求
掌握统计学基本概念、理解考试范围内各种统计方法的统计思想及统计软件的实现,能够应用所学统计知识分析实际问题。
四、考试形式与试卷结构
(一)答卷方式:闭卷,笔试
(二)答题时间:180分钟
(三)满分:150分
(四)各部分内容考查比例:
统计学基本概念,占30%-40%;统计学基本方法及其统计思想,占40%-50%;应用统计知识分析实际问题,占比10%-20%。
掌握的部分:60%
需要熟悉的部分:20%-30%
需要了解的部分:10%-20%
(五)题型及分值
考试题型主要有名词解释、简答题、计算分析题、论述题,其中名词解释20分,简答题40分,计算分析题60分,论述题30分。
五、参考书目(可以不指定参考书目,但大纲内容须足够详尽)
(1)马立平,张玉春,统计学原理,电子工业出版社,2018.
(2)贾俊平,何晓群,金勇进,统计学(第6版),中国人民大学出版社,2015.
第二部分 考试内容
(一) 统计学与统计数据
考试内容:统计学的性质、研究对象;数据的计量尺度;数据的类型;.统计规律
考试要求:了解统计学产生与发展的历程和统计学的研究方法;理解统计学的研究对象;掌握和应用统计数据的计量尺度和统计数据的类型。
(二) 统计数据收集的方法与数据质量
考试内容:数据的间接来源;.数据的直接来源;抽样调查;普查;问卷设计;统计数据的误差。
考试要求:了解数据的两个来源,理解问卷编制的基本技术,掌握数据的误差,能够针对一定的问题编制调查问卷。
(三) 数据的图标展示
考试内容:统计分组;定性数据的频数分布表;定性数据的统计图示;定量数据的频数分布表;定量数据的统计图示。
考试要求:了解定性数据的图表制作,定量数据的分组、不同图表的制作、理解,图表的应用范围,掌握不同类型数据的图表的使用,能正确运用统计图表分析实际问题。
(四) 数据的统计量描述
考试内容:集中趋势的测度;平均数;中位数;众数;算术平均数、中位数和众数的关系;数据离散程度的测度;极差与四分位差;方差与标准差;离散系数。
考试要求:了解各统计量的概念、计算公式等,理解各概念间的关系,掌握不同的计算公式使用,能正确运用所学统计量分析问题。
(五) 概率抽样与抽样分布
考试内容: 概率抽样的基本概念;简单随机抽样;分层抽样;等距抽样;整群抽样;多阶段抽样;总体分布;样本分布;抽样分布;中心极限定理;样本均值的抽样分布;样本比例的抽样分布;Χ2分布;t分布;f分布。
考试要求:掌握各种抽样调查、抽样分布和均值抽样分布,理解主要的几种抽样分布的形式。
(六) 参数估计
考试内容:抽样推断及其基本概念;评价估计量的标准;点估计与区间估计;参数估计的原理;一个总体均值的区间估计;一个总体比例的区间估计;两个总体均值之差的区间估计;两个总体比例之差的区间估计;样本量的确定。
考试要求:了解估计量、估计值的基本概念,准确理解置信区间、置信水平的概念,理解参数估计的基本思路,掌握不同参数的估计方法和样本容量的确定方法,能正确运用参数估计的方法分析实际问题。能够掌握基本统计软件的参数估计操作方法。
(七) 假设检验
考试内容: 假设检验的基本概念;假设检验的基本步骤;假设检验的两类错误;假设检验结论的准确解读;总体均值的假设检验;总体比例的假设检验;两个总体均值之差的检验;两个总体比例之差的假设检验。
考试要求:了解假设检验的基本思路,掌握不同参数的检验方法,能正确运用参数假设检验的方法分析实际问题。能够掌握基本统计软件的假设检验操作方法。
(八) 方差分析
考试内容:方差分析的原理;方差分析的基本概念;方差分析的种类;方差分析的结果解释;多因子方差分析。
考试要求:理解方差分析的基本思路,掌握单因素、双因素方差分析的基本方法,能正确运用方差分析的方法分析实际问题。能够掌握基本统计软件的方差分析操作方法。
(九) 相关与回归分析
考试内容:相关关系;Pearson相关系数;Spearman秩相关系数;Kendall相关系数;线性回归模型;模型参数估计;回归系数的含义;回归方程的评价与检验;利用回归方程进行预测。
考试要求:理解各种相关系数的适用场合,理解最小平方法的基本思路,掌握回归方程的估计方法、检验方法和评价方法,能正确运用相关与回归分析的方法分析实际问题。能够掌握基本统计软件的相关与回归分析操作方法。
(十) 列联分析与聚类分析
考试内容:列联表的分析基本原理;卡方分布;卡方检验;列联表中的相关测量;卡方分布的期望值准则;聚类分析的基本思想;聚类的两种类型:R型聚类和Q型聚类;点间距离的几种度量方法:欧式距离、统计距离、相似系数的含义及计算方法;K均值聚类法的方法;分层聚类的方法。
考试要求:了解各种距离的设计,理解列联分析的适用场合,掌握列联分析和聚类分析的操作方法,能正确运用列联分析和聚类分析的方法分析实际问题。
(十一) 时间序列分析与预测
考试内容:时间序列及其基本种类;时间序列的动态分析指标;时间数列的构成要素;长期趋势、季节变动、循环变动、随机变动;时间数列的修匀;长期趋势模型的建立;季节指数的计算。
考试要求:了解时间序列的概念及其构成要素,理解时间序列的各种动态分析指标,掌握时间序列的长期趋势分析方法和季节指数的计算。
第三部分 题型示例
计算分析题:一家电话公司制订出一个广告计划,以增加客户长途电话的通话时间。为了解该计划的优点,公司对其进行小规模推广试验,他们从推广目标客户中随机抽取100位客户作为样本,并记录这100位客户在过去一个月长途电话的通话时间,然后公司在接下来的一个月里,在给用户的声明中加上一份特殊的广告传单,然后再记下这些客户该月的通话时间,数据如下表所示(分钟)。
客户 | 加入广告传单前 | 加入广告传单后 |
1 | 92 | 129 |
2 | 304 | 249 |
3 | 48 | 214 |
…… | …… | …… |
100 | 217 | 487 |
运用Excel对以上样本数据进行分析,分析结果如下:
描述统计结果
均值 | N | 标准差 | 均值的标准误差 | |
推广后 | 202.68 | 100 | 147.106 | 14.711 |
推广前 | 171.89 | 100 | 133.051 | 13.305 |
推广后-推广前均值差的检验结果
标准差 | 标准误 | 均值之差的95%置信区间 | t | 自由度 | 双侧P值 | ||
Lower | Upper | ||||||
30.79 | 68.41 | 6.84 | 17.22 | 44.36 | 4.50 | 99 | .000 |
注:为推广前后样本数据之差的均值
试根据上述结果回答以下问题
(1)公司是否可以认为,给用户的声明中加上一份特殊的广告传单对于提高用户长途电话的通话时间是有帮助的?请写出对应的原假设、备择假设及其含义,并给出检验结果及理由。
(2)给出广告传单推广后比推广前其用户长途电话的平均通话时间之差的95%的置信区间,并简要说明其含义。