中国地质大学(武汉)
应用统计学专业学位(025200)硕士研究生
考研复试科目《多元统计剖析》考试概要
试题:
1、选择题
2、判断题
3、简答卷
考试内容:
1、 多元数据的数字特点和图表示
1. 多元数据样本均值、样本方差(标准差)、样本协方差矩阵和样本有关矩阵的基本定义和运算,统计距离及其与欧氏距离有什么区别;
2. 多元数据的图表示,如散点图、轮廓图、星图、调和曲线图、脸谱图等。
2、 矩阵代数与样本几何初步
1. 行列式、逆矩阵、迹、二次型、正定阵与矩阵微商等基本定义和运算;
2. 基本的矩阵不等式( 如Cauchy-Schwarz 不等式)和矩阵范数;
3. 偏差向量和偏差矩阵,基于数据矩阵、单位矩阵和等角向量构建均值向量和样本协方差矩阵。
3、 随机向量和多元正态分布
1. 随机向量及其联合分布、边缘分布和条件分布的概念及性质;
2. 随机向量的数字特点及运算性质;
3. 多元正态分布的概念及基本性质;
4. 三大抽样分布(分布、
分布、
分布)及其多元推广。
4、 多元正态分布的统计判断
1. 正态数据的预处置:正态检验、异常值测试与清除、正态变换;
2. 多元正态分布均值和协差阵的参数估计(很大似然估计)和假设检验,尤其是协差阵已知和协差阵未知情形下的均值向量检验。
5、 辨别剖析
1. 马氏距离,距离辨别的概念和准则;
2. 先验概率、后验概率、平均错判损失等,贝叶斯辨别的概念和准则;
3. 投影和方差剖析思想,费希尔辨别的概念和准则。
6、 聚类剖析
1. Q型和R型聚类剖析常见的距离和相似系数的概念;
2. 知道八种系统聚类法及其基本性质(类间距和单调性),熟知最短距离法、最长距离法、类平均法的具体计算步骤,会作谱系图。
7、 主成分剖析
1. 主成分剖析的基本思想、数学模型和几何意义;
2. 主成分的推导及性质。
8、 因子剖析
1. 因子剖析的基本思想,及其与主成分剖析有什么区别和联系;
2. 正交因子模型的概念、性质及统计意义;
3. 常见的三种参数估计办法: 主成分法, 主因子解和很大似然法;
4. 因子旋转和因子得分(加权最小二乘法和回归法)。
9、 典型有关剖析
1. 典型有关的基本思想和数学描述;
2. 总体(或样本)的典型有关系数和典型变量的计算。
参考书目:
[1] 高惠璇. 应用多元统计剖析[M]. 北京: 北京大学出版社, 2005.
[2] 何晓群. 多元统计剖析[M]. 第3版. 北京: 人民大学出版社, 2012.
[3] Johnson R A, Wichern D W. Applied Multivariate Statistical Analysis[M]. 第6版. New Jersey: Prentice Hall, 2007.