超全干货 | 统计学中常用的数据分析方法汇总!
机器学习算法与Python实战
共 4422字,需浏览 9分钟
·
2020-10-01 21:11
1. 参数检验
1)U验 :使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验 使用条件:当样本含量n较小时,样本值符合正态分布
2. 非参数检验
让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。
分类: 1. 外在信度:不同时间测量时量表的一致性程度,常用方法重测信度。 2. 内在信度:每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。
分类: 1. 单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系 2. 多因素有交互方差分析:一项实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系 3. 多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系 4. 协方差分析:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分析结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法。
只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。
横型诊断方法
残差检验:观测值与估计值的差值要跟从正态分布
强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法
共线性诊断:诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例,处理方法:增加样本容量或选取另外的回归如主成分回归等
分类: Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。
推荐阅读
(点击标题可跳转阅读)
评论