统计学新手必知必会:1文带你走进数据分析!(下)
4
回归分析
确定回归方程中的解释变量(自变量)和被解释变量(因变量) 确定回归模型——选择合适的数学模型概括回归线 确定回归方程——根据样本数据及确定的回归模型,在一定的统计拟合准则下估计模型的参数,得到确定的回归方程 对回归方程进行各种检验——基于样本得到的回归方程是否真实反映了总体间的统计关系?回归方程能否用于预测? 利用回归方程进行预测
X为自变量 Y为因变量 Y的截距,即常量 斜率为回归系数,表明自变量对因变量的影响程度
注:软件原因“德宾-沃森”英文实际为:Durbin-Watson
5
常犯的概率学错误
比如第2节介绍的中心极限定理:警察通过计算车内乘客的体重分布,有99%的把握估计那些体重较大的乘客不是铁人三项选手,但这个推理还有1%的概率是错的,原因就在于铁人三项运动员体重样本的平均值虽然会接近整体的平均值,但并不能说二者完全相等。就好像从一棵树上摘的苹果,如果进行精确的化学分析他们的成分和甜度总会有细微的不同。这就是统计误差的含义,我们不可能通过数据得出完全确凿的真相,只能通过合理控制误差来无限接近真相。
另外举一个有趣的例子:检方谬误。假设你是一名法官,听到公诉人陈述这样的事实“犯罪现场遗留的DNA样本和被告的DNA相吻合,除了被告以外这个样本和其他人吻合的概率只有百万分之一,在这个证据的基础上你能为被告人定罪吗?
- END -
本文为转载分享&推荐阅读,若侵权请联系后台删除
评论