多重共线性是如何影响回归模型的
数据派THU
共 1126字,需浏览 3分钟
·
2021-11-18 11:30
来源:DeepHub IMBA 作者:hqtquynhtram 本文约1000字,建议阅读6分钟 特征如果存在多重共线性时为什么不能估计出最佳回归系数?
在机器学习面试中经常会被问到的一个问题是,特征如果存在多重共线性时为什么不能估计出最佳回归系数?本篇文章可以算是这个问题的标准答案
多重共线性是什么?
它对线性回归模型有何影响?
theta_hat 是最小化损失函数的估计系数 y 目标值向量 X 是包含所有预测变量的设计矩阵(design matrix)
如何消除多重共线性?
保留一个变量并删除与保留变量高度相关的其他变量 将相关变量线性组合在一起 使用对高度相关的特征进行降维,例如PCA LASSO 或 Ridge 回归是回归分析的高级形式,可以处理多重共线性
评论