独家 | 线性代数:每个数据科学家的必知概念(下)
共 5442字,需浏览 11分钟
·
2024-07-26 17:00
作者:Benedict Neo
翻译:陈之炎
校对:ZRX
本文约2900字,建议阅读8分钟
本文将探讨上述线性代数概念、视觉解释和代码示例。
本文(上篇)目录
-
单位向量
-
向量相加 -
标量相乘 -
点积
-
零空间(核) -
张成空间 -
基 -
线性独立
-
矩阵作为函数 -
线性变换 -
逆矩阵 -
奇异矩阵 -
单位矩阵 -
对角矩阵 -
正交矩阵 -
矩阵乘法 -
迹 -
决定值 -
秩 -
特征向量和特征值
矩阵
矩阵是按行和列组织输入和操作方式。
图片由作者提供
这是一个2行2列的矩阵,矩阵是一种数学工具,可以以结构化的方式解决实际问题。
矩阵作为函数
可以将矩阵视为函数,Python函数接收输入矩阵,经过处理之后返回输出矩阵, 矩阵变换通过线性变换将输入向量转换为输出向量。
图片由作者提供
线性变换
线性变换是在两个向量空间V和W之间的映射,它保留了向量加法和标量乘法的操作。将矩阵A应用于向量x以得到另一个向量y(通过操作Ax = y)是一种线性变换。这种变换在数据科学中得到大量使用:
-
降维:PCA使用线性变换将高维数据映射到低维空间 -
数据转换:归一化或标准化数据集是一种线性变换 特征工程:通过组合现有特征来创建新特征。
以下是一些特殊形式的矩阵:
逆矩阵
当矩阵与其逆矩阵相乘时,结果为单位矩阵。
奇异矩阵
奇异矩阵是没有一个逆矩阵的方阵,即矩阵的决定值为零或其秩小于其大小。
单位矩阵
单位矩阵是一个方阵,其对角线上的元素值为1,其余位置元素值为零,它在矩阵乘法中作为乘法恒等元素, 就像数字1一样,不改变矩阵中任何元素的值。
对角矩阵
对角矩阵是一个方阵,其中主对角线外的所有元素均为零,。它用于求解特征值, 并用于决定值计算。
正交矩阵
如果一个方阵的转置等于它的逆阵,那么认为它是正交的。
正式地说,如果矩阵A满足 AᵀA=AAᵀ = I,其中I是单位矩阵,那么A就是正交的。
从几何意义上讲,如果一个矩阵的列和行是正交单位向量,即它们是相互垂直的并且大小为1, 那么该矩阵就是正交的。回想一下,如果两个向量互相垂直(90度),并且它们之间的点积为0,则它们就是正交的。
矩阵乘法
如何使用矩阵来执行矩阵乘法? 这里有一个很好的可视化图,摘自《线性代数直观指南》
想象你正在对每个输入数据实施不同的操作。
举个操作的例子。
经过操作后,得到以下结果。
输入是一个[3 x 2] 矩阵,对输入实施操作的矩阵是 [2 x 3];结果是 [2 x 3] [3 x 2] = [2 x 2]。输入的大小必须与操作的大小相匹配。
迹
矩阵的迹是其所有对角线元素的和,它在基变换下是不变的, 提供了关于矩阵的值信息,即,迹是矩阵的特征值之和。
决定值
决定值是输出变换的大小, 如果输入是单位向量(面积或体积为1),那么决定值就是变换后的面积或体积的大小。 以下述矩阵为例,如果A的面积放大了6倍,那么变换的决定值就是6。
负决定值意味着整个空间被翻转了,这种变换就像是把一堆纸翻转到另一边。
注意红色轴和绿色轴的方向是如何反转的,决定值为0意味着矩阵是“破坏性的”,并且无法逆转。类似于乘以零,信息丢失了。 决定值可以告诉我们矩阵是否可逆,如果det(A)是0,那么逆矩阵不存在;矩阵是奇异的。
秩
矩阵中线性独立列/行向量的最大数量,它表示由其行或列张成的向量空间的维度,由此得出线性变换后的输出维度数量。当变换的输出是单一向量(它是一维的),说明变换的秩是1。如果所有向量都落在某个二维平面上,则说变换的秩是2。对于2x2矩阵来说,秩为2是它所能达到的最好情况,称之为满秩,它意味着基向量可以张成整个2D空间,并且决定值非零。 对于3x3矩阵来说,秩为2意味着它已经坍塌了,但还没有秩为1那么严重。
特征向量和特征值
特征向量和特征值表示变换的“轴”。特征向量是在线性变换后方向不变的输入,即便方向没变,但是大小可能会变。 这个大小则是特征向量放大或缩小的程度,即特征值。 想象一下当旋转一个地球仪,每个位置都面向一个新的方向,但极点除外,极点的方向始终没有改变。
特征向量
对于矩阵A和向量v,如果Av = λv,那么λ是特征值,v是A的特征向量。还有一种说法是,方阵A的特征向量是满足矩阵乘法 = 标量乘法的向量。
感谢拨冗阅读!
资源
-
程序员必学计算线性代数 -
应用机器学习的线性代数入门
-
图形线性代数-一种新的LA方法 -
线性代数的本质3BluelBrown-惊人的动画,可视化的概念 -
矢量化 -
洞察数学
-
深度学习所需的矩阵演算 -
数据分析、信号处理和机器中的矩阵方法 |麻省理工学院开放式课程 -
线性代数全答对 -
4页线性代数.Pdf
保持联络!
务必关注 bitgrit 数据科学出版物以保持更新!想和其他数据科学家讨论数据科学和人工智能的最新发展吗?加入我们的discord服务器!关注 Bitgrit 以获取有关研讨会和即将到来的比赛的更新!
作者简介:
本博由 Benedict Neo 撰写 ,bitgrit 数据科学出版物的编辑,40K 关注, Python ∩ 数据科学 ∩ AI
译者简介
陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织