机器学习算法之主成分分析PCA
机器学习算法之主成分分析PCA
来源: https://www.biaodianfu.com
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。一般我们提到降维最容易想到的算法就是PCA,下面我们就对PCA的原理做一个总结。
首先考虑一个问题:对于正交属性空间中的样本点,如何用一个超平面(直线的高维推广)对所有样本进行恰当的表达?
可以想到,若存在这样的超平面,那么它大概具有这样的性质:
最近重构性 :样本点到这个超平面的距离都足够近,即下图中所有红线(即投影造成的损失)加...