什么是PCA?
PCA(principal component analysis),也就是主成分分析,是一种算法,主要用来数据降维。
PCA是将原始的样本矩阵XXX转换成降维后的新样本YYY的一种方法。
为了实现维度变化我们需要一个
变换矩阵UUU,Yr×n=UTr×mXm×nY_{r \times n} = {U^T}_{r \times m}X_{m \times n}Yr×n=UTr×mXm×n(这里是先转置,再取前n行),用于对行进行压缩
或者矩阵VVV,Ym×r=Xm×nVn×r{Y_{m \times r}} = {X_{m \times n}}{V_{n \times r}}Ym×r=Xm×nVn×r,用于对列进行压缩。
一般不会对样本数量降维,都是对样本的特征数量降维,也就是用少量的特征数量去表征样本的特征,这样就实现了数据降维。
怎么计算PCA?
PCA计算一般有两种常用的方法,分别是特征值分解法和奇异值分解法。
特征值分解:
推导:
PCA是要求降维后的数据YYY的方差最大,并且基向量之间正交。
数据的方差计算公式:
1n−1∑i=1n(UiTXi ...
关于建blog过程和踩过的坑
写在前面:一个电脑新手,这是我第一次写博客,参考的教程来自15级的一个学长,基本就是根据他建立的过程来操作的
主要步骤:
注册github账户,新开一个repository,设置git page
也可以租一个VPS,但是免费的git page托管服务多好用啊
下载安装hexo,跟着教程来操作就OK了
可以再hexo设置自己喜欢的主题和插件
最后托管到github上面
其实用这个的另一个原因是我想学一学markdown,之前有看过这个,感觉用起来还不错,语法也和html基本上差不多关键是jupyter notebook也支持(。・∀・)ノ
嘿嘿(~﹃~)~zZ,先写这么多,踩过的坑有点多,一时间写不完。
遇到的坑(或者比较难的地方吧):
注意,下面所有带[]的表示里面的内容需要根据自己的进行替换
绑定github账户
这部分其实还好,也就是git的使用,baidu教程一大堆,常用的也就那几个
1234567891011git init #初始化本地git仓库git add filename #添加文件到缓冲区git com ...