Update 2023.11.30

機械学習 ベストプラクティス Wine 主成分分析 PCA
PCA ; Principal Component Analysis 機械学習 シャローラーニングの教科書

主成分分析 PCA は特徴抽出や次元削減の1種です。特徴抽出では,データが新しい特徴空間に変換または射影されます。scikit-learn を使います。PCA後にロジスティック回帰でクラス分類します。また,これらをパイプラインで一気通貫で処理します。

極端な例をだすと,健康と食べ物の関係を調べるとき,特徴量を食べ物から和食と洋食に次元削減するような例です。特徴量の特性が相当量残せるので特徴抽出と言われる。 元の特徴量の特性をどれだけ残っているかを示すのが分散説明率である。

DataFrame, Series, NumPy ndarray(numpy.array, np.array), Listなどの構造や変換を知りたければ次を参照してください。

https://yamakatsusan.web.fc2.com/NumpyPandasArrayData_inhtml.html
『機械学習 ベストプラクティス NumPy,Pandas』

https://yamakatsusan.web.fc2.com/NumpyMatrix_in.html
機械学習 ベストプラクティス 線形代数:Numpyの行列演算の教科書』


(2023-11-30 Python3.10.9(CPUマシン)で動作確認済み)



実際に動作するJupyter Notebookのhtmlを下に添付します。Jupyter Notebookと下のhtmlを左上隅からダウンロードできます。



トップページに戻る
inserted by FC2 system