[概要]
Kaggleの下記URLに登録されている心臓病疾患データを利用し、Scikit-learnのDecisionTreeClassifierクラスを使用し疾患あり、疾患なしの2値分類モデルを作成する仕組みについて理解するため、データセットを元にジニ係数、利得計算を行うExcelシートを作成しました。
完全に上記データセットに特化したExcelですが、実際にデータを自分で手入力して計算結果を確かめることで、アルゴリズムの理解が深まると思いますので、添付します。
Udemyベストセラー講師Shotaが運営するTechメディア
Kaggleの下記URLに登録されている心臓病疾患データを利用し、Scikit-learnのDecisionTreeClassifierクラスを使用し疾患あり、疾患なしの2値分類モデルを作成する仕組みについて理解するため、データセットを元にジニ係数、利得計算を行うExcelシートを作成しました。
完全に上記データセットに特化したExcelですが、実際にデータを自分で手入力して計算結果を確かめることで、アルゴリズムの理解が深まると思いますので、添付します。