決定木アルゴリズムによる分類モデル作成の仕組み理解のための、学習用データに基づくジニ係数、利得計算Excelシート

[概要]

Kaggleの下記URLに登録されている心臓病疾患データを利用し、Scikit-learnのDecisionTreeClassifierクラスを使用し疾患あり、疾患なしの2値分類モデルを作成する仕組みについて理解するため、データセットを元にジニ係数、利得計算を行うExcelシートを作成しました。

Kaggle心臓病疾患データセットURL

完全に上記データセットに特化したExcelですが、実際にデータを自分で手入力して計算結果を確かめることで、アルゴリズムの理解が深まると思いますので、添付します。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です