決定木アルゴリズムによる分類モデル作成の仕組み理解のための、学習用データに基づくジニ係数、利得計算Excelシート

[概要] Kaggleの下記URLに登録されている心臓病疾患データを利用し、Scikit-learnのDecisionTreeClassifierクラスを使用し疾患あり、疾患なしの2値分類モデルを作成する仕組みについて理 […]

Continue reading

Kaggleのカリフォルニア住宅価格データセットの注意点

[概要] Kaggleの下記URLに登録されているカリフォルニア住宅価格データセットを利用する上で、2点注意すべきポイントがあります。 Kaggleカリフォルニア住宅価格データセットURL ①各データの単位は1戸の住宅単 […]

Continue reading

Scikit-learnのGridSearchCVを使用した場合のデータセットの分割方法

[概要] 機械学習モデル作成に使用される、Scikit-learnライブラリにはGridSearchCVというクラスがあります。本クラスを使用する際、データセットをK分割交差検証を使用して検証用データを確保したい場合は、 […]

Continue reading

AWSのEC2インスタンス(Linux)にec2-userでログイン後、ssh-addコマンド実行時にエラー「Could not open a connection to your authentication agent.」の対処法

[背景] Ansibleでマスターマシンからターゲットマシンに対してPlaybookを実行するための前準備として、SSH Agentに対してssh-addコマンドを実行しSSH秘密鍵を登録しようとしましたが、エラーが発生 […]

Continue reading