Scikit-learnのGridSearchCVを使用した場合のデータセットの分割方法

[概要]

機械学習モデル作成に使用される、Scikit-learnライブラリにはGridSearchCVというクラスがあります。本クラスを使用する際、データセットをK分割交差検証を使用して検証用データを確保したい場合は、引数のcvにK分割のKの値を設定すればOKです。

事前にわざわざ自らK分割して、検証用データを確保する必要はありません。

<サンプルコード>

gridsearch_tuned_model = GridSearchCV(estimator=estimator, param_grid=param_grid, cv=cv, return_train_score=False)

ちなみに、各引数の意味は以下の通りです

・estimator: 作成するモデルの種類(モデルのインスタンスを指定)

・param_grid: グリッドサーチによるハイパーパラメータの探索範囲

・cv: K分割交差検証のKの値

・return_train_score: K分割交差検証によりデータセットを学習用、検証用に分割した際、学習用データによるモデルの精度を返すかどうか。(True:返す、False:返さない)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です