[概要]
DecisionTreeClassifierクラスの以下ハイパーパラメータは、それぞれ意味合いが異なります。混同しがちなので注意しましょう。
・min_samples_split: ノードを分割するために必要な最小サンプル数。デフォルト値は2であり、この数未満のサンプルがあるノードはそれ以上分割されません。例えば、min_samples_splitが5なら、5未満のサンプル数なら分割しない、5以上なら分割する、となります。
・min_samples_leaf: 1ノードあたりの最小サンプル数。デフォルト値は1であり、分割後にこの数未満のサンプルになることが見込まれる場合ノードはそれ以上分割されません。例えば、min_samples_leafが5なら、分割後に左右いずれかのノードが5未満のサンプル数なら分割しない、左右どちらのノードも5以上なら分割する、となります。