您當前的位置:首頁 > 娛樂

1.5 基尼指數(Gini Index)生成決策樹【第三週】

作者:由 愛科研的小可愛 發表于 娛樂時間:2021-02-16

上次我們總結了C4。5演算法,該演算法是ID3決策樹的一種改進演算法:

愛科研的小可愛:1。4 C4。5演算法【第三週】

這次我們總結一個全新的生成決策樹的方法——基尼指數(Gini Index)。

1.5 基尼指數(Gini Index)生成決策樹【第三週】

根據上面2、3,就可以用所給資料集D,根據基尼指數求最優特徵,取最小的為最優特徵:

1.5 基尼指數(Gini Index)生成決策樹【第三週】

A1為年齡,A2為是否有工作,A3為是否有房子,A4為信貸情況。以

Gini(D,A_{1}=1)

計算過程為例,即

A_{1}=1

表示青年(5/15),剩下的中年和老年(10/15)為另一類。然後青年中類別為是的佔兩個(2/5),否的佔三個(3/5);中年和老年中類別為是的佔7個(7/10),否的佔3個(3/10)。剩下的計算過程類似。

因為A3對應基尼指數最小,所以優先選擇是否有房子為切分點。

下次我們總結決策樹剪枝相關內容~

標簽: 基尼  10  決策樹  演算法  C4