1.5 基尼指數(Gini Index)生成決策樹【第三週】
作者:由 愛科研的小可愛 發表于 娛樂時間:2021-02-16
上次我們總結了C4。5演算法,該演算法是ID3決策樹的一種改進演算法:
愛科研的小可愛:1。4 C4。5演算法【第三週】
這次我們總結一個全新的生成決策樹的方法——基尼指數(Gini Index)。
根據上面2、3,就可以用所給資料集D,根據基尼指數求最優特徵,取最小的為最優特徵:
A1為年齡,A2為是否有工作,A3為是否有房子,A4為信貸情況。以
計算過程為例,即
表示青年(5/15),剩下的中年和老年(10/15)為另一類。然後青年中類別為是的佔兩個(2/5),否的佔三個(3/5);中年和老年中類別為是的佔7個(7/10),否的佔3個(3/10)。剩下的計算過程類似。
因為A3對應基尼指數最小,所以優先選擇是否有房子為切分點。
下次我們總結決策樹剪枝相關內容~
上一篇:庫不齊旅行雜亂思考
下一篇:最重要的,或許就是眼前擁有的