資料分析36計(三):熵權法如何確定指標權重構建評價體系
作者:由 糖甜甜甜 發表于 寵物時間:2022-03-24
1. 熵權法
資訊理論基本原理解釋資訊是系統有序性的度量單位,而熵可以度量系統的無序程度;如果某個指標的資訊熵越小,該指標提供的資訊量越大,指標變異程度(方差)高,因此在綜合評價中所起作用理當越大,權重就應該越高。熵權法的基本原理就是根據指標變異性的大小來確定客觀權重。一般來說,這個方法相比於AHP專家打分更客觀。熵權法確定指標權重的推導過程如下:
第一步:資料標準化
將各個指標的資料進行標準化處理。假設給定了
個指標
,其中
。假設對各指標資料標準化後的值為
,那麼
第二步:求各指標的資訊熵
根據資訊理論中資訊熵的定義,一組資料的資訊熵計算為:
,其中
第三步:確定各指標權重
根據資訊熵的計算公式,計算出各個指標的資訊熵為
。透過資訊熵計算各指標的權重:
2. 評價體系之確定指標權重並計算樣本得分
比如最近某快遞公司在多地設定了快遞點,但是快遞點運營狀態如何從資料上來獲知,有哪些快遞點需要取消,哪些快遞點需要擴大經營?如何為給出每個快遞點的具體得分,從而設定獎懲制度。這裡建立一個評價體系,評價體系中包括能很好衡量快遞點經營效果的指標,每個快遞點都有這些指標的資料,因為熵權法可以自己計算出各個指標的權重,那麼避免了專家打分法等主觀權重帶來的偏見,因此從該資料基礎上即可獲得各個快遞點的得分。
熵權法計算過程:
求解過程放在了Excel,公眾號後臺回覆“熵權法”即可獲取。第一步:資料標準化。假設有11個快遞點參與評價,評價體系中包括以下7個子指標,以下指標資料透過歸一化公式已實現資料標準化。
表1 資料標準化
第二步:求各指標的資訊熵
表2 求解各資料的Pij
表3 求解資訊熵Ei
第三步:求各指標權重,見表3倒數第一行。
第四步:各快遞點得分,見表3最後一列。可以看到快遞點S6得分最高。