資料分析36計(三)：熵權法如何確定指標權重構建評價體系

作者：由糖甜甜甜發表于寵物時間：2022-03-24

1. 熵權法

資訊理論基本原理解釋資訊是系統有序性的度量單位，而熵可以度量系統的無序程度；如果某個指標的資訊熵越小，該指標提供的資訊量越大，指標變異程度（方差）高，因此在綜合評價中所起作用理當越大，權重就應該越高。熵權法的基本原理就是根據指標變異性的大小來確定客觀權重。一般來說，這個方法相比於AHP專家打分更客觀。熵權法確定指標權重的推導過程如下：

第一步：資料標準化

將各個指標的資料進行標準化處理。假設給定了

個指標

，其中

$X_i={x_1,x_2,...,x_n}$

。假設對各指標資料標準化後的值為

，那麼

$Y_{ij}=\frac{X_{ij}-minX_i}{maxX_i-minX_i}$

第二步：求各指標的資訊熵

根據資訊理論中資訊熵的定義，一組資料的資訊熵計算為：

$E_j=-ln(n)^{-1}\sum_{i=1}^{n}{p_{ij}lnp_{ij}}$

，其中

$p_{ij}=Y_{ij}/\sum_{i=1}^{n}{Y_{ij}}$

第三步：確定各指標權重

根據資訊熵的計算公式，計算出各個指標的資訊熵為

。透過資訊熵計算各指標的權重：

$W_i=\frac{1-E_i}{k-\sum_{}^{}{E_i}},其中i=1,2,...,k$

2. 評價體系之確定指標權重並計算樣本得分

比如最近某快遞公司在多地設定了快遞點，但是快遞點運營狀態如何從資料上來獲知，有哪些快遞點需要取消，哪些快遞點需要擴大經營？如何為給出每個快遞點的具體得分，從而設定獎懲制度。這裡建立一個評價體系，評價體系中包括能很好衡量快遞點經營效果的指標，每個快遞點都有這些指標的資料，因為熵權法可以自己計算出各個指標的權重，那麼避免了專家打分法等主觀權重帶來的偏見，因此從該資料基礎上即可獲得各個快遞點的得分。

熵權法計算過程：

求解過程放在了Excel，公眾號後臺回覆“熵權法”即可獲取。第一步：資料標準化。假設有11個快遞點參與評價，評價體系中包括以下7個子指標，以下指標資料透過歸一化公式已實現資料標準化。