為什麼邏輯迴歸要使用交叉熵作為損失函式
作者:由 賈唐浩 發表于 旅遊時間:2018-01-21
在邏輯迴歸中,
。根據機率論,我們約定
。這樣我們可以得到:
綜合起來,就有
由於取自然對數不改變機率的函式的單調性,因此最大化機率等價於最大化以下的函式:
我們使用梯度下降法求解,因此需要對上式取相反數,從而轉化為求最小值。
在整個訓練集上的m個樣本使用以上的損失函式,可以得到最終的成本函式。這裡假設所有樣本都是獨立同分布的,因此機率分散式所有機率分佈的乘積:
同樣,對上式取對數,使用極大似然估計求得機率最大時對應的引數。類似地,我們需要最小化函式,因此取相反數,即:
通常,我們會給函式新增一個額外的縮放係數
,得到
我們的目標就是最小化上面的函式。
上一篇:瘦腿霜好還是茶多酚減肥好?
下一篇:學習麻醉真的治病救人嗎?