當然我們是可以用之前提到的對資料做 normalization 預處理,使得輸入的 x變化範圍不會太大,讓輸入值經過激勵函式的敏感部分
sigmoid激勵函式是個很敏感的函式1/(1+exp(-x))在x大於10的時候,計算結果就差不多是1了,此時sigmoid的導函式sigmoid(x)(1-sigmoid(x))幾乎為0,如果開發的時候用的是C/C++,訓練的時候由於d