Deep Learning 用Python 進行深度學習的基礎理論實作-9－書籍分享天地

書-Deep Learning 用Python 進行深度學習的基礎理論實作

∞小批次學習

∞損失函數&辨識準確率

∞數值微分

小批次學習

我們講訓練資料讓他學習，就是為了降低損失函數的值，但是如果如果整個資料過於龐大，我們可能從資料裡面先抽出100份來訓練看看成效，就像做民調一樣不可能每個人都有機會被問到，所以就隨機抽樣來代表此區的民意，雖說有時不一定準，但是可以當作是相近值來看。假設我們有60000筆資料，隨機抽100個資料用交叉熵(ㄉ一)誤差來做為損失函數。

下面這個公式，很好懂，n就是資料，ynk是輸出答案(第n個資料的k)、tnk是正確答案，除以100就是這100筆資料總共的損失率。

第7行的one_hot_label的意思是陣列中只有一個1其他都是0就是one hot編碼。

第10行的意思是從60000中隨機挑出10個

損失函數&辨識準確率

為甚麼不用辨識正確率，而用奇怪的損失函數?這又會扯到數學的「微分」，我們要尋找到最佳參數(權重、偏權重)，就必須要對參數進行微分(找出斜率)，根據微分的數值來做調整，如果微出來是負值，就要往正的方向調整，以此來減少損失函數，微出來是正值，就往負值調整，減少損失函數，如果用辨識率的話，不管怎麼微分都會是0，根本無法調整，所以才不用辨識率當作指標的原因。