top of page
尚無標記。

SEARCH BY TAGS: 

RECENT POSTS: 

FOLLOW ME:

  • Facebook Clean Grey
  • Twitter Clean Grey
  • Instagram Clean Grey

Convolutional Neural Network,CNN

卷積神經網路在圖像和語音的識別上效果非常地顯著,而他與其他深度學習系統的特別之處在於它可以端到端的學習整個感知過程,為一種前饋式的神經網路,而以下我將透過圖像來大略解釋:

所以對於卷積神經網路來說並不是上下層的神經元都可以直接連接,而是透過卷積核作為連接,同一個卷積核在所有圖像中都是一起共用的,圖像透過卷積操作後仍然保留原先的位置關係,舉例來說:兩層卷積傳輸的關係如下圖:

假設圖十三中的m-1=1為輸入層,要去是別出一幅彩色的圖像,這幅圖像我們給他4個通道,分別為ARGB(透明、紅、綠、藍),假設卷積核的大小是2x2,共有w1到w2,2個卷積核,四個通道上的卷積核操作,每個通道對應一個卷積核,先只看w1,那麼在w1的某位置(i,j)處的值是由四個通道上(i,j)處的卷積結果相加在用函數值求得。

所以在上圖中,由4個通道卷積得到兩個通道的過程中,參數為4x2x2x2個,其中4表示4個通道,第一個2則是生成2條通道,最後2x2表示卷積大小。

在這個例子裡可以看到輸入層到隱藏層的參數降低到4x2x2x2個,這就已經夠用已有的訓練數據得到好一點的模型,而圖像識別適用於CNN正是由於CNN模型限制參數的個數,並且可以挖掘局部特徵的特點。

最後一層連接到了全部層


bottom of page