Bu neden sıradan bir evrişim değil?

Şu anda bu kağıdı (sayfa 53) çalışıyorum. Evrişimin özel bir şekilde yapılmasını önerir.

Bu formül:

\ begin {denklemi} \ etiketi {1} \ etiket {1} q_ {j, m} = \ sigma \ left (\ sum_i \ sum_ {n = 1} ^ {F} o_ {i, n + m-1} \ cdot w_ {i, j, n} + w_ {0, j} \ right) \ Ucu {denklem}

İşte onların açıklaması:

Şek. 4.2 , tüm girdi özellikli haritalar (toplamda varsayım), $ O_i (i = 1, · · ·, I) $, bir dizi özellik eşleminde (toplamda $ J $ varsa), $ Q_j (j = 1, · · ·, J) $ Bir dizi yerel filtreye (toplamda $ I × J $) dayalı evrişim katmanlarında $, $ w_ {ij} $ $ (i = 1, · · · I j = 1, · · ·, J) $. Haritalama, sinyal işlemede iyi bilinen konvolüsyon çalışması olarak temsil edilebilir. Girdi özellik haritalarının hepsinin tek boyutlu olması, evrişim katmanındaki bir özellik haritasının her biriminin denklemi $ \ eqref {1} $ (yukarıdaki denklem) olarak hesaplanabilir.

$ o_ {i, m} $, $ iththththththththththththth özelliği birim $ O_i $, $ q_ {j, m} $ $ m $ birimidir. $ j karakterinin $ j karakterinin $ q_j $ değerindeki evrişim katmanı $ w_ {i, j, n} $, ağırlık vektörünün $ n $ th öğesidir, $ w_ {i, j} $, Girişin $ i $ th özellikli haritasının evrişim katmanının $ j $ th özellikli haritasına bağlanması ve $ F $ değerinin, konvolüsyon katmanının her biriminin aldığı giriş bantlarının sayısı olan filtre boyutu denir.

Çok uzak çok iyi:

Bundan temel olarak anladığım şey, bu resimde göstermeye çalıştığım şeydi.

enter image description here

Bana öyle geliyor ki, yaptıkları şey aslında tüm veri noktalarını F'ye kadar ve tüm özellik haritalarında işliyor. Temelde x-y yönünde hareket eder ve bundan yola çıkarak hesaplar.

Temelde 2d boyutundaki 2d boyutundaki görüntü, görüntü boyutuna eşit bir filtre ile $ (I x F) $ boyutunda değil mi? Buradaki ağırlığın hiç bir önemi yok gibi görünüyor.

6

1 cevap

It's analogous to an extremely specific convolution step on a 2D image. That is, it's analogous to an $N \times I$ image with one feature map (e.g. a black & white image, if we're talking about the input), and you choose to use $J$ filters of size $F \times I$ which spans the entire width of the image and only strides along the length to create $J$ feature maps of size $(N - F + 1) \times 1.$ The restrictions here are that:

- "Görüntü" (veya üzerinde çalıştığınız mevcut katman) mutlaka sadece bir özellik haritasına sahiptir

- Filtreler görüntünün tüm genişliğini kapsar, bu yüzden bu yönde ilerlemezler ve ortaya çıkan özellik haritaları 1 $ 'lık bir genişliğe sahiptir.

Daha sonra $ (N-F + 1) \ times 1 $ sonuç özellikli haritaları tek bir $ (N-F + 1) \ times J $ görüntü olarak yeniden yorumlayabilirsiniz. Bu, sonraki kıvrımlar için tam olarak aynı kısıtlamaları oluşturur. katman (veya havuz yapıyorsanız daha fazla kısıtlama).

Yani evet, analoji var, ama sadece 2D görüntü dizileri üzerinde çok sınırlı bir konvolüsyon sınıfına benziyor, ki bu çok kullanışlı olduğunu düşünmüyorum. Kullanılacak olan uygulama türü, boyutlardan biri boyunca çeviri değişmezliğini umursamadığınız siyah beyaz resimlerdir.

Resimlerdeki CNN'lerin, bu benzetmenin izin verdiğinden çok daha esnek olmasının nedeni, bir görüntü CNN'sinin girdi nesneleri (ve her bir gizli katman), bu durumda olduğu gibi bir 2D dizi değil, bir 3B dizi olmasıdır. Üçüncü boyut, özellik haritalarıdır (örneğin giriş görüntüsü için RGB değerleri). Daha sonra, filtrenin her iki boyutta da herhangi bir boyutta olmasını ve her iki yönde ilerlemesini sağlayabilirsiniz. Bir CNN'nin 2D girişleri söz konusu olduğunda metin yorumunu tutmayı tercih ederim.

1
katma
"Bu uygulama onun ağırlığını paylaşmalı" dediğinde ne demek istediğini anlamıyorum. Bir CNN'de meydana gelen tek "ağırlık paylaşımı" türü, tek bir filtrenin bir görüntü boyunca ilerlemesidir. Bu şekilde, bir görüntüdeki bir pikseli bir sonraki görüntüdeki bir piksele bağlayan ağırlık, birinci görüntüdeki bir pikselin komşusunu ikinci görüntüdeki bir pikselin komşusuna bağlayan ağırlık ile aynıdır. Ağırlığınız, 3B benzersiz değer dizisi (veya 2D görüntü CNN'de benzersiz değerlerin 4D dizisi) olarak hala ifade edilebilir.
katma yazar Farinha, kaynak
Örnek 1d örneğidir, ancak 2d örnek için de uygulanabilir. (Ek toplama ekleme). Ama kilo matrisini biraz detaylandırır mısın? Bu uygulama kağıda göre olmalı, ağırlığını paylaşmalıdır, ancak ağırlık her işlem için daha farklıdır.
katma yazar zloster, kaynak