Metody Deep Learning

Autoencoders

1.Feed Forward NN

2. NN - training

3. Probabilistic graphical models

4. Restricted Boltzmann machines

5. Autoencoders

6. Deep learning

7. Convolutional NNs

Dlaczego?

Przykład: redukcja wymiarowości - PCA

Przykład: redukcja wymiarowości - DAE

Autoencoder

W ⇤ = WT

Decoder

Encoder

x̂ = sigm(c+W

⇤h(x))

h(x) = sigm(b+Wx)x

Loss function• dla danych binarnych

• dla danych liniowych

l(x, x̂) = �X

(xk log (x̂k) + (1� xk) log (1� x̂k))

l(x, x̂) =1

(xk � x̂k)2

Trenowanie• możemy minimalizować koszt metodą gradient descent • dla obu przypadków funkcji kosztu gradient względem

aktywacji ma taką samą formę:

Oa(x)l(x, x̂) = x̂� x

• gradienty wag oraz biasów możemy uzyskać propagacją wsteczną

Adaptacja do wejścia• wybieramy łączny rozkład nad wejściem p(x | µ)

gdzie µ to wektor parametrów tego rozkładu

• wybieramy relację pomiędzy wektorem µ

i ukrytą warstwąh(x)

• użyj jako funkcji kosztu:

l(x) = � log p(x | µ)

Jaka może być warstwa ukryta?

Undercomplete Hidden Layer

• warstwa ukryta kompresuje wejścieW

W ⇤ = WT

• warstwa ukryta dobrze modeluje dane treningowe, ale źle inne wejścia

Overcomplete Hidden Layer

W ⇤ = WT

• nie ma kompresji w warstwie środkowej • warstwa ukryta może nauczyć się identyczności • nie ma gwarancji, że ukryte jednostki nauczą się

znaczącej reprezentacji

Jak zapobiec uczeniu się identyczności?

Idea: reprezentacja odporna na szum

Denoising autoencoder

W ⇤ = WT

p(x̃ | x)

• dodajemy szum do wejścia

• rekonstrukcja obliczana z zaszumionego wejścia

• loss function porównuje rekontrukcję z autentycznym wejściem

Intuicja

x̂ = sigm(c+Wh(x̃))

p(x̃ | x)

• Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Demonising Criterion - Vincent, Larochelle, Lajoie, Bengio Manzagol, 2008

• A Connection Between Score Matching and Denoising Autoencoders - Vincent, 2011

Filtry (Vincent, Larochelle, Bengio i Manzagol, ICML 2008)

• bez szumu

• 25% szumu

• 50% szumu

Idea: karanie modelowania wszystkich

danych

Contractive Autoencoder

W ⇤ = WT

• dodajemy składnik do funkcji kosztu,

który penalizuje nieinteresujące nas

rozwiązania • chcemy ekstrachować tylko cechy, które

odzwierciedlają wariacje danych ze

zbioru treningowego • model ma być inwariantny na inne

wariacje

Contractive Autoencoder

l(x, x̂) + � kOx

h(x)k2F

Nowa funkcja kosztu:

Dla binarnych obserwacji:

l(x, x̂) = �X

(xk log (x̂k) + (1� xk) log (1� x̂k))

� kOx

h(x)k2F

(@h(x)

Intuicja

encoder musi być wrażliwy na takie wariecje, żeby dobrze rekonstruować dane

encoder nie powinien być wrażliwy na wariację nie zaobserwowaną w zbiorze treningowym

Contractive Auto-Encoders: Explicit Invariance During Feature Extraction - Rifai, Vincent, Muller,

Glorot, Bengio, 2011

https://github.com/Craftinity/DA-AGH

Metody Deep Learning - Wykład 6

Documents

Metody Numeryczne w Budowie Samolotów/Śmigłowcówitlims-zsis.meil.pw.edu.pl/pomoce/MN/MN_1.pdf · 1 Metody Numeryczne w Budowie Samolotów/Śmigłowców Wykład I Dęblin, 11 maja

Metody numeryczne - lanczont.pollub.pllanczont.pollub.pl/images/Moje_doc/Dokumenty/Dzienne/MN/Wyklad/... · 17.11.2018 1 Metody numeryczne Wykład 5 Dr inż. Michał Łanczont Instytut

Zbiory Julii, wymiary – metody formalizmu termodynamicznegofeliksp/Orlicz.pdf · 2014-12-21 · Zbiory Julii, wymiary – metody formalizmu termodynamicznego Wykład im. Profesora

Państwowa Wyższa Szkoła Zawodowa w Nysie Opis modułu ... · Wykład Metody dydaktyczne Wykład interaktywny, prezentacja multimedialna L.p. Tematyka zajęć Liczba godzin 1. Fizjologia

Matematyczne Metody Fizyki Ihome.agh.edu.pl/~mariuszp/wfiis_mmf/wyklad_mmf1_1_1112.pdfM. Przybycie ń Matematyczne Metody Fizyki I Wykład 1-8 Symbole sumy (ΣΣΣΣ) i iloczynu (ΠΠΠΠ)

Metody teledetekcyjne w badaniach atmosfery i oceanów . Wykład 7

Wykład 11: Kody i metody korekcji błędów

Metody analizy decyzji Wykład 7 – sekwencyjne problemy decyzyjne

Metody numeryczne Wykład 1 - lanczont.pollub.pllanczont.pollub.pl/images/Moje_doc/Dokumenty/Dzienne/MN/Wyklad/... · Metody numeryczne stosuje się gdy stawiany problem nie posiada

Metody Deep Learning - Wykład 5

Metody teledetekcyjne w badaniach atmosfery i oceanów . Wykład 3. Pomiary ozonu

Wykład 05 Metody utylizacji odpadów (część 2)

metody Monte Carlo –zastosowanie metod do obliczenia ...etacar.put.poznan.pl/albert.kubzdela/p5-10.pdf · Nr: 15 Metody obliczeniowe -Budownictwo semestr 2 -wykład nr 5 Obliczenie

Metody teledetekcyjne w badaniach atmosfery i oceanów . Wykład 9

Wykład trzeci - eti.pg.edu.pl · Ilustracja graficzna Metody rozwiązywania równań nieliniowych, ... Metody rozwiązywania równań nieliniowych, metoda regula falsi

Neurokognitywistyka WYKŁAD 5 Nowe metody badawcze III

Metody teledetekcyjne w badaniach atmosfery i oceanów . Wykład 12. Teledetekcja Aktywna

Metody analizy decyzji Wykład 8 – oczekiwana wartość opcji i doskonałej informacji

aproksymacja i interpolacja – poj ęcie modelu regresjietacar.put.poznan.pl/albert.kubzdela/p3-09z.pdf · Nr: 1 Metody obliczeniowe -Budownictwo semestr 2 -wykład nr 3 Metody obliczeniowe

wykład nr 3 - Poznan University of Technologyetacar.put.poznan.pl/albert.kubzdela/w_3-2014ns.pdf · Interpolacja wielomianowa Metody obliczeniowe - Budownictwo semestr 4 -3 wykład