of 7/7
6/10/2013 1 Materiały/konsultacje http://www.ibp.pwr.wroc.pl/KotulskaLab Konsultacje –wtorek, piątek 9-11 (uprzedzić ) D1-115 [email protected] Automatyczna predykcja Co to jest uczenie maszynowe? Uczenie maszynowe to wnioskowanie o nieznanych zależnościach pomiędzy danymi wejściowymi (zmienne niezależne, cechy, predyktory) a wyjściowymi (zmienne zależne, odpowiedź). Zależność pomiędzy WE i WY nie zawsze może być przedstawiona w formie analitycznej funkcji lub innej relacji typu explicite. Często przyjmuje formę czarnej skrzynki, działającej wg. określonego algorytmu uzyskanego z uczenia W przypadku danych, dla których nie istnieje WY jest to wnioskowanie o prawdopodobieństwie równoczesnego wystąpienia pewnego zespołu cech Przykład Białka -> Tłuszcze -> Węglowodany -> Nieznane relacje zakaźne miażdżyca Alzheimer wzrok Dieta: X=[X1,X2,X3] Przewidywana zapadalność na schorzenia (klasa choroby lub przewidywana data) Google buduje wehikuł czasu Google Prediction API, maj 2010 http://code.google.com/intl/pl/apis/predict /

spd1 2013 - ibp.pwr.wroc.pl Pomiarowo... · zaburzona losowym szumem (patrz poprzedni wykład o analizie medycznych szeregów czasowych) zadanie jest znacznie trudniejsze. Często

  • View
    212

  • Download
    0

Embed Size (px)

Text of spd1 2013 - ibp.pwr.wroc.pl Pomiarowo... · zaburzona losowym szumem (patrz poprzedni wykład o...

6/10/2013

1

Materiay/konsultacje

http://www.ibp.pwr.wroc.pl/KotulskaLab

Konsultacje wtorek, pitek 9-11 (uprzedzi)D1-115

[email protected]

Automatyczna predykcja

Co to jest uczenie maszynowe? Uczenie maszynowe to wnioskowanie o nieznanych

zalenociach pomidzy danymi wejciowymi (zmienne niezalene, cechy, predyktory) a wyjciowymi (zmienne zalene, odpowied).

Zaleno pomidzy WE i WY nie zawsze moe by przedstawiona w formie analitycznej funkcji lub innej relacji typu explicite. Czsto przyjmuje form czarnej skrzynki, dziaajcej wg. okrelonego algorytmu uzyskanego z uczenia

W przypadku danych, dla ktrych nie istnieje WY jest to wnioskowanie o prawdopodobiestwie rwnoczesnego wystpienia pewnego zespou cech

Przykad

Biaka ->

Tuszcze ->

Wglowodany ->

Nieznane relacje

zakane

miadyca

Alzheimer

wzrok

Dieta: X=[X1,X2,X3]

Przewidywana zapadalno na schorzenia (klasachoroby lub przewidywana data)

Google buduje wehiku czasu Google Prediction API, maj 2010

http://code.google.com/intl/pl/apis/predict/

6/10/2013

2

Rozpoznawanie twarzy Kiedy uczenie maszynowe?

W przypadku danych okrelonych deterministycznie wystarczy zna funkcj wic dane wejciowe z wyjciowymi.

Majc zestaw uczcy mona prbowa t funkcj aproksymowa (dopasowanie, z ang.fitowanie), co jest tym skuteczniejsze im lepiej znamy typ funkcji (np. wielomian, wykadnicza, etc) i ilo wolnych parametrw.

W przypadku danych ze skadow losow, np. seria pomiarw okrelona za pomoc pewnego cigu funkcji gstoci prawdopodobiestwa lub zaburzona losowym szumem (patrz poprzedni wykad o analizie medycznych szeregw czasowych) zadanie jest znacznie trudniejsze.

Czsto nie istnieje adna funkcja analityczna wica dane wyjciowe z klas obiektu lub wartoci odpowiedzi. Aproksymacja opiera si moe na modelu nauczonym na danych uczcych (czyli o znanej odpowiedzi na zadane dane wejciowe).

Model moe szacowa zaleno pewn funkcj (np. regresja liniowa) lub generowa odpowied za pomoc czarnej skrzynki , czyli bez ujawniania typu zaleno w postaci analitycznej -explicite

Kiedy uczenie maszynowe (cd)?Jakie obszary wykorzystuj uczenie maszynowe?

Data mining wyuskiwanie niewielkiej, uytecznej czci danych z ogromnych zbiorw danych

Sztuczna inteligencja wnioskowanie

Rodzaje uczenia maszynowego

Uczenie maszynowe z nadzorem (ang. supervised learning)

Uczenie maszynowe bez nadzoru (ang. unsupervised learning)

Popularna metoda uczenia maszynowego z nadzorem

Sieci neuronowe

6/10/2013

3

Uczenie z nadzorem

Mamy pewien zbir danych tzw. zbir uczcy, w ktrym znamy zmienn wejciow i wynikajc z niej zmienn wyjciow.

Na tej podstawie moemy prbowa znale relacje, ktre cz WE z WY i przewidywa WY dla nowych danych (spoza zbioru uczcego)

Komputerowa metoda znajdowania tych relacji (na podstawie odpowiednio duego zbioru uczcego) jest metod uczenia maszynowego

Uczenie z nadzorem

Mamy pewien zbir danych tzw. zbir uczcy, w ktrym znamy zmienn wejciow i wynikajc z niej zmienn wyjciow.

Na tej podstawie moemy prbowa znale ukryterelacje, ktre cz WE z WY i przewidywa WY dla nowych danych (spoza zbioru uczcego)

Model to komputerowa metoda znajdowania tych relacji (na podstawie odpowiednio duego zbioru uczcego) - metoda uczenia maszynowego

Przykad spam w emailu

Zbir uczcy: e-maile, o ktrych wiemy, czy s spamem, czy wiadomociami

Zbir testowy: e-maile przychodzce na serwer, o ktrych nie mamy takiej informacji, a jest nam potrzebna do ustawienia filtru

Cechy (zmienna niezalena): np. zbir sw w tytule albo.?

Problemy w uczeniu maszynowym

Wybr optymalnej metody do wyznaczenia modelu

Waciwy dobr cech znaczcych w uczeniu (redukcja cech nadmiarowych). Podaj moliwe zestawy cech w przykadzie ze spamem emailowym i redukcj.

Waciwy dobr optymalnego i reprezentatywnego zbioru uczcego

Funkcja oceny akceptowalnoci wyniku

Przykadowe metody w uczeniu z nadzorem

Sieci neuronowe

Drzewa decyzyjne

SVM (ang. Support Vector Machines)

Metody liniowe i najmniejszych kwadratw

Metoda najbliszych ssiadw

Metody Bayesa

Ukryte modele Markova

Algorytmy genetyczne

Gramatyki formalne .

Uczenie z nadzoremPodstawowe modele klasyfikacji

6/10/2013

4

Uczenie z nadzorem: klasyfikacja i regresja

KLASYFIKACJA - Uczenie z nadzorem, w ktrym WY jest podane w sposb jakociowy podzia na klasy (np. spam- niespam; choroba krenia czy choroba zakana)

REGRESJA - Uczenie z nadzorem, w ktrym WY jest podane w sposb ilociowy liczbowo (np. przewidywany czas zapadnicia na schorzenie; poziom korelacji pomidzy wielkociami)

WEKA

http://www.cs.waikato.ac.nz/ml/weka

Uczenie bez nadzoru - klastering

Obserwujemy tylko cechy (zmienn wejciow) ale zmiennej wyjciowej nie znamy (lub nie istnieje) .

Nie istnieje wic zbir uczcy, ktry umoliwi nam wyznaczenie modelu zalenoci

Nie wyznaczamy wic tych zalenoci interesuje nas tylko grupowanie danych w tzw. klastry, ktrych elementy s w jaki sposb do siebie podobne. Innymi sowy chcemy wnioskowa o prawdopodobiestwie (tzn. funkcji gstoci prawd.) znalezienia si obiektu (zdefiniowanego poprzez wektor cech) w okrelonym miejscu przestrzeni

Problem do uczenia bez nadzoru (klastrowanie; grupowanie)

Kompresja obrazw (np. grupowanie waciwoci kolorystycznych)

Jak pogrupowa ludzi podobnych na podstawie danych demograficznych ? Np. jak dowiedzie si o prawdopodobiestwie wystpienia pewnych zestawwcech w populacji (np. osoby o duych dochodach i nie leczonych zbach)?

6/10/2013

5

Przykad do uczenia bez nadzoruPrzykadowe metody w uczeniu bez

nadzoru

Algorytm k-rednich

Grupowanie hierarchiczne

Grupowanie skupione (ang. agglometrative clustering)

Grupowanie dzielce (ang. divisive clustering)

Grupowanie spektralne

Skalowanie wielowymiarowe

Zachowanie klasyfikatora dla rnych k w metodzie k-rednich

Sztuczne sieci neuronowe.Zastosowanie w uczeniu z

nadzorem i analizie skupie

Literatura

R. Tadeusiewicz, Sieci neuronowe

S. Ossowski, Sieci neuronowe w ujciu algorytmicznym

Samouczek - http://nrn.prv.pl/

MZG

ODPORNY NA USZKODZENIA;

ELASTYCZNY ATWO DOSTOSOWUJE SI DO ZMIENNEGO OTOCZENIA;

UCZY SI - NIE MUSI BY PROGRAMOWANY;

POTRAFI RADZI SOBIE Z INFORMACJ ROZMYT, LOSOW, ZASZUMION LUB NIESPJN;

W WYSOKIM STOPNIU RWNOLEGY;

MAY, ZUYWA BARDZO MAO ENERGII.

6/10/2013

6

Inspiracje biologiczne Neuron McCullocha-Pittsa

Odpowied pojedynczego neuronu liniowego Perceptron wielowarstwowy

Ile warstw?

Sie 1 warstwowa rozwizuje tylko problemy liniowe

Sie dwuwarstwowa dzieli obszar na spjne i wypuke klasy

Sie trzywarstwowa rozwie kady problem klasyfikacji/regresji, ale ze wzgldu na redukcj wzw w jednej warstwie stosuje si czasem sieci czterowarstwowe

Ile wzw?

Warstwy WE i WY w zalenoci od problemu

Warstwa ukryta drog eksperymentw

6/10/2013

7

Moliwoci klasyfikacji Wyznaczanie wag

Algorytm wstecznej propagacji bdw

Jest to podstawowy algorytm uczenia nadzorowanego wielowarstwowych jednokierunkowych sieci neuronowych.

Podaje on przepis na zmian wag wij dowolnych pocze elementw przetwarzajcych rozmieszczonych w ssiednich warstwach sieci.

Oparty jest on na minimalizacji sumy kwadratw bdw uczenia z wykorzystaniem optymalizacyjnej metody najwikszego spadku.

Funkcje aktywacji

Neuron typu sigmoidalnego ma struktur podobn do modelu McCullocha-Pittsa, z t rnic, e w przeciwiestwie do perceptronu funkcja aktywacji jest ciga i przyjmuje posta funkcji sigmoidalnej unipolarnej (0,1) lub bipolarnej (-1,1). Funkcja unipolarna ma zwykle posta

natomiast bipolarna

Sie Hopfielda to sie autoasocjacyjna (kady z kadym)