Upload
ermin
View
38
Download
0
Embed Size (px)
DESCRIPTION
Predykcja chaotycznych szeregów czasowych przy pomocy Algorytmów Genetycznych. W skrócie. Odległy cel Ambitne założenia Droga do celu Ewoluujące wzorce Karkołomna implementacja Pierwsze wyniki Dalsze problemy i prace. Cel. - PowerPoint PPT Presentation
Citation preview
mgr inż.Marcin Borkowski
Predykcja chaotycznych szeregów czasowych
przy pomocy AlgorytmówGenetycznych
mgr inż.Marcin Borkowski
W skrócie
• Odległy cel• Ambitne założenia• Droga do celu• Ewoluujące wzorce • Karkołomna implementacja• Pierwsze wyniki• Dalsze problemy i prace
mgr inż.Marcin Borkowski
Cel
• Przewidywanie kolejnych wartości liczbowych szeregu czasowego na podstawie wiedzy o jego poprzednich wartościach
Zastosować opracowaną metodę w praktyce
Zostać bogatym ;-)
mgr inż.Marcin Borkowski
Założenia
• Sama wartość predykcji nie wystarczy, potrzeba współczynnika zaufania
• W trudnych przypadkach system może dać kilka odpowiedzi
• Praca i uczenie się systemu są operacjami tożsamymi
mgr inż.Marcin Borkowski
Założenia
• Predykcja na podstawie nie pełnych danych
• Dalszy horyzont predykcji• Uwzględnianie wielu czynników
podczas predykcji• Skalowalność
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Wzorce pamięci
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Odpytanie wzorca Zk
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Mała rozbieżność punktów testowych prawdopodobnie pozostaje w korelacji z prawdopodobieństwem prawidłowej predykcji
• Na odpowiedź systemu składa się wypadkowa odpowiedzi wszystkich wzorców
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Odpytanie wzorców Z1-Zn
Uczenie
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Wzorce mało wiarygodne (w danej chwili) nie są brane do predykcji
• w razie braku dość dużej liczby wzorców system nie daje odpowiedzi
• Skalowanie to podstawa• Pozostaje problem jak zdobyć i
utrzymać efektywny zbiór wzorców ?
mgr inż.Marcin Borkowski
Rozwiązanie ewolucyjne
• Wzorce mogą być osobnikami algorytmu genetycznego lub ewolucyjnego
• ale:– nie chodzi o wyszukanie super
osobnika, ale o skuteczną populacje.
mgr inż.Marcin Borkowski
Rozwiązanie ewolucyjne
• Klasyczny napór ewolucyjny zawodzi
• Potrzeba nowych metod oceny• Potrzeba nowej metody selekcji
– bieżąca nieprzydatność o niczym nie świadczy
• Potrzeba prezentacji osobnika
mgr inż.Marcin Borkowski
Implementacja
• Wzorce przewidujące 1 krok, o stałej ilości segmentów– Reprezentacja binarna (bloki
reprezentujące węzły (dystans od bieżącego pomiaru, wartość)
– standardowe operatory genetyczne, selekcja ruletkowa ze skalowaniem
mgr inż.Marcin Borkowski
Implementacja
• Ocena (fitness)kumulacyjna:– jeżeli wzorzec był przydatny i
wiarygodny i się sprawdził, jego ocena zwiększa się proporcjonalnie
– jeżeli wzorzec mimo wiarygodności okazał się błędny proporcjonalnie traci ocenę
– mało wiarygodny wzorzec mało zmienia swoją ocenę
mgr inż.Marcin Borkowski
1’sze wyniki
• Początkowa populacja była losowa i algorytm musiał się nauczyć wzorców
• Katastroficzne zapominanie• Zbyt silne dominowanie super
osobników nad populacją
mgr inż.Marcin Borkowski
1’sze wyniki
• Pozytywne (sprawdzone na drodze oszustwa)– udało się wypracować skuteczne
skalowanie– udało się ze zbioru wyników wydobyć
poprawne odpowiedzi
mgr inż.Marcin Borkowski
Dalsze prace
• Reasumując– brak sprawnej metody naboru do
nowej populacji (metody oceny)– brak efektywnej prezentacji wzorca– i wiele dalszych prac
mgr inż.Marcin Borkowski
EtapII
• Reprezentacja bitowa pozostaje• Zmieniono zasady naboru i oceny• Zmieniono operatory • Dodano czynnik ścisku – algorytmy
niszowe• Tymczasowa eliminacja
skalowania, dane z zakresu <-1,1>
mgr inż.Marcin Borkowski
EtapII
• Nabór „rankingowy” inspirowany lepszymi niż nabór ruletkowy – Osobniki przed naborem są sortowane
według przydatności– Podczas krzyżowania i mutacji
powstające nowe osobniki są umieszczane na początku populacji (zastępują najsłabszych)
mgr inż.Marcin Borkowski
EtapII
• Operator krzyżowania zostawia w populacji oboje rodziców, dzieci są umieszczane na początku populacji
• Operator mutacji zostawia oryginał, nowy osobnik z maksimum 1 mutacją jest przenoszony na początek populacji
mgr inż.Marcin Borkowski
EtapII
• Ocena osobnika – Każdy osobnik ma pewną długość n,
pozwala to korzystając z dostępnych danych (seria N odczytów) sprawdzić N-n dopasowań.
– Tylko dopasowania powyżej zadanego pułapu są uśredniane i uznawane za ocenę osobnika
mgr inż.Marcin Borkowski
EtapII
• Czynnik ścisku– Uniemożliwia superosobnikom
zdominowanie populacji– Pozwala utrzymać w populacji wiele
efektywnych, wysoko ocenianych osobnikow
mgr inż.Marcin Borkowski
EtapII
• Czynnik ścisku– Dla każdych 2 osobników w populacji
wyliczany jest „dystans”– Jeżeli 2 osobniki są dość podobne
(decyduje parametr) słabszy z nich zwiększa swój czynnik ścisku
– Współczynniki ścisku dzielą wartość dopasowania
mgr inż.Marcin Borkowski
EtapII
• Czynnik ścisku– Odległość początkowo jako dystans
Haminga • Różnica jednego bitu oznacza czasem dużą
różnice we wzorcu!
– Podobieństwo fizyczne wzorców pod rozkodowaniu chromosomu
• Fizycznie niepodobne dopasowania mogą mieć zastosowania w podobnych przypadkach, jednak nie podlegają ściskowi!
mgr inż.Marcin Borkowski
EtapII
Prezentacja wyników testowych
mgr inż.Marcin Borkowski
EtapIII
• Nowe zastosowanie– Data Fitting
• Zmiana reprezentacji chromosomu• Zmiana metody oceny• Zmiana metody predykcji• Zmiana metody liczenia dystansu
mgr inż.Marcin Borkowski
EtapIII
• Nowe zastosowanie– Wzorce można dopasowywać również
wewnątrz szeregu i uzupełniać w ten sposób braki
– Pokrywa to też poprzednie podejście predykcyjne
– Umożliwia predykcje na kilka kroków w przód
mgr inż.Marcin Borkowski
EtapIII
• Zmiana reprezentacji chromosomu– Dotychczasowa wartość predykcji
staje się ustalonym węzłem zero– Węzły są poprzesuwane o jeden dalej
w kierunku starszych danych– Więcej osobników może teraz brać
udział w predykcji
mgr inż.Marcin Borkowski
EtapIII
• Zmiana metody oceny– Podczas oceniania osobników pojawia
się problem braku w danych– dla każdego węzła predykcji, któremu
brakuje danej zakłada się maksymalne niedopasowanie
– Do oceny brane są dopasowania tylko powyżej i równe średniej z danych (wyeliminowało to parametr)
mgr inż.Marcin Borkowski
EtapIII
• Zmiana metody predykcji– Każdy osobnik (dopasowanie) jest
przypasowywane każdym węzłem do brakującej danej
– Czyli każdy węzeł może stanowić o wartości predykcji, lub być jak poprzednio uwzględniany przy dopasowaniu
mgr inż.Marcin Borkowski
EtapIII
• Zmiana metody liczenia dystansu– Istotne dla dłuższych dopasowań o
malej ilości węzłów– Porównuje się podobieństwo
cząstkowych dopasowań (ocen) na danych uczących
– Pozwala to uznać za podobne zupełnie różne fizycznie osobniki !
mgr inż.Marcin Borkowski
EtapIII
Prezentacja wyników testowych
mgr inż.Marcin Borkowski
Dziękuje za uwagę