Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
STATYSTYKA MATEMATYCZNAWYKŁAD 15 października 2009
Model deterministyczny
Model probabilistyczny (stochastyczny)
Model statystyczny
Statystyka:
statystyka opisowa
statystyczna analiza danych
wnioskowanie statystyczne
Statystyka:
statystyka opisowa
statystyczna analiza danych
wnioskowanie statystyczne
Statystyka:
statystyka opisowa
statystyczna analiza danych
wnioskowanie statystyczne
Statystyka:
statystyka opisowa
statystyczna analiza danych
wnioskowanie statystyczne
Statystyka opisowa: charakteryzacja populacji za pomocąróżnych (syntetycznych) wskaźników. Parametry populacji.
Populacja Zbiór elementów etykietowanych. Etykiety jakościowe,liczbowe, wektorowe (wielowymiarowe). Populacje skończone.Populacje nieskończone - rozkład prawdopodobieństwa. Wskaźniki(parametry): średnia, mediana, kwantyle, rozrzut, symetria, ...
Wskaźniki współzależności cech
Statystyka opisowa: charakteryzacja populacji za pomocąróżnych (syntetycznych) wskaźników. Parametry populacji.Populacja Zbiór elementów etykietowanych. Etykiety jakościowe,liczbowe, wektorowe (wielowymiarowe). Populacje skończone.Populacje nieskończone - rozkład prawdopodobieństwa.
Wskaźniki(parametry): średnia, mediana, kwantyle, rozrzut, symetria, ...
Wskaźniki współzależności cech
Statystyka opisowa: charakteryzacja populacji za pomocąróżnych (syntetycznych) wskaźników. Parametry populacji.Populacja Zbiór elementów etykietowanych. Etykiety jakościowe,liczbowe, wektorowe (wielowymiarowe). Populacje skończone.Populacje nieskończone - rozkład prawdopodobieństwa. Wskaźniki(parametry): średnia, mediana, kwantyle, rozrzut, symetria, ...
Wskaźniki współzależności cech
Statystyczna analiza danych: formułowanie wniosków ozjawiskach i procesach na podstawie wyników obserwacji tychzjawisk i procesów. Typowe: medycyna kojarzy wskaźniki stanupacjenta z wystąpieniem określonej choroby lub na podstawieróżnych wskaźników stanu zdrowia pacjentów po różnych terapiaocena skuteczność tych terapii. Inżynier obserwuje wskaźnikijakości produktów i ocenia jak na tę jakość wpływają różneczynniki; np. jak zawartość węgla w stali wpływa na określonewłasności konstrukcyjne tej stali.
Statystyczna analiza danych - data mining - statistical data analysis
Wnioskowanie statystyczne (statystyka matematyczna w ścisłymsensie). Na podstawie obserwacji X1,X2, . . . ,Xn wnioskować orozkładzie prawdopodobieństwa tych obserwacji, gdy znane są tylkopewne ogólne własności tego rozkładu.
(Populacja, etykieta, losowanie z populacji) – (zmienna losowa,rozkład prawdopodobieństwa)
Przykład: W populacji jest N elementów, w tym nieznana liczba Melementów wyróżnionych. Oznaczamy θ = M/N. Z populacjiwybieramy losowo n elementów X1,X2, . . . ,Xn i umawiamy się, żeXj = 1, gdy Xj jest jednym z M elementów wyróżnionych orazXj = 0 w p.p. Na podstawie tej próby oszacować frakcję θ. Albo:na podstawie tej próby sprawdzić, czy θ < 0.1.
Zmienna losowa Xj ma rozkład prawdopodobieństwa:
Pθ{Xj = 1} = θ = 1− Pθ{Xj = 0}
Model statystyczny
Przestrzeń próby X , R , Rn.
Rodzina rozkładów prawdopodobieństwa P, {Pθ, θ ∈ Θ}.
Problem statystyki matematycznej:
z jakiej populacji pochodzą obserwacje, które mamy w ręku
Podstawowe twierdzenie statystyki matematycznej
Podstawowe twierdzenie statystyki matematycznej
Dystrybuanta. Dystrybuanta empiryczna
Ogólne twierdzenia o dystrybuancie empiryczznej:
SPWL, MPWL: Fn(x)− > F (x) w danym punkcie x .
Gliwienko-Cantelli: supx |Fn(x)− F (x)|− > 0
Podstawowe twierdzenie statystyki matematycznej
Podstawowe twierdzenie statystyki matematycznej
Dystrybuanta. Dystrybuanta empiryczna
Ogólne twierdzenia o dystrybuancie empiryczznej:
SPWL, MPWL: Fn(x)− > F (x) w danym punkcie x .
Gliwienko-Cantelli: supx |Fn(x)− F (x)|− > 0
Podstawowe twierdzenie statystyki matematycznej
Podstawowe twierdzenie statystyki matematycznej
Dystrybuanta. Dystrybuanta empiryczna
Ogólne twierdzenia o dystrybuancie empiryczznej:
SPWL, MPWL: Fn(x)− > F (x) w danym punkcie x .
Gliwienko-Cantelli: supx |Fn(x)− F (x)|− > 0
Podstawowe twierdzenie statystyki matematycznej
Podstawowe twierdzenie statystyki matematycznej
Dystrybuanta. Dystrybuanta empiryczna
Ogólne twierdzenia o dystrybuancie empiryczznej:
SPWL, MPWL: Fn(x)− > F (x) w danym punkcie x .
Gliwienko-Cantelli: supx |Fn(x)− F (x)|− > 0
TWIERDZENIA STATYSTYCZNE
Model statystyczny: (X ,P), (X , {Pθ, θ ∈ Θ})
DUŻO RÓŻNYCH PRAWDOPODOBIEŃSTW !!!
P{T (X1,X2, . . . ,Xn) ¬ ε} η dla każdego P ∈ P
Pθ{T (X1,X2, . . . ,Xn) ¬ ε} η dla każdego θ ∈ Θ
Zadania:
• Estymacja
• Weryfikacja hipotez statystycznych
• Teoria decyzji statystycznych
Przykład: na podstawie próby
oszacować prawdopodobieństwo, że rozważana zmienna losowaprzekracza daną wartość (zastosowania: np ubezpieczenia, wielkośćrezerw itp)
oszacować wielkość, która będzie przekroczona z zadanym(małym) prawdopodobieństwem (np. poziom wody w rzece, V@R)
NASZE NARZĘDZIA
Pakiet R
Excel
Matematyka
LITERATURA
Bartoszewicz, J. (1996): Wykłady ze statystyki matematycznej.PWN
Bobrowski, D., Maćkowiak–Łybacka, K. (2006): Wybrane metodywnioskowania statystycznego. Wydawnictwo PolitechnikiPoznańskiej
Plucińska, A., Pluciński, E. (2000): Rachunekprawdopodobieństwa. Statystyka matematyczna. Procesystochastyczne. WNT
Silvey, S.D. (1978): Wnioskowanie statystyczne. PWN
Zieliński, R. (1990): Siedem wykładów wprowadzających dostatystyki matematycznej. PWN. www.impan.pl/ rziel (aktualizacja10.III.2005)
Duuuuuuuużo !
LITERATURA
Bartoszewicz, J. (1996): Wykłady ze statystyki matematycznej.PWN
Bobrowski, D., Maćkowiak–Łybacka, K. (2006): Wybrane metodywnioskowania statystycznego. Wydawnictwo PolitechnikiPoznańskiej
Plucińska, A., Pluciński, E. (2000): Rachunekprawdopodobieństwa. Statystyka matematyczna. Procesystochastyczne. WNT
Silvey, S.D. (1978): Wnioskowanie statystyczne. PWN
Zieliński, R. (1990): Siedem wykładów wprowadzających dostatystyki matematycznej. PWN. www.impan.pl/ rziel (aktualizacja10.III.2005)
Duuuuuuuużo !
ZALICZENIA
Własne problemy!
Aktywność
Lista obecności