Upload
shani
View
86
Download
0
Embed Size (px)
DESCRIPTION
Wykład 5 Standardowy błąd a odchylenie standardowe. Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji Używane do przewidywań dotyczących indywidualnych obserwacji. - PowerPoint PPT Presentation
Citation preview
Wykład 5Standardowy błąd a odchylenie standardowe
• Odchylenie standardowe z próby s:– Służy do oceny zmienności w zbiorze danych– Gdy n wzrasta s zbliża się do odchylenia
standardowego w populacji – Używane do przewidywań dotyczących
indywidualnych obserwacji
• Błąd standardowy średniej SE = :– Służy do oceny niepewności związanej z
estymacją średniej w populacji– Maleje do zera wraz ze wzrostem n– Używane do przewidywań dotyczących
średniej
sn
Jak duża powinna być próba?
• Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości
• Możemy estymować z zadaną precyzją • Przykład: znajdź rozmiar próby taki, aby
95% PU dla średniej miał szerokość 5.
Załóżmy, że =10. Wtedy
• Na ogół nie znamy, możemy jednak wykonać badanie wstępne (mała próba) i użyć s.
Podstawowe założenie (jeszcze raz)
• Próba musi być losowa:
– każdy element w populacji ma jednakową szansę być wybranym
– poszczególne wybory są od siebie niezależne• Jeżeli to założenie nie jest spełnione to
wzrost n może nie gwarantować zmniejszenia SE.
Przedział ufności dla frakcji w populacji
• Estymujemy p za pomocą • Chcemy skonstruować przedział ufności dla p• Moglibyśmy skorzystać z rozkładu
dwumianowego, ale wymagałoby to uciążliwych rachunków.
• Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym
• Gdy Y ma rozkład dwumianowy (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład normalny
p̂
, (1 )N np np p
• = Y/n ma wartość oczekiwaną=
i =
• Zatem ma w przybliżeniu rozkład
p̂
p̂
Przedział ufności dla p
• Będziemy korzystali z przybliżonego przedziału ufności Agrestiego-Coula (patrz np. Brown, Cai i DasGupta, Annals of Statistics, 2002):
– Środkiem przedziału będzie (modyfikacja ) – Przypomnijmy, że Z/2 jest taką liczbą, że
Pr(Z < - Z/2) = Pr(Z > Z/2) = /2
– Dla 95% PU, = 0.05 i Z/2 = 1.96
p p̂
• Definiujemy
• SE dla definiujemy jako
• Np. dla 95% PU wstawiamy Z0.025 = 1.96 i dostajemy
2/ 20.5
2/ 2
y Zp
n Z
p 2/ 2
(1 )p
p pSEn Z
2
2
0.5(1.96 ) 1.92 23.84 41.96
y y ypn nn
2
(1 ) (1 ) (1 )3.84 41.96p
p p p p p pSEn nn
Przedział ufności dla p (cd.)• Skonstruujemy przybliżony przedział ufności dla
p, z centrum w • Użyjemy kwantyli z rozkładu normalnego Z/2
• Dla 95% PU użyjemy Z0.025 =1.96
• Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58.
• przybliżony 95% PU dla p wynosi
p
11.96 1.96
4p
p pp SE p
n
Przykład:
• Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na biało
• p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki
• 95% PU dla p:
90% PU dla p
• Sformułowanie konkluzji:Mamy 90% pewności że frakcja myszek w tej
populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a .
• Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.
Klasyczny przybliżony przedział ufności (informacja)
• Klasyczny przedział ufności uzyskuje się biorąc za jego środek i zastępując p przez we wzorze na i błąd standardowy.
• Klasyczne przedziały ufności zachowują się źle, gdy liczba sukcesów (Y) jest bliska zeru lub n. Może się wtedy zdarzyć np., że klasyczny PU zawiera ujemne wartości.
p̂p̂
Jak duża powinna być próba ?• Chcemy aby 95% PU miał długość nie większą od
zadanej. Jak ustalić rozmiar próby? • Idea: długość przedziału zależy od n, skąd można
wyznaczyć wystarczający rozmiar próby.• Uwaga – długość przedziału zależy też od , którego nie
znamy.• Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej
przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n)
• Jeżeli nie mamy żadnych wstępnych informacji, to użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n: szerokość PU skonstruowanego w oparciu o próbę o wyliczonym rozmiarze nie będzie większa od założonej, a może być dużo mniejsza. (Czy to dobrze?)
p
Przykład
• Chcemy aby SE było równe 0.005 (95% PU będzie miał długość około 0.02).
• Przypuszczamy, że prawdziwe p jest bliskie 0.05. Rachunki:
• Konkluzja: „Proszę złapać myszy.”
• Obliczenia, gdy nie wiemy nic o p:
• Konkluzja: „Proszę złapać myszy.”
• Asymptotyczne przedzialy ufnosci dla estymatorow najwiekszej wiarogodnosci – patrz tablica