Wielkość próby – podstawowe zagadnienia

Wielkość próby – podstawowe zagadnienia

Dobór próby w badaniach

5 maja 2014 r.

Co to jest próba?

Próbą jest każdy podzbiór pochodzący z populacji.

Co to jest podzbiór?

Podzbiorem jest każdy układ elementów należących do populacji, który nie obejmuje wszystkich elementów populacji.

Populacja

próba

próba próba

próba

Kilka nieporozumień dotyczących wielkości próby…

• „Wielkość próby musi stanowić określoną proporcję populacji, np. 5%”• „Próba powinna liczyć co najmniej 2000 elementów”• „Wraz ze zwiększaniem wielkości próby rośnie precyzja

wnioskowania na podstawie danych z próby”

Powyższe przekonania są FAŁSZYWE!

Estymacja i estymatory• Estymacja - proces, którego celem jest ocena wartości

parametru na podstawie badanej próby. Estymacji dokonuje się przy użyciu estymatora – funkcji, która w najlepszy sposób pozwoli na oszacowanie wielkości parametru.

• Celem jest znalezienie takiej funkcji, która pozwolił na najbardziej precyzyjne oszacowanie wartości parametru.

• Chcielibyśmy na estymator wybrać taką funkcję, gdzie różnica między T a t będzie najmniejsza

• Gdy chcemy np. znać średnią dochodu w populacji możemy użyć do tego średniej z próby. Średnia z próby będzie wtedy estymatorem wartości z populacji. Wartość, którą uzyskamy to ocena parametru.

W jaki sposób ocenić „jakość” estymatora?•Obciążenie

Estymator jest nieobciążony, jeśli średnia jego

rozkładu z próby jest równa wartości parametru

• Efektywność

Efektywność estymatora zależy od tego, jak bardzo

rozkład z próby skupia się wokół rzeczywistej wartości

parametru. Często to błąd standardowy średniej.

Błąd standardowy (błąd próby)

• Błąd standardowy estymacji to estymowane odchylenie standardowe błędu tej metody. • Prawdziwa wartość błędu standardowego jest zwykle

nieznana, a jako błąd standardowy przyjmuje się odchylenie standardowe dla rozkładu średniej z próby.

Mówiąc prościej: błąd standardowy pozwala nam na oszacowanie, na ile dokładnie wyniki otrzymane na podstawie badania próby odzwierciedlają rzeczywiste wartości parametrów w populacji

Przykład i zadanie

Studentka Wielkość stypendium

Kinga 500 zł

Ida 650 zł

Wiola 400 zł

Monika 700 zł

Ada 600 zł

Średnia zarobków w populacji μ=570 zł

Powiedzmy, że dobieramy próbę składającą się z dwóch elementów, aby oszacować wielkość parametru μ. Jeśli wybierzemy do próby Kingę (500 zł) i Wiolę (400 zł), wówczas średnia z próby () będzie wynosiła 450 zł. Jest to oszacowanie populacyjnego parametru μ.

Oszacuj parametr μ dla wszystkich możliwych dwuelementowych (n=2) prób w tej populacji.

Przykład i zadanie


Kinga 500 zł

Ida 650 zł

Wiola 400 zł

Monika 700 zł

Ada 600 zł

Ile możliwych prób dwuelementowych można stworzyć w tej populacji?

Czy któraś z wartości μ odpowiada parametrowi średniej w populacji (570 zł)?

Zwróć uwagę, że w „normalnych” badaniach wartość średniej w populacji nie jest znana!

Wariancja, odchylenie standardowe i błąd standardowy

• Odchylenie standardowe (s) – miara rozproszenia wartości w próbie

• Błąd standardowy (SE) – rozkład wszystkich wartości średnich wokół średniej tych wartości.

Wariancją (n) w populacji , o średniej arytmetycznej jest liczba

.

Odchylenie standardowe to po prostu pierwiastek kwadratowy z

wariancji, t.j.:

Przykład i zadanie


Kinga 500 zł

Ida 650 zł

Wiola 400 zł

Monika 700 zł

Ada 600 zł

Oblicz odchylenie standardowe rozkładu z próby w przykładzie naszych studentek.

Wartość błędu standardowego (SE) obliczymy, dzieląc odchylenie standardowe z próby przez pierwiastek kwadratowy z wielkości próby (n), t.j.

dla populacji nieskończonych, lub dla populacji skończonych (małych), gdzies – odchylenie standardowen – wielkość próbyN – wielkość populacji

Przykład i zadanie


Kinga 500 zł

Ida 650 zł

Wiola 400 zł

Monika 700 zł

Ada 600 zł

Oblicz standardowy błąd średniej z próby

1. Oblicz wariancję w próbie (pamiętaj, że populacja jest mała!)

2. Oblicz standardowy błąd średniej z próby, według wzoru:

3. Jaki otrzymałeś(aś)wynik?

Przedziały ufności

• W przedziale między -1σ i 1σ możemy oczekiwać 68% wartości średnich z próby

• W przedziale między -1,96σ i 1,96σ możemy oczekiwać 95% wartości średnich z próby

• W przedziale między -2,58σ i 2,58σ możemy oczekiwać 99% wartości średnich z próby

• Jeżeli skonstruujemy przedział ufności równy ±1,96σ, możemy się spodziewać, że średnia populacyjna będzie leżała w tym obszarze

• Prawdopodobieństwo popełnienia błędu, polegającego na tym, że średnia populacyjna nie wpada do tego przedziału, wynosi tylko 5%

Określanie wielkości próby1. Przypomnijmy wzór na standardowy błąd średniej: , gdzie s –

odchylenie standardowe badanej zmiennej, n – wielkość próby2. Dokonując przekształcenia, otrzymamy 3. Aby obliczyć wielkość próby, musimy mieć wyobrażenie o wielkości

odchylenia standardowego w populacji i musimy zdecydować, jak duży standardowy błąd pomiaru możemy tolerować.

4. Jeśli, na przykład, mamy pobrać próbę z populacji liczącej 10000 elementów, a s2=0,20 oraz wartość akceptowanego SE=0,016, to szacowana wielkość próby wynosi

5. Jeżeli wielkość próby okaże się zbyt duża w stosunku do populacji, to należy wprowadzić poprawkę dla populacji nieskończenie dużych. W tym przypadku do 1 dodajemy wartość ułamka n/N. W naszym przypadku:

6. , to jest

Kalkulator doboru próbyhttp://www.naukowiec.org/dobor.html

http://www.naukowiec.org/dobor.html

http://www.naukowiec.org/dobor.html

Zadanie

Dostałeś/aś zlecenie zbadania warszawskich organizacji pozarządowych pod kątem angażowania przez nie do pracy wolontariuszy. Badanie ma być zrealizowane metodą sondażu telefonicznego.1. Znajdź wiarygodny operat do badania2. Określ wielkość próby (maksymalny błąd = 5%)3. Dokonaj losowania warstwowego próby z operatu.

Samodzielnie wybierz kryterium wyodrębnienia warstw.4. Wynikiem Twojej pracy powinna być wylosowana do

badania próba – lista organizacji z danymi teleadresowymi.

Education

Wielkość próby – podstawowe zagadnienia