Upload
radek-oryszczyszyn
View
904
Download
0
Embed Size (px)
DESCRIPTION
Materiały na zajęcia "Dobór próby w badaniach". Instytut Socjologii UwB
Citation preview
Wielkość próby – podstawowe zagadnienia
Dobór próby w badaniach
5 maja 2014 r.
Co to jest próba?
Próbą jest każdy podzbiór pochodzący z populacji.
Co to jest podzbiór?
Podzbiorem jest każdy układ elementów należących do populacji, który nie obejmuje wszystkich elementów populacji.
Populacja
próba
próba próba
próba
Kilka nieporozumień dotyczących wielkości próby…
• „Wielkość próby musi stanowić określoną proporcję populacji, np. 5%”• „Próba powinna liczyć co najmniej 2000 elementów”• „Wraz ze zwiększaniem wielkości próby rośnie precyzja
wnioskowania na podstawie danych z próby”
Powyższe przekonania są FAŁSZYWE!
Estymacja i estymatory• Estymacja - proces, którego celem jest ocena wartości
parametru na podstawie badanej próby. Estymacji dokonuje się przy użyciu estymatora – funkcji, która w najlepszy sposób pozwoli na oszacowanie wielkości parametru.
• Celem jest znalezienie takiej funkcji, która pozwolił na najbardziej precyzyjne oszacowanie wartości parametru.
• Chcielibyśmy na estymator wybrać taką funkcję, gdzie różnica między T a t będzie najmniejsza
• Gdy chcemy np. znać średnią dochodu w populacji możemy użyć do tego średniej z próby. Średnia z próby będzie wtedy estymatorem wartości z populacji. Wartość, którą uzyskamy to ocena parametru.
W jaki sposób ocenić „jakość” estymatora?•Obciążenie
Estymator jest nieobciążony, jeśli średnia jego
rozkładu z próby jest równa wartości parametru
• Efektywność
Efektywność estymatora zależy od tego, jak bardzo
rozkład z próby skupia się wokół rzeczywistej wartości
parametru. Często to błąd standardowy średniej.
Błąd standardowy (błąd próby)
• Błąd standardowy estymacji to estymowane odchylenie standardowe błędu tej metody. • Prawdziwa wartość błędu standardowego jest zwykle
nieznana, a jako błąd standardowy przyjmuje się odchylenie standardowe dla rozkładu średniej z próby.
Mówiąc prościej: błąd standardowy pozwala nam na oszacowanie, na ile dokładnie wyniki otrzymane na podstawie badania próby odzwierciedlają rzeczywiste wartości parametrów w populacji
Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Średnia zarobków w populacji μ=570 zł
Powiedzmy, że dobieramy próbę składającą się z dwóch elementów, aby oszacować wielkość parametru μ. Jeśli wybierzemy do próby Kingę (500 zł) i Wiolę (400 zł), wówczas średnia z próby () będzie wynosiła 450 zł. Jest to oszacowanie populacyjnego parametru μ.
Oszacuj parametr μ dla wszystkich możliwych dwuelementowych (n=2) prób w tej populacji.
Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Ile możliwych prób dwuelementowych można stworzyć w tej populacji?
Czy któraś z wartości μ odpowiada parametrowi średniej w populacji (570 zł)?
Zwróć uwagę, że w „normalnych” badaniach wartość średniej w populacji nie jest znana!
Wariancja, odchylenie standardowe i błąd standardowy
• Odchylenie standardowe (s) – miara rozproszenia wartości w próbie
• Błąd standardowy (SE) – rozkład wszystkich wartości średnich wokół średniej tych wartości.
Wariancją (n) w populacji , o średniej arytmetycznej jest liczba
.
Odchylenie standardowe to po prostu pierwiastek kwadratowy z
wariancji, t.j.:
Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Oblicz odchylenie standardowe rozkładu z próby w przykładzie naszych studentek.
Wartość błędu standardowego (SE) obliczymy, dzieląc odchylenie standardowe z próby przez pierwiastek kwadratowy z wielkości próby (n), t.j.
dla populacji nieskończonych, lub dla populacji skończonych (małych), gdzies – odchylenie standardowen – wielkość próbyN – wielkość populacji
Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Oblicz standardowy błąd średniej z próby
1. Oblicz wariancję w próbie (pamiętaj, że populacja jest mała!)
2. Oblicz standardowy błąd średniej z próby, według wzoru:
3. Jaki otrzymałeś(aś)wynik?
Przedziały ufności
• W przedziale między -1σ i 1σ możemy oczekiwać 68% wartości średnich z próby
• W przedziale między -1,96σ i 1,96σ możemy oczekiwać 95% wartości średnich z próby
• W przedziale między -2,58σ i 2,58σ możemy oczekiwać 99% wartości średnich z próby
• Jeżeli skonstruujemy przedział ufności równy ±1,96σ, możemy się spodziewać, że średnia populacyjna będzie leżała w tym obszarze
• Prawdopodobieństwo popełnienia błędu, polegającego na tym, że średnia populacyjna nie wpada do tego przedziału, wynosi tylko 5%
Określanie wielkości próby1. Przypomnijmy wzór na standardowy błąd średniej: , gdzie s –
odchylenie standardowe badanej zmiennej, n – wielkość próby2. Dokonując przekształcenia, otrzymamy 3. Aby obliczyć wielkość próby, musimy mieć wyobrażenie o wielkości
odchylenia standardowego w populacji i musimy zdecydować, jak duży standardowy błąd pomiaru możemy tolerować.
4. Jeśli, na przykład, mamy pobrać próbę z populacji liczącej 10000 elementów, a s2=0,20 oraz wartość akceptowanego SE=0,016, to szacowana wielkość próby wynosi
5. Jeżeli wielkość próby okaże się zbyt duża w stosunku do populacji, to należy wprowadzić poprawkę dla populacji nieskończenie dużych. W tym przypadku do 1 dodajemy wartość ułamka n/N. W naszym przypadku:
6. , to jest
Kalkulator doboru próbyhttp://www.naukowiec.org/dobor.html
Zadanie
Dostałeś/aś zlecenie zbadania warszawskich organizacji pozarządowych pod kątem angażowania przez nie do pracy wolontariuszy. Badanie ma być zrealizowane metodą sondażu telefonicznego.1. Znajdź wiarygodny operat do badania2. Określ wielkość próby (maksymalny błąd = 5%)3. Dokonaj losowania warstwowego próby z operatu.
Samodzielnie wybierz kryterium wyodrębnienia warstw.4. Wynikiem Twojej pracy powinna być wylosowana do
badania próba – lista organizacji z danymi teleadresowymi.