15
1 1 Statystyka z demografią Wyklad: poniedzialek, 15:15 – 16:45, sala δ (delta) CIN, (18 h). Prowadzący: dr Maciej Stępiński, [email protected]. Forma zaliczenia: egzamin w formie pisemnej obejmujący zadania z treścią wymagające umiejętności teoretycznych i praktycznych. Cel zajęć: poznanie zasad planowania i prowadzenia badań statystycznych oraz demograficznych, zdobycie podstawowych umiejętności analizowania wyników badań statystycznych. Wymagania wstępne w zakresie wiedzy: elementarna wiedza z zakresu szkoly ponadgimnazjalnej z matematyki i wiedzy o spoleczeństwie. 2 Plan zajęć 1. Przedmiot i zadania statystyki. 2. Etapy badania statystycznego. 3. Analiza struktury zbiorowości statystycznej. 4. Pojęcie demografii i podstawowe procesy demograficzne. 5. Metody i narzędzia analizy demograficznej: stan ludności, wspólczynniki demograficzne, siatka demograficzna. 6. Analiza przykladowych danych demograficznych.

Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

Embed Size (px)

Citation preview

Page 1: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

1

1

Statystyka z demografi ąWykład : poniedziałek, 15:15 – 16:45, sala δ (delta) CIN, (18 h).Prowadz ący : dr Maciej Stępiński, [email protected] zaliczenia: egzamin w formie pisemnej obejmujący zadania z treścią wymagające umiejętności teoretycznych i praktycznych.Cel zajęć: poznanie zasad planowania i prowadzenia badań statystycznych oraz demograficznych, zdobycie podstawowych umiejętności analizowania wyników badań statystycznych.Wymagania wst ępne w zakresie wiedzy: elementarna wiedza z zakresu szkoły ponadgimnazjalnej z matematyki i wiedzy o społeczeństwie.

2

Plan zajęć1. Przedmiot i zadania statystyki.2. Etapy badania statystycznego.3. Analiza struktury zbiorowo ści statystycznej.4. Pojęcie demografii i podstawowe procesy

demograficzne.5. Metody i narz ędzia analizy demograficznej: stan

ludno ści, współczynniki demograficzne, siatka demograficzna.

6. Analiza przykładowych danych demograficznych.

Page 2: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

2

3

Literatura• Hanna Augustyniak, Statystyka opisowa z

elementami demografii, wyd. trzecie, poprawione, Ars boni et aequi, Poznań;

• Jerzy Zdzisław Holzer, Demografia, PWE, Warszawa 2004;

• Mieczysław Sobczyk, Statystyka, wyd. piąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008.

4

Określenie „statystyka” posiada obecnie cztery znaczenia:� metoda poznawania zjawisk masowych;� nauka badająca zjawiska masowe;� zbiór liczb charakteryzujący zbiorowość, np. statystyka ludności miastaPoznania, statystyka rolnictwa województwa dolnośląskiego, statystyka obrotupieniężnego banku X itp.;� parametr opisowy rozumiany jako pewna wielkość charakterystyczna, np.średnia arytmetyczna, odchylenie ćwiartkowe, moment czwarty względny, itp.

Biorąc pod uwagę przedmiot zajęć, przyjęta zostanie definicja, zgodnie z którąstatystyka jest nauk ą o metodach badania zjawisk masowych.

Metody statystyczne są swoistym sposobem badania zjawisk masowychpolegającym na wyrażaniu ich za pomocą liczb. Liczby te charakteryzują ilościowąstronę badanych zjawisk w nierozerwalnym zwi ązku z ich stron ą jako ściow ą.Liczba ma sens, gdy posiada odzwierciedlenie w rzeczywistości.

Narzędzia statystyczne znajdują zastosowanie w wielu dyscyplinach naukowych.Teoria statystyki odgrywa szczególne znacznie w badaniu zjawisk i procesówspołeczno-ekonomicznych.

Przedmiot i zadania statystyki

Page 3: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

3

5

Przedmiot i zadania statystyki cd.

Zjawiska masowe to takie, które powtarzają się często. Badane w dużej masie zdarzeńwykazują prawidłowości, których nie można uchwycić w pojedynczym przypadku.Prawidłowości te są wynikiem procesu odbywającego się w przyrodzie lub w społeczeństwieludzkim, w którym we wszystkich przypadkach działa ten sam splot przyczyn (przyczynygłówne) i kiedy, oprócz tego, w każdym indywidualnym przypadku działają przyczynydodatkowe, dla każdego przypadku inne (przyczyny uboczne).Przyczyny główne są tym składnikiem procesu statystycznego, który ma charaktersystematyczny , wspólny dla wszystkich jednostek zbiorowości statystycznej. Mają onedecydujący udział w kształtowaniu zjawisk społeczno-ekonomicznych, podczas gdy przyczynyuboczne (składnik przypadkowy ) nie są związane z istotą badanego procesu, ale działają naniego odmiennie, powodując odchylenia od prawidłowości.W ujęciu ilościowym składnik systematyczny (s) stanowi liczbowe odzwierciedlenie działania nazjawisko przyczyn głównych w procesie statystycznym, zaś składnik przypadkowy (ζ) mówi oujętym ilościowo oddziaływaniu przyczyn ubocznych.

ζ+= sn

mn – liczba wszystkich zdarzeń,

m – liczba zdarzeń z daną cechą,

s – składnik systematyczny,

ζ – składnik przypadkowy.

6

Przedmiot i zadania statystyki cd.Podstawowym celem statystyki jest identyfikacja prawidłowości i wyrażenie ichilościowo. Wyróżniamy trzy rodzaje prawidłowości, dla których stosuje się odmiennyzespół metod statystycznych:� prawidłowości dotyczące struktury danego zjawiska, które identyfikuje sięstosując metody analizy struktury;� prawidłowości jako związki i stosunki między badanymi zjawiskami, któreidentyfikuje się stosując metody analizy współzależności;� prawidłowości poziomu liczbowego zjawiska w rozwoju czasowym lubrozmieszczeniu przestrzennym, identyfikowane przy użyciu metod analizy dynamikioraz metod taksonomicznych.Wraz ze wzrostem obserwacji prawidłowości stają się coraz wyraźniejsze, ponieważprzy dużej liczbie obserwacji skutki różnokierunkowych oddziaływań przyczynubocznych wzajemnie się znoszą. Suma odchyleń in plus i in minus dąży do zera.Pozwala to na uwypuklenie głównych przyczyn, czyli działania czynnikasystematycznego. Zaczyna wówczas działać prawo wielkich liczb.Warunkami wystąpienia prawa wielkich liczb są:� dostatecznie duża liczba jednostek objętych badaniem (liczba obserwacji);� jednorodnośćmasy statystycznej, czyli zbiorowości;� niezależność przyczyn ubocznych czyli ich różnokierunkowe oddziaływanie.

Page 4: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

4

7

Przedmiot i zadania statystyki cd.Statystykę dzielimy na opisow ą i matematyczn ą.Statystyka opisowa zajmuje się:

� identyfikacją i opisem prawidłowości statystycznych na podstawie badańpełnych , w których obserwacja dotyczy wszystkich jednostek zbiorowościstatystycznej;

� analizą jakościowo-ilościową opartą na badaniu częściowym , dotyczącąprawidłowości obserwowanych w reprezentatywnej próbie, wylosowanej zpopulacji generalnej.

Statystyka matematyczna, zwana także wnioskowaniem statystycznym,uogólnia przy użyciu narzędzi rachunku prawdopodobieństwaprawidłowości zaobserwowane w próbie na całą zbiorowość.

8

Etapy badania statystycznego1.Programowanie badania statystycznego

1.1. Określenie celów badania statystycznego

Celem badania statystycznego jest poznanie rzeczywistości:

a) teoretyczno-naukowe, czyli „dobrze jest, gdy wie się”;

b) w celu praktycznym, głównie by na postawie wyników badań diagnozującychrzeczywistość podejmować określone, odpowiednie decyzje.

1.2. Określenie przedmiotu badania

Przedmiotem badania statystycznego są zbiorowo ści osób, rzeczy lub zjawisk .Zbiorowość jest zdeterminowana celem badania. Składa się z jednostekstatystycznych. Podstawą wyodrębnienia zbiorowości statystycznej są cechyrzeczowe, czasowe i przestrzenne. Są to tzw. cechy stałe . Dana jednostka, abyzostała objęta badaniem, musi zatem spełniać wszystkie kryteria sformułowane dlabadanej zbiorowości statystycznej (musi posiadać wszystkie cechy stałe).

1.3. Określenie zakresu badania

Cechy stałe nie podlegają badaniu, służą jedynie wyodrębnieniu zbiorowości. Cechy,które podlegają badaniu nazywa się cechami zmiennymi . One różnią jednostkizbiorowości statystycznej.

Page 5: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

5

9

Etapy badania statystycznego cd.Cechy zmienne możemy podzielić na:a) cechy ilo ściowe , czyli takie, które można zmierzy ć i które wyst ępują z określonymnatężeniem u ka żdej jednostki zbiorowo ści statystycznej ; przykłady: liczba mieszkańcówgminy, wzrost osoby, średnie wynagrodzenie w przedsiębiorstwie, liczba posiadanychodbiorników telewizyjnych w gospodarstwie domowym, wielkość ogródka działkowego itd. Ważneze względów analitycznych jest rozróżnienie na:

• cechy ilościowe skokowe , czyli takie, które przyjmują ściśle określone wartości nadanej skali liczbowej; przykład: liczba mieszkańców gminy, liczba posiadanychodbiorników telewizyjnych w gospodarstwie domowym;

Oznaczając cechę ilościową przez X, a jej wartość przez xi, dla i = 1, 2, …, N, gdzie N jestliczebnością zbiorowości, można to graficznie przedstawić w następujący sposób:

• cechy ilościowe ciągłe , czyli takie, które mogą przyjąć każdą z wartości z określonegoprzedziału liczbowego; przykład: wzrost osoby, średnie wynagrodzenie wprzedsiębiorstwie, wielkość ogródka działkowego. Cechę ilościową ciągłą równieżoznaczymy przez X, z tym że dla zbiorowości liczącej N jednostek, poszczególnewartości xi (wartości i-tej jednostki) mogą się mieścić w dowolnym punkcie danegoprzedziału zmienności <a,b>

W szczególnym przypadku mogą to być wartości od - ∞ do + ∞.

x1 x2 x3 x4 x5 … xN-1 xN x

a b x

10

Etapy badania statystycznego cd.

b) cechy jakościowe (niemierzalne) , czyli takie, które maja określoną liczbęwariantów. Jednostka może posiadać, lub nie, określony wariant badanej cechy.Podział zbiorowości wg cechy jakościowej może mieć charakter dychotomiczny (gdybadana cecha ma tylko dwa warianty, np. płeć) lub wielodzielny (gdy wariantów jestwięcej, np. podział populacji osób w wieku produkcyjnym w Polsce na osoby biernezawodowo, bezrobotne bądź poszukujące zatrudnienia (mamy zatem trzy wariantycech);

c) cechy quazi-ilo ściowe , czyli takie, które łączą charakter ilościowy z jakościowym(przykład miast, które podzielono by ze względu na wielkość, używając następującychwariantów: bardzo duże, duże, średnie, małe i podkreślając w ten sposób ich charakterspołeczno-ekonomiczno-kulturowy. Kryterium przedzielającym byłoby jednaknatężenie cechy ilościowej, jaką jest liczba mieszkańców.

ZADANIE DOMOWE:

Podaj przykładowy cel badania statystycznego, określając jego przedmiot i zakres –po jednym przykładzie dla cechy ilościowej skokowej, ilościowej ciągłej, cechyjakościowej i cechy quazi-ilościowej.

Page 6: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

6

11

Etapy badania statystycznego cd.

1.4. Wybór metody badania

a) badanie całkowite (pełne) są takimi, w których badaniu podlegają wszystkie jednostki zbiorowości statystycznej. Bada się zatem całą populację generalną;

b) badania częściowe , czyli takie, w których badaniu podlega tylko część jednostek zbiorowości statystycznej (reprezentatywna próba wylosowana z populacji generalnej).

12

Etapy badania statystycznego cd.2. Obserwacja statystyczna

2.1. Wybór źródeł danych statystycznych

a) źródła pierwotne, a więc takie, które tworzone są specjalnie dla potrzeb określonego badania;

b) źródła wtórne, czyli takie, które nie były tworzone dla potrzeb danego badania.

Najczęściej wykorzystywane źródła wtórne, to:

• Powszechne Spisy Ludności;

• Powszechne Spisy Rolne;

• Wydawnictwa GUS: Roczniki Statystyczne RP, roczniki specjalistyczne, itp.;

• Bank Danych Lokalnych;

• rejestracja bieżąca – bazy danych różnych podmiotów gospodarczych i instytucji;

• sprawozdawczość statystyczna;

• publikacje w czasopismach.

2.2. Kontrola materiału statystycznego

Czynność ta jest szczególnie istotna w przypadku źródeł pierwotnych. Zebrany materiał pierwotny (najczęściejw postaci kwestionariuszy) powinien podlegać kontroli:

a) formalnej, czyli identyfikacji formularzy i pytań, na które nie udzielono odpowiedzi. Zostają oneautomatycznie wyeliminowane z badania;

b) merytorycznej, która polega na ocenie, przy użyciu posiadanej wiedzy i zdrowego rozsądku,

prawdopodobieństwa realności odpowiedzi.

Page 7: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

7

13

Etapy badania statystycznego cd.2.3. Klasyfikacja i grupowanie statystyczne

Informacje zgromadzone w wyniku badania statystycznego nazywamy surowym materiałem statystycznym.Przykład 2.1.Załóżmy, że na osiedlu Z w miejscowości „Słońce” badano zbiorowość wynajmowanych mieszkań pod względem ich powierzchni użytkowej i liczby zamieszkujących w nim osób wg stanu z dnia 30 IV 2012 r. Otrzymano następujące wyniki:

Powierzchnia użytkowa mieszkania [m2] 37,8 72,4 35,6 46,8 54,2 62,4 44 39,8 85,7 62,3Liczba mieszkających osób 2 3 1 4 6 5 3 3 7 6

Powierzchnia użytkowa mieszkania [m2] 74,7 46,8 34,7 56,2 95,4 67,8 54,7 72,1 46,7 87,6Liczba mieszkających osób 6 0 3 2 9 5 5 8 3 12

Powierzchnia użytkowa mieszkania [m2] 43,7 76,6 55,7 44,2 97,3 43,7 72,1 39,9 57,9 40Liczba mieszkających osób 0 2 4 4 10 3 0 4 8 5

Dane podane w postaci surowego materiału statystycznego są nieuporządkowane i trudno jest przeprowadzić ich analizę. Pierwszy krok polega na ich uporządkowaniu, najczęściej wg rosnących wartości zmiennej i przedstawieniu w postaci szeregu szczegółowego. Omawiane szeregi miałyby postać:Powierzchnia mieszkania [m2]:34,7; 35,6; 37,8; 39,8; 39,9; 40,0; 43,7; 43,7; 44,0; 44,2; 46,7; 46,8; 46,8; 54,2; 54,7; 55,7; 56,2; 57,9; 62,3; 62,4; 67,8; 72,1; 72,1; 72,4; 74,7; 76,6; 85,7; 87,6; 95,4; 97,3.Liczba mieszkających osób: 0; 0; 0; 1; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 8; 8; 9; 10; 12.Uporządkowanie zatem to tworzenie ładu wg przyjętego kryterium (najczęściej rosnącej wartości zmiennej, czyli uporządkowany szereg szczegółowy ma postać:x1≤x2≤x3≤…≤xN-1≤xN

14

Etapy badania statystycznego cd.

Mimo, że materiał statystyczny został uporządkowany, to nadal prezentuje się małoczytelnie (nieczytelność rośnie wraz z rosnącą liczbą zbiorowości), dlategoprzeprowadza się grupowanie statystyczne.

Grupowanie statystyczne polega na wyodrębnieniu z rozpatrywanej populacjigeneralnej jednorodnych, lub względnie jednorodnych grup, wg przyjętych kryteriów.Grupy te będziemy nazywać subpopulacjami .

Grupowanie możemy podzielić na:a) grupowanie wariancyjne , które oparte jest na cesze ilościowej (skokowej bądźciągłej);b) grupowanie typologiczne oparte na cesze jakościowej, czyli wg wariantu badanejcechy.

Gdy cecha jest quasi-ilościowa, grupowanie odbywa się na podstawie cechyjakościowej, która jest ściśle związana z natężeniem cechy ilościowej.

Page 8: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

8

15

Etapy badania statystycznego cd.3. Prezentacja wyników obserwacji statystycznej

3.1. Szeregi statystyczneSzeregiem statystycznym nazywamy ciąg wielkości statystycznych rosnących lubmalejących, uporządkowanych według określonego kryterium.Jest on ograniczony z góry i z dołu, zatem jego wyrazy przyjmują wartości tylko zokreślonego przedziałua) szereg szczegółowy obejmuje wszystkie uporządkowane wartości zmiennej(każdą z osobna wyszczególnia)b) szeregi rozdzielcze stanowią formę prezentacji wyników grupowaniastatystycznego. Otrzymujemy je więc dzieląc populacje na określone subpopulacje wgokreślonej cechy i podajemy liczebności każdej z nich. Szereg rozdzielczy składa się zdwóch kolumn. W pierwszej z nich podajemy wartości badanej zmiennej lub wariantycechy, które umożliwiają wyodrębnienie subpopulacji. W drugiej kolumnie podaje sięliczebności subpopulacji. Przy budowaniu szeregu rozdzielczego należy przestrzegaćdwóch zasad:

• rozł ączno ści , która polega na tym, że dana jednostka – o określonej wartości zmiennej lub określonym wariancie zmiennej może być przydzielona tylko do jednej subpopulacji;

• zupełno ści , polegającej na tym, że rozdzielając jednostki populacji na klasy (subpopulacje), musimy nimi objąć wszystkie jednostki zbiorowości statystycznej.

16

Etapy badania statystycznego cd.Szereg rozdzielczy w przypadku cechy ilo ściowej skokowej

Częstości, z jaką określona wartość zmiennej występowała w populacji generalnej nazywamy liczebno ściami i oznaczamy symbolem ni. Czyli ni to częstość, z jaką wystąpiła i-ta wartość zmiennej. To inaczej liczebność i-tej klasy (subpopulacji).

Szereg rozdzielczy powstały w oparciu o dane z przykładu 2.1 miałby następującą postać:

Tablica 3.1Liczba

zamieszkujących osób x i

Liczba mieszkań

n i

0 31 12 33 64 45 46 37 18 29 110 112 1

Razem 30

Page 9: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

9

17

Etapy badania statystycznego cd.Szereg rozdzielczy w przypadku cechy ilo ściowej ci ągłejChcąc zbudować szereg rozdzielczy oparty na cesze ilościowej ciągłej, należy wyznaczyćminimalną wartość zmiennej xmin i maksymalną wartość zmiennej xmax. Różnicę xmax - xmin

nazywa się rozst ępem lub przedziałem zmienno ści badanej zmiennej .Przedział zmienności dzieli się następnie na klasy (subpopulcje). Klasy muszą objąć wszystkiewartości badanej zmiennej. Klasy można również nazwać przedziałami klasowymi lubprzedziałami .W pierwszej kolumnie umieszcza się rozpiętości poszczególnych klas (przedziałów), natomiast wdrugiej liczebności poszczególnych klas, czyli liczby jednostek przyjmujących wartości badanejzmiennej z danego przedziału klasowego.Szereg rozdzielczy powstały w oparciu o dane z przykładu 2.1 ma postać:

Tablica 3.2

Powierzchnia mieszkania [m2]

x imin - x i

max

Liczba mieszkań n i

30-40 640-50 750-60 560-70 370-80 580-90 290-100 2Razem 30

18

Etapy badania statystycznego cd.Szeregi o różnej rozpiętości stosujemy w trzech przypadkach:

a) gdy w jednym z przedziałów szeregu o równej rozpiętości wystąpiła wyraźnie przeważającakoncentracja jednostek zbiorowości – wtedy warto rozbić ten przedział na kilka klas o mniejszychrozpiętościach; umożliwia to lepsze, bardziej dogłębne poznanie struktury badanej zbiorowości;

b) gdy w kilku przedziałach liczebności są relatywnie małe na tle pozostałych – wówczas zasadnejest ich połączenie, gdyż taka koncentracja nie wypacza obrazu struktury zbiorowości; co więcej,czyni go bardziej przejrzystym;

c) w przypadku cechy quazi-ilościowej, kiedy natężenie cechy ilościowej przesądza o warianciejakościowym na podstawie kryteriów przyjmowanych w różnych dziedzinach nauki.

ZADANIE DOMOWE:

W oparciu o wymyślone przez siebie dane, zapisane w formie surowego materiałustatystycznego, dokonaj grupowania, a następnie zbuduj szereg rozdzielczy (patrz tablica 3.1 i3.2). Zadanie powinno zawierać po jednym przykładzie dla cechy ilościowej skokowej i cechyilościowej ciągłej.

Szeregi o otwartych przedziałach klasowychKorzystając ze źródeł wtórnych często spotyka się szeregi rozdzielcze, w których nieznana jest dolna granica pierwszego przedziału klasowego i/lub górna granica ostatniego przedziału klasowego. Takie szeregi nazywa się szeregami o otwartych przedziałach klasowych. Identyfikacja otwartego charakteru przedziału ma istotny wpływ na analizę struktury populacji, gdyż determinuje zestaw możliwych do obliczenia parametrów

Page 10: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

10

19

Etapy badania statystycznego cd.Przykład 3.1W tablicy 3.3 przedstawiono wydajność wodociągów miejskich w Polsce na podstawieewidencji z dnia 31 grudnia 2008 r.

Tablica 3.3

Wydajność w

m3/dzieńLiczba

wodociągów

poniżej 100 818100-1000 706

1001-10000 53410001-100000 56

powyżej 100000 5Razem 2119

Źródło: Mały rocznik statystyczny Polski 2009, GUS, Warszawa 2009, s. 46.

Gdy materiał statystyczny pochodzi ze źródeł pierwotnych i badacz zna wszystkie wartościzmiennej, może również stosować szeregi o otwartych przedziałach klasowych. Jest towskazane wtedy, kiedy liczebności kilku pierwszych lub kilku ostatnich klas są zdecydowaniemniejsze od pozostałych. Wówczas badacz łączy je, tworząc otwarty przedział.Szeregi rozdzielcze otwarte można również stosować wtedy, gdy badana zmienna macharakter skokowy.

20

Etapy badania statystycznego cd.Przykład 3.2W tablicy 3.4 przedstawiono liczbę prywatnych telefonów komórkowych przypadających na jednogospodarstwo domowe w kraju X według spisu z roku 2015:

Tablica 3.4Liczba

prywatnych telefonów kom. w

gospodarstwie domowym

Liczba gospodarstw

[tys.]

0 1000,21 1548,42 2341,73 5632,14 4567,95 2567,16 1728,9

7 i więcej 1567,2Razem 20953,5

Źródło: dane fikcyjne.Szeregi kumulacyjne

Szeregi rozdzielcze pozwalały odpowiedzieć na pytanie, ile jednostek zbiorowości statystycznej charakteryzujesię określoną wartością zmiennej (szeregi oparte na cesze skokowej) lub wartościami z określonego przedziału(najczęściej szeregi oparte na cesze ciągłej). Występują jednak przypadki, gdy chcemy odpowiedzieć napytanie, ile jednostek zbiorowości ma wartości zmiennej mniejsze lub równe danej wartości (w przypadku cechyskokowej) lub ile jednostek zbiorowości statystycznej ma wartości zmiennej mniejsze od górnej granicy danychprzedziałów (lub nie większe, w zależności od tego, jak przebiegał podział na przedziały). Buduje się wówczastzw. liczebności kumulacyjne.

Page 11: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

11

21

Etapy badania statystycznego cd.Przykład 3.3Na podstawie danych z przykładu 3.2 zbudowano szereg kumulacyjny:

Tablica 3.5Liczba

prywatnych telefonów kom. w

gospodarstwie domowym

Liczba gospodarstw

[tys.]

Liczebności kumulacyjne

n p,cum

0 1000,2 1000,21 1548,4 2548,62 2341,7 4890,33 5632,1 10522,44 4567,9 15090,35 2567,1 17657,46 1728,9 19386,3

7 i więcej 1567,2 20953,5Razem 20953,5Przykład 3.4

Na podstawie danych z przykładu 2.1 zbudowano następujący szereg kumulacyjny:Tablica 3.6

Powierzchnia

mieszkania [m2] x i

min - x imax

Liczba mieszkań n i

Liczebność kumulacyjna

n p,cum

30-40 6 640-50 7 1350-60 5 1860-70 3 2170-80 5 2680-90 2 28

90-100 2 30Razem 30

22

Etapy badania statystycznego cd.Szeregi strukturalne

Gdy podstawą grupowania jednostek populacji o liczebności N jest cecha jakościowa, wyniki badania przedstawiamy w postaci szeregu strukturalnego. Składa się on z dwóch kolumn: w pierwszej podajemy warianty badanej cechy, powiedzmy warianty A, B, C,…K, natomiast w drugiej wstawiamy liczbę jednostek, które mają określony wariant badanej cechy – ni, dla i = A, B, C,…K.

∑=

=K

Ai

Nn

Liczebności proste (ni) można przedstawić również za pomocą liczb względnych, czyli jako udziały względne:

• ułamkowe

N

n i dla i = A, B,…, K;• procentowe

%100∗N

ni dla i = A, B,…, K;

ułamkowy procentowy

A n A

B n B

C n C

.

.

.

.

.

.

.

.

.

K n K

N 1 100%

Wariant cechyLiczebność

bezwzględnaLiczebność względna - udział względny

N

nA

N

nB

N

nC

N

nK

%100*N

nA

%100*N

nB

%100*N

nB

%100*N

nK

Page 12: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

12

23

Etapy badania statystycznego cd.Przykład 3.4W tablicy 3.7 przedstawiono liczbę zarejestrowanych bezrobotnych w Wielkopolsce wedługpoziomu wykształcenia zgodnie ze stanem z dnia 31 XII 2009 roku.

Tablica 3.7

ułamkowy procentowyWyższe 12 837 0,096 9,6%Policealne, średnie zawodowe 30 679 0,230 23,0%Średnie ogólnokształcące 13 405 0,100 10,0%Zasadnicze zawodowe 42 453 0,318 31,8%Gimnazjalne i poniżej 34 189 0,256 25,6%Ogółem 133 563 1,000 100,0%

Liczba osób

n i

Liczebość względna - udział względnyWykształcenie

Źródło: opracowanie własne na podstawie zasobów Banku Danych Regionalnych [online, dostęp 23 IX 2010 r.]. Dostępne w Internecie: http://www.stat.gov.pl/bdr_n/app/dane_podgrup.nowe_okno?p_zest_id=737365&p_typ=HTML Przykład 3.5W tablicy 3.8 przedstawiono średnioroczną liczbę ludności w wieku produkcyjnym w Wielkopolsce według poziomu wykształcenia w roku 2009.

Tablica 3.8

ułamkowy procentowyWyższe 336 0,134 13,4%Policealne, średnie zawodowe 550 0,220 22,0%Średnie ogólnokształcące 244 0,098 9,8%Zasadnicze zawodowe 784 0,314 31,4%Gimnazjalne i poniżej 586 0,234 23,4%Ogółem 2 500 1,000 100,0%

WykształcenieLiczba

osób [tys.] n i

Liczebość względna - udział względny

Źródło: opracowanie własne na podstawie zasobów Banku Danych Regionalnych [online, dostęp 23 IX 2010 r.]. Dostępne w Internecie: http://www.stat.gov.pl/bdr_n/app/dane_podgrup.nowe_okno?p_zest_id=737768&p_typ=HTML

24

Etapy badania statystycznego cd.Liczebności względne stosuje się często również w szeregach rozdzielczych opartych na ceszeilościowej. Dotyczy to zarówno liczebności prostych, jak i kumulacyjnych.Przykład 3.6Szereg rozdzielczy z przykładu 3.4 można przedstawić w ujęciu względnym. Będzie miał on wówczas postać:

Tablica 3.9

Powierzchnia

mieszkania [m2]

x imin - x i

max

Liczebność względna

[%]

Liczebność kumulacyjna

względna

30-40 20,00 0,2040-50 23,33 0,4350-60 16,67 0,6060-70 10,00 0,7070-80 16,67 0,8780-90 6,67 0,9390-100 6,67 1,00Razem 100,00

Źródło: parz tablica 3.6

ZADANIE DOMOWE:

W oparciu o faktycznie istniejące źródła wtórne zbuduj tablicę, w której obok liczebności prostych i liczebności kumulacyjnych znajdą się kolumny z ich odpowiednikami w wartościach względnych.

Page 13: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

13

25

Etapy badania statystycznego cd.Szeregi geograficzne

Szereg geograficzny przedstawia natężenie badanej zmiennej w jednostkach terytorialnych.

Przykład 3.7

W tablicy 3.10 przedstawiono średnie miesięczne wynagrodzenie brutto (w zł) w poszczególnych województwach w roku 2012.

Tablica 3.10

WojewództwoŚrednie miesiączne

wynagrodzenie brutto wg województw w roku 2012 [zł]

Dolnośląskie 3 503,59Kujawsko-Pomorskie 3 032,09Lubelskie 3 213,67Lubuskie 3 034,01Łódzkie 3 194,30Małopolskie 3 260,87Mazowieckie 4 375,97Opolskie 3 172,23Podkarpackie 3 024,50Podlaskie 3 143,64Pomorskie 3 455,09Śląskie 3 629,57Świętokrzyskie 3 070,29Warmińsko-Mazurskie 2 996,24Wielkopolskie 3 218,67Zachodniopomorskie 3 179,33

a bez wynagrodzeń pracowników w jednostkach budżetowych prowadzących działalność w zakresie obrony narodowej i bezpieczeństwa publicznego. Źródło: Rocznik statystyczny Rzeczypospolitej Polskiej 2013, GUS, Warszawa 2013, s. 72-75.

26

Etapy badania statystycznego cd.

Szeregi dynamiczneSzereg dynamiczny prezentuje poziom badanej zmiennej w kolejnych momentach lub okresach.

Przykład 3.8

W poniższych tablicach przedstawiono w dwóch wariantach liczbę pracujących w gospodarce narodowej w Polsce w latach 1998-2008 (objaśnienie różnic pomiędzy wariantami – w trakcie zajęć):

Tablica 3.11 Tablica 3.12

Lata Pracujący w

gospodarce narodowej ogółem (Wariant A)

1998 15 921 0841999 15 691 7242000 15 159 2282001 14 670 5532002 14 607 1282003 14 452 8522004 12 413 2842005 12 576 2812006 12 905 3982007 13 456 9732008 13 711 043

Lata Pracujący w

gospodarce narodowej ogółem (Wariant B)

1998 15 921 0841999 15 691 7242000 15 159 2282001 14 670 5532002 12 486 6822003 12 332 4062004 12 413 2842005 12 576 2812006 12 905 3982007 13 456 9732008 13 711 043

Źródło: opracowanie własne na podstawie zasobów Banku Danych Regionalnych [online, dostęp 24 IX 2010 r.]. Dostępne w Internecie: http://www.stat.gov.pl/bdr_n/app/dane_podgrup.nowe_okno?p_zest_id=739919&p_typ=HTML

Page 14: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

14

27

Etapy badania statystycznego cd.3.2. Tablice statystyczne

Tablice statystyczne są zbiorem szeregów statystycznych. Szereg statystyczny można zatem uznać zanajprostszą tablicę. Jeżeli w tablicy znajdują się przynajmniej dwa szeregi, to muszą być one ze sobąmerytorycznie powiązane i dotyczyć jednej zbiorowości statystycznej.

Modelowa tablica składa się z trzech części: tytułu, tablicy wła ściwej i informacji na temat źródeł orazewentualnych uwag . Tytuł tablicy powinien zawierać określenie zbiorowości statystycznej w wymiarzerzeczowym, czasowym i przestrzennym (kto? co? kiedy? gdzie?), a także zmienne, w oparciu o którebudowano szeregi wchodzące w skład tablicy.

Przykład 3.9

W tablicy 3.13 przedstawiono wielkość złożonego zjawiska jakim jest rozbieżność pomiędzy wielkościąbezrobocia rejestrowanego w urzędach pracy a wielkością bezrobocie faktycznego w Polsce w latach2003-2011. Tablica 3.13

Bezrobocie a rejestracja w urz ędach pracy w Polsce w latach 2003-2011

aSaldo obliczono poprzez odjęcie od ogółu zarejestrowanych bezrobotnych sumy liczby zarejestrowanych bezrobotnych spełniających kryteria BAEL i osób niezarejestrowanych, ale spełniających te kryteria. Źródło: P. Strzelecki, I. E. Kotowska, Rynek pracy – ogólne tendencje, (w:) Diagnoza Społeczna 2011. Warunki i jakość życia Polaków. Raport, red. J. Czapiński, T. Panek, Rada Monitoringu Społecznego, Warszawa 2011, s. 132.

2003 2005 2007 2009 2011

Bezrobotni zarejestrowani i spełniający definicję bezrobotnego wg BAEL jako odsetek wszystkich zarejestrowanych w urzędach pracy

69,9 56,6 60,6 62 61,9

Osoby niezarejestrowane, ale spełniające definicję bezrobotnego wg BAEL jako odsetek wszystkich zarejestrowanych w urzędach pracy

17 24,6 27,6 29,1 21,7

Saldo osób fałszujących statystyki urzędów pracy jako odsetek

ogółu zarejestrowanych bezrobotnycha 13,1 18,8 11,8 8,9 16,4

Grupy osób wyróżnione ze względu na definicję bezrobotnego oraz rejestrację w urzędzie pracy

Lata

28

Etapy badania statystycznego cd.3.3. Wykresy statystyczne

Wykres statystyczny jest graficznym sposobem prezentacji informacji zawartych w szeregach statystycznych. Składa się z części tekstowej i pola wykresu. Część tekstowa zawiera (podobnie jak tablica) część tekstową (z tytułem i informacją o źródle i ewentualnymi uwagami) oraz pole wykresu. Możliwości konfiguracji pola wykresu i doboru określonych form graficznych wykresu są praktycznie nieograniczone. Poniżej przykłady najbardziej podstawowe.Wykresy szeregów rozdzielczychWykres punktowy służy do graficznego przedstawiania szeregu opartego na cesze ilościowej skokowej. Na osi OX (odciętych) zaznacza się wartości zmiennych, a na osi rzędnych (OY) częstości ich występowania (liczebności proste).Przykład 3.10Na poniższym wykresie punktowym przedstawiono graficznie informację zawartą w tablicy 3.1.

Wykres 3.1

Liczba osób zamieszkuj ących w w ynajmowanym mieszkaniu na osiedlu Z w miejscow o ści Sło ńce w dniu 30 IV 2009 r. (na podstawie

tablicy 3.1)

0

1

2

3

4

5

6

7

0 2 4 6 8 10 12 14x i

ni

Źródło: przykład 2.1, tablica 3.1.

Page 15: Statystyka z demografi ą z... · Statystyka z demografi ... • Mieczysław Sobczyk, Statystyka, wyd. pi ąte, poprawione, Wydawnictwo Naukowe PWN, Warszawa 2008. 4

15

29

Etapy badania statystycznego cd.Wykres słupkowy (histogram) przedstawia graficznie dane tworzące szereg rozdzielczy z przedziałamiklasowymi. Na osi OX zaznacza się przedziały klasowe, które stają się podstawą słupków, natomiast naosi rzędnych zaznaczamy liczebności tychże przedziałów. Wysokość słupka zależy więc od liczebnościprzedziałów klasowych.

Przykład 3.11

Dane zawarte w tablicy 3.6 (szeregu rozdzielczego opartego na cesze ciągłej) wyrażono za pomocąhistogramu (wykres 3.2). Szereg można przedstawić również w postaci wieloboku liczebno ści , którybuduje się łącząc odcinkami środki górnych boków wszystkich prostokątów histogramu (rysunek 3.1). Jeślinatomiast linie wieloboku zostaną wygładzone, wówczas mamy do czynienia z krzyw ą liczebno ści .

Wykres 3.2 Rysunek 3.1

Powierzchnia mieszka ń wynajmowanych na osiedlu Z w miejscowo ści Sło ńce w dniu 30 IV 2009 r.

0

2

4

6

8

0-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100

powierzchnia mieszkania [m2]

liczb

a m

iesz

kań

0

1

2

3

4

5

6

7

8

0-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100

Źródło: przykład 2.1, tablica 3.2.

30

Etapy badania statystycznego cd.Wykresy szeregów strukturalnychNajczęstszą formą prezentacji wykresów strukturalnych są wykresy kołowe, (rysunek na zajęciach) ale również liniowe.

Wykresy szeregów dynamicznych mają najczęściej formę liniową lub słupkową.