Upload
alfonso-montes
View
235
Download
6
Embed Size (px)
Citation preview
14/11/2012
1
UNIDAD 5
ELEMENTOS DE MUESTREO
TECNICAS DE MUESTREO ALEATORIO
a) Muestreo aleatorio simple
b) Muestreo sistemático
c) Muestreo por conglomerado
TECNICAS DE MUESTREO NO ALEATORIO
a) Muestreo dirigido
b) Muestreo por cuotas
c) Muestreo deliberado o por conveniencia
En esta unidad estudiaremos las técnicas de muestreo aleatorio
Existen 2 tipos de técnicas para la selección
de muestras:
14/11/2012
2
TECNICAS DE MUESTREO ALEATORIO
Se caracterizan porque las unidades elementales se seleccionan
con probabilidades conocidas, en dichas técnicas intervienen
las leyes probabilísticas
1. MUESTREO ALEATORIO SIMPLE
Es el proceso por medio del cual se selecciona los elementos de
una población en forma aleatoria, es decir que cada uno de los
elementos tienen la misma probabilidad de formar parte de la
muestra.
Este puede ser de dos tipos:
a) Muestreo con reposición:
Los elementos que se van seleccionando vuelven a participar las
veces que se repite el experimento. No disminuye el espacio
muestral.
1. MUESTREO ALEATORIO SIMPLE
El numero de muestras se determina por medio de la formula Nn
N: Es el tamaño de la población
n: Es el tamaño de la muestra
Ejemplo 1:
N = A,B,C,D,E
N = 2 elementos
Numero de muestras que habrán: 52 =25
AA BA CA DA EA
AB BB CB DB EB
AC BC CC DC EC
AD BD CD DD ED
AE BE CE DE EE
Cada elemento (muestra)
tiene una probabilidad de
1/25=0.04
14/11/2012
3
a) Para los datos del ejemplo 1, determine: Cual es la
probabilidad de seleccionar una muestra que tenga
dentro de sus elementos una letra B (solamente una).
Casos favorables = 8 Casos posibles = 25
P = 8/25 =0.32
EJEMPLO 2. Dada una población de 25 elementos,
determine el numero de muestras de 5 elementos
que pueden obtenerse.
Nn = 255 = 9,765,625
1. MUESTREO ALEATORIO SIMPLE
b) Muestreo sin reposición:
Los elementos que han sido seleccionados ya no participan en el
siguiente experimento.
Por lo tanto la formula para determinar el numero de muestras
que habrán, se utilizará la formula de combinaciones (la que no
permite repetición).
N: Es el tamaño de la población
n: Es el tamaño de la muestra
Uso de la tabla de números aleatorios para seleccionar una
muestra.
Uno de los métodos que se utiliza en la selección aleatoria de
muestras, es la tabla de números aleatorios. Su uso consiste en
enumerar toda la población, en el orden que se haya dado. Luego
usamos la tabla de números aleatorios para ir seleccionando
muestras, dicha tabla nos proporciona la ubicación de la muestra
a seleccionar.
)!(!
!
nNn
NNCn
1. MUESTREO ALEATORIO SIMPLE
14/11/2012
4
1. ₡ 5000 6. 2500 11. 5400 16. 3750 21. 6275 26. 6775 31. 3800 36. 4320
2. 5500 7. 3200 12. 1825 17. 5000 22. 5450 27. 2820 32. 2002 37. 2480
3. 3000 8. 4000 13. 2580 18. 6575 23. 1850 28. 2525 33. 1920 38. 5200
4. 3235 9. 6700 14. 4300 19. 4034 24. 3950 29. 4432 34. 4225 39. 1925
5. 3135 10. 6200 15. 4130 20. 4124 25. 3130 30. 4452 35. 4565 40. 1785
Ejemplo: Se tiene un listado de los salarios de 40 trabajadores de los cuales se quiere escoger
aleatoriamente una muestra de 8 salarios.
Uso de la tabla de números aleatorios para seleccionar una muestra.
De estos 40 salarios queremos escoger ocho, ya están enumerados del 1 al 40, por lo tanto en la
tabla de números aleatorios vamos a buscar valores inferiores a 40.
El número máximo que podemos encontrar es 40, puede ser cualquier numero interior también,
como este valor nada mas tiene dos cifras, vamos a observar las primeras 2 cifras de cada
cantidad que aparece en la tabla de números aleatorios.
La tabla debe tener las columnas y filas enumeradas del uno al diez. Cada una de las filas-
columnas contiene cinco cantidades de cinco cifras cada una.
Para iniciar se le proporcionará la ubicación de donde comenzará a buscar sus muestras.
Por ejemplo: inicie su búsqueda en la F4- C5.
Nos ubicamos en la tabla en la fila a cuatro columna cinco a partir del primer valor de esa fila y
col. Empezamos a observar las primeras dos cifras, nuestro objetivo son aquellos valores
inferiores a 40 en este caso, vamos buscando en esa misma columna hacia abajo, hasta
encontrar ocho datos, ya que estamos buscando seleccionar ocho muestras, esos números
encontrados serán las muestras a seleccionar de los salarios. (Ver tabla. ADELANTE)
Tabla de números
aleatorios
F4- C5. Esta dirección sólo le
proporciona el punto de partida,
y debe seguir la búsqueda de
arriba hacia abajo siempre.
Si al finalizar la búsqueda en
esta columna no ha encontrado
aún todas las muestras
buscadas, entonces debe iniciar
en la siguiente columna, siempre
de arriba hacia abajo, hasta
encontrar todas las muestras
solicitadas.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10
F1 02711
94873
54921
77640
61545
F2
F3
F4 14636
76539
92634
46991
03985
F5 21564
89845
06779
70722
45685
F6 15364
83314
93780
09799
63794
F7 51887
86412
09333
80161
88883
F8 86022
37706
95029
83532
80875
F9 92786
11172
60446
20470
34417
Las muestras a seleccionar son:
14, 03, 21, 06,15, 09, 09, 37,11.
Ubicación de los salarios a
seleccionar.
Ya tenemos las ocho muestras
que nos piden, como el 9 ya se
había escogido, se anula el
siguiente encontrado. Y se
selecciona la siguiente muestra.
14/11/2012
5
Cuando ya se han encontrado las muestras se hace un listado de ellas,
en el orden en que se fueron escogiendo cada una.
14, 03, 21, 06,15, 09, 37,11.
1. 5000 6. 2500 11. 5400 16. 3750 21. 6275 26. 6775 31. 3800 36. 4320
2. 5500 7. 3200 12. 1825 17. 5000 22. 5450 27. 2820 32. 2002 37. 2480
3. 3000 8. 4000 13. 2580 18. 6575 23. 1850 28. 2525 33. 1920 38. 5200
4. 3235 9. 6700 14. 4300 19. 4034 24. 3950 29. 4432 34. 4225 39. 1925
5. 3135 10. 6200 15. 4130 20. 4124 25. 3130 30. 4452 35. 4565 40. 1785
MUESTRA SELECCIONADA ALEATORIAMENTE
14. 4300
3. 3000
21. 6275
6. 2500
15. 4130
9. 6700
37. 2480
11. 5400
Las presentamos en el orden en el que las fuimos
seleccionando. Según la tabla de números
aleatorios.
MUESTREO SISTEMATICO
Este consiste en seleccionar los elementos de la población, cada cierto numero de
dichos elementos. Este numero resulta de dividir el tamaño de la población entre el
tamaño de la muestra. Este valor se conoce como razón de muestreo y
usualmente se representa por la letra k.
2. MUESTREO SISTEMATICO
n
Nk
si k tiene valores con decimales se redondea al entero siguiente o
anterior, según aproximaciones.
Cuando ya hemos encontrado el valor de K.
El primer paso a seguir es: encontrar aleatoriamente un número que éste entre 1 y K.
Para esto podemos utilizar la tabla de números aleatorios a partir de una ubicación ya
dada (en el ejercicio). Este valor encontrado será la ubicación de la primera muestra a
elegir. La población debe estar ordenada previamente.
Para seleccionar las siguientes muestras; al primer valor encontrado le vamos
sumando el valor de K, hasta obtener el número de muestras que se piden.
Ver ejemplo siguiente.
14/11/2012
6
2. MUESTREO SISTEMATICO
Ejemplo 1. Una empresa encontró que se habían registrado 2000 recibos de
ventas los cuales se almacenaron en cajones en un archivero y decidieron
seleccionar 100 recibos para calcular el ingreso medio en dólares.
Como los recibos están almacenados en un archivero no es necesario que los
enumere. Sino que encontramos k y vamos seleccionando de una vez del
archivero, el recibo que está en la ubicación que se determina:
N=2000
n= 100 20
100
2000k
1º. En número de inicio se elige aleatoriamente entre 1 y k, entonces
podemos seleccionar cualquier numero entre 1 y 20, esto puede ser por
medio de la tabla de números aleatorios.
Digamos que se ha sugerido iniciar la búsqueda del número aleatorio a partir
de la columna 3 fila 5,(C3-F5), entonces como nos interesa encontrar un
número menor que 20, observamos las primeras 2 cifras de cada una de las
cantidades, desde la ubicación dada (siempre en el sentido de arriba hacia
abajo) hasta encontrar un número que éste entre uno y 20.
Esta es la constante que le vamos sumando al
primer numero encontrado aleatoriamente. Para
ir seleccionando todas las muestras que se
piden.
El primer de número de esa columna y fila que aparece en la tabla es 11838, al
observar las primeras dos cifras vemos que es el número once, eso significa que la
primer factura a escoger es la que está en la posición 11, Cuando ya hemos escogido
el primer número aleatoriamente, a este valor le vamos sumando el valor de K
consecutivamente, y esto nos irá dando la ubicación de las facturas a seleccionar como
muestra.
MUESTRA ESCOGIDA POR MUESTREO SISTEMATICO
Posición de las facturas a escoger:
+K
+20 Ir sumando K, hasta completar
las 100 muestras que se piden
11 211 411
31 231 431
51 251 451
71 271
91 291
111 311
131 331
151 351
171 371
191 391
Primer número se escoge aleatoriamente,
y a este se le va sumando K
14/11/2012
7
3. MUESTREO POR CONGLOMERADO En este tipo de muestreo la población se divide en sub-grupos
llamados conglomerados. Los elementos dentro de cada
conglomerado se seleccionan de la forma mas heterogénea
posible con respecto a la variable estudiada, y cada
conglomerado con respecto a otro debe ser lo mas homogéneo
posible.
Cuando a usted le asignan hacer una investigación, lo primero
que hace es empezar a delimitar su población por ejemplo
haciendo grupos más pequeños.
Por ejemplo: se le pide hacer una investigación en San
Salvador sobre las familias que no poseen agua potable.
Lo primero que usted hace es hacer grupos más pequeños de
su población porque no podrá investigar a todo San Salvador
casa por casa
por ejemplo:
San salvador
colonias colonias colonias
pasajes pasajes pasajes
casas casas casas
1
2
3
1
2
3
Muestreo de una etapa
Muestreo de dos etapas
Muestreo de tres etapas
POBLACION
CONGLOMERADOS
Primero selecciona algunas colonias específicas de San Salvador:
éste sería un primer sub- grupo y le llamaremos muestreo de una
etapa.
Luego será necesario dividir otros un grupo, este será un muestreo
de dos etapas, ya que tomamos un segundo sub grupo; que podría
ser seleccionar ciertos pasajes de cada colonia.
Un tercer sub grupo podría ser seleccionar algunas casas de los
pasajes, éste sería un muestreo de tres etapas.
3. MUESTREO POR CONGLOMERADO
14/11/2012
8
En conclusión:
Se pretendía estudiar a San Salvador, de San
Salvador se escogen algunas colonias, de estas
colonias se selecciona algunos pasajes, y de estos
pasajes se selecciona algunas casas. Siendo estas
últimas la muestra seleccionada para nuestra
investigación.
3. MUESTREO POR CONGLOMERADO
DISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRAL: Es el conjunto de estadísticos
(valores que resultan del análisis de muestreo), que pueden
obtenerse de las diferentes muestras de igual tamaño que
conforman una población determinada.
DISTRIBUCION MUESTRAL DE MEDIAS
•Es una distribución de probabilidades de todas las medias
posibles de las muestras de igual tamaño que se pueden extraer
de poblaciones dadas.
Para realizar una distribución muestral de medias es necesario
seguir los siguientes pasos:
14/11/2012
9
DISTRIBUCIÓN MUESTRAL DE MEDIAS. 1. Determinar el # de muestras 2. Listar todas las muestras 3. Calcular la media para cada muestra. 4. Agrupación de media y calculo de la media de medias . Completar la siguiente tabla. 5. Cálculo de la media poblacional (la media de la población dada) 6. Confirmar que 7. Calculo del error típico 8. Confirmar que
Muestreo con reposición: Muestreo sin reposición
Para: Muestreo con reposición
Error típico para muestra
Error típico para población
Tabla para encontrar la desviación
Donde:
n: son los elementos que se toman de la población
N: son el total de elementos de la población
Para: Muestreo sin reposición
Error típico para muestra
Error típico para población
se determina de la misma manera que para muestreo
con reposición.
F
( )x
( )x
x ( )F x 2( )F x x
( )x
x
( )
( )
2( )f x xx
f
2( )f x xx
f
2( )x x
DISTRIBUCION MUESTRAL DE MEDIAS
Cómo determinar el número de muestras y como listar las muestras.
1. Se tiene la siguiente población: N= A,B,C,D.
(N= 4 elementos)
Determine cuántas muestras de dos elementos (n=2) se pueden obtener y haga un
listado de esas muestras.
Utilice los dos métodos: muestreo con reposición y sin reposición.
Muestreo con reposición
Número de muestras que se obtienen al seleccionar dos elementos de cuatro.
N=4 n=2
Habrán 16 muestras de 2 elementos
N= A,B,C,D.
Listar muestras: cada elemento de la población se relaciona con todos los elementos.
24 16nN
AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD
14/11/2012
10
Muestreo sin reposición
Número de muestras que se obtienen al seleccionar dos elementos de cuatro.
N=4 n=2
Se tendrán 6 muestras de 2 elementos
Listar muestras: como no se permite repetición; El primer elemento de la población se
relaciona con todos los elementos que aparecen después de él. El segundo elemento
se relaciona, con todos los elementos que están después de él. El tercer elemento se
relaciona con todos los que están después de él. Y así sucesivamente.
N= A,B,C,D.
DISTRIBUCION MUESTRAL DE MEDIAS
24 6NCn C
AB BC CD
AC BD
AD
Establece que para muestras aleatorias grandes, la
distribución muestral de medias tiende en su forma a la
distribución normal, cualquiera que fuera la distribución de la
población de la cual se seleccionó la muestra.
El teorema del limite central conduce al uso del error estándar.
Si tienden a una distribución normal podemos determinar
entonces valores de Z. (Al encontrar un valor de Z, podemos utilizar la tabla de áreas bajo la
curva, del mismo modo que lo hacíamos en el en el tema de distribución normal estándar)
TEOREMA DEL LIMITE CENTRAL
x
xZ
Error estándar
Cuando no se conoce la población
Error estándar
Cuando se conoce la población
x .1
N n
Nn
x
n
Valores a
buscar en la
tabla de
áreas bajo la
curva
N: total de datos de la población
n: elementos que seleccionan la población.
: Es la media población
: Es la media de la muestra
: Es la desviación estándar de la población
: Es el error estándar de la población x
x
14/11/2012
11
Ejemplo1: de una población de 600 personas se selecciona una muestra de 81
personas, se sabe que el salario promedio de la población es de $3,000 con una
desviación estándar de $ 220.
a) Cuál es la probabilidad de que en dicha muestra la media sea de $ 2,980
b) cuál es la probabilidad de que en dicha muestra la media sea mayor de $2,980
c) cuál es la probabilidad que la media se encuentra entre $3,040 y $ 3,060
En el enunciado del ejercicio le darán el valor de la media poblacional, la desviación estándar, el tamaño de la
muestra y el tamaño de la población.
Y en cada uno de los literales le proporcionarán la media de la muestra, valor que tendrá que pasar a un
equivalente en Z, para poder graficar el área bajo la curva.
Del enunciado se conoce:
TEOREMA DEL LIMITE CENTRAL
3,000
220
600
81
N
n
a) Cuál es la probabilidad de que en dicha muestra la
media sea de $ 2,980
En la curva: en el punto central de la distribución en
forma de campana, se gráfica media de la población,
y la media de la muestra se grafica atrás o delante de
la media de la población, luego se encuentran los
valores de Z para poder dar la probabilidad que se
piden.
2,980x
2,980 3,000
a) Cuál es la probabilidad de que en dicha muestra la media sea de $ 2,980
Como no nos dice que sea mayor o menor a ese valor por lo tanto nos están pidiendo la probabilidad exacta que hay desde el cero
hasta el valor Z encontrado
Z= - 0.88 0
x220 600 81
. . 22.641 600 181
N n
Nn
2980 30000.88
22.64x
xZ
3,000
220
600
81
N
n
2,980x
Cuando se conoce N se usa:
Buscando un valor equivalente para la media de 2, 980
El área para Z= - 0.88 es 0.3106
Entonces la probabilidad de que la
muestra sea de 2980 es P= 0.3106
0.3106
14/11/2012
12
b)cuál es la probabilidad de que en dicha muestra la media sea mayor de $2,980
La media de la muestra sigue teniendo el mismo valor
Los otros datos se mantienen constantes
3,000
220
600
81
N
n
2,980x
x 22.64
2,980 3,000
Z= - 0.88 0
0.3106 Que sea mayor que 2,980
sombreamos a la derecha
de ese valor.
Ya conocíamos el valor de
Z equivalente.
0.5
Por lo tanto la Probabilidad de que sea mayor de 2980 es:
P= 0.3106 + 0.5 = 0.8106
c) cuál es la probabilidad que la media se encuentra entre $3,040 y $ 3,060 Como hay dos medias debemos encontrar dos valores de Z
3,000
220
600
81
N
n
x 22.64
3,040
3,060
x
x
0.4960
3000 3040 3060
El área total sombreada se obtiene en este
caso restando al área mayor, el área menor.
P=0.4960 – 0.4616 = 0.0334
Se sombrea el área entre
los dos valores graficados.
0 Z=1.77 Z=2.65
0.4616
3040 30001.77
22.64
3060 30002.65
22.64
x
x
xZ
xZ