20
TEORÍA DEL MUESTREO UNT 1 Dr. Carlos A. Risco Dávila [email protected] MUESTREO POR CONGLOMERADOS I. INTRODUCCIÓN. En el muestreo por conglomerados se requiere dividir a la población en N conglomerados de elementos, de tal manera que todo elemento de la población pertenezca a uno y sólo un conglomerado. Por ejemplo, suponga que desea encuestar a votantes registrados en una urbanización de la ciudad de Trujillo. Un método sería formar un marco de todos los votantes de la urbanización, para entonces tomar de aquí una muestra aleatoria simple de votantes. En forma alterna, en el muestreo por conglomerados optaríamos por definir al marco como la lista de las N=60 manzanas de la urbanización. (véase la figura 1). En este método, cada manzana o conglomerado consistiría en un conglomerado de votantes registrados, y todo votante registrado en el estado pertenecería a uno y sólo un conglomerado. Suponga que se selecciona una muestra aleatoria simple de n=10 de las 60 manzanas. En este punto, podríamos reunir datos de todos los votantes registrados en cada uno de los 10 conglomerados muestreados, método al que se le da el nombre muestreo por conglomerados en una etapa; o bien, podríamos seleccionar una muestra aleatoria simple de votantes registrados en cada uno de los 10 conglomerados muestreados, método llamado muestreo por conglomerados en dos etapas. En cualquier caso se dispone de fórmulas para emplear los resultados de la muestra con el fin de establecer estimaciones puntuales y de intervalo de los parámetros de población, como la media el total y la proporción. El muestreo estratificado y el muestreo por conglomerados se parecen en que ambos dividen a la población en conglomerados de elementos. Pero las razones para elegir uno u otro son distintas. El muestreo por conglomerados tiende a dar mejores resultados cuando los elementos dentro de los conglomerados son heterogéneos o distintos. En el caso ideal, cada conglomerado debería ser una versión de toda la población, aunque en pequeña escala. En este caso, una muestra de una pequeña cantidad de conglomerados produciría buena información acerca de las características de toda la población. Una de las aplicaciones principales del muestreo por conglomerados es el muestreo por áreas, en que los conglomerados son departamentos, pueblos, manzanas urbanas o secciones bien definidas en la población. Debido a que los datos solo se recopilan de una muestra de la totalidad de la áreas geográficas o conglomerados disponibles, los elementos de los conglomerados se parecen entre sí, se pueden tener ahorros considerables de tiempo y costo cuando se manda a un encuestador a una unidad muestreada. Como resultado de esto, incluso cuando se requiere un tamaño grande de muestra, el muestreo por conglomerados puede ser menos costoso que un muestro aleatorio simple o estratificado; además, puede minimizar el tiempo y el costo asociados con el desarrollo del marco o la lista de los elementos que se encuestan, porque en él no se requiere formar la lista con cada elemento de la población, sino únicamente se necesita una lista de los elementos de los conglomerados muestreados.

Muestreo Por Conglomerados

Embed Size (px)

DESCRIPTION

Muestreo Por Conglomerados

Citation preview

  • TEORA DEL MUESTREO UNT

    1 Dr. Carlos A. Risco Dvila [email protected]

    MUESTREO POR CONGLOMERADOS

    I. INTRODUCCIN.

    En el muestreo por conglomerados se requiere dividir a la poblacin en N conglomerados

    de elementos, de tal manera que todo elemento de la poblacin pertenezca a uno y slo un

    conglomerado. Por ejemplo, suponga que desea encuestar a votantes registrados en una

    urbanizacin de la ciudad de Trujillo. Un mtodo sera formar un marco de todos los

    votantes de la urbanizacin, para entonces tomar de aqu una muestra aleatoria simple de

    votantes. En forma alterna, en el muestreo por conglomerados optaramos por definir al

    marco como la lista de las N=60 manzanas de la urbanizacin. (vase la figura 1). En este

    mtodo, cada manzana o conglomerado consistira en un conglomerado de votantes

    registrados, y todo votante registrado en el estado pertenecera a uno y slo un

    conglomerado.

    Suponga que se selecciona una muestra aleatoria simple de n=10 de las 60

    manzanas. En este punto, podramos reunir datos de todos los votantes registrados en

    cada uno de los 10 conglomerados muestreados, mtodo al que se le da el nombre

    muestreo por conglomerados en una etapa; o bien, podramos seleccionar una muestra

    aleatoria simple de votantes registrados en cada uno de los 10 conglomerados

    muestreados, mtodo llamado muestreo por conglomerados en dos etapas. En cualquier

    caso se dispone de frmulas para emplear los resultados de la muestra con el fin de

    establecer estimaciones puntuales y de intervalo de los parmetros de poblacin, como la

    media el total y la proporcin.

    El muestreo estratificado y el muestreo por conglomerados se parecen en que ambos

    dividen a la poblacin en conglomerados de elementos. Pero las razones para elegir uno u

    otro son distintas. El muestreo por conglomerados tiende a dar mejores resultados cuando

    los elementos dentro de los conglomerados son heterogneos o distintos. En el caso ideal,

    cada conglomerado debera ser una versin de toda la poblacin, aunque en pequea

    escala. En este caso, una muestra de una pequea cantidad de conglomerados producira

    buena informacin acerca de las caractersticas de toda la poblacin.

    Una de las aplicaciones principales del muestreo por conglomerados es el muestreo

    por reas, en que los conglomerados son departamentos, pueblos, manzanas urbanas o

    secciones bien definidas en la poblacin. Debido a que los datos solo se recopilan de una

    muestra de la totalidad de la reas geogrficas o conglomerados disponibles, los

    elementos de los conglomerados se parecen entre s, se pueden tener ahorros

    considerables de tiempo y costo cuando se manda a un encuestador a una unidad

    muestreada. Como resultado de esto, incluso cuando se requiere un tamao grande de

    muestra, el muestreo por conglomerados puede ser menos costoso que un muestro

    aleatorio simple o estratificado; adems, puede minimizar el tiempo y el costo asociados

    con el desarrollo del marco o la lista de los elementos que se encuestan, porque en l no

    se requiere formar la lista con cada elemento de la poblacin, sino nicamente se necesita

    una lista de los elementos de los conglomerados muestreados.

  • TEORA DEL MUESTREO UNT

    2 Dr. Carlos A. Risco Dvila [email protected]

    FIGURA 1: MANZANAS DE UNA URBANIZACIN DE TRUJILLO, USADOS

    COMO CONGLOMERADOS DE LOS VOTANTES EMPADRONADOS.

    Para dar un ejemplo de muestreo por conglomerados, un socilogo quiere estimar los

    ingresos medios por persona en cierta ciudad pequea. No existe una lista disponible de

    adultos residentes. Cmo se puede disear la encuesta por muestreo?

    El muestreo por conglomerados parece ser la eleccin lgica para el diseo de la encuesta

    porque no se encuentra una lista disponible de elementos. La ciudad se divide en bloques

    rectangulares, excepto las dos reas industriales y los tres parques que contienen pocas

    casas. El socilogo decide que cada bloque de la ciudad se considerar como un

    conglomerado, las dos reas industriales se considerarn como otro, y finalmente, los

    tres parques se considerarn un conglomerado ms. Los conglomerados se enumeran

    sobre un mapa de la ciudad, con los nmeros del 1 al 415, y los conglomerados con esos

    nmeros se marcan en el mapa. Despus se asignan los entrevistadores a cada uno de los

    conglomerados seleccionados.

    Las frmulas del muestreo por conglomerados que se necesitan en la determinacin de

    intervalos de confianza aproximados de 95% para la media, el total y la proporcin

    poblacional, requieren de la siguiente notacin.

    N= nmero de conglomerados en la poblacin

    n= nmero de conglomerados seleccionados en la muestra

    Mi= nmero de elementos en el conglomerado i

  • TEORA DEL MUESTREO UNT

    3 Dr. Carlos A. Risco Dvila [email protected]

    M= nmero de elementos en la poblacin; M=M1+M2++MN

    nmero promedio de elementos en un conglomerado

    xi = Total de observaciones en el conglomerado i

    ai = nmero de observaciones en el conglomerado i con determinada caracterstica.

    II. MEDIA DE LA POBLACIN

    El estimador puntual de la media poblacional obtenido con el muestreo por

    conglomerados est definido con la siguiente ecuacin.

    ESTIMADOR PUNTUAL DE LA MEDIA DE LA POBLACIN

    (1)

    Una estimacin del error estndar de este estimador puntual es

    (2)

    En consecuencia, la siguiente ecuacin define a la estimacin del intervalo de confianza

    aproximado de 95% para la media de la poblacin.

    ESTIMACIN DEL INTERVALO DE CONFIANZA APROXIMADO DE 95% PARA

    LA MEDIA DE LA POBLACIN.

    (3)

    Se realizan entrevistas en cada uno de los 25 bloques muestreados del ejemplo. Los datos

    sobre ingresos se presentan en la Tabla 1.

  • TEORA DEL MUESTREO UNT

    4 Dr. Carlos A. Risco Dvila [email protected]

    TABLA 1: INGRESOS POR PERSONA

    Conglomerados Nmero de Ingreso total por Nmero de

    residentes, mi conglomerado, xi arrendatarios, ai

    1 8 96000 4

    2 12 121000 7

    3 4 42000 1

    4 5 65000 3

    5 6 52000 3

    6 6 40000 4

    7 7 75000 4

    8 5 65000 2

    9 8 45000 3

    10 3 50000 2

    11 2 85000 1

    12 6 43000 3

    13 5 54000 2

    14 10 49000 5

    15 9 53000 4

    16 3 50000 1

    17 6 32000 4

    18 5 22000 2

    19 5 45000 3

    20 4 37000 1

    21 6 51000 3

    22 8 30000 3

    23 7 39000 4

    24 3 47000 0

    25 8 41000 3

    Clculos en Excel:

    N = 415 M = 2500

    8801 M-bar = 6.04 = 634501213.4 fc = 0.93975904

    est V(x-bar c) 653785 error estand 808.5698451 gl = 126

    t = 2.0

    margen de error 1600

    LI 7201 LS 16003

  • TEORA DEL MUESTREO UNT

    5 Dr. Carlos A. Risco Dvila [email protected]

    III. TOTAL DE LA POBLACIN

    El estimador puntual del total de la poblacin X, se obtiene multiplicando M por

    ESTIMADOR PUNTUAL DEL TOTAL DE LA POBLACIN

    (4)

    Una estimacin del error estndar del estimador anterior es

    (5)

    En consecuencia, una estimacin del intervalo de confianza aproximado de 95% para

    el total de la poblacin est dado por la siguiente expresin.

    ESTIMACIN DEL INTERVALO DE CONFIANZA APROXIMADO DE 95% PARA

    EL TOTAL DE LA POBLACIN.

    (6)

    Utilice los datos de la Tabla 1 para estimar el ingreso total de todos los residentes de la

    ciudad, y calcule un intervalo de confianza aproximado de 95%.

    Clculos en Excel:

    22003311.26

    Li 18002971.43

    Ls 40006282.69

    Frecuentemente, el nmero de elementos en la poblacin no es conocido en problemas

    donde el muestreo por conglomerados es apropiado. Entonces no podemos usar el

    estimador , pero podemos formar otro estimador del total poblacional que no

    depende de M. la cantidad , est dada por

    es el promedio de los totales de conglomerados para los n conglomerados muestreados.

    Por ello, es un estimador insesgado del promedio de los N totales de conglomerados en

    la poblacin.

  • TEORA DEL MUESTREO UNT

    6 Dr. Carlos A. Risco Dvila [email protected]

    Por ejemplo, es muy improbable que se conozca el nmero de adultos varones en una

    ciudad, por lo que se tendr que usar el estimador , en lugar de para estimar el

    total poblacional.

    ESTIMADOR DEL TOTAL POBLACIONAL, EL CUAL NO DEPENDE DE M

    VARIANZA ESTIMADA DE

    donde

    Use los datos de la tabla 1 para estimar el ingreso total de todos los residentes de la

    ciudad si M no es conocido. Y calcule un intervalo de confianza aproximado de 95%.

    22061400

    varianza (N x-bar) 3.07228E+12

    error estand 1752792.018

    margen de error 3505584

    LI 18555816

    LS 25566984

    IV. PROPORCIN DE LA POBLACIN

    El estimador de puntual de la proporcin poblacional, determinado con muestreo por

    conglomerados, se obtiene con la siguiente expresin.

    ESTIMADOR PUNTUAL DE LA PROPORCIN DE LA POBLACIN

    (11)

  • TEORA DEL MUESTREO UNT

    7 Dr. Carlos A. Risco Dvila [email protected]

    Una estimacin del error estndar de este estimador puntual es

    (12)

    As, la siguiente expresin define una estimacin del intervalo de confianza aproximado

    de 95% para la proporcin de la poblacin.

    ESTIMACIN DEL INTERVALO DE CONFIANZA APROXIMADO DE 95% PARA

    LA PROPORCIN DE LA POBLACIN.

    (13)

    Adems de la pregunta sobre sus ingresos, a los residentes de la encuesta muestral del

    ejemplo, se les interroga acerca de si son dueos o alquilan la casa donde viven. Utilice

    los datos de la Tabla 1 para estimar la proporcin de residentes que viven en casas de

    alquiler usando un intervalo de confianza aproximado de 95%.

    0.476821192

    0.530543251

    est V(p-bar c) 0.00055

    error estand 0.023380926

    margen de error 0.046270165

    LI 0.4306

    LS 0.9074

    V. DETERMINACIN DEL TAMAO DE LA MUESTRA

    Una vez formados los conglomerados, el asunto principal para definir el tamao de una

    muestra es seleccionar n, la cantidad de conglomerados. El procedimiento para muestrear

    conglomerados se parece al de otros mtodos de muestreo. Se especifica un nivel

    aceptable de precisin, eligiendo un valor de B, la cota del error de muestro. A

    continuacin, se determina una ecuacin para calcular el valor de n con el que se alcance

    la precisin deseada.

    El tamao medio de un conglomerado y la varianza entre conglomerados son

    factores clave para decidir cuntos conglomerados se deben incluir en la muestra. Si los

    conglomerados son parecidos, la varianza entre ellos ser pequea y puede ser menor la

    cantidad de conglomerados muestreados. Tambin, si la cantidad media de elementos por

    conglomerado es mayor, la cantidad de conglomerados muestreados se puede reducir.

  • TEORA DEL MUESTREO UNT

    8 Dr. Carlos A. Risco Dvila [email protected]

    a) Tamao de muestra aproximado requerido para estimar la media de la

    poblacin, con un lmite B para el error de estimacin

    donde

    y

    Usando los datos de la Tabla 1 De qu tamao debe tomarse la muestra en una

    encuesta futura para estimar los ingresos medios por persona con un lmite de 500 para

    el error de estimacin?

    B = 500

    M-bar = 6.04

    D 2280100

    N = 415

    = 634501213

    n = 166.58

    Luego se deben muestrear 167 conglomerados

    b) Tamao de muestra aproximado requerido para estimar el total de la poblacin,

    usando con un lmite B para el error de estimacin

    donde

    y

    Usando nuevamente los datos de la Tabla 1 como una muestra preliminar de ingresos

    en la ciudad cul ser el tamao de la muestra que se necesita estimar los ingresos

    totales de todos los residentes, con un lmite de 1000000 para el error de estimacin?

    Hay 2500 residentes en la ciudad (M=2500)

    B = 1000000

    M = 2500

    D= 1451589.49

    N = 415

    S2 r = 634501213.4

    n = 212.88

    Luego se deben muestrear 213 conglomerados.

  • TEORA DEL MUESTREO UNT

    9 Dr. Carlos A. Risco Dvila [email protected]

    c) Tamao de muestra aproximado requerido para estimar el total de la poblacin,

    usando ,con un lmite B para el error de estimacin

    donde

    y

    Suponga que los datos de la Tabla 1 provienen de un estudio preliminar de ingresos

    en la ciudad y que no se conoce M. De qu tamao se debe tomar la muestra para

    estimar el ingreso total de todos los residentes, con un lmite de 1000000 para el

    error de estimacin?

    B = 1000000

    M = 2500

    D= 1451589.49

    N = 415

    S2 t = 474556666.7

    n = 182.87

    Luego se deben muestrear 183 conglomerados.

    d) Tamao de muestra aproximado requerido para estimar la proporcin de la

    poblacin, con un lmite B para el error de estimacin

    donde

    y

    Los datos de la Tabla 1 estn obsoletos. Se va a realizar un nuevo estudio en la

    misma ciudad con el propsito de estimar la proporcin de residentes que viven en

    alquiler. Cul sera el tamao de la muestra para estimar p con un lmite de 0.04 en

    el error de estimacin?

    B = 0.04

    M-bar = 6.04

    D 0.01459264

    N = 415

    = 0.530543251

    n = 33.43

    Luego se deben muestrear 34 conglomerados.

  • TEORA DEL MUESTREO UNT

    10 Dr. Carlos A. Risco Dvila [email protected]

    VI. USO DE PAQUETE ESTADSTICO EPIDAT.

  • TEORA DEL MUESTREO UNT

    11 Dr. Carlos A. Risco Dvila [email protected]

    VII. Ejercicios:

    1. Una dependencia pblica desea saber ms acerca de las personas que viven en casa de

    asistencia en determinada ciudad. Un total de 100 casa albergan a 4800 personas en la

    ciudad, y se ha tomado una muestra por conglomerados de 6 casas. Se entrevist a

    cada persona en las 6 casas. Parte de los resultados de la encuesta aparecen a

    continuacin:

    casa Residentes

    Edad media de los

    residentes

    Residentes discapacitados

    1 14 61 12

    2 7 74 2

    3 96 78 30

    4 23 69 8

    5 71 73 10

    6 29 84 22

    a) Establezca una estimacin de la media de la edad de los residentes en casas de

    asistencia de esta ciudad.

    b) Determine un intervalo de confianza aproximadado de 95% para la media de la

    edad de los residentes en casa de asistencia de esta ciudad.

    c) Determine un intervalo de confianza aproximadado de 95% para la proporcin de

    discapacitados en las casas de asistencia de la ciudad.

    2. Una empresa elctrica hace una encuesta entre ingenieros mecnicos para conocer

    ms acerca de los factores que influyen en la eleccin del sistema de calefaccin,

    ventilacin y aire acondicionado (CVAA) para edificios comerciales nuevos. Hay un

    total de 120 empresas en el rea servida por la empresa elctrica que disean sistemas

    de CVAA. El plan es emplear muestreo por conglomeradosen el que cada empresa

    representa un conglomerado. En cada empresa de la muestra se entrevistar a todos

    los ingeneirros mecnicos. Se cree que las 120 empresas dan trabajo,

    aproximadamente, a 500 ingenieros mecnicos. Se tom una muestra de 10 empresas.

    Entre otras cosas, se anotaron la edad de cada encuestado y si el encuestado haba

    asistido a la universidad de la localidad.

    Conglomerado (i) Mi xi ai

    1 12 520 8

    2 1 33 0

    3 2 70 1

    4 1 29 1

    5 6 270 3

    6 3 129 2

    7 2 102 0

    8 1 48 1

    9 9 337 7

    10 13 462 12

  • TEORA DEL MUESTREO UNT

    12 Dr. Carlos A. Risco Dvila [email protected]

    a) Establezca la media de la edad de los ingenieros mecnicos que intervienen en

    estas actividades.

    b) Estime la proporcin de ingenieros mecnicos en el rea servida por la empresa

    electrica que asistieron a la universidad local.

    c) Determine un intervalo de confianza aproximado de 95% para la media de la edad

    de ingenieros mecnicos que disean sistemas de CVAA para edificios comerciales

    d) Determine un intervalo de confianza aproximado de 95% para la proporcin de

    ingenieros mecnicos en el rea servida por la empresa elctrica que asistieron a la

    universidad local.que disean sistemas de CVAA para edificios comerciales

    e) Estime puntual e intervalicamente el total de ingenieros mecnicos en el rea

    servida por la empresa elctrica que asistieron a la universidad local.

    f) Se va a realizar un mismo estudio en la misma ciudad con el propsito de estimar la

    proporcin de ingenieros mecnicos que asistieron a la Universidad Local Qu tan

    grande se debe tomar la muestra para estimar P, con un lmite de 0.08 en el error de

    estimacin?

    3. Supngase que se quiere obtener una muestra de aproximadamente 120 estudiantes de un centro universitario que tiene 966 alumnos registrados y que los alumnos estn

    distribuidos en 52 grupos de tamaos variables y conocidos. El archivo

    UNIVERSIDAD 4.xls contiene la lista de los 52 grupos y los tamaos de stos.

    Ntese que el campo que contiene los conglomerados tiene que ser numrico (en este

    archivo, el campo se llama GRUPO, estos estn identificados por los nmeros del 1 al

    52).

    4. Supngase ahora que se cuenta con un archivo que contiene la informacin completa: listado de los 966 sujetos y, para cada cual, el cdigo del grupo al que pertenece.

    Puede contener, adems, otra informacin sobre los individuos, que no ser empleada

    en el acto de seleccin.

    El archivo UNIVERSIDAD 5.xls contiene los datos (nombre y edad) de cada uno de

    los 966 estudiantes y el campo GRUPO, donde se consigna el grupo al que pertenece

    cada uno de ellos (codificados como 1, 2,..., 52). En el archivo UNIVERSIDAD 5.xls

    los registros estn ordenados segn grupos y, dentro de stos, alfabticamente (tal y

    como verosmilmente se obtendran de un registro secretarial). Al correr el programa,

    se obtiene un resultado similar en su estructura al del caso anterior, pero ahora se

    tiene la posibilidad de guardar el archivo con la base de datos resultante del proceso

    de seleccin (es decir, la informacin contenida en UNIVERSIDAD 5.xls, pero slo

    para los sujetos que resulten elegidos).

  • TEORA DEL MUESTREO UNT

    13 Dr. Carlos A. Risco Dvila [email protected]

    MUESTREO POR CONGLOMERADOS BIETPICO

    I. Introduccin.

    El muestreo por conglomerados en dos etapas es una extensin del muestreo por

    conglomerados monoetpico. Recordar que un conglomerado es usualmente una coleccin

    conveniente o natural de elementos tal como manzanas de casas. Un conglomerado contiene

    frecuentemente demasiados elementos para obtener una medicin de cada uno de ellos, o

    stos son tan semejantes que la medicin de slo unos cuantos, proporciona informacin

    sobre el conglomerado completo. Cuando cualquiera de las dos situaciones ocurre, el

    investigador puede seleccionar una muestra aleatoria de conglomerados y despus tomar una

    muestra aleatoria de los elementos dentro de cada conglomerado. El resultado es una

    muestra de conglomerados en dos etapas.

    II. Cmo seleccionar una muestra por conglomerados en dos etapas?

    El primer problema en la seleccin de una muestra por conglomerados en dos etapas es la

    eleccin de conglomerados apropiados. Dos condiciones son deseables: (1) proximidad

    geogrfica de los elementos dentro de un conglomerado y (2) tamaos de conglomerados

    convenientes para su manejo.

    La seleccin de los conglomerados apropiados tambin depende de si queremos muestrear

    pocos conglomerados y muchos elementos de cada uno, o muchos conglomerados y pocos

    elementos de cada conglomerado. Fundamentalmente la seleccin se basa en los costos. Los

    conglomerados grandes tienden a contener elementos heterogneos y, en consecuencia, se

    requiere una muestra grande de cada uno para lograr estimaciones precisas de los parmetros

    de la poblacin. Por el contrario, los conglomerados pequeos con frecuencia contienen

    elementos relativamente homogneos, en cuyo caso puede obtenerse informacin precisa

    sobre las caractersticas de un conglomerado seleccionando una muestra pequea de cada

    uno.

    Como ejemplo, considere la encuesta sobre la opinin de los estudiantes universitarios. Si

    los estudiantes de una universidad tienen opiniones similares sobre la pregunta de inters,

    pero difieren ampliamente de una universidad a otra, entonces la muestra deber contener

    pocos representantes de muchas universidades. Si las opiniones varan mucho dentro de cada

    universidad, entonces la encuesta deber incluir muchos representantes de cada una de las

    pocas universidades.

    III. Estimacin insesgada de la media y del total de una poblacin.

    Se utiliza la siguiente notacin:

    N= nmero de conglomerados en la poblacin

    n= nmero de conglomerados seleccionados en la muestra

    Mi= nmero de elementos en el conglomerado i

    mi= nmero de elementos seleccionados en una muestra aleatoria simple

    del conglomerado i

    M= nmero de elementos en la poblacin; M=M1+M2++MN

  • TEORA DEL MUESTREO UNT

    14 Dr. Carlos A. Risco Dvila [email protected]

    nmero promedio de elementos en un conglomerado

    xij = la j-sima observacin en la muestra del i-simo conglomerado.

    la media muestral para el i-simo conglomerado

    Estimador insesgado de la media de la poblacin :

    Suponiendo un muestreo aleatorio simple en cada etapa.

    Varianza estimada de :

    donde

    y

    Estimador del total poblacional X

    Suponiendo un muestreo aleatorio simple en cada etapa

    Varianza estimada del total poblacional

  • TEORA DEL MUESTREO UNT

    15 Dr. Carlos A. Risco Dvila [email protected]

    IV. Estimador de razn de una media poblacional

    El estimador , depende del nmero total de elementos en la poblacin, M. Cuando M es

    desconocido, como es frecuente el caso, entonces debe estimarse en funcin de los datos

    de la muestra. Se obtiene un estimador de M multiplicando el tamao medio de

    conglomerados

    por el nmero de conglomerados en la poblacin, N. si se

    reemplaza M por su estimador, se obtiene un estimador de razn, denotado por , debido

    a que tanto el numerador como denominador son variables aleatorias.

    Estimador de razn de una media poblacional

    Varianza estimada de :

    donde

    y

    V. Estimacin de una proporcin de la poblacin

    Estimador de una proporcin poblacional p:

    Varianza estimada de p

  • TEORA DEL MUESTREO UNT

    16 Dr. Carlos A. Risco Dvila [email protected]

    donde

    y

    VI. Muestreo por conglomerados en dos etapas con probabilidades proporcionales al

    tamao

    Como el nmero de conglomerados puede variar mucho de un conglomerado a otro, una

    tcnica que suele ser ventajosa consiste en muestrear conglomerados con probabilidades

    proporcionales a sus tamaos. Generalmente, l muestreo pps slo se utiliza en la primera

    etapa de un procedimiento de muestreo en dos etapas, debido a que los elementos dentro de

    los conglomerados tienden a ser algo similares en tamao. Por tanto presentaremos los

    estimadores de y X para el muestreo por conglomerados en dos etapas, en el cual, la

    primera etapa se realiza con probabilidades proporcionales al tamao.

    Estimador de la media poblacional :

    Varianza estimada de :

    Estimador del total poblacional X:

    Varianza estimada de :

  • TEORA DEL MUESTREO UNT

    17 Dr. Carlos A. Risco Dvila [email protected]

    VII. Ejercicios propuestos:

    1. Un fabricante de prendas de vestir tiene 90 plantas localizadas en todo Estados Unidos y

    quiere estimar el nmero promedio de horas que las mquinas de coser estuvieren sin

    funcionar por reparacin en los meses pasados. Debido a que las plantas estn muy

    dispersas, el fabricante decide utilizar un muestreo por conglomerados, especificando

    cada planta como un conglomerado de mquinas. Cada planta contiene muchas mquinas,

    el verificar los registros de reparacin de cada mquina implicara consumir tiempo. Por

    tanto el fabricante usa un muestreo en dos etapas. Se dispone de tiempo y dinero

    suficientes para muestrear 10 plantas y aproximadamente un 20% de las mquinas de

    cada planta. Dados los siguientes datos sobre el tiempo sin funcionar para las mquinas

    de coser por plantas

    PLANTA Mi mi tiempo sin funcionar (en horas) pi

    1 50 10 5 7 9 0 11 2 8 4 3 5 0.4

    2 65 13 4 3 7 2 11 0 1 9 4 3 2 1 5 0.4

    3 45 9 5 6 4 11 12 0 1 8 4 0.3

    4 48 10 6 4 0 1 0 9 8 4 6 10 0.3

    5 52 10 11 4 3 1 0 2 8 6 5 3 0.5

    6 58 12 12 11 3 4 2 0 0 1 4 3 2 4 0.4

    7 42 8 3 7 6 7 8 4 3 2 0.4

    8 66 13 3 6 4 3 2 2 8 4 0 4 5 6 3 0.3

    9 40 8 6 4 7 3 9 1 4 5 0.3

    10 56 11 6 7 5 10 11 2 1 4 0 5 4 0.4

    a) El fabricante sabe que si tiene un total de 4500 mquinas en todas las plantas. Estimar

    puntual e intervalicamente el tiempo sin funcionar promedio sin mquina. Use

    alpha=0.05

    b) Estimar tambin puntual e intervalicamente la cantidad total de tiempo sin funcionar

    durante el mes pasado para todas las mquinas. Use alpha=0.05

    c) Estimar puntual e intervalicamente el tiempo sin funcionar promedio por mquina en

    caso de que no se conozca el nmero total de mquinas. Use alpha=0.05

    d) Las proporciones muestrales de las mquinas que requieren reparaciones mayores se

    presentan en la ltima columna. Estime puntual e intervalicamente la proporcin de

    mquinas que involucran reparaciones mayores para todas las plantas. Use alpha=0.05

    2. Una cadena de supermercados tiene 32 ciudades. Un director de la Compaa quiere

    estimar la proporcin de tiendas en la cadena que no satisfacen un criterio de limpieza

    especfico. Las tiendas dentro de cada ciudad al parecer poseen caractersticas similares;

    por lo tanto el director decide seleccionar una muestra por conglomerados en dos etapas

    conteniendo la mitad de las tiendas dentro de cada una de las 4 ciudades. El muestreo por

    conglomerados es conveniente en esta situacin debido al costo de traslado. Los datos

    recolectados se presentan en la tabla adjunta.

  • TEORA DEL MUESTREO UNT

    18 Dr. Carlos A. Risco Dvila [email protected]

    Ciudad

    Nmero de tiendas en la ciudad

    Nmero de tiendas

    muestreadas

    Nmero de tiendas que

    no satisfacen el criterio

    de limpieza 1 25 13 3 2 10 5 1 3 18 9 4 4 16 8 2

    a) Dado que la cadena contiene 450 tiendas. Estime puntual e intervalicamente (99%) la

    proporcin de tiendas que no satisfacen el criterio de limpieza

    b) Estime puntual e intervalicamente (95%) el nmero total de tiendas que no satisfacen

    el criterio de limpieza.

    c) Asuma que se desconoce el nmero total de tiendas de la cadena de supermercados.

    Estime puntual e intervalicamente (95%) la proporcin de tiendas que no satisfacen

    que no satisfacen el criterio de limpieza.

    3. Un investigador desea muestrear tres hospitales de entre los seis que existen en una

    ciudad, con el propsito de estimar la proporcin de pacientes que han estado (o estarn)

    en el hospital por ms de dos das consecutivos. Puesto que los hospitales varan en

    tamao, stos sern muestreados con probabilidades proporcionales al nmero de sus

    pacientes. En los tres hospitales muestreados se examinar un 10% de los registros de los

    pacientes actuales para determinar cuntos pacientes permanecern por ms de dos das

    en el hospital. Con la informacin sobre los tamaos de los hospitales dados en la tabla

    adjunta, seleccione una muestra de tres hospitales con probabilidades proporcionales al

    tamao.

    Hospital Nmero de pacientes

    Intervalo acumulado

    1 328 1-328

    2 109 329-437

    3 432 438-869

    4 220 870-1089

    5 280 1090-1369

    6 190 1370-1559

    Supngase que los hospitales muestreados dieron los siguientes datos sobre el nmero de

    pacientes con permanencia de ms de dos das:

    Hospital

    Nmero de pacientes

    muestreados

    Nmero con permanencia de ms de dos das

    3 43 25

    5 28 15

    6 19 8

    Estime la proporcin de pacientes con permanencia de ms de dos das, para los seis

    hospitales, y establezca un intervalo de confianza del 95%

  • TEORA DEL MUESTREO UNT

    19 Dr. Carlos A. Risco Dvila [email protected]

    VIII. SELECCIN DEL TAMAO MUESTRAL USANDO EL PAQUETE

    ESTADSTICO EPIDAT

  • TEORA DEL MUESTREO UNT

    20 Dr. Carlos A. Risco Dvila [email protected]

    Ejemplo 1:

    Supngase que se quiere obtener una muestra bietpica equiprobabilstica de 120

    estudiantes de un centro universitario que tiene 966 alumnos registrados. Supngase

    adems que los alumnos estn distribuidos en 52 grupos de tamaos variables y

    conocidos y que se ha decidido seleccionar 12 de esos grupos, o equivalentemente, 10

    alumnos por grupo.

    El archivo UNIVERSIDAD 4.xls contiene la informacin necesaria para hacer la

    seleccin si se est en el primer caso; dicha base consta de 52 registros (tantos como

    GRUPOS diferentes contiene el centro universitario). El campo TAMAO de la base

    UNIVERSIDAD 4.xls contiene el nmero de sujetos existentes en cada uno de los 52

    grupos.

    Ejemplo 2:

    Supngase ahora que se cuenta con un archivo que contiene la informacin completa:

    listado de los 966 sujetos y, para cada cual, el dato del grupo al que pertenece. Cada

    registro puede contener o no, adems, otra informacin sobre los individuos, que no ser

    empleada en el acto de seleccin. El archivo UNIVERSIDAD 5.xls contiene los datos

    (nombre y edad) de cada uno de los 966 estudiantes y el campo GRUPO, donde se

    consigna el grupo al que pertenece cada uno de ellos (codificada como 1, 2,..., 52). En el

    archivo UNIVERSIDAD 5.xls los registros estn ordenados segn grupos y, dentro de

    stos, alfabticamente (tal y como verosmilmente se obtendran de un registro

    secretarial). Al correr el programa, se obtiene un resultado similar al del caso anterior,

    pero ahora se tiene la posibilidad de guardar el archivo con la base de datos resultante del

    proceso de seleccin (es decir, la informacin contenida en UNIVERSIDAD 5.xls pero

    slo para los sujetos que resulten elegidos).

    IX. REFERENCIAS BIBLIOGRFICAS.

    ANDERSON, D.; SWEENEY, D. y WILLIAMS, T. (2008). Estadstica para la

    Administracin y Economa. (10 ed.). Mxico: CENGAGE.

    SCHEAFFER y MENDENAHALL (2007). Elementos de Muestreo. 6ta Edicin.

    Espaa: Ed. Thomson.

    http://epidemiologia.bravehost.com/UDA2008_2T/bioestadistica_1_72.pdf

    http://epidemiologia.bravehost.com/UDA2008_2T/bioestadistica_1_72.pdf