modulo_2

Embed Size (px)

DESCRIPTION

ESTADISTICA DESCRIPTIVA

Citation preview

  • Mdulo 2 Estadstica descriptiva Medidas de tendencia central y de dispersin I (Distribucin de Frecuencias)

    ndice

    Introduccin Propsito y objetivos ndice de temas

    o 2.1 Distribucin de Frecuencias Orientaciones para el estudio Organizador avanzado Estadstica descriptiva. Medidas de tendencia central y de dispersin I

    (Distribucin de Frecuencias) Ejercicios de autoevaluacin Resumen Bibliografa del mdulo

    Introduccin

    Este segundo mdulo del curso est orientado a que revises la informacin sobre el tema de la distribucin de frecuencias. Para ello te pedimos que complementes lo anteriormente descrito con la lectura de dos archivos. El primer archivo ya lo empezaste a revisar en el mdulo anterior, es el Manual de Estadstica, pero ahora revisars el captulo 2 que comienza en la pgina 8 y en donde se describe a detalle este tema. Tambin ser necesario que revises las lecturas Tablas de frecuencia y Captulo II. En ambas se describen algunos ejemplos estadsticos y el anlisis de los mismos a travs del uso de Excel. Recuerda que estaremos usando esta aplicacin como auxiliar en el procesamiento de la informacin.

    Las actividades para esta semana consisten en resolver algunos ejercicios usando Excel adems de revisar la informacin del Manual de Estadstica para hacer un resumen de los trminos ah descritos.

    Propsito y objetivos

    Objetivo

    El estudiante aplicar el concepto de distribucin de frecuencias como elemento inicial en la Estadstica Descriptiva, a partir de un conjunto de lecturas y actividades relacionadas, indispensable para la clasificacin y ordenamiento de los datos para su estudio estadstico.

    Propsito

  • Que aprendas como debes crear la tabla de distribucin de frecuencias a partir de un conjunto de datos proporcionados.

    Orientaciones para el estudio

    Organiza tu propia agenda, estableciendo objetivos semanales para cubrir los contenidos de las lecturas y realizar las actividades de aprendizaje planeadas para cada mdulo.

    Realiza una lectura rpida y despus una segunda revisin de los contenidos ya que esto te permitir obtener una mejor comprensin de los conceptos estudiados.

    Realiza resmenes, esquemas, cuadros sinpticos o mapas conceptuales para clarificar conceptos, establecer similitudes o diferencias entre los contenidos que vas cubriendo a lo largo del curso.

    Utiliza un cuaderno de apuntes para anotar los conceptos ms importantes.

    Establece conexiones entre los conocimientos nuevos y los ya cubiertos en cuatrimestres anteriores, inclusive de otras materias, para que vayas estructurando una visin global del mbito de aplicacin de tu carrera.

    LA ESTADSTICA DESCRIPTIVA

    La estadstica descriptiva se encarga de resumir y organizar una gran cantidad de datos referentes a una muestra o a una poblacin. Para resumir y organizar los datos se utilizan diferentes procedimientos, llamados tcnicas descriptivas: la matriz de datos permite ordenarlos, las tablas de frecuencias o tablas de distribucin de frecuencia permiten agruparlos, los grficos permiten visualizarlos, las medidas estadsticas y las medidas de asimetra y curtosis permiten resumirlos reducindolos a un solo dato.

    El proceso comienza con la recoleccin de los datos para despus ordenarlos en una matriz de datos y posteriormente agruparlos en una tabla de frecuencias. La forma de ordenarlos y agruparlos depender del tipo de variable considerada.

    Las tablas de frecuencias contienen tres elementos importantes: las frecuencias, el tamao de la muestra y los intervalos.

    a) Frecuencia (f). Se define como la cantidad de datos iguales o que se repiten. Por ejemplo, al realizar el levantamiento de informacin de las edades de los alumnos en una primaria, podemos decir que la frecuencia 8 significa que el dato 7 aos se repite 8 ocho veces.

    b) Tamao de la muestra (n). Es la cantidad total de datos. La suma de todas las frecuencias f debe dar como resultado el tamao n de la muestra.

    c) Intervalos. Un intervalo, tambin llamado intervalo de clase, es cada uno de los grupos de valores ubicados en una fila en una tabla de

  • frecuencias. Por ejemplo, el intervalo 15-16 significa que en esa fila se estn considerando las edades de 15 a 16 aos.

    La estadstica descriptiva hace nfasis en tres aspectos:

    1. La forma de la distribucin. Para describir como estn distribuidos los datos utiliza una herramienta llamada "distribucin de frecuencia" y presenta la informacin por medio de tablas y grficas.

    2. Las "medidas de tendencia central" que resume la informacin a una cifra que es representativa de la serie de datos.

    3. Las "medidas de variabilidad" nos indican que tan variables son los datos respecto a las medidas de tendencia central.

    Primero comenzaremos presentando la manera de elaborar una distribucin de frecuencia, para despus continuar con los temas de medidas de tendencia central y medidas de variabilidad.

    Construccin de una distribucin de frecuencias

    Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las cuales se muestra el nmero de observaciones que contiene cada categora.

    Los pasos para la construccin de una distribucin de frecuencias son mejor explicados con este ejemplo: Los siguientes datos son el nmero de meses de duracin de una muestra de 40 bateras para coche.

    22 41 35 45 32 37 30 26

    34 16 31 33 38 31 47 37

    25 43 34 36 29 33 39 31

    33 31 37 44 32 41 19 34

    47 38 32 26 39 30 42 35

    1. El rango

    Rango = Dato mayor Dato menor = 47 16 = 31

    2. Nmero tentativo de los intervalos de clase

    El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo a la frmula 2 nic

  • Nmero de intervalos (nic) Nmero mximo de datos ( 2 nic) 5 32

    6 64

    7 128

    8 256

    9 512

    10 1024

    En este ejercicio, puesto que tenemos 40 datos el NIC sera de 6.

    3. Tamao de los Intervalos de Clase (tic)

    TIC = Rango

    =

    31 = 5.16 se redondea a 5

    NIC 6

    Para facilitar la clasificacin de los datos, el Tic se redondea a una cifra ms o menos cerrada.

    4. Lmite inferior

    Usualmente, el lmite inferior del primer intervalo de clase es un mltiplo del tamao del intervalo (tic) igual o menor que el dato ms chico. Si el tic es ms grande que el dato menor, el primer lmite inferior es cero. En este problema el tic es de 5, entonces el primer lmite inferior ser el mayor mltiplo de 5 pero inferior o igual al dato menor, el 15.

    El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande.

    5. Lmite superior

    El lmite superior se calcula con la siguiente frmula LS = LI + TIC 1

    LI LS

    15 19

  • 20 24

    25 29

    30 34

    35 39

    40 44

    45 49

    6. Lmite Superior Real

    Los lmites anteriores son los lmites nominales pero no son los reales. Los lmites reales son el punto medio entre el lmite superior y el lmite inferior del siguiente intervalo.

    LSR = LS + LIsig

    2

    LI LS LSR

    15 19 19.5

    20 24 24.5

    25 29 29.5

    30 34 34.5

    35 39 39.5

    40 44 44.5

    45 49 49.5

  • 7. Marca de clase (x) La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms representativo de los valores del intervalo.

    X = LI + LS

    2

    LI LS LSR X

    15 19 19.5 17

    20 24 24.5 22

    25 29 29.5 27

    30 34 34.5 32

    35 39 39.5 37

    40 44 44.5 42

    45 49 49.5 47

    8. Clasificacin de los datos y conteo de frecuencias

    Clasificar las observaciones en los intervalos. La prctica usual es marcar con una lnea ( / ) que representa una observacin. En el ejemplo la observacin 22 se clasifica en el intervalo 20 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasificados todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de cada intervalo de clase.

    LI LS LSR X cuenta F

    15 19 19.5 17 // 2

    20 24 24.5 22 / 1

  • 25 29 29.5 27 //// 4

    30 34 34.5 32 ///// ///// ///// 15

    35 39 39.5 37 ///// ///// 10

    40 44 44.5 42 ///// 5

    45 49 49.5 47 /// 3

    9. Distribucin de frecuencia relativa

    Se pueden convertir las frecuencias de clase en frecuencias relativas de clase para mostrar los porcentajes de observaciones en cada intervalo de clase. Para convertir una distribucin de frecuencia en una distribucin de frecuencia relativa cada una de las frecuencias de clase se dividen entre el nmero total de observaciones.

    FR = F

    n

    LI LS LSR X cuenta F FR

    15 19 19.5 17 // 2 2/40=.05

    20 24 24.5 22 / 1 1/40=.025

    25 29 29.5 27 //// 4 4/40=.1

    30 34 34.5 32 ///// ///// ///// 15 15/40=.375

    35 39 39.5 37 ///// ///// 10 10/40=.25

    40 44 44.5 42 ///// 5 5/40=.125

    45 49 49.5 47 /// 3 3/40=.075

  • n= 40

    10. Distribuciones de frecuencia acumulada

    Las distribuciones de frecuencia acumulada se usan cuando queremos determinar cuantas observaciones, o que porcentaje de observaciones estn debajo de cierto valor. La distribucin de frecuencia acumulada de cierto intervalo se calcula sumando las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase del intervalo de inters. Si queremos la frecuencia acumulada del intervalo 25 29, sumamos las frecuencias de clase 2 + 1 + 4 = 7.

    La distribucin de frecuencia relativa acumulada de cierto intervalo se calcula dividiendo la frecuencia acumulada entre el nmero total de observaciones.

    FRA = FA

    n

    LI LS LSR X cuenta F FR FA FRA

    15 19 19.5 17 // 2 .05 2 .05

    20 24 24.5 22 / 1 .025 3 .075

    25 29 29.5 27 //// 4 .1 7 .175

    30 34 34.5 32 ///// ///// ///// 15 .375 22 .55

    35 39 39.5 37 ///// ///// 10 .25 32 .8

    40 44 44.5 42 ///// 5 .125 37 .925

    45 49 49.5 47 /// 3 .075 40 1

    n= 40

    Despus de haber revisado la distribucin de frecuencias, te invito a que realices algunas actividades para afianzar los contenidos revisados.

  • Es momento de realizar algunas actividades, al trmino de la temtica.

    Descripcin

    Lecturas y actividades

    1. Retoma el libro que empezamos a revisar la semana pasada que es el Manual de Estadstica (http://ceaam.edu.mx/cont/la1/2/L_01_E_01_Manual_Estadistica.pdf) y realiza la lectura del captulo II. A partir de su revisin, identifica los principales conceptos que ah se manejan y crea un pequeo resumen de cada trmino. Enva tu archivo a la plataforma.

    2. Realiza la lectura Tablas de frecuencia (http://ceaam.edu.mx/cont/la1/2/L_02_E_01_TABLAS_DE_FRECUENCIA.doc).

    3. Realiza la lectura del archivo Captulo II (http://ceaam.edu.mx/cont/la1/2/L_02_E_02_Capitulo_II.pdf) que corresponde al segundo captulo del libro Estadstica bsica con aplicaciones en Excel. A partir de la lectura del mismo, realiza los ejercicios en Excel que vienen indicados a partir de la pgina 23 del archivo.

    Tendrs que copiar la informacin a Excel y crear las frmulas o aplicar las funciones que sean necesarias para obtener los resultados de cada ejercicio planteado. Guardar el archivo con el nombre EJERCICIOS MODULO 2 y enva tu archivo a la plataforma.

  • Autoevaluacin

    1. Qu es la MEDIA y cuantos tipos hay? 2. Qu es la MEDIANA? 3. Qu es la MODA? 4. Qu son los CUARTILES? 5. Qu son los DECILES? 6. Qu son los CENTILES? 7. Cules son los elementos que contiene la tabla de distribucin? 8. Qu es la frecuencia absoluta? 9. Cmo se obtiene la frecuencia absoluta acumulada? 10. Que es la frecuencia relativa? 11. Cmo se obtiene la frecuencia relativa? 12. Diferencia entre frecuencia relativa y frecuencia relativa acumulada?

  • RESUMEN

    Como puedes ver, es simple la elaboracin de la tabla de frecuencia, lo ms importante antes de elaborar la tablas de frecuencia es tener datos y lo realmente difcil seria obtener estos datos, para lo cual existen herramientas como las entrevistas, cuestionarios si es que se trata de investigacin de campo, o actualmente puedes obtener informacin de las bases de datos de las empresas.

    El principal objetivo de la estadstica descriptiva es sintetizar conjuntos de datos mediante tablas o grficos resumen, con el fin de poder identificar el comportamiento caracterstico de un fenmeno y facilitar su anlisis exhaustivo.

    Cualquier investigacin que se emprenda puede conducir a la acumulacin de valores cuantitativos y cuasi-cualitativos correspondientes a las diversas medidas efectuadas. Esta posibilidad, convierte a la estadstica en una herramienta vital para el tratamiento de volmenes de datos mediante tablas resmenes conocidas como "Tablas de Frecuencia". Cuando los datos son agrupados, la interpretacin resulta ser ms sencilla.

    Bibliografa

    Fuenlabrada, Samuel (2004). Probabilidad y Estadstica. Mxico DF: Mc Graw Hill.

    Cazau, Pablo (2007). Fundamentos de estadstica. Buenos Aires: Manual.