Click here to load reader

2. Organización Datos

  • View
    9

  • Download
    0

Embed Size (px)

DESCRIPTION

123

Text of 2. Organización Datos

  • Anlisis de DatosOrganizacin y representacin de datos

    Luceny Guzmn Acua

    23 de enero de 2015

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 1 / 39

  • Tipos de Datos

    Cuando se analiza una poblacin (o muestra) a cada unidad o elementodentro de sta se le asigna un nombre o un nmero dependiendo delinters que se tenga. A stos le denominaremos datos. Los datos se puedenclasicar de la siguiente manera:

    1 Datos cualitativos: se reere a categoras o atributos que puedenclasicarse de acuerdo con determinado criterio.

    2 Datos cuantitativos: se reeren a informacin numrica (representantodo lo que se puede contar o medir)

    1 Los datos discretos son los obtenidos de un proceso de conteo(asociados al conjunto de los enteros no negativos)

    2 Los datos continuos son los obtenidos de un proceso de medicin(asociados al conjunto de los nmeros reales)

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 2 / 39

  • Tipos de Datos

    Algunos datos numricos se pueden clasicar como cualitativos, porejemplo: los cdigos de estudiantes, grados de escolaridad, telfonos,etc.

    Algunos datos se pueden representar de los dos tipos, por ejemplo: Laestatura, calicacin etc.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 3 / 39

  • Escalas de medicin

    Atendiendo a la relacin entre los nombres o nmeros asignados a loselementos de la poblacin o muestra surgen las escalas de medicin.

    1. Nominal. Se utilizan para datos cualitativos (clasicacin deproductos, tipos de autos, gnero, nmeros telefnicos,cdigos, grados escolares, etc). Caractersticas: no hay unorden particular, no se pueden realizar clculos numricos,las categoras deben ser excluyentes (un elemento no puedeasignrsele ms de una categora) y exhaustivas (todoelemento debe asignrsele una categora).

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 4 / 39

  • Escalas de medicin

    2. Ordinal. Son datos medidos en una escala nominal, pero,ordenada de alguna manera (Calicaciones por letra,clasicacin de productos, grados de escuela, etc). En estaescala la distancia entre o diferencia entre valores no tienesignicado. Caractersticas: tiene sentido establecer unordenamiento, las categoras son excluyentes y exhaustivas,no se pueden realizar clculos numricos.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 5 / 39

  • Escalas de medicin

    3. De intervalo. Son datos medidos en una escala ordinal, perode tipo cuantitativo, la distancia entre valores tiene sentido.Esta escala no siempre tiene un punto cero, que indiqueausencia de medida. (temperatura, puntaje en un examen).Adems no se pueden establecer razones entre valores.Caractersticas: tiene sentido establecer un ordenamiento,las categoras son excluyentes y exhaustivas, se puedenrealizar clculos numricos, no existe un valor que indiqueausencia de la caracterstica medida, se puede establecerdiferencias entre valores.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 6 / 39

  • Escalas de medicin

    4. De razn. son datos medidos en una escala de intervalo,donde el punto cero indica ausencia de medida, se puedenestablecer razones entre valores (Tiempo, peso, dinero, etc).Caractersticas: tiene sentido establecer un ordenamiento,las categoras son excluyentes y exhaustivas, se puedenrealizar clculos numricos, existe el valor que indiqueausencia de la caracterstica medida.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 7 / 39

  • Organizacin de datos

    Los datos se organizan en tablas de frecuencia tambin denominadasdistribuciones de frecuencia, hablaremos de los siguientes tipos de tablas.

    1 No agrupadas: Datos cualitativos y cuantitativos discretos cuando elrango de valores no es muy amplio.

    2 Agrupadas: Datos cuantitativos continuos y discretos cuando el rangode valores es muy amplio.

    3 Acumuladas: Cuantitativos4 Bivariadas: Cualitativos.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 8 / 39

  • Representacin de un conjunto de datos

    La representacin de un conjunto de datos se realiza a partir de grcos.Analizaremos los siguientes:

    1 Diagrama de barras, de puntos, univariados y bivariados, circular(Datos cualitativos y cuantitativos discretos de tablas no agrupadas)

    2 Histograma (datos cuantitativos)3 Polgono (datos cuantitativos)4 Ojiva (datos cuantitativos, tablas acumuladas)5 Diagrama de pareto (datos cualitativos)6 Diagrama de cajas (datos cuantitativos)

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 9 / 39

  • Tabla o distribucin de frecuencias no agrupadas

    Ejemplo 1 (Datos cualitativos)La tabla organizacin datos.xls contiene informacin para un grupo deestudiantes de Anlisis de datos I. Los datos incluidos son: ingeniera a lacual pertenecen, nmero de fallas durante el semestre hasta la semana 9;estado (G: aprobado, R: retirado, P: reprobado).

    1 Construya una tabla de frecuencias completa para la ingeniera a laque pertenecen.

    2 Construya una tabla de frecuencias para el estado.3 Repita el ejemplo 1 sin tener en cuenta los estudiantes retirados.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 10 / 39

  • Tabla o distribucin de frecuencias no agrupadas

    Ejemplo 1 (Datos cualitativos)

    Ingeniera f fr =fn % = 100fr

    IN 15 0;268 26;8CV 15 0;268 26;8MC 10 0;179 17;9EL 5 0;089 8;9ET 8 0;143 14;3ST 3 0;054 5;4Total 56 1 100

    Donde:n : nmero de datos, f : frecuencia absoluta (nmero de veces queaparece un dato), fr : frecuencia relativa, % : porcentaje.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 11 / 39

  • Diagrama de barras

    Ejemplo 1 (Datos cualitativos)

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 12 / 39

  • Diagrama circular

    Ejemplo 1 (Datos cualitativos)

    Ingeniera f ngulo: 360fn % = 100frIN 15 96; 4 26;8CV 15 96; 4 26;8MC 10 64; 3 17;9EL 5 32; 1 8;9ET 8 51; 4 14;3ST 3 19; 3 5;4Total 56 360 100

    Donde:n : nmero de datos, f : frecuencia absoluta (nmero de veces queaparece un dato), % : porcentaje.

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 13 / 39

  • Diagrama circular

    Ejemplo 1 (Datos cualitativos)

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 14 / 39

  • Tabla o distribucin de frecuencias no agrupadas

    Ejemplo 2 (Datos cuantitativos discretos )La tabla organizacin datos.xls contiene informacin para un grupo deestudiantes de Anlisis de datos I. Los datos incluidos son: ingeniera a lacual pertenecen, nmero de fallas durante el semestre hasta la semana 9;estado (G: aprobado, R: retirado, P: reprobado) construya una tabla defrecuencias completa para el nmero de fallas

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 15 / 39

  • Tabla o distribucin de frecuencias no agrupadas

    Ejemplo 2 (Datos cuantitativos discretos )

    # de fallas f fr % # de fallas f fr %0 16 0;286 28;6 10 0 0;000 0;00

    1 3 0;054 5;40 11 0 0;000 0;00

    2 9 0;161 16;1 12 2 0;036 3;60

    3 2 0;036 3;60 13 1 0;018 1;80

    4 1 0;018 1;80 14 0 0;000 0;00

    5 3 0;054 5;40 15 1 0;018 1;80

    6 2 0;036 3;60 16 2 0;036 3;60

    7 3 0;054 5;40 17 1 0;018 1;80

    8 2 0;036 3;60 18 1 0;018 1;80

    9 7 0;125 1;25 Total (n) 56 1 100

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 16 / 39

  • Diagrama de barras

    Ejemplo 2 (Datos cuantitativos discretos )

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 17 / 39

  • Diagrama de puntos

    Ejemplo 2 (Datos cuantitativos discretos )

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 18 / 39

  • Histograma

    Ejemplo 2 (Datos cuantitativos discretos )

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 19 / 39

  • Polgono

    Ejemplo 2 (Datos cuantitativos discretos )

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 20 / 39

  • Tabla o distribucin de frecuencias agrupadas

    Ejemplo 3Se realiz un estudio a un grupo de trabajadores de una empresa paraanalizar su productividad. Se obtuvieron datos acerca del nmero de piezasaceptablesproducidas. Los datos se resumen en la tabla. Construya unatabla de frecuencias.

    21 35 41 46 51 54 57 61 64 69 7722 36 41 47 52 54 57 61 65 71 7724 37 44 48 52 55 58 61 66 71 7729 37 44 48 52 55 58 62 66 73 7932 37 44 48 52 55 58 62 66 73 8033 38 44 49 52 55 58 62 66 73 8134 40 44 50 53 55 59 62 66 74 8134 40 44 50 53 56 60 63 66 75 8335 40 46 51 53 56 60 63 68 75 8435 40 46 51 53 56 61 63 69 76 88

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 21 / 39

  • Tabla o distribucin de frecuencias agrupadas

    Ejemplo 31. Se determina el nmero de clases C a utilizar. Ley deSturges: C = 3; 3 log n+ 1; donde n es el nmero de datos aagrupar (aproximar al entero ms cercano)

    2. Se calcula el rango R; R = Dato mayor Dato menor3. Se determina la precisin (en la prctica la precisin es dadapor el instrumento de medicin), lo cual es quivalente aseguir la regla siguiente:

    # de cifras decimales 0 1 2 3 P 1 0;1 0;01 0;001

    4. Se calcula la amplitud A; A = RC (se acuerda aproximar porarriba, teniendo en cuenta la precisin, es decir, la amplitudtendr tantas cifras decimales como los datos).

    Luceny Guzmn Acua () Anlisis de Datos 23 de enero de 2015 22 / 39

  • Tabla o distribucin de frecuencias agrupadas

    Ejemplo 35. Se calculan lmites tericos (lmites de clase) y lmitesprcticos (fronteras de clase) para las clases. Los de laprimera clase sern:

    Lmite inferior de la primera clase: LIP1 = Dato menor;

    Lmite superior de la primera clase: LSP1 = LIP1 +A PFrontera inferior de la primera clase: FIP1 = LIP1