Conseptos Basicos de Estadistica

Embed Size (px)

Citation preview

  • 7/31/2019 Conseptos Basicos de Estadistica

    1/78

    Estadstica: conceptos bsicos y

    definiciones.

    1

  • 7/31/2019 Conseptos Basicos de Estadistica

    2/78

    Conceptos bsicos

    2

  • 7/31/2019 Conseptos Basicos de Estadistica

    3/78

    Conceptos bsicos cont.

    3

  • 7/31/2019 Conseptos Basicos de Estadistica

    4/78

    Conceptos bsicos cont.

    4

  • 7/31/2019 Conseptos Basicos de Estadistica

    5/78

    Conceptos bsicos cont.

    5

  • 7/31/2019 Conseptos Basicos de Estadistica

    6/78

    Conceptos bsicos cont.

    6

  • 7/31/2019 Conseptos Basicos de Estadistica

    7/78

    Definicin de Estadstica

    La estadstica es la Ciencia de la

    7

  • 7/31/2019 Conseptos Basicos de Estadistica

    8/78

    Divisin de la Estadstica

    8

  • 7/31/2019 Conseptos Basicos de Estadistica

    9/78

    Grfica del Anlisis Estadstico

    9

  • 7/31/2019 Conseptos Basicos de Estadistica

    10/78

    Pasos en un estudio estadstico

    10

  • 7/31/2019 Conseptos Basicos de Estadistica

    11/78

    Pasos en un estudio estadstico cont.

    11

  • 7/31/2019 Conseptos Basicos de Estadistica

    12/78

    Tcnicas de Muestreo

    12

  • 7/31/2019 Conseptos Basicos de Estadistica

    13/78

    Tipo de Variables

    13

  • 7/31/2019 Conseptos Basicos de Estadistica

    14/78

    Tipo de variables cont.Ejemplos:

    Es buena idea codificarlas variables como nmeros para poder procesarlascon facilidad en un computador.

    Es conveniente asignar etiquetas a los valores de las variables pararecordar qu significan los cdigos numricos.

    Gnero (Cualitativa : Cdigos arbitrarios)

    1 : Hombre

    2 : MujerRaza (Cualitativa: Cdigos arbitrarios)

    1 : Blanca

    2 : Negra, ...

    Felicidad Ordinal: Respetar un orden al codificar.

    1 : Muy feliz

    2 : Bastante feliz

    3 : No demasiado feliz

    Se pueden asignar cdigos a respuestas especiales como

    0 : No sabe

    99 : No contesta...

    14

  • 7/31/2019 Conseptos Basicos de Estadistica

    15/78

    Ejemplo: Tipo de variables cont.

    15

  • 7/31/2019 Conseptos Basicos de Estadistica

    16/78

    Tabla de Frecuencias

    16

  • 7/31/2019 Conseptos Basicos de Estadistica

    17/78

    Tabla de Frecuencias cont.

    17

    Ordenamos los datos en forma creciente:

    La amplitud total A = 12060

    Nmero de clases: K = 3 01/2 = 5.48. Aprox. 6 clases

    Extensin del intervalo: H = A/ K = 60/6 = 10

    En este caso, entonces, la tabla de frecuencias tendr

    aproximadamente 6 clases de amplitud 10 unidades en

    cada clase.

  • 7/31/2019 Conseptos Basicos de Estadistica

    18/78

    Tabla de Frecuencias cont.

    18

  • 7/31/2019 Conseptos Basicos de Estadistica

    19/78

    Histograma de la distribucin de

    presin diastlica en mm de Hg

    segn las frecuencias absolutas:

    19

  • 7/31/2019 Conseptos Basicos de Estadistica

    20/78

    20

  • 7/31/2019 Conseptos Basicos de Estadistica

    21/78

    Grficos para variables cualitativas cont.

    21

  • 7/31/2019 Conseptos Basicos de Estadistica

    22/78

    22

  • 7/31/2019 Conseptos Basicos de Estadistica

    23/78

    Diagramas Integrales

    23

  • 7/31/2019 Conseptos Basicos de Estadistica

    24/78

    Estadsticos de forma intuitiva

    24

  • 7/31/2019 Conseptos Basicos de Estadistica

    25/78

    Estadsticos

    25

  • 7/31/2019 Conseptos Basicos de Estadistica

    26/78

    26

  • 7/31/2019 Conseptos Basicos de Estadistica

    27/78

    27

  • 7/31/2019 Conseptos Basicos de Estadistica

    28/78

    28

  • 7/31/2019 Conseptos Basicos de Estadistica

    29/78

    29

  • 7/31/2019 Conseptos Basicos de Estadistica

    30/78

    30

  • 7/31/2019 Conseptos Basicos de Estadistica

    31/78

    31

  • 7/31/2019 Conseptos Basicos de Estadistica

    32/78

    32

  • 7/31/2019 Conseptos Basicos de Estadistica

    33/78

    Concepto de Variabilidad

    33

  • 7/31/2019 Conseptos Basicos de Estadistica

    34/78

    Conceptos de Variabilidad cont.

    34

  • 7/31/2019 Conseptos Basicos de Estadistica

    35/78

    Conceptos de Variabilidad cont.

    35

  • 7/31/2019 Conseptos Basicos de Estadistica

    36/78

    Conceptos de Variabilidad cont.

    36

  • 7/31/2019 Conseptos Basicos de Estadistica

    37/78

    Conceptos de Variabilidad cont.

    37

  • 7/31/2019 Conseptos Basicos de Estadistica

    38/78

    Conceptos de Variabilidad cont.

    38

  • 7/31/2019 Conseptos Basicos de Estadistica

    39/78

    Conceptos de Variabilidad cont.

    39

  • 7/31/2019 Conseptos Basicos de Estadistica

    40/78

    Conceptos de Variabilidad cont.

    40

  • 7/31/2019 Conseptos Basicos de Estadistica

    41/78

    Distribucin de Frecuencias

    41

  • 7/31/2019 Conseptos Basicos de Estadistica

    42/78

    Distribucin de Frecuencias cont.

    42

  • 7/31/2019 Conseptos Basicos de Estadistica

    43/78

    Medidas de Resumen de Centralizacin

    43

  • 7/31/2019 Conseptos Basicos de Estadistica

    44/78

    Medidas de Resumen de Centralizacin cont.

    44

  • 7/31/2019 Conseptos Basicos de Estadistica

    45/78

    Medidas de Resumen de Centralizacin cont.

    45

  • 7/31/2019 Conseptos Basicos de Estadistica

    46/78

    Medidas de Resumen de Centralizacin cont.

    46

  • 7/31/2019 Conseptos Basicos de Estadistica

    47/78

    Medidas de Resumen de Centralizacin cont.

    La media es sensible a la presencia de datosextremos.

    La mediana es muy til cuando la distribucin de la

    variable es poco simtrica.

    47

  • 7/31/2019 Conseptos Basicos de Estadistica

    48/78

    Medidas de Resumen de Centralizacin cont.

    48

  • 7/31/2019 Conseptos Basicos de Estadistica

    49/78

    Medidas de Resumen de Dispersin

    49

  • 7/31/2019 Conseptos Basicos de Estadistica

    50/78

    Medidas de Resumen de Dispersin cont.

    50

  • 7/31/2019 Conseptos Basicos de Estadistica

    51/78

    Medidas de Resumen de Dispersin cont.

    51

  • 7/31/2019 Conseptos Basicos de Estadistica

    52/78

    Medidas de Resumen de Dispersin cont.

    52

  • 7/31/2019 Conseptos Basicos de Estadistica

    53/78

    Medidas de Resumen de Dispersin cont.

    53

  • 7/31/2019 Conseptos Basicos de Estadistica

    54/78

    Medidas de Resumen de Dispersin cont.

    54

  • 7/31/2019 Conseptos Basicos de Estadistica

    55/78

    Medidas de Resumen de Dispersin cont.

    55

  • 7/31/2019 Conseptos Basicos de Estadistica

    56/78

    56

  • 7/31/2019 Conseptos Basicos de Estadistica

    57/78

    Medidas de Resumen de Dispersin cont.

    57

  • 7/31/2019 Conseptos Basicos de Estadistica

    58/78

    Medidas basadas en el Orden (Posicin)

    58

  • 7/31/2019 Conseptos Basicos de Estadistica

    59/78

    Estadsticos de Posicin

    59

  • 7/31/2019 Conseptos Basicos de Estadistica

    60/78

    Estadsticos de Posicin cont.

    60

  • 7/31/2019 Conseptos Basicos de Estadistica

    61/78

    Estadsticos de Posicin cont.

    61

  • 7/31/2019 Conseptos Basicos de Estadistica

    62/78

    Estadsticos de Posicin cont.

    Son valores de la variable que dividen a

    la muestra en partes de igual porcentaje.

    Los percentiles separan la muestra engrupos de 1% cada uno (son 99).

    Cuartiles: agrupan 25% c/u (son 3).

    Quintiles: agrupan 20% c/u (son 4).

    Deciles: agrupan 10% c/u (son 9).

    62

  • 7/31/2019 Conseptos Basicos de Estadistica

    63/78

    Estadsticos de Posicin cont.

    Se calculan de la siguiente forma:Ordenar de menor a mayor los n datos.

    Obtener D = n * k /100

    a) Si D es entero, entonces el percentil kcorresponde al valor medio de lasobservaciones ubicadas en las posicionesD y D+1.

    b) Si D no es un entero, el percentil k corresponde a la observacin ubicada en laposicin entera siguiente, es decir, [D+1]

    63

  • 7/31/2019 Conseptos Basicos de Estadistica

    64/78

    Estadsticos de Posicin cont.Ejemplo

    Determinar los percentiles 25 y 60 de lossiguientes datos: 3, 5, 5, 8, 12, 15, 21, 23, 25, 26,29, 35

    P25 D= 12 x 25 /100 = 3

    resulta un entero, por tanto el P25 corresponde alpromedio de las observaciones en las posiciones3 y 4, es decir, P25= (5+8)/2 = 6.5

    P60 D = 12 x 60 / 100 = 7.2Dado que no es un entero, nos movemos alentero siguiente.

    Es decir, P60 = 23 (observacin en la 8 posicin)

    64

  • 7/31/2019 Conseptos Basicos de Estadistica

    65/78

    Estadsticos de Posicin cont.

    65

  • 7/31/2019 Conseptos Basicos de Estadistica

    66/78

    Box-plot (Caja con bigotes)

    66

    Box plot cont

  • 7/31/2019 Conseptos Basicos de Estadistica

    67/78

    Box-plot cont.

    Un grfico asociado a los cuartiles es el box-plot: en un eje se

    ubican los siguientes 5 nmeros extrados de una muestra:mnimo, cuartil 1, cuartil 2, cuartil 3 y mximo.

    67

    Una regla para determinar si un dato es anmalo (outlier) es:

    Si un dato es < Q1 1.5(Q3-Q1)

    Si un dato es > Q3 + 1.5(Q3-Q1)

  • 7/31/2019 Conseptos Basicos de Estadistica

    68/78

    68

  • 7/31/2019 Conseptos Basicos de Estadistica

    69/78

    Box-plot comparacin de grupos

    69

  • 7/31/2019 Conseptos Basicos de Estadistica

    70/78

    Estadsticos de Forma: Asimetra y Curtosis

    Momentos de una distribucin

    Los momentos de una distribucin son medidas obtenidas a partir de

    todos sus datos y de sus frecuencias absolutas. Estas medidas

    caracterizan de tal forma a las distribuciones que si los momentos de

    dos distribuciones son iguales, diremos que las distribuciones son

    iguales. Podemos decir que dos distribuciones son ms semejantescuanto mayor sea el nmero de sus momentos que coinciden.

    Se define el momento de orden h respecto al origen de una

    variable estadstica como:

    70

    Es inmediato observar que, para h=1, a1 es la media de la

    distribucin.

  • 7/31/2019 Conseptos Basicos de Estadistica

    71/78

    Estadsticos de Forma cont.

    Se define el momento central de orden h o momentorespecto a la media aritmtica de orden h como:

    Es inmediato observar que m1 = 0 y que m2 = S2

    Relaciones entre los momentos:

    1.

    2. Los momentos respecto a la media se ven afectados por loscambios de escala, pero no por los cambios de origen. El resto,por ambos.

    71

  • 7/31/2019 Conseptos Basicos de Estadistica

    72/78

    Estadsticos de Forma cont.Forma de una distribucin

    Cuando dos distribuciones coinciden en sus medidas deposicin y dispersin, no tenemos datos analticos para ver sison distintas. Una forma de compararlas es mediante su forma.Bastar con comparar la forma de sus histogramas o diagramasde barras para ver si se distribuyen o no de igual manera.

    Para efectuar este estudio de la forma en una sola variable,hemos de tener como referencia una distribucin modelo.Como convenio, se toma para la comparacin la distribucinnormal de media 0 y varianza 1. En particular, es

    conveniente estudiar si la variable en cuestin est ms omenos apuntada que la Normal. Y si es ms o menos simtricaque sta, para lo que se definen los conceptos de Asimetra yCurtosis, y sus correspondientes formas de medida.

    72

  • 7/31/2019 Conseptos Basicos de Estadistica

    73/78

    La asimetra y su medida

    El objetivo de la medida de la asimetra es, sinnecesidad de dibujar la distribucin defrecuencias, estudiar la deformacin horizontal delos valores de la variable respecto al valor central

    de la media. Las medidas de forma pretendenestudiar la concentracin de la variable hacia unode sus extremos.

    Una distribucin es simtrica cuando a la derecha

    y a la izquierda de la media existe el mismonmero de valores, equidistantes dos a dos de lamedia, y adems con la misma frecuencia.

    73

    La asimetra y su medida cont

  • 7/31/2019 Conseptos Basicos de Estadistica

    74/78

    La asimetra y su medida cont.

    74

    L i t did t

  • 7/31/2019 Conseptos Basicos de Estadistica

    75/78

    La asimetra y su medida cont.Coeficiente de asimetra de Fisher

    En una distribucin simtrica los valores se sitan en torno a

    la media aritmtica de forma simtrica. El coeficiente de

    asimetra de Fisher se basa en la relacin entre las distancias a

    la media y la desviacin tpica.

    75

  • 7/31/2019 Conseptos Basicos de Estadistica

    76/78

    La asimetra y su medida cont.Coeficiente de asimetra de Pearson

    Se basa en el hecho de que en una distribucin simtrica, la

    media coincide con la moda. A partir de este dato se define el

    coeficiente de asimetra de Pearson como:

    76

  • 7/31/2019 Conseptos Basicos de Estadistica

    77/78

    La curtosis y su medida El concepto de curtosis o apuntamiento de una distribucin

    surge al comparar la forma de dicha distribucin con la formade la distribucin Normal. De esta forma, clasificaremos las

    distribuciones segn sean ms o menos apuntadas que la

    distribucin Normal.

    Coeficiente de Curtosis de FischerEl coeficiente de curtosis o apuntamiento de Fischer

    pretende comparar la curva de una distribucin con la curva de

    la variable Normal, en funcin de la cantidad de valores

    extremos e la distribucin. Basndose en el dato de que en unadistribucin normal se verifica que:

    77

  • 7/31/2019 Conseptos Basicos de Estadistica

    78/78

    La curtosis y su medida cont.

    Se define el coeficiente de curtosis de Fisher como:

    Si g2 = 0, la distribucin es Mesocrtica: Al igual que en la

    asimetra es bastante difcil encontrar un coeficiente de curtosis

    de cero, por lo que se suelen aceptar los valores cercanos ( 0.5

    aprox.). Si g2 > 0, la distribucin es Leptocrtica

    Si g2 < 0, la distribucin es Platicrtica