MATEMATICA Y ESTADISTICA I
Lic. Carla Rojas del
Carpio
CONCEPTOS BÁSICOS Y ESTADÍSTICA DESCRIPTIVA
Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.
CONCEPTO DE ESTADÍSTICA
Tem
a 1
. Intro
ducció
n
Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.
CONCEPTO DE ESTADÍSTICA
Tem
a 1
. Intro
ducció
n
• Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.
ÁREAS QUE CONFORMAN A LA ESTADÍSTICA
Tem
a 1
. Intro
ducció
n
DESCRIBIRDESCRIBIR
• Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas.
ÁREAS QUE CONFORMAN A LA ESTADÍSTICA
Tem
a 1
. Intro
ducció
n
INFERIRINFERIR
El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee.
Los métodos estadísticos han encontrado aplicación en: Gobierno Negocios Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual.
ÁREAS DE APLICACIÓN DE LA ESTADÍSTICA
Tem
a 1
. Intro
ducció
n
Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.
CONCEPTOS DE POBLACIÓN Y MUESTRA
Tem
a 1
. Intro
ducció
n
Se clasifica en dos categorías: Finita: es aquella que incluye una cantidad limitada contable de
observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.
Tem
a 1
. Intro
ducció
n
Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.
Tem
a 1
. Intro
ducció
n
Muestra: es un conjunto de mediciones u observaciones tomadas
a partir de una población. es un subconjunto de la población.
CONCEPTOS DE POBLACIÓN Y MUESTRA
Tem
a 1
. Intro
ducció
n
Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado.
CONCEPTOS DE POBLACIÓN Y MUESTRA
Variables: son las características o lo que se estudia de cada individuo de la
muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...
Datos: son los valores que toma la variable en cada caso.
TIPOS DE DATOS Y ESCALAS DE MEDIDA
Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej: Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…
TIPOS DE DATOS
Cuantitativos: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos: Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanos
TIPOS DE DATOS
Tipos de variables cuantitativas: Discretas: es aquella que solo puede tomar un número finito o
infinito numerable de valores. Ejemplo: cantidad de hermanos. Continuas: es la variable que puede tomar cualquier valor en una
escala continua. Ejemplo: cantidad de líquido contenido en un recipiente.
ESCALAS DE MEDIDA
ESTADÍSTICA DESCRIPTIVA
Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.
ORGANIZACIÓN DE LOS DATOS
ORGANIZACIÓN DE LOS DATOS
Formas de organizar los datos: Un arreglo: es la forma más sencilla de organizar
los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.
Poco práctica cuando se tiene una gran cantidad de datos.
ORGANIZACIÓN DE LOS DATOS
Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.
Clase Pto.Medio
fi Fi fri FRi
• La Distribución de Frecuencias:– Se recomienda su uso cuando se tienen grandes
cantidades de datos (n).– Su construcción requiere, en primer lugar, la selección
de los límites de los intervalos de clase.– Para definir la cantidad de intervalos de clase (k), se
puede usar:• La regla de Sturges: k = 1 + 3.3log(n)• k = n
ORGANIZACIÓN DE LOS DATOS
La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.
La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una cifra significativa más que los datos en bruto.
ORGANIZACIÓN DE LOS DATOS
Determinar: Punto medio = (Li+Ls)/2. Frecuencia absoluta de la clase (fi).
Frecuencia acumulada de la clase (Fi)
Frecuencia relativa de la clase (fri) o(ni).: fri = fi/n
Frecuencia relativa acumulada de la clase (FRi) o(Ni).
ORGANIZACIÓN DE LOS DATOS
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.•PASOS :
•1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.•2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer. •Es conveniente que el número de intervalos oscile entre 6 y 15.•En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
CONSTRUCCIÓN DE UNA TABLA DE DATOS AGRUPADOS
c i f i F i n i N i
[ 0 , 5 ) 2 . 5 1 1 0 . 0 2 5 0 . 0 2 5
[ 5 , 1 0 ) 7 . 5 1 2 0 . 0 2 5 0 . 0 5 0
[ 1 0 , 1 5 ) 1 2 . 5 3 5 0 . 0 7 5 0 . 1 2 5
[ 1 5 , 2 0 ) 1 7 . 5 3 8 0 . 0 7 5 0 . 2 0 0
[ 2 0 , 2 5 ) 2 2 . 5 3 1 1 0 . 0 7 5 0 . 2 7 7 5
[ 2 5 , 3 0 ) 2 7 . 5 6 1 7 0 . 1 5 0 0 . 4 2 5
[ 3 0 , 3 5 ) 3 2 . 5 7 2 4 0 . 1 7 5 0 . 6 0 0
[ 3 5 , 4 0 ) 3 7 . 5 1 0 3 4 0 . 2 5 0 0 . 8 5 0
[ 4 0 , 4 5 ) 4 2 . 5 4 3 8 0 . 1 0 0 0 . 9 5 0
[ 4 5 , 5 0 ) 4 7 . 5 2 4 0 0 . 0 5 0 1
4 0
1
Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos: Histogramas. Polígono de frecuencias. Ojiva o Polígono de frecuencias acumuladas.
REPRESENTACIÓN GRÁFICA DE LOS DATOS
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Histograma
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Histograma y Polígono de Frecuencias
Ojiva
REPRESENTACIÓN GRÁFICA DE LOS DATOS
c i f i F i
[ 5 0 , 6 0 ) 5 5 8 8
[ 6 0 , 7 0 ) 6 5 1 0 1 8
[ 7 0 , 8 0 ) 7 5 1 6 3 4
[ 8 0 , 9 0 ) 8 5 1 4 4 8
[ 9 0 , 1 0 0 ) 9 5 1 0 5 8
[ 1 0 0 , 1 1 0 ) 1 1 0 5 6 3
[ 1 1 0 , 1 2 0 ) 1 1 5 2 6 5
6 5
EJEMPLOEL PESO DE 65 PERSONAS ADULTAS VIENE DADO POR LA
SIGUIENTE TABLA:
Para datos cualitativos se usan: Curvas Barras Sectores
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Barras
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Barras
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Curvas
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Sectores, torta o circular
Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.
Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.
MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN
Las medidas de tendencia central más importantes son: Media: Aritmética y Aritmética ponderada. Mediana. Moda.
MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN
Es la suma de todas las observaciones dividida entre el número total de observaciones.
Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable.
MEDIA ARITMÉTICA
CÁLCULO DE LA MEDIA ARITMÉTICA
Para datos no agrupados:
n
xX
n
ii
1
n
fmX
k
iii
1
Para datos agrupados:
Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i
k: cantidad de clases
Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.
Divide al conjunto de datos en dos partes iguales.
MEDIANA
Para datos no agrupados: Si n es impar: posición donde se ubica la mediana es igual a
(n+1)/2. Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será
igual al promedio de las dos posiciones centrales.
CÁLCULO DE LA MEDIANA
CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS
Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2.
Cmxf
xFn
LmMdm
m
)(
)(21
1
Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.
Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal, bimodal o multimodal.
Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.
MODA
CÁLCULO DE LA MODA PARA DATOS AGRUPADOS
Para datos no agrupados: es simplemente la observación que más se repite.
Para datos agrupados:
CmLimMo21
1
Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).
RELACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
Cuando los datos son sesgados es mejor emplear la Md
Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.
MEDIDAS DE DISPERSIÓN, VARIACIÓN O VARIABILIDAD.
Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.
MEDIDAS DE DISPERSIÓN, VARIACIÓN O VARIABILIDAD.
Rango.Varianza.Desviación Típica.Coeficiente de variación.
MEDIDAS DE DISPERSIÓN, VARIACIÓN O VARIABILIDAD.
Rango (amplitud o recorrido):Está determinado por los dos valores extremos de
los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.
Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.
MEDIDAS DE DISPERSIÓN: RANGO
Casi no se emplea debido a que depende únicamente de dos valores.
No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.
Notación: R
MEDIDAS DE DISPERSIÓN: RANGO
Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.
Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.
Notación: s2, 2, var(X)
MEDIDAS DE DISPERSIÓN: VARIANZA
MEDIDAS DE DISPERSIÓN: VARIANZA
Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.
21
2
2
1
2
2
xn
xs
n
xxs
n
ii
n
ii
Para datos NO
agrupados:
Para datos agrupados en una distribución de frecuencias:
MEDIDAS DE DISPERSIÓN: VARIANZA PARA DATOS AGRUPADOS
21
2
2
1
2
2
xn
fms
n
fxms
k
iii
k
iii
MEDIDAS DE DISPERSIÓN: DESVIACIÓN TÍPICA
Es la raíz cuadrada de la varianza.Notación: s, .
2ss
MEDIDAS DE DISPERSIÓN: COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.
No tiene dimensiones.Notación: CV
%100x
sCV
EJEMPLOS
MODA PARA DATOS AGRUPADOS
fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
Li es el límite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
MEDIANA PARA DATOS AGRUPADOS
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
100/2 = 50Clase de la mediana: [66, 69)
MEDIA PARA DATOS AGRUPADOS
xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
VARIANZA PARA DATOS AGRUPADOS
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
DESVIACIÓN TÍPICA PARA DATOS AGRUPADOS
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
COEFICIENTE DE VARIACION
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?
Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este proceso se llama tipificación.
Las puntuaciones típicas se representan por z. Las puntuaciones típicas son adimensionales, es decir, son independientes de
las unidades utilizadas. Las puntuaciones típicas se utilizan para comparar las puntuaciones
obtenidas en distintas distribuciones.
PUNTUACIONES TÍPICAS
En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las desviaciones típicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg. ¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?
José es más grueso respecto de su grupo que Ana respecto al suyo.
Recommended