Upload
roger-paucar-uscamaita
View
178
Download
0
Tags:
Embed Size (px)
Citation preview
Estadstica General Mg. Mara Vallejos Atalaya
Estadstica General
Mg. Mara Vallejos Atalaya
Estadstica General Mg. Mara Vallejos Atalaya
PRESENTACIN
El mdulo de Estadstica General tiene la naturaleza terico- prctica, pertenece al rea de
Formacin Bsica, en el I ciclo, con un total de 4 horas y 3 crditos. Asimismo, responde a las
exigencias curriculares de los programas acadmicos y de los diseos curriculares de la Facultad de
Ciencias Empresariales y sus respectivas carreras acadmicas profesionales, en el contexto de los
perfiles, las visiones y las misiones institucionales educativas y profesionales.
Tiene el propsito de proporcionar al futuro profesional los conocimientos necesarios de la estadstica,
que le permitir investigar y resolver problemas con el quehacer de su carrera profesional. El mundo
actual que vivimos, ha provocado incertidumbre en las personas que tienen que tomar decisiones en
las diferentes funciones que les toca desempear, ya sea en las instituciones gubernamentales,
comerciales, de negocios pblicos y privados. La estadstica es una herramienta intelectual que ayuda
a tomar decisiones racionales, porque sabemos que El pasado puede evaluarse, el presente puede
ser descrito y el futuro puede ser previsto.
El sistema modular no es sino un encuentro de los alumnos y profesores en espacios diseados y
establecidos previamente, con mucha inteligencia, seleccin adecuada y pertinente de los contenidos,
instrumentos y metodologa, cuyos alcances de autoaprendizajes sern coronados en la grandeza de
los alumnos participantes, especialmente de quienes quedan inmersos en los programas acadmicos a
distancia, cuya dinmica acadmica se ha estandarizado y responde al uso de las tecnologas
modernas. En este sentido, el mdulo ha sido diseado para desarrollarlo en dos fases: una a distancia
y la otra presencial (tutorial) que comprende 10 tutoras presenciales.
Este mdulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1: Conceptos fundamentales y la organizacin de la informacin, Unidad 2: Medidas de resumen: anlisis e interpretacin de los resultados, Unidad 3: Nociones de probabilidad: propiedades, anlisis combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Adems, en el mismo mdulo se encuentra la metodologa, la evaluacin y la bibliografa. Por ejemplo, se trabajar la metodologa activa, adems, se ejercer la evaluacin de acuerdo con los indicadores, criterios y condiciones registrados en el desarrollo de cada unidad. Este mdulo comprende una bibliografa bsica y especializada.
Estadstica General Mg. Mara Vallejos Atalaya
NDICE
UNIDAD I: TEORA ESTADSTICA Sesin N1 CONCEPTOS FUNDAMENTALES Y ORGANIZACIN DE LA INFORMACIN
1.1 Generalidades 1.1.1 Definicin de estadstica 1.1.2. Ramas de la estadstica 1.1.3. Poblacin 1.1.4. Muestra 1.1.5. Unidad estadstica 1.1.6. Dato estadstico 1.1.7. Parmetro 1.1.8. Estadstico o estadgrafo 1.1.9. Variable estadstica
Sesin N 2 ETAPAS DEL MTODO ESTADSTICO
2.1. Etapas del mtodo estadstico 2.1.1. Planificacin del estudio 2.1.2. Recoleccin de la informacin
2.1.2.1. Mtodo de recoleccin de la observacin 2.1.2.2. Muestreo 2.1.2.3. Determinacin del tamao de muestra
2.1.3. Presentacin u organizacin de la informacin 2.1.3.1. Revisin y correccin de la informacin recogida 2.1.3.2. Presentacin de la informacin mediante cuadros 2.1.3.3. Presentacin de la informacin mediante grficos
2.1.4. Anlisis e interpretacin de los resultados EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 3 ORGANIZACIN DE LA INFORMACIN: TABLAS Y GRFICOS ESTADSTICOS
3.1. Tablas de frecuencias o distribucin de frecuencias 3.1.1. Distribucin de frecuencias de una variable discreta 2.1.2. Distribucin de frecuencias para datos agrupados
Sesin N 4 REPRESENTACIN DE LA INFORMACIN
4.1. Presentacin de la informacin mediante grficos EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN
UNIDAD II: MEDIDAS ESTADSTICAS
Estadstica General Mg. Mara Vallejos Atalaya
Sesin N5 MEDIDAS DE RESUMEN 5.1. Anlisis e interpretacin de los resultados
5.2. Medidas de tendencia central 5.2.1. La media o promedio aritmtico ( x ) 5.2.1. Mediana (Me) 5.1.3. La moda (Mo)
Sesin N 6 MEDIDAS DE POSICIN
6.1. Medidas de posicin 6.1.1. Cuartiles (Qi ) 6.1.2. Deciles (Di ) 6.1.3. Percentiles (Pi )
EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 7 MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin 7.1.1. Varianza (s2 ) 7.1.2. Desviacin estndar (s ) 7.1.3. Coeficiente de variacin (c.v. % )
Sesin N 8 MEDIDAS DE FORMA
8.1. Medidas de forma. 8.1.1. Asimetra (As) 8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN
UNIDAD III: PROBABILIDAD Sesin N9 PROBABILIDAD
9.1. Introduccin 9.2. Anlisis combinatorio
9.2.1. Factorial de un nmero (!) 9.2.2. Permutaciones 9.2.3 variaciones 9.2.4. Combinaciones 9.2.5. Propiedad
Sesin N 10 ALGUNOS CONCEPTOS BSICOS DE PROBABILIDAD
10.1. Algunos conceptos bsicos de probabilidad 10.1.1. Experimento 10.1.2. Espacio muestral
Estadstica General Mg. Mara Vallejos Atalaya
10.1.3. Suceso o evento
10.1.4. Operaciones con eventos 10.1.5. Eventos mutuamente excluyentes
10.2. Probabilidad de un evento EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 11
PROBABILIDAD CONDICIONAL
11.1. Probabilidad condicional 11.2. Regla de la multiplicacin de eventos 11.4. Teorema de bayes
EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN
UNIDAD IV: PROBABILIDAD Y DISTRIBUCIN Sesin N12 PROBABILIDAD BSICA
12.1. Las distribuciones de probabilidades bsicas 12.2. Las variables aleatorias 12.3. Las distribuciones de probabilidad
12.3.1. La distribucin binomial 12.3.1.1.1. Propiedades de una distribucin binomial 12.3.1.1.2. Uso de tablas de la distribucin binomial 12.3.1.1.3. Media y desviacin estndar de una distribucin binomial
12.3.2. La distribucin de poisson 12.3.2.1. La frmula de poisson 12.3.2.2. Uso de tablas de la distribucin acumulada de poisson
EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 13 DISTRIBUCIN NORMAL
13.1. Distribucin normal 13.1.1. Uso de tablas de distribucin acumulada normal estndar
EJERCICIOS PROPUESTOS EVALUACIN AUTOEVALUACIN
UNIDAD V: DISTRIBUCIONES DE MUESTREO Sesin N14 DISTRIBUCIONES MUESTRALES
14.1. Distribuciones muestrales 14.2. Muestreo 14.3. Etapas del muestreo 14.4. Las distribuciones muestrales de probabilidad
Estadstica General Mg. Mara Vallejos Atalaya
14.5. Distribuciones de muestreo de estadsticas 14.6. Distribucin muestral de la media
Sesin N 15 DISTRIBUCIN MUESTRAL DE UNA PROPORCIN
15.1. Distribucin muestral de una proporcin 15.2. Distribucin muestral de la diferencia de dos medias
EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN REFERENCIAS BIBLIOGRFICAS APNDICES
Apndice N 1 Nmeros aleatorios Apndice N 2 Tabla de la distribucin acumulada binomial Apndice N 3 Distribucin de poisson - trminos acumulativos Apndice N 4 Distribucin acumulativa normal
Mg. Mara Vallejos Atalaya
15
SUMILLA
La asignatura de Estadstica General tiene la naturaleza terico- prctico, pertenece al rea de
Formacin Bsica, con cuatro horas, tres crditos, corresponde al I ciclo de las Carreras Acadmico
Profesional de Administracin y Contabilidad. Pretende proporcionar los conocimientos necesarios de
la estadstica, que le permitir investigar, analizar y resolver problemas con el quehacer de su carrera
profesional, cuyo contenido son: conceptos fundamentales y la organizacin de la informacin, medidas
de resumen: anlisis e interpretacin de los resultados, nociones de probabilidad, distribuciones de
probabilidad y distribuciones muestrales.
Mg. Mara Vallejos Atalaya
16
UNIDAD I: TEORA ESTADSTICA Sesin N1: Conceptos fundamentales y organizacin de la informacin Sesin N2: Etapas del Mtodo Estadstico Sesin N3: Organizacin de la informacin: tablas y grficos estadsticos Sesin N4: Representacin de la Organizacin
Mg. Mara Vallejos Atalaya
17
CONCEPTUAL PROCEDIMENTAL ACTITUDINAL
Reconoce los diferentes
conceptos fundamentales y
construye tablas y grficos de informacin
estadstica.
Reconocen y delimitan la poblacin, muestra y variables en estudio, y
adems utilizan tablas y grficos adecuados.
Analizan e interpretan los resultados obtenidos en
las tablas y grficos estadsticos.
COMPETENCIAS
Mg. Mara Vallejos Atalaya
16
Sesin N 1
CONCEPTOS FUNDAMENTALES Y ORGANIZACIN DE LA INFORMACIN
1.1 GENERALIDADES
1.1.1 Definicin de estadstica
La estadstica es una ciencia que nos proporciona un conjunto de mtodos y tcnicas para la
recoleccin, clasificacin, presentacin, anlisis e interpretacin de los datos, con la finalidad de
realizar una toma de decisin ms efectiva.
1.1.2. Ramas de la estadstica
Estadstica descriptiva
Consiste en recolectar, clasificar, presentar y describir los datos vlidos nicamente para la poblacin
objeto de estudio, utilizando tablas, grficos y algunas medidas de resumen. No se efectan inferencias
para un grupo mayor.
Estadstica inferencial
Se emplea para generalizar conclusiones vlidas para una poblacin a partir de datos obtenidos de
una muestra extrada de dicha poblacin.
1.1.3. Poblacin
Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una caracterstica
comn, que son objetos de estudio. Se representa con la letra N.
La poblacin se define de acuerdo a la caracterstica, unidad estadstica y extensin del problema
objeto de estudio.
Ejemplo:
1. Las edades de los estudiantes de la UPeU.
2. Los errores que presentan las facturas del supermercado La Unin.
Respecto a la caracterstica objeto de estudio se puede distinguir:
a) Poblacin objeto. Considerada como el conjunto de elementos que son objeto de estudio.
Ejemplo.
1. Conjunto de los alumnos de la UPeU.
2. Conjunto de facturas del supermercado La Unin.
b) Poblacin objetivo. Considerada como el conjunto de observaciones, medidas de la
caracterstica que es de inters para el estudio de la poblacin objeto.
Ejemplo.
1. Conjunto de edades.
2. Conjunto de errores.
La poblacin de acuerdo al nmero de elementos que la forman puede ser finita o infinita.
Poblacin finita: Es aquella que tiene un nmero limitado de elementos.
Ejemplo:
Mg. Mara Vallejos Atalaya
17
1. Ventas efectuadas durante un ao en una tienda determinada.
2. Edades de los alumnos de la UPeU.
Poblacin infinita: Es aquella que tiene un nmero indeterminado de elementos. No se refiere a que
no se puede contar, sino que es imposible ubicar a todos los elementos de la poblacin.
Ejemplo:
1. Los sntomas de los enfermos tuberculosos de Lima.
2. Evasin de impuestos de las empresas adscritas al RUC.
1.1.4. Muestra
Es un subconjunto o parte de la poblacin. Se examina una muestra cuando no es posible examinar
una poblacin, ya sea por factores econmicos, disponibilidad de personal o tiempo.
La muestra debe cumplir dos requisitos bsicos: Debe ser representativa y adecuada.
Es representativa cuando contiene todos los sectores o aspectos de la poblacin en la misma
proporcin en que se hallan en la totalidad del universo. La representatividad asegura la calidad de la
muestra.
Es adecuada cuando el tamao de la muestra tiene una magnitud suficiente que permita confiar en la
estabilidad de las caractersticas presentes en la muestra. La adecuacin asegura la confiabilidad de la
muestra.
1.1.5. Unidad estadstica
Es el elemento que pertenece a la poblacin objeto de estudio. Dicho elemento contiene las
caractersticas, atributos que el individuo o fenmeno puede poseer. Ejemplo:
1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad
estadstica son los productos terminados.
2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas
clientes, la unidad estadstica son las facturas por cobrar.
1.1.6. Dato estadstico
Son nmeros o medidas que han sido recopilados como resultado de observaciones que pueden ser
comparados, analizados e interpretados. Ejemplo:
1. Si la caracterstica de estudio es la variable X: edad de un grupo de 5 estudiantes. El conjunto de
datos estadsticos seran los siguientes:
x1 = 17, x2 = 18, x3 = 21, x4 = 22, x5 = 19
2. Si la caracterstica de estudio es la variable X: n de errores ubicados en 5 facturas. El conjunto de
datos estadsticos seran los siguientes:
x1 = 2, x2 = 5 , x3 = 0, x4 = 4, x5 = 2
1.1.7. Parmetro
Es una medida de resumen que describe alguna caracterstica de toda la poblacin objeto de estudio. Para determinar el valor del parmetro se requiere informacin de toda la poblacin.
Mg. Mara Vallejos Atalaya
18
Las ms usadas son:
i) Media poblacional ()
ii) Varianza poblacional (2)
iii) Desviacin estndar poblacional () iv) Proporcin poblacional (P)
1.1.8. Estadstico o estadgrafo
Es una medida de resumen que describe alguna caracterstica de la muestra.
Las ms usadas son:
i) Media Muestral ( x ) ii) Varianza muestral (s
2)
iii) Desviacin estndar muestral (s) iv) Proporcin muestral (p)
1.1.9. Variable estadstica
Es una caracterstica de la poblacin que interesa al investigador y que toma diferentes valores.
Se denota con las letras: X, Y, Z, etc.
Ejemplo:
1. Edad 2. Profesin
3. Ingreso familiar 4. Estado Civil
5. Estatura 6. Nivel socioeconmico
Las variables se pueden clasificar de la siguiente manera:
a. Variables cualitativas
Son aquellas caractersticas que no se expresan cuantitativamente, constituidas por atributos.
Ejemplo:
- Lugar de procedencia (norte, centro sur, oriente)
- Estado civil (soltero, casado, viudo, divorciado, conviviente).
Estas variables a su vez pueden clasificarse segn la escala de medicin en:
i) Variable cualitativa nominal
Es aquella que no lleva ninguna ordenacin en sus posibles modalidades (datos estadsticos).
Ejemplo:
- Estado civil: soltero, casado, viudo divorciado, conviviente (en estas clasificaciones no hay
ordenacin jerrquica, si quisiramos forzar la ordenacin y pondramos al soltero en primer lugar,
quin ira segundo, el casado o el conviviente y luego el viudo o el divorciado).
- Filiacin religiosa: catlico, adventista, mormn,
ii) Variable cualitativa ordinal
Es aquella que busca ordenar sus casos en trminos del grado que posee una determinada
caracterstica.
Ejemplo:
- Nivel socio-econmico: alto, medio, bajo
- Rendimiento: excelente, bueno regular malo, psimo.
b. Variables cuantitativas
Mg. Mara Vallejos Atalaya
19
Es aquella cuyos datos estadsticos son numricos y se obtiene como resultado de mediciones o
conteos.
Ejemplo:
- Sueldos: 800, 1500, 935, 450, - Notas: 12, 19, 16, 08, 10,
Las variables cuantitativas segn la escala de medicin pueden ser:
i) Variable cuantitativa de intervalo
Es aquella que se presenta en intervalos y no necesariamente empieza del cero racional.
Ejemplo:
- Temperatura corporal: 36, 37, 38 (una persona no puede tener 0 de temperatura, porque estara
muerta).
- Peso: 20kg, 35kg, 58kg.
Todos los signos vitales son variables cuantitativas de intervalo.
ii) Variable cuantitativa de razn
Es aquella que necesariamente empieza del cero racional.
Ejemplo:
- Notas: 0, 1, 2, 3, , 20 (empieza desde cero) - Edad: 0, 1, 2,
Las variables cuantitativas segn su naturaleza pueden ser:
i) Variable discreta
Son aquellas que toman valores numricos aislados y no pueden tomar ningn valor entre dos
nmeros consecutivos fijados (slo asume nmeros enteros).
Ejemplo:
- N de hijos: 0, 1, 2, 3, (no puede existir 2.5 porque sera ilgico pensar en 2 hijos y medio) - N de facturas que presentan errores: 0, 1, 2, 3,
ii) Variable continua Son aquellas que pueden tomar infinitos valores entre dos nmeros, por muy prximos que los fijemos,
es decir, se presentan valores enteros as como decimales. Ejemplo:
- Peso: 62.55 kg, 72.40 kg, 56.35 kg,...
- Talla: 1.50 mt, 1.65 mt, 1.85 mt,
Mg. Mara Vallejos Atalaya
20
Sesin N 2
ETAPAS DEL MTODO ESTADSTICO
2.1. ETAPAS DEL MTODO ESTADSTICO
De acuerdo con el orden de aplicaciones de la estadstica a un problema determinado, los mtodos
estadsticos se dividen en cuatro etapas:
1. Planificacin del estudio.
2. Recoleccin de la informacin.
3. Presentacin u organizacin de la informacin.
4. Anlisis e interpretacin de los resultados.
2.1.1. Planificacin del estudio
Estudia los detalles concernientes a la recoleccin, clasificacin y anlisis de la informacin. En base a
lo cual se definirn caractersticas de la poblacin o se negarn o confirmarn una hiptesis de trabajo.
En esta etapa se pueden considerar los siguientes aspectos:
- Planteamiento del problema.
- Bsqueda y evaluacin de la informacin existente.
- Formulacin de hiptesis.
- Verificacin de la hiptesis.
- Anlisis y presentacin de los resultados.
2.1.2. Recoleccin de la informacin
Los principales puntos que deben considerarse al recoger la informacin son: - Los errores que puedan cometerse en la recoleccin de los datos y la manera de controlarlos.
- Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la informacin.
- Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms
convenientes para su eleccin.
- El diseo de los formularios que servirn para registrar la informacin que se recoja.
2.1.2.1. Mtodo de recoleccin de la observacin
a. Directa.- Cuando los datos son recolectados directamente de la fuente de origen. sta puede ser mediante la observacin o el interrogatorio. b. Indirecta.- Cuando los datos provienen de datos recogidos por otros individuos en este caso se habla de fuentes secundarias.
En cuanto al tiempo, la recoleccin de datos puede clasificarse en: Continuas: Cuando son registradas a medida que ocurren. Ejemplo:
Mg. Mara Vallejos Atalaya
21
Registro civil de hechos vitales (nacimientos, defunciones y casamientos). Peridicas: Cuando est hecho en determinados intervalos de tiempo (forma cclica). Ejemplo: Censos hechos en el Per cada 10 aos. Ocasionales: Cuando se efecta en cualquier poca. Ejemplo: Estudios de investigacin realizados por algn investigador.
2.1.2.2. Muestreo
Es la tcnica mediante la cual se obtiene la muestra representativa y adecuada.
VENTAJAS Y LIMITACIONES DEL MUESTREO
a. Permite conocer con relativa aproximacin determinada caracterstica de una poblacin de gran
tamao, dentro de un costo razonable y en menor tiempo.
b. Permite mayor exactitud de los resultados, puesto que los factores artificiales de variacin pueden
controlarse.
c. Cuando la poblacin es infinita o muy grande, entonces, el estudio slo podr realizarse a travs de
una muestra.
d. Cuando se trata de ensayos destructivos o no recuperables, necesariamente se tendr que utilizar
una muestra.
e. Una limitacin de la muestra, es que, por buena que pueda ser la muestra y los cuidados puestos
en ella, siempre existe el sesgo debido a factores aleatorios. Dicho riesgo debe ser establecido a
priori por el investigador de modo que se tenga suficiente garanta de la muestra seleccionada.
2.1.2.3. Determinacin del tamao de muestra
Se determina el tamao de muestra utilizando la frmula siguiente, para una muestra sacada de una
poblacin finita cuya fuente es Arkin y Colton.
21 1N
nN k
NOTAS
Donde:
n = tamao de la muestra (nmero de elementos de la muestra)
N = tamao de la poblacin (nmero de elementos de la poblacin)
k = error de muestreo.
Ejemplo:
Seleccionar el tamao de la muestra para la poblacin que est constituida por 1500 estudiantes de la
UPeU, utilizando un error de muestreo del 25% y 5%.
Solucin:
si: k = 25%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
25/100 = 0.25
2
150015.84 16
1500 1 0.25 1n alumnos
Mg. Mara Vallejos Atalaya
22
si: k = 5%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
5/100 = 0.05.
2
1500315.96 316
1500 1 0.05 1n alumnos
2.1.3. Presentacin u organizacin de la informacin
Se consideran los tres pasos siguientes:
1. Revisin y correccin de la informacin recogida.
2. Presentacin de la informacin mediante cuadros.
3. Presentacin de la informacin mediante grficos.
2.1.3.1. Revisin y correccin de la informacin recogida
Se debe revisar y corregir:
a) La escritura.
b) Las respuestas inconsistentes.
c) Las respuestas incompletas.
d) Las unidades en las cifras son diferentes.
2.1.3.2. Presentacin de la informacin mediante cuadros
Despus de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos.
2.1.3.3. Presentacin de la informacin mediante grficos
Los grficos ms usados son:
a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo
2.1.4. Anlisis e interpretacin de los resultados
Para el anlisis e interpretacin de los resultados nos basamos en los cuadros y grficos, y en las
medidas de resumen de la serie de datos.
EJERCICIOS PROPUESTOS
1. Indique cules de los trminos u operaciones siguientes se relacionan con una muestra o con una
poblacin:
a) grupo de medidas llamados parmetros b) uso de inferencia estadstica c) hacer un censo
d) juzgar la calidad de un embarque de fruta inspeccionando varios de los bultos incluidos en el
Mg. Mara Vallejos Atalaya
23
embarque.
2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Poblacin (P):
a) Nmero de estudiantes egresados del Instituto YI en el ao 2004 b) Estudio de personas con proceso judicial por trfico de drogas en el ao 2000 c) Nmeros de nios nacidos vivos en el hospital X d) Estudio del 25% de pacientes con tuberculosis del distrito DF
3. Elabore una lista de 10 variables. Luego:
a. Identifique la poblacin objeto. b. Identifique la poblacin objetivo. c. Determine la unidad estadstica. d. Mencione algunos datos estadsticos.
4. Clasificar las siguientes variables en cualitativas (nominal y ordinal) y cuantitativas (discreta y
continua).
a. rendimiento acadmico b. velocidad de lectura c. peso contenido en un paquete de cereales d. categora de docente e. nmero de artculos defectuosos producidos f. nmero de unidades de un artculo en existencia g. grado de desnutricin h. asistencia a los cultos devocionales i. patrn conductual j. cultura organizacional k. tipo de alimentacin l. nmero de hermanos m. grado de instruccin n. estado civil.
5. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes caractersticas:
a) Profesin b) Ao de nacimiento c) Nacionalidad d) Grado de instruccin e) ingreso mensual familiar promedio f) Nmero de telfono g) Grado de instruccin h) Nmero de hijos
6. Utilizando la frmula determine el tamao de la muestra, considerando los datos que se mencionan a continuacin.
a). N = 1 500 k = 3% b) N = 2 000 k = 10% c) N = 5 000 k = 2% d) N = 500 k = 10% e) N = 1 000 k = 5%
7. En el siguiente enunciado identifique: poblacin, muestra, unidad estadstica, parmetro,
estadstico, variable(s), tipo de variable(s) y d 2 ejemplos de dato estadstico.
Con la finalidad de mejorar el servicio de la Biblioteca de la UPeU" se decidi realizar un estudio de investigacin, para lo cual se seleccion aleatoriamente a 45 estudiantes usuarios de la biblioteca obtenindose los siguientes resultados:
- En promedio un alumno dedica 1 hora a la lectura en sala.
Mg. Mara Vallejos Atalaya
24
- El 80% afirma que la atencin es buena. - El 10% de los usuarios son recin ingresantes a la UPeU. - En promedio un alumno se lleva 1.5 libros a su casa.
8. Identifique en cada caso: unidad elemental, variable, tipo de variable
a) consumo mensual de electricidad b) opinin acerca de la gestin de un ministro c) peso de nios de 5 aos d) estado civil e) nmero de artculos defectuosos producidos por las mquinas de una fbrica f) nacionalidad de personas que asisten a un congreso.
Mg. Mara Vallejos Atalaya
28
Autoevaluacin
CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:
a) ( ) Una muestra es representativa si sta contiene todas las
caractersticas de la muestra. b) ( ) La variable es una caracterstica que asume diferentes valores. c) ( ) Para que una poblacin est bien definida, debe contener la
caracterstica, unidad estadstica y extensin. d) ( ) Las ramas de la estadstica son: estadstica descriptiva e inferencial. e) ( ) Las variables cualitativas son aquellas que son numricas y se
obtiene como resultado del conteo
PROCEDIMENTAL
2. Los mtodos de recoleccin de la informacin son: directa e indirecta. Cul
es la diferencia entre ambas?
3. Dadas las siguientes variables, colocar en la tabla en el lugar donde le
corresponde de acuerdo a su naturaleza y escala de medicin.
a. Estudios diarios e. Grado de instruccin b. Lugar de procedencia f. Sueldos c. Velocidad de lectura g. Gastos d. Idiomas h. Rendimiento i. Estado civil j. Edad k. Estatura l. Categora de docente
Variable cualitativa Variable cuantitativa
Nominal Ordinal Discreta Continua
4. Utilizando la frmula determine el tamao de la muestra, considerando los
datos que se mencionan a continuacin.
a) N = 500 k = 10% b) N = 1 000 k = 5% c) N = 1 500 k = 3% d) N = 2 000 k = 10%
ACTITUDINAL
5. Considerando los conocimientos adquiridos en esta tutora identificar las
clases de variables estadstica, su naturaleza, y de esta manera poder realizar un estudio estadstico.
Mg. Mara Vallejos Atalaya
29
Sesin N 3
ORGANIZACIN DE LA INFORMACIN: TABLAS Y GRFICOS ESTADSTICOS
3.1. TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS
Una distribucin de frecuencias (o tabla de distribucin de frecuencias) es una representacin de una
serie de datos. En ella se muestra cmo se distribuyen los valores de la variable estadstica junto a sus
frecuencias correspondientes a cada uno de ellos.
En estas tablas de distribucin de frecuencias, como producto de la operacin de tabulacin (conteo),
se observa cuantos elementos (frecuencia o repeticin) hay en cada categora, valor o intervalo de la
variable.
Luego de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos. A continuacin se presenta algunos
conceptos y procedimientos comunes para la presentacin de cuadros o tablas.
Frecuencia absoluta simple ( if ): Se llama al nmero de veces que aparece repetido dicho valor, en
un conjunto de valores realizadas. La suma de todas las frecuencias es igual al total n de datos observados.
Se denota mediante: if
Propiedad: nffffm
i
im 1
21 ...
Frecuencia absoluta acumulada (Fi): Es igual a la suma de las frecuencias absolutas simples
inferiores o iguales a las frecuencias acumuladas que se desea encontrar.
Se denota mediante: iF
Propiedad:
qfF 1
212 ffF
. . .
mm fffF ...21
Frecuencia relativa simple ( ih ): Es el cociente entre la frecuencia absoluta simple de su fila y el nmero total de observaciones realizadas (n). La suma de todas las frecuencias relativas es igual a 1.
Su frmula es: n
fh ii
Se denota mediante: ih
Mg. Mara Vallejos Atalaya
30
Propiedad: 1...1
21
m
i
im hhhh
Frecuencia relativa acumulada ( iH ): Se llama al cociente entre la frecuencia absoluta acumulada de su fila y el nmero de observaciones realizadas (n).
Su frmula es: n
FH ii
Se denota mediante: iH
Propiedad:
qhH 1
212 hhH
. . .
mm hhfH ...21
Para presentacin de la informacin mediante cuadros o tablas, es necesario construir la tabla de
distribucin de frecuencias. La cual puede ser:
3.1.1. Distribucin de frecuencias de una variable discreta
Una distribucin de frecuencias es un arreglo de los valores observados x1,...xm de una variable X con
sus respectivas frecuencias, en una tabla de la forma:
Valores
de X
fi Fi hi Hi
x1 x2
.
.
.
xk
f1 f2
.
.
.
Fm
F1 F2
.
.
.
F m= n
h1 h2
.
.
.
Hm
H1 H2
.
.
.
Hm = 1
Total fi=n hi=1
Ejemplo:
Dadas las edades de 12 estudiantes de la UPeU, construir la tabla de distribucin de frecuencias.
EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.
Solucin
EDAD fi Fi hi Hi
18
19
20
23
25
3
1
4
2
2
3
4
8
10
12
0.25
0.08
0.33
0.17
0.17
0.25
0.33
0.66
0.83
1.00
Total 12 1.00
La suma de las frecuencias relativas simples (hi) siempre debe ser igual a uno, en caso de error de
redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dgito a cualquier nmero para
conseguir la suma de 1.
f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 4.
Mg. Mara Vallejos Atalaya
31
F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 10.
h3: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al nmero 0.33. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza
multiplicando el nmero por 100, as 0.33x100 = 33%.
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.83. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando el nmero por 100, as 0.83x100 = 83% Interpretacin:
f3: Existen 4 alumnos que tienen 20 aos de edad. F4: Existen 10 alumnos cuyas edades varan de 18 a 23 aos. h3: El 33% de los alumnos que tienen 20 aos de edad. H4: El 83% de los alumnos tienen edades que varan de 18 a 23 aos. Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas interpretan desde el principio hasta su fila.
Observacin:
Cuando se realiza una observacin en una muestra o en una poblacin, se puede presentar los
siguientes casos: Que se hayan hecho pocas observaciones y por lo tanto, la variable estadstica tome pocos
valores.
Que se hayan hecho muchas observaciones y sin embargo, la variable estadstica toma muy pocos
valores diferentes.
Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.
(*) Los dos primeros casos caern dentro del estudio de variable discreta.
(*) El tercer caso se agrupar los valores de la variable en intervalos adecuadamente para no perder
mucha informacin.
2.1.2. Distribucin de frecuencias para datos agrupados
Es una tabla en donde los datos originales se clasifican en intervalos de clase.
Para la elaboracin de esta tabla se debe tener en cuenta las definiciones siguientes:
- Intervalos o lmites de clase: se identifica por tener su lmite superior y su lmite inferior. Los
extremos de los intervalos no se repiten.
Ejemplo:
15-19 LCI=15 y LCS=19
20-24
25-29
- Amplitud intervlica (c): Llamado tambin ancha de clase, es la cantidad de datos que estn
comprendidos en un intervalo de clase.
- Marca de clase (Xi): Es el punto medio del intervalo de clase:
2i
LCI LCSX
Mg. Mara Vallejos Atalaya
32
Ejemplo:
La marca de clase para el primer intervalo ser:
15 1917
2iX
REGLA GENERAL PARA LA CONSTRUCCIN DE UNA DISTRIBUCIN DE FRECUENCIAS DE
UNA VARIABLE CONTINUA AGRUPADA EN INTERVALOS
Dado n valores de una variable cuantitativa X continua, o discreta con ms de 20 valores distintos, uno de los mtodos para construir la distribucin de frecuencias es:
1) Determinar el Rango: R El rango de variacin de los datos se define por:
mnmx XXR 2) Determinar el Nmero de intervalos: k Utilizando la regla de Sturges:
1 3.322log( )k n
n: Nmero total de datos. Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor. Ejemplo:
Si 6.32k entonces, 7k (Nmero de intervalos igual a 7). Si 6.84k entonces, 7k (Nmero de intervalos igual a 7). 3) Determinar la Amplitud del intervalo: c La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.
Rc
k
4) Determinar los extremos de los intervalos
Ejemplo:
Los siguientes datos son puntajes del cociente de inteligencia (CI) de 50 alumnos de la UPeU. Con
base en estos puntajes, preparar la tabla de distribucin de frecuencias.
PUNTAJES DEL COCIENTE DE INTELIGENCIA (CI)
DE 50 ESTUDIANTES DE LA UPeU
91 104 113 125 101
114 105 101 89 126
118 100 111 125 109
119 95 106 120 129
89 113 118 127 129
128 107 89 122 89
114 106 105 115 98
112 103 92 125 107
97 104 105 95 91
106 93 89 100 115
Mg. Mara Vallejos Atalaya
33
1) Determinar el Rango: R El rango de variacin de los datos se define por:
mnmx XXR 2) Determinar el Nmero de intervalos: k Utilizando la regla de Sturges:
1 3.322log( )k n
n: Nmero total de datos. Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor. Ejemplo:
Si 6.32k entonces, 7k (Nmero de intervalos igual a 7). Si 6.84k entonces, 7k (Nmero de intervalos igual a 7). 3) Determinar la Amplitud del intervalo: c La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.
Rc
k
4) Determinar los extremos de los intervalos
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmite de
clase
Yi fi Fi hi Hi
88 94 94 100 100 106 106 112 112 118 118 124 124 130
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
0.18
0.12
0.22
0.1
0.16
0.06
0.16
0.18
0.3
0.52
0.62
0.78
0.84
1.00
50 1.00
f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 11. F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 31. h3: Indica la relativa absoluta simple de la tercera fila y corresponde al nmero 0.22. Para interpretar se
debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando al nmero por 100, as 0.22x100 = 22% .
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.62. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando al nmero por 100, as 0.62x100 = 62%
Interpretacin: f3: Existen 11 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 100 a 106 puntos.
Mg. Mara Vallejos Atalaya
34
F4: Existen 31 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que vara de 106 a 112 puntos
h3: El 20% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
100 a 106 puntos H4: El 62% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
106 a 112 puntos Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas interpretan la variable desde el principio hasta su fila.
CUIDADOS EN LA PRESENTACIN DE CUADROS ESTADSTICOS
A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante cuadros.
1. N de cuadro
2. Ttulo: Debe responder las siguientes preguntas:
a. Qu informacin contiene el cuerpo del cuadro?
Ej. Cociente de inteligencia de 50 alumnos
b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima
c. Cundo fue tomada la informacin?
Ej. ...Enero, 1995
3. Los encabezados: Corresponde a la identificacin de la variable y las frecuencias.
4. Columna matriz: corresponde a las categoras de clasificacin de la variable.
5. Cuerpo del cuadro: Corresponde a la informacin numrica, generalmente frecuencias absolutas y
relativas.
6. Fuente: Sealar el medio de informacin que condujo al conjunto de datos.
Ej. Test aplicado por los investigadores
7. Notas: son colocadas para esclarecimiento.
8. Comentarios: sirve para aclarar minucias en relacin a cada celda.
Para nuestro ejemplo visto anteriormente el cuadro ser:
CUADRO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA, 2004
COCIENTE DE
INTELIGENCIA
N DE
ALUMNOS
%
88 94
94 100
100 106
106 112
112 118
118 124
124 130
9
6
11
5
8
3
8
18
12
22
10
16
6
16
TOTAL 50 100
Fuente: Test aplicado por los investigadores.
Mg. Mara Vallejos Atalaya
35
Sesin N 4
REPRESENTACIN DE LA INFORMACIN 4.1. PRESENTACIN DE LA INFORMACIN MEDIANTE GRFICOS
Los grficos ms usados son:
a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo
a. Histograma de frecuencias
Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de clase,
mediante una serie de intervalos continuos.
Se usa:
Cuando se tiene una variable cuantitativa continua
Se construye:
1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).
2. Se levanta cada intervalo a la altura de la frecuencia absoluta simple o relativa simple.
Ejemplo:
Considere el ejemplo de tabla de distribucin de frecuencia para datos agrupados del Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Mg. Mara Vallejos Atalaya
36
b. Polgono de frecuencias
Se usa:
Cuando se tiene una variable cuantitativa continua y econmica.
Se construye:
1. Se ubica en el eje x la marca de clase y se considera el punto medio,
2. Se levanta el punto de la marca de clase a la altura de la frecuencia absoluta simple o relativa
simple,
3. Luego de marcar los puntos, unirlos,
4. Finalmente, unir los extremos al eje de las abscisas.
Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
c. Polgono de frecuencias acumuladas u ojivas
Se usa:
Cuando la frecuencia acumulada es de inters.
Se construye:
1. Se ubica en el eje x la marca de clase.
2. Se levanta el punto del extremo superior de cada lmite de intervalo de clase a la altura de la
frecuencia absoluta acumulada o relativa acumulada.
3. Luego de marcar los puntos, unirlos
4. Finalmente, unir los extremos al eje de las abscisas.
Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU
10
9
8
7
6
5
4
3
2
1
91 97 103 109 115 121 127
9
6
11
5 8
3
8
fi
x
Mg. Mara Vallejos Atalaya
37
d. Barras
Se representa mediante una serie de rectngulos separados
Se usa:
Para representar variables cualitativas.
Se construye:
1. Se ubica en el eje x las categoras de la variable, utilizando intervalos y separando
aproximadamente la mitad del intervalo entre una categora y otra.
2. Se levanta cada intervalo de la categora que corresponde a la variable, a la altura de la frecuencia
absoluta simple o relativa,
Ejemplo:
Facultad N de alumnos
1. Ciencias Contables y Administrativas
2. Teologa
3. Ciencias de la Salud
4. Educacin y Ciencias Humanas
5. Ingeniera
500
200
250
250
300
Total 1500
e. Bastones
Tiene la forma de alfileres.
Se usa:
50
45
40
35
30
25
20
15
10
5
88 94 100 106 112 118 124 130
9
15
26
31
39
42
50
fi
x
50
0 45
0 40
0 35
0 30
0 25
0 20
0 15
0 10
0 50
1 2 3 4 5
50
0
20
0
25
0
30
0
fi
x
25
0
Mg. Mara Vallejos Atalaya
38
Para representar una variable cuantitativa discreta.
Se construye:
1. Se ubica en el eje x los valores de la variable, separando equitativamente entre uno y otro valor,
2. Se levanta utilizando una lnea recta para cada valor de la variable, a la altura de la frecuencia
absoluta simple o relativa y se termina con un punto, en forma de alfiler.
Ejemplo:
No de Hijos (xi) 0 1 2 3 4 5
N de familias (fi) 3 7 12 20 15 5
NOTAS
f. Sectores
Se representa mediante un crculo particionado.
Se usa:
Para representar una variable cualitativa cuyo principal inters es conocer su frecuencia relativa.
Se construye:
1. Se particiona a una circunferencia equitativamente, considerando que sta constituye el 100%,
2. Se efecta la particin, segn la frecuencia relativa simple lo considere y se ubican las categoras
de la variable en cada particin.
Ejemplo:
Rubro hi %
Diezmo
Vivienda
Alimentacin
Vestido
Educacin
Recreacin
Otros
10
20
30
10
20
5
5
Total 100
20
15
10
5
1 2 3 4 5
7
12
20
5
fi
x
15
3
ALIMENTACIN 30%
EDUCACIN
20%
RECREAC. 5%
DIEZMO 10%
VESTIDO 10%
OTROS 5%
VIVIENDA 20%
Mg. Mara Vallejos Atalaya
39
g. Series de tiempo
Son curvas idnticas al del polgono de frecuencias pero sus extremos no tocan el eje de las abscisas.
Se usa:
Cuando la variable de inters es el tiempo.
Ejemplo:
N DE ALUMNOS INGRESANTES A LA UPeU DE TRES
COLEGIOS DIFERENTES 1991-1995
AOS N DE ALUMNOS INGRESANTES
COLEGIO 1 COLEGIO 2 COLEGIO 3
1991
1992
1993
1994
1995
10
15
20
25
35
20
25
20
25
25
15
20
25
20
25
CUIDADOS EN LA PRESENTACIN DE GRFICOS ESTADSTICOS
A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante grficos.
1. N de grfico
2. Ttulo: Debe responder las siguientes preguntas:
a. Qu informacin contiene el cuerpo del cuadro?
Ej. Cociente de inteligencia de 50 alumnos
b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima
c. Cundo fue tomada la informacin?
Ej. ...Setiembre, 1994
3. Representacin grfica (sealar escalas).
4. Leyenda (si fuere necesario).
5. Fuente.
6. Nota (en caso de ser necesario).
0
5
10
15
20
25
30
35
40
1991 1992 1993 1994 1995
COLEGIO 1
COLEGIO 2
COLEGIO 3
X
AOS
fi
Mg. Mara Vallejos Atalaya
40
Ejemplo:
La representacin grfica para el ejemplo de datos agrupados de los datos del Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
GRFICO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA,
2001
Fuente: Test aplicado por los investigadores.
EJERCICIOS PROPUESTOS 1. En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas: B, R, R, B, R, A, A, B, B, A B, A, A, R, B, A, B, R, B, A
a) Construir la distribucin de frecuencias b) Graficar la distribucin
2. La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias:
Ingresos fi Fi hi
160 170
170 180
180 190
190 200
200 210
48 60 0,125 0,075
a) Determinar el nmero de familias que ganan menos de 200 nuevos soles
3. Para cada uno de los siguientes ejercicios construir:
a) La tabla de distribucin de frecuencias
b) El grfico adecuado
c) Interpretacin
3.1. Los siguientes datos proporcionan las remuneraciones de 50 obreros.
730 470 672 820 670 610 800 670
600 700 650 700 570 850 590 700
Mg. Mara Vallejos Atalaya
41
570 730 770 580 609 700 574 578
730 663 569 720 860 766 456 258
378 930 848 860 748 777 640 560
730 640 708 461 685 630 720 840
650 740
3.2. Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en
cm)
151 152 154 155 159 159 160 161 161 161 161 162 163 163 164 165 166 165 166 166 166 166 166 167 167 167 167 168 168 168 168 168 168 168 168 168 168 169 169 169 169 169 169 169 169 170 170 170 170 170 170 170 171 171 171 172 172 172 173 173 173 173 174 174 174 175 175 175 176 176 176 176 176 177 177 177 177 178 178 178 179 179 180 180 180 181 181 181 181 182 182 182 183 184 185 186 187 188 189 190
3.3 El gerente de una compaa registra el nmero de cierto trabajo, completados por los
empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25
y en salones diferentes.
En el saln A, el gerente registra el siguiente nmero de unidades completadas por da:
21 22 20 15 25 30 28
29 28 30 24 29 27 34
38 24 35 36 31 41 32
43 44 53 50
En el saln B los datos son los siguientes:
16 21 13 36 18 24 32
16 18 20 28 25 33 26
30 26 20 35 45 59 32
31 30 40 30
a) Combinar todos los puntajes y obtener la distribucin de frecuencias con tamao de clase
k=10.
b) Obtener la distribucin de frecuencias por cada saln y realice la grfica adecuada.
4. Se tiene la siguiente tabla de frecuencias relativas de 300 empleados segn su edad.
EDADES hi
19-21
22-24
25-27
28-30
31-33
0.15
0.25
0.40
0.10
0.10
a) Cuntos empleados tienen edades entre 22 y 30 aos?
b) Qu porcentaje de empleados tienen 25 aos o ms?
c) Qu porcentaje de empleados tienen 24 aos o menos?
d) Una empresa que se dedica a preparar dietas, proyecta lanzar al mercado una dieta rigurosa.
Los empleados de una compaa se presentaron como voluntarios para dicha promocin. Se
realiz un muestreo con 80 empleados elegidos aleatoriamente. Los resultados del chequeo
de los pesos (en Kg), fueron los siguientes:
80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
76.9 77.4 67.9 63.7 49.9 46.4 68.8 67.3 72.3 75.8
Mg. Mara Vallejos Atalaya
42
88.3 94.6 57.3 87.3 74.3 73.2 90.4 76.3 52.7 71.7
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3
a) Elaborar la distribucin de frecuencias
b) Cuntos empleados tienen pesos entre 45 y 60 kg?
c) Qu porcentaje de empleados tienen pesos mayores que 75.5 Kg?
Mg. Mara Vallejos Atalaya
42
Autoevaluacin
CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:
a) ( ) Una tabla estadstica representa a la informacin en forma organizada.
b) ( ) La marca de clase es el punto medio de los intervalos de clases.
c) ( ) F3 indica la frecuencia acumulada relativa simple de la tercera fila.
d) ( ) La suma de las frecuencias relativas simples debe ser igual a uno.
e) ( ) El histograma de frecuencia se utiliza para una distribucin de frecuencias
agrupadas en intervalos de clase.
PROCEDIMENTAL
2. A continuacin se presentan las notas de 50 alumnos:
60
65
71
47
80
53
41
39
94
94
85
74
35
54
61
77
55
60
98
88
33
57
81
68
41
45
78
76
66
89
52
50
91
48
66
65
35
55
69
73
77
64
73
85
42
84
74
59
67
65
Se pide:
a) Determinar el rango.
b) Nmero de clases o filas.
c) Amplitud de las clases o filas.
d) Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.
Interpretar por lo menos 2 de cada fila.
3. Al investigar el nivel socioeconmico en los valores: Bajo (B), medio (M), alto (A), 20
familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B
Construir la distribucin de frecuencia y trazar su grfica.
4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran
ciudad, siendo stos los siguientes: 73% en sueldos, honorarios profesionales
mdicos y bonificaciones a los empleados; 13% en suministros, equipo mdico y
quirrgico; 8% en mantenimiento, alimentacin y energa; y 6% en costos
administrativos. ACTITUDINAL
5. Considerando los conocimientos adquiridos en la primera unidad, qu aconsejaras
a un empresario que necesita tomar decisiones acertadas para el buen
funcionamiento de su negocio?
Mg. Mara Vallejos Atalaya
43
UNIDAD II: MEDIDAS ESTADSTICAS Sesin N5: Medidas de resumen Sesin N6: Medidas de posicin Sesin N7: Medidas de dispersin Sesin N8: Medidas de forma
Mg. Mara Vallejos Atalaya
44
CONCEPTUAL PROCEDIMENTAL ACTITUDINAL
Reconoce los conceptos de las medidas de resumen, como las de tendencia central, de posicin, de dispersin y de forma, de una serie de datos.
Calcular las diversas medidas de resumen para una serie de datos.
Identifican y reconocen qu medidas de resumen son adecuadas para el anlisis de una serie de datos.
COMPETENCIAS
Mg. Mara Vallejos Atalaya
67
Sesin N 5
MEDIDAS DE RESUMEN
5.1. Anlisis e interpretacin de los resultados
Se estudi los cuadros y grficos estadsticos en la unidad anterior como formas para ordenar y
describir un conjunto de datos para tomar decisiones. Sin embargo, el anlisis resulta incompleto, para
esto se utiliza ciertos indicadores.
Estos indicadores llamados medidas de resumen o ESTADGRAFOS permiten hallar un solo valor
numrico, el mismo que representa a toda la poblacin o muestra en estudio.
Los estadgrafos o medidas de resumen ms importante son:
De tendencia central: media, mediana y la moda.
De posicin: cuartiles, deciles y percentiles.
De dispersin: varianza, desviacin estndar, y coeficiente de variacin.
De forma: asimetra y el coeficiente de kurtosis.
5.2. MEDIDAS DE TENDENCIA CENTRAL
Son estadsticos que permiten hallar el valor numrico que indica el "centro" de un conjunto de datos;
sealando la caracterstica que destaca en la informacin.
5.2.1. La media o promedio aritmtico ( x )
Es la ms estable y se obtiene de acuerdo a lo siguiente:
a) Media aritmtica para datos simples (en serie):
Proceso: Sumar todos los valores de la variable y dividir entre el nmero de datos que se han sumado.
_ x
nx
b) Media aritmtica para datos agrupados (en tablas):
Proceso: Sumar todos los valores de la variable o marca de clase multiplicados por la frecuencia
absoluta simple y dividir entre el nmero de datos o la suma de las frecuencias absolutas simples.
x fx
f
Ventajas de la media aritmtica:
- Es til cuando los datos estn distribuidos en forma normal o simtrica.
- Es de gran estabilidad porque toma en cuenta todos los datos.
- Nos permite probar parmetros en inferencia estadstica. Desventajas de la media aritmtica:
Mg. Mara Vallejos Atalaya
68
- Puede ser afectado por valores extremos.
- Cuando los datos agrupados tienen clases abiertas en los extremos, no es recomendable calcular
el promedio.
5.2.2. Mediana (Me)
Es el estadstico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se
obtiene de acuerdo a lo siguiente: a) Mediana para datos simples (en serie):
Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie
es par); del conjunto de datos previamente ordenados en forma creciente.
(*) La mediana se utiliza tambin en variables ordinales Ej: Se tiene la siguiente informacin sobre el nmero de alumnos repitentes por aos de estudios de la
carrera de contabilidad en la UPeU.
AOS fi 1
Fi 2
Primero
Segundo
Tercero
Cuarto
Quinto
25
14
6
9
2
25
39
45
54
56
Clase
mediana.
Total 56
Proceso:
1. Se calcula la suma de las frecuencias absolutas simples entre 2 as:
2
n =
5628
2 2
f
2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde
a la frecuencia absoluta acumulada Fi (en este ejemplo corresponde a 39, porque 25 es menor
que 28).
3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observ el
nmero 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.
Me = Segundo.
Interpretacin: La mitad de los estudiantes repitentes lo hacen como mximo hasta segundo ao,
aproximadamente la otra mitad repiten categoras superiores al segundo ao.
b) Mediana para datos agrupados:
Cuando los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la mediana se
encuentra utilizando la siguiente frmula:
1
inf
2i
i
nF
Me L cf
Donde
1 fi : frecuencia absoluta simple
2 Fi : frecuencia absoluta acumulada.
Mg. Mara Vallejos Atalaya
69
infL : Lmite inferior del intervalo que contiene a la mediana
c : Amplitud del intervalo n : Nmero total de datos
1iF : Frecuencia absoluta acumulada anterior a la clase mediana
if : Frecuencia (o frecuencia absoluta) de la clase mediana.
Lugar de la Mediana, Me : 2
n .
Ventajas de la mediana:
- No est afectada por valores extremos, y por lo tanto es ms representativa que el promedio,
cuando las series son poco simtricas.
- Es til cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene lmite
inferior en la primera clase ni lmite superior en la ltima clase).
- Se aplica a variables que pertenecen a la escala ordinal.
5.2.3. La moda (Mo)
Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de una informacin. Se
obtiene de acuerdo a lo siguiente:
a) Moda para datos simples (en serie):
Es el valor que ms se repite en una serie.
(*) Es til cuando la variable en estudio pertenece a la escala nominal.
Ejemplo:
Hallar la moda para la siguiente informacin que consiste en una muestra de 100 consumidores segn
preferencia por tipos de panes Unin.
TIPOS DE
PANES
CONSUMIDORES
(fi)
Integral
Americano
Fibra
Hamburguesa
25
20
40
15
Total 100
Clase modal,
por ser el valor ms frecuente (f =40)
Entonces, la moda ser el valor que corresponde a la categora de la variable, en la clase o fila modal.
Mo = Fibra
Interpretacin:
La mayora de los consumidores de Productos Unin prefiere pan fibra.
b) Moda para datos agrupados:
En este caso la moda se halla mediante la frmula:
21
1
inf cLMo
Donde
infL : Lmite inferior del intervalo que contiene a la moda
Mg. Mara Vallejos Atalaya
70
c : Amplitud del intervalo
con 1 1i if f ; 2 1i if f
Ventajas de la moda:
- No est afectada por valores extremos.
- Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
- Se usa para variables que pertenecen a la escala nominal.
Desventajas de la moda:
- No es representativa a menos que la distribucin contenga un gran nmero de datos y exista
significativa repeticin de alguno de ellos.
- Muchas veces la serie no tiene moda porque ningn valor se repite, en ese caso se dice que la
informacin es unimodal.
- Cuando la serie tiene 2 modas, se dice que la informacin es bimodal, y si tiene ms de 2 modas,
la informacin es multimodal. En estos casos se hace difcil su interpretacin y comparacin, por lo
tanto, no se considera una medida representativa
Ejemplo:
Correspondiente a datos simple (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad :
Xi: 18, 20, 23, 17, 18, 19, 23, 18
Calcular la media, mediana y moda e interpretar sus resultados.
Solucin:
Media
18 20 23 17 18 19 23 18 15619.5 20
8 8
xx
n
Interpretacin
La edad promedio de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
es de 20 aos.
Mediana
Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.
En este caso la serie es par, por lo tanto, se procede del siguiente modo:
1 Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23
2 Se particiona la serie por la mitad
17, 18, 18, 18, 19, 20, 23, 23
Mg. Mara Vallejos Atalaya
71
3 la mediana ser la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.
18 19
18.5 192
Me
Interpretacin:
La mitad de los de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
tiene como mximo 19 aos, aproximadamente la otra mitad tienen ms de 19 aos.
Moda
Es el valor que ms se repite.
As, en nuestra base de datos.
1 Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23
2 Se toma el valor que ms se repite.
En nuestro ejemplo el 18 se repite 3 veces.
Mo = 18
Interpretacin:
La mayora de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas tiene de
20 aos de edad.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la media, mediana y moda para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites de
clases
Xi fi Fi Xi fi Xi 2fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
Mo 11
5
8
3
8
9
15
Me 26
31
39
42
50
819
582
1133
545
920
363
1016
74529
56454
116699
59405
105800
43923
129032
Total 50 5378 585842
Solucin:
La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.
Mg. Mara Vallejos Atalaya
72
La columna de Xi fi : se obtiene multiplicando valor por valor la columna de las marcas de clase denotada por Xi por las frecuencias absolutas simple denotada por fi: As: X1 f1 = 91 x 9 = 819 X2f2 = 97 x 6 = 582 X3 f3 = 103 x 11 = 1133 X7 f7 = 127 x 8 = 1016
Observacin: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).
La clase mediana se ubica con las frecuencias absolutas acumuladas.
La clase modal se ubica con las frecuencias absolutas simples. Media:
819 582 1133 545 920 363 1016
9 6 11 5 8 3 8
5378 107.56 107
50
i i
i
x fx
f
Interpretacin:
El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unin es de
aproximadamente 107 puntos.
Mediana:
Proceso:
1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):
Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)
Analizando, la mediana se encuentra en la 4ta. Clase.
Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.
2
LCSLCIXi
1272
130124
.
.
1032
106100
972
10094
912
9488
7
3
2
1
X
X
X
X
Mg. Mara Vallejos Atalaya
73
En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia acumulada es F4 = 31 y es el
inmediatamente superior a 25.
La cuarta fila es la clase mediana y de all se considera los datos que van a ser reemplazados en la
frmula.
2. Utilizando la frmula:
1
inf
2i
i
nF
Me L cf
Linf : Lmite inferior del intervalo de la clase mediana = 100
n : Nmero total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase mediana = 15
fi : Frecuencia absoluta simple de la clase mediana = 11
c : Amplitud intervlica: 6
La mediana ser:
5015
2100 6
11Me
= 105.45
Interpretacin:
La mitad de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 105 puntos, aproximadamente la otra mitad tienen ms de 105 puntos.
Moda
Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (fi) el mayor valor.
En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f3 = 11,
En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.
2. Utilizando la frmula:
21
1
inf cLMo
hallando:
1 1i if f = 11- 6= 5
2 1i if f = 11-5= 6
Mg. Mara Vallejos Atalaya
74
5100 6
5 6Mo
= 102.72
Interpretacin:
La mayora de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia de
103 puntos.
Mg. Mara Vallejos Atalaya
75
Sesin N 6
MEDIDAS DE POSICIN
6.1. MEDIDAS DE POSICIN
Son estadgrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.
Estas medidas son:
- Cuartiles
- Deciles
- Percentiles
6.1.1. Cuartiles (Qi )
Son estadgrafos que dividen a la informacin en cuatro partes iguales, donde cada uno de ellos es el
25% de la informacin.
Esquemticamente se tiene:
Q1 25% Q2
25% Q3
25%
25%
total 100%
Los cuartiles se calculan con la frmula siguiente:
1
inf
( )
4i
j
i
j nF
Q L cf
Donde:
j : 1,2 3
Linf : Lmite inferior del intervalo de la clase cuartlica.
n : Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica.
fi : Frecuencia absoluta simple de la clase cuartlica.
c : Amplitud intervlica. 6.1.2. Deciles (Di )
Son estadgrafos que dividen a la informacin en diez partes iguales, donde cada uno de ellos es el
10% de la informacin.
Mg. Mara Vallejos Atalaya
76
Esquemticamente se tiene:
D1 10%
10% D9
. . .
10%
10%
Total 100%
Los deciles se calculan con la frmula siguiente:
1
inf
( )
10i
j
i
j nF
D L cf
Donde:
j : 1,2, 3, 9 Linf : Lmite inferior del intervalo de la clase declica.
n : Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase declica.
fi : Frecuencia absoluta simple de la clase declica.
c : Amplitud intervlica.
6.1.3. Percentiles (Pi )
Son estadgrafos que dividen a la informacin en cien partes iguales, donde cada uno de ellos es el 1%
de la informacin.
Esquemticamente se tiene:
P1 1%
1% P99
. . . 1%
1%
total 100%
Los percentiles se calculan con la frmula siguiente:
1
inf
( )
100i
j
i
j nF
P L cf
Donde:
D2
P2
Mg. Mara Vallejos Atalaya
77
j : 1,2, 3, 99 Linf : Lmite inferior del intervalo de la clase percentlica.
n : Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentlica.
fi : Frecuencia absoluta simple de la clase percentlica.
c : Amplitud intervlica.
Observacin:
Generalmente se calculan las medidas de posicin para datos agrupados, pues se tiene una gran
cantidad de informacin.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas)
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA UPeU
Intervalo de clase Xi fi Fi
[88 94> [94 100> [100 106> [106 112> [112 118> [118 124> [124 130>
91 97 103 109 115 121 127
9 6 11 5 8 3 8
9 15 26 31 39 42 50
P10 Q1,D2 Q3,D8 P90
Total 50
Solucin
Cuartil 1 (Q1)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el primer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.
(1)5012.5
4 4
i f
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el
inmediatamente superior a 12.5.
3. La segunda fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en
la frmula.
1
inf
( )
4i
j
i
j nF
Q L cf
Mg. Mara Vallejos Atalaya
78
Linf : Lmite inferior del intervalo de la clase cuartlica = 94
n : nmero total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica = 9
if : Frecuencia absoluta simple de la clase cuartlica = 6
c : amplitud intervlica: = 6
Cuartil 1 ser:
1
(1)509
494 6 97.56
Q
Interpretacin:
El 25% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 98 puntos, aproximadamente el 75% restante tienen ms de 98 puntos.
Cuartil 3 (Q3)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el tercer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.
( ) (3)5037.5
4 4
j n
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.
En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F5 = 39 y es el
inmediatamente superior a 37.5.
3. La quinta fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en la
frmula.
Linf : Lmite inferior del intervalo de la clase cuartlica = 112
n : nmero total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica = 31
if : Frecuencia absoluta simple de la clase cuartlica = 8
c : Amplitud intervlica: = 6
El cuartil 3 ser:
(3)(50)31
43 112 6 116.878
Q
Interpretacin:
El 75% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 117 puntos, aproximadamente el 25% restante tienen ms de 117 puntos.
Mg. Mara Vallejos Atalaya
79
Decil 2 (D2)
Proceso:
1. Se ubica la clase o fila declica (donde se encuentra el segundo decil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu decil se desea encontrar; ya sea el 1, 2, , 9.
( ) (2)5010
10 10
j n
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el
inmediatamente superior a 10.
3. La segunda fila es la clase declica y de all se considera los datos que van a ser reemplazados en
la frmula.
Li : Lmite inferior del intervalo de la clase declica = 94
n : Nmero total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase declica = 9
if : Frecuencia absoluta simple de la clase declica = 6
c : Amplitud intervlica: = 6
El decil 2 ser:
2
(2)(50)9
1094 6 956
D
Interpretacin:
El 20% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 95 puntos, aproximadamente el 80% restante tienen ms de 95 puntos.
Percentil 10 (P10)
Proceso
a. Se ubica la clase o fila percentlica (donde se encuentra el percentil 10), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2, , 99.
( ) (10)505
100 100
j n
b. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.
En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F2 = 9 y es el
inmediatamente superior a 5.
c. La primera fila es la clase percentlica y de all se considera los datos que van a ser remplazados
Mg. Mara Vallejos Atalaya
80
en la frmula.
Li : Lmite inferior del intervalo de la clase percentlica = 88
n : Nmero total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentlica = 0
if : Frecuencia absoluta simple de la clase percentlica = 9
c : Amplitud intervlica: = 6
El percentil 10 ser:
10
(10)(50)0
10088 6 91.39
P
Interpretacin:
El 10% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 91.3 puntos, aproximadamente el 90% restante tienen ms de 91.3 puntos.
EJERCICIOS PROPUESTOS
1) Los datos siguientes corresponden al peso en Kg. de 10 alumnos.
40.8 52.5 49.2 40.8 62.2
52.5 58.0 60.0 40.8 52.5
Calcular:
a) La media, la mediana y la moda.
b) Cul de los 3 indicadores (en (a)) miden con mayor precisin el centro de los datos?
2) El nmero de autos vendidos por cada uno de 10 vendedores de una distribuidora de
automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.
Determine e interprete: a) La media b) La mediana c) La moda
3) La media mnima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestin, el estudiante
fue aprobado?
4) A Continuacin se dan las notas de 50 alumnos.
60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89
Se pide:
Mg. Mara Vallejos Atalaya
81
a) Obtener la distribucin de frecuencias
b) Determinar: la media, mediana y moda
c) Determinar el 3er cuartil, 7mo decil y 55avo percentil.
5) A continuacin tenemos la distribucin del nmero de accidentes por da durante 43 das, en
cierta autopista.
N de accidentes 0 1 2 3 4
N de das 10 15 10 5 3
a) Determinar: la media, mediana y moda
b) Cul es el porcentaje de das en que se tuvo dos o ms accidentes por da?
6) Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151 152 154 155 159 159 160 161 161 161 161 162
163 163 164 165 166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168 168 168 168 168
168 169 169 169 169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172 172 172 173 173
173 173 174 174 174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178 179 179 180 180
180 181 181 181 181 182 182 182 183 184 185 186
187 188 189 190
Calcular las medidas de tendencia central, posicin, dispersin y de forma. Interpretar los
resultados.
7) Obtenga la media y la mediana para cada uno de los siguientes conjuntos de nmeros:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25
a) Para cul de estos conjuntos de datos son iguales la media y la mediana? b) Cul medida es la misma para los 3 conjuntos? c) Cul de estos conjuntos tiene una moda?
8) Los siguientes datos representan el nmero de obreros ausentes en cierta empresa
manufacturera, en 10 das consecutivos de trabajo: 5, 3, 0, 4, 3, 1, 4, 2, 20, 0
a) Encontrar la media, la mediana y la moda. b) Interpretar sus resultados.
9) El siguiente cuadro muestra la distribucin de edades de casos de una cierta enfermedad
reportada durante un ao en una ciudad del estado.
EDAD Nmero de casos
5 - 14 15 - 24 25 - 34 35 - 44 45 - 54 55 - 64
5 10 20 22 13 5
Total 75
a) Determinar e interpretar las medidas de tendencia central: media, mediana, moda. b) Determinar e interpretar las medidas de Posicin: Cuartiles (Q1 y Q3) Deciles (D3 y D4) y
Percentil (P14 y P94).
Mg. Mara Vallejos Atalaya
82
10) En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemtico:
Yi-1 - Yi
fi hi Fi Hi
Yi
42 - 51 51 - 60 60 - 69 69 - 78 78 87 87 - 96
11 0.35 10 0.28 2 0.055 5 0.14 3 0.08 5 0.14
a) Calcular la media aritmtica, mediana y moda e interprete los datos b) Calcular Q1, P90, D9 e interprete c) Graficar el histograma y polgono de frecuencia
Mg. Mara Vallejos Atalaya
83
Autoevaluacin
CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes
enunciados:
a) ( ) La mediana es una medida de tendencia central. b) ( ) La moda indica el valor que se repite con mayor frecuencia. c) ( ) Los cuartiles dividen a la informacin en 10 partes iguales. d) ( ) La media se calcula sumando todos los valores de la variable. e) ( ) Los percentiles dividen la informacin en cien partes iguales.
PROCEDIMENTAL
2. Establezca las diferencias entre las medidas de tendencia central: media,
mediana y moda. 3. El nmero de autos vendidos por cada uno de 10 vendedores de una
distribuidora de automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.
Determine e interprete: a) La media b) La mediana c) La moda
4. La siguiente tabla muestra la distribucin de edades de casos de una cierta
enfermedad informados durante un ao en una provincia.
Edad Nmero de casos
[5 - 15> [15 - 25> [25 - 35> [35 - 45> [45 - 55> [55 - 65>
5 10 20 22 13 5
total 75
a) Calcular la media, la mediana, la moda. Interprete. b) Calcular el Q1, Q3, D2, D5, P8, P10
ACTITUDINAL
5. Para conocer la edad ms frecuente de tus compaeros de clase, qu
medida de tendencia central utilizaras?, qu procedimiento efectuaras para su clculo? y cmo ensearas a tus subordinados para conocer la edad ms frecuente de los que siempre llegan tarde?
Mg. Mara Vallejos Atalaya
84
Sesin N 7
MEDIDAS DE DISPERSIN 7.1. Medidas de dispersin
Son estadgrafos que cuantifican el grado de concentracin o de dispersin de los valores de la
variable en torno a un promedio o valor central de la distribucin. Las medidas de dispersin se
necesitan para dos propsitos bsicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variacin de la misma.
Las principales medidas de dispersin o variabilidad son:
- Varianza
- Desviacin estndar
- Coeficiente de variacin
7.1.1. Varianza (s
2 )
Es una medida que cuantifica el grado de dispersin o de variacin de los valores de una variable
cuantitativa con respecto a su media aritmtica.
Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.
Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmtica; si el resultado es bastante pequeo los datos estarn
bastante cercanos o concentrados alrededor de la media aritmtica.
Se obtiene de acuerdo a lo siguiente:
a) Varianza para datos simples (en serie):
2 2
2( )
1
x n xs
n
Donde:
2x Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores. n = Tamao de la muestra. (nmero de datos).
x = Media para datos simples.
b) Varianza para datos agrupados:
2 2
2( )
1
Y f n Ys
n
Donde:
2Y f = Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple, luego se suman todos los valores.
n = Tamao de la muestra.
Mg. Mara Vallejos Atalaya
85
Y = Media para datos agrupados. Observacin: La varianza es una medida terica; no tiene interpretacin prctica.
7.1.2. Desviacin estndar (s )
Es la raz cuadrada de la varianza. Esta medida tiene interpretacin prctica.
2s s
Es uno de los estadsticos de mayor uso en el cual las unidades de la variable ya no estn elevados al
cuadrado sino estn en unidades originales.
7.1.3. Coeficiente de variacin (c.v. % )
Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As:
100.%x
scv
- El coeficiente de variacin se usa para saber si un conjunto de datos es homogneo o heterogneo
(concentrados o dispersos). Para esto se utiliza el siguiente criterio:
Si C.V. < 0.33 Datos HOMOGNEOS
Si C.V. 0.33 Datos HETEROGNEOS
- El coeficiente de variacin tambin se utiliza para comparar la variabilidad de 2 ms series de
datos que tengan unidades de medidas diferentes (por ejemplo, peso en kgs. y edad en aos). Si C.V.A < C.V.B Los datos de la serie A presentan una menor variabilidad con respecto a los
datos de la serie B
Ejemplo:
Correspondiente a datos simples (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad:
Xi: 18, 20, 23, 17, 18, 19, 23, 18
Calcular la varianza, desviacin estndar y coeficiente de variacin e interpretar sus resultados.
Solucin:
La varianza (s2) :
Proceso:
18 20 23 17 18 19 23 18 156
19.58 8
xx
n
2 2 2 2 2 2 2 2 218 20 23 17 18 19 23 18 3080x
n = 8, pues hay 8 datos.
Mg. Mara Vallejos Atalaya
86
Entonces, la varianza es:
2 2 2
2( ) 3080 8(19.5)
5.431 8 1