20
Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología 1 1 INTRODUCCIÓN. 1.1 Historia de la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadísticas, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594 A.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Embed Size (px)

Citation preview

Page 1: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

1

1 INTRODUCCIÓN.

1.1 Historia de la Estadística.

Desde los comienzos de la civilización han existido formas sencillas de estadísticas, pues ya se

utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de

cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los

babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción

agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos

de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los

libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El

primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de

las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año

2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594

A.C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la

población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se

realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y

Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y

762 respectivamente.

Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un

censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday

Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y

en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the

London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres).

Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en

1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de

mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los

fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir

la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.

En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud

los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve

como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no

consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa

información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las

aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,

utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para

analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias

estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio

estadístico.

Page 2: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

2

1.2 Importancia.

La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si

tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre...

y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones

con un determinado grado de confianza.

Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es

un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los

métodos estadísticos. Sin embargo muchos "investigadores" tendenciosos han cometido abusos con

la estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que

les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o

negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y

erróneos que conducen al rotundo fracaso de sus investigaciones.

Lincoln L. Chao hace referencia a uno de los más estruendosos fracasos, debido a los abusos en la

toma de una muestra:

Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones

presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos

electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8

solamente.

El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores de la

Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y suscripciones a revistas no

configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un

pronóstico confiable con tan sesgada información.

1.3 El papel de la Estadística en las Ciencias Sociales.

En las ciencias sociales se utiliza en la psicología (análisis de los resultados de tests de personalidad

o de inteligencia), en las ciencias políticas (medición de la legitimidad del sistema político), en la

sociología (medición de las diferencias entre estratos sociales), en la educación (comparación de

diversos métodos de enseñanza), en la economía (estimación del crecimiento del P.I.B.), en los

negocios (proyección de ventas), en trabajo social (caracterización de grupos marginados), en la

geografías( descripción de varias características

1.4 Definición.

Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que

se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general,

que la estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos,

permiten al investigador obtener conclusiones útiles sobre ellos.

Page 3: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

3

1.5 División.

El campo de la estadística esta dividido en 2 áreas generales de estudio. La primera es la Estadística

Descriptiva cuyo propósito es tomar una gran cantidad de datos, organizarlos y presentarlos de tal

forma que revelen información oculta o de interés en la realización de un estudio o investigación.

La segunda área es la Estadística Inferencial, que estudia las propiedades de una pequeña muestra de

datos seleccionada de una porción mucho mayor para inferir (a través de las matemáticas) la

naturaleza de dichas propiedades. Al utilizar la Probabilidad, el investigador puede deducir y

algunas veces controlar el error inevitablemente asociado a dichas inferencias.

El propósito fundamental de la estadística es revelar la verdad acerca de las propiedades de los datos

que están siendo estudiados. Este propósito frecuentemente ignorado de tal manera que no existe

manipulación de la información para beneficiar a alguna de las partes.

EJEMPLOS

No. 1

Estas tratando de determinar el porcentaje de tarjetas de circuitos defectuosas en los lotes que se

están produciendo. Las tarjetas son producidas en lotes de 100. Examinas 15 lotes para determinar el

número de tarjetas defectuosas en cada lote y la naturaleza del defecto.

Suponer que para cada uno de los lotes es generada una forma, en la cual se anotan la naturaleza de

los defectos en cada una de las tarjetas defectuosas que hallan sido encontradas. ¿Qué es lo que

deberías de hacer con estas formas?.

No. 2

En el Departamento de Sociología y Trabajo Social fue aplicada a una encuesta, en la cual a cada

estudiante se le preguntaba su sexo, altura, tiempo promedio de descanso, nivel de agrado hacia la

estadística, número de CD’s que poseía, importancia de la música o el ejercicio como pasatiempos,

No. de veces a la semana que hacía ejercicio. ¿Cómo podemos organizar los datos para poder

entenderlos?

1.6 Variables.

Una variable es cualquier característica o atributo que difiere para diferentes sujetos. Por ejemplo, si

el peso de 30 sujetos fuese medido los pesos varían dependiendo del sujeto, por lo cual el peso es

una variable.

1.6.1 Cuantitativas y Cualitativas.

Las variables pueden ser cuantitativas y cualitativas. Las variables cualitativas son algunas veces

llamadas “variables categóricas”, este tipo de variables son medidas a un nivel de medición nominal.

Por otro lado las variables cuantitativas son medidas a un nivel ordinal, por intervalos o proporción

(también denominado de razón). Por ejemplo, si a un sujeto le preguntasen cual es su color favorito,

entonces la variable sería cualitativa. Si el tiempo que le toma responder fuese medido, entonces la

variable sería cuantitativa.

Page 4: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

4

1.6.2 Independientes y Dependientes.

Cuando un experimento es conducido, algunas variables son manipuladas por el investigador y otras

son inherentes al objeto del estudio. Las primeras son denominadas variables independientes,

mientras que las otras son las variables dependientes. Por ejemplo, consideremos un experimento

hipotético sobre el efecto de consumir alcohol en el tiempo de reacción de la persona. Los sujetos

beben ya sea: agua, 1 cerveza, 3 cervezas o 6 cervezas y entonces se mide su tiempo de reacción a

ciertos eventos. En este caso la variable independiente sería el número de cervezas ingeridas (0, 1, 3,

6) y la variable dependiente el tiempo de reacción.

1.6.3 Continuas y Discretas.

Algunas variables (tales como el tiempo de reacción) son medidas en una escala continua. Hay un

número infinito de posibles valores que las variables puedan tomar. Otras variables únicamente

pueden tomar un número limitado de valores. Por ejemplo, si una variable dependiente sólo puede

tomar valores de una escala de 5 puntos (1, 2, 3, 4, 5), tales variables son denominadas variables

discretas.

1.7 Parámetros.

Un parámetro es una cantidad numérica obtenida de algún aspecto de un conjunto de valores. Por

ejemplo la media es una medida de tendencia central. Las letras griegas son utilizadas para designar

los parámetros son raramente conocidos y son usualmente utilizados por los investigadores. En la

siguiente tabla se muestra el símbolo del alfabeto griego junto con el estadístico utilizado para su

obtención de una muestra.

Medida Parámetro Estadístico

Media M Desviación

Estándar

s

Proporción p Correlación

r

1.8 Sumatoria.

La letra griega (sigma) es utilizada para representar la sumatoria. Por ejemplo, en un experimento

se mide el desempeño de 4 sujetos en determinada habilidad, la puntuación del sujeto 1 será

representada como I, la del sujeto 2 como 2 y así sucesivamente. Los puntajes son mostrados en

la siguiente tabla:

Sujeto Puntuación

1 1 7

2 2 6

3 3 5

4 4 8

Page 5: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

5

La forma que representaría la sumatoria de la 4 ’s es:

4

1i

iX

Esta notación se lee como sigue: Sumar los valores de , desde 1 hasta 4 . El índice i de la

anotación indica los valores de que serán sumados. El índice i toma los valores iniciando con el

valor de la derecha del signo “=” (en este caso 1) y continua secuencialmente hasta el valor indicado

en la parte superior de sigma (para este ejemplo 4). Por lo tanto i toma los valores de 1, 2, 3, y 4, por

lo cual los valores de 1, 2, 3, 4 son sumados (7+6+5+8=26).

Para hacer las formulas en forma más general las variables pueden ser utilizadas con la notación

de la sumatoria. Por ejemplo: significa que se deben sumar los valores de . Desde 1 hasta N ,

donde N puede ser cualquier número, aunque N generalmente indica el tamaño de la muestra.

Con frecuencia una formula abreviada de la sumatoria es utilizada. Por ejemplo significa que se

deben sumar todos los valores de

Cuando únicamente un subconjunto de los valores de serán sumados entonces la versión completa

es requerida. De tal manera que la suma de todos los elementos de excepto el primero y el último

(el N’th) debe ser indicada de la siguiente manera:

1

2

N

i

iX La cual debe ser interpretada como la suma de las ’s con i=2 hasta N-1

Algunas formulas requieren que cada número sea elevado al cuadrado antes de ser sumados, como

lo muestra la siguiente formula:

1

2

N

i

IX desarrollando la formula tenemos 72+62+52+82=174.

La versión abreviada es simplemente X2

. Es muy importante hacer notar que existe una gran

diferencia entre elevar los números al cuadrado y después sumarlos, que sumarlos y posteriormente

elevarlos al cuadrado, en este caso el resultado sería (7+6+5+8)2

=676, resultando muy diferente al

174 del ejemplo anterior.

Algunas veces una formula requiere que sea calculada la suma de los productos cruzados. Por

ejemplo, si 3 sujetos fueron examinados dos veces, las calificaciones son asignadas a e Y, como lo

muestra en la siguiente tabla:

Sujeto Y

1 2 3

2 1 6

3 4 5

La suma de los productos cruzados (2x3)+(1x6)+(4x5)=32 puede ser representada de la siguiente

manera

Page 6: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

6

1.8.1 Teoremas Básicos.

3 8

2 3

4 1

(x +Y)=Y

(x +Y)= 11+5+5=21

x =3+2+4=9

Y =8+3+1=12

x + Y =9+12=21

ax=a x (a es una constante)

Si a =2.

ax = (2)(3)+(2)(2)+(2)(4)=18

a x(2)(9)=18

(x-M)2 = x

2-( x)

2/N (N es el número de valores, 3 para este ejemplo, y M es la media

aritmética, también igual a 3).

(x-M)2 =(3-3)

2+(2-3)

2+(4-3)2=2

x2=32+22+42=29

( x)2/N=92/3=27

x2-( x)

2/N=29-27=2

1.9 Niveles de Medición.

La medición de algún atributo es un conjunto de cosas, es el proceso de asignar números u otros

símbolos a las cosas de tal manera que las relaciones de los números o símbolos reflejen las

relaciones de los atributos que están siendo medidos. Una forma particular de asignar números o

símbolos para medir alguna cosa es denominada escala de medición

“Resumiendo la medición es un proceso mediante el cual las cosas se diferencian”.

La medición en las ciencias sociales y en la educación por lo general produce números, pero tales

números están sin algunas de las propiedades matemáticas para la medición de variables como

tiempo, distancia, área, peso y costo. Por ejemplo, la escala de medición para evaluar el CI difiere en

forma significativa de la usada para medir la estatura. Esto es importante debido a que la

interpretación de un valor influye la escala de medición correspondiente.

Generalmente se distinguen cuatro escalas o valores de medición: nominal, ordinal, intervalos y de

razón.

Page 7: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

7

1.9.1 Nominal.

La medición nominal es la forma más rudimentaria de medir. Es el proceso de agrupar unidades

(objetos, personas, etc.) en categorías basándose en uno o más atributos o propiedades observados.

Con las escalas nominales, los números asignados definen cada grupo distinto y sirven meramente

como etiquetas o nombres. La magnitud de los números no reflejan alguna ordenación inherente de

las cosas a las que fueron asignados, más bien sirven solo como códigos de identidad. Las

observaciones no pueden ser ordenadas de pequeño a grande o de menos a más. La única cuestión

comparativa relevante para los datos nominales pertenecen a si dos observaciones son o no de la

misma. Ejemplos de la medición nominal son los partidos políticos, etnia, genero, tipo de escuela

(privada o pública).

1.9.2 Ordinal.

Es cuando las observaciones pueden colocarse en un orden o jerarquía con respecto a la

característica que se evalúa. La magnitud de los números no es arbitraria, sino que representa el

orden del rango del atributo observado. Se supone un continuo subyacente en los números. Ejemplos

de este nivel de medición son la clase social, lugar sen la clase, concursos de belleza, etc.

1.9.3 Intervalo.

El nivel de intervalo tiene, además de las propiedades de la escala ordinal, la propiedad de que la

distancia entre dos valores es de una magnitud conocida lo cual da a estas escala un mayor grado de

perfección. En la escala de intervalo el punto cero y la unidad de medición son arbitrarios. La razón

entre dos intervalos es siempre independiente del punto cero y de la unidad que se emplea en la

medición. Como ejemplo podemos mencionar: la temperatura, las puntuaciones del IQ y la fecha.

1.9.4 Razón.

Este nivel de medición tiene propiedades de las escalas ordinales y de las escalas de intervalos, pero,

además el cero representa la ausencia de la característica en cuestión (cero absoluto); en

consecuencia, los números pueden compararse como proporciones. Las medidas de longitud para las

cuales se utiliza una regla o una cinta métrica ejemplifican una medición de razón. Si Sue mide 1.52

mts. y Carmen 1.27 mts. Entonces Sue es 119% tan alta como Carmen o Sue es 20% más alta que

Carmen. Además del ejemplo anterior, las medidas de tiempo, distancia, peso, área y costo por lo

general representan escalas de razón.

1.10 Organización de Datos.

1.10.1 Distribuciones de Frecuencia

Es el conteo y agrupación de los datos de acuerdo a un sistema de clasificación previamente

determinado.

Sirven como depositarios de información, con el propósito de efectuar posteriormente el

cálculo de medidas estadísticas.

Tienen como finalidad ayudar en el análisis formal de las interrelaciones entre las variables.

Page 8: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

8

1.10.1.1 Distribuciones de Frecuencia No Agrupada

Tienen la función de mostrar en forma organizada las características más importantes de un

conjunto de valores. La categoría o distribuciones ordinales representan el grado en que está presente una

característica en particular.

El listado de tales categorías o puntajes en las distribuciones de frecuencia simple deben

hacer de modo que refleje ese orden

Elementos: Un listado de todos los valores ordenados de mayor a menor, y la frecuencia de

cada uno de los valores.

Elementos de una Tabla

NNúúmmeerroo ddee llaa ttaabbllaa

TTiittuulloo Nota en el

encabezado

Fuente

Nota al pie

Casillas cabecera

CCoolluummnnaass

RReegglloonneess oo hhiilleerraass

Cabeza de cuadro

Cuerpo de Cuadro

RReennggllóónn ddee ttoottaalleess

Page 9: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

9

Comparación.

PPrrooppoorrcciióónn. Compara el número de casos en una categoría dada con el tamaño total de la

distribución.

PP==ff //NN

PPoorrcceennttaajjee.. Frecuencia de ocurrencia de una categoría por cada 100 casos.

%%==110000**((ff //NN))

RRaazzoonneess.. Comparación directa entre el número de casos que caen dentro de una categoría, con el

número de casos que caen dentro de otra categoría.

RRaazzóónn==ff11 // ff22

TTaassaass. Compara el número de casos reales y el número de casos potenciales

TTaassaa ddee NNaacc..==11000000**((ff CC.. RReeaalleess // ff CC.. PPootteenncciiaalleess))

IInnccrreemmeennttoo PPoorrcceennttuuaall.. Comparación directa entre el número de casos que caen dentro de una

categoría, con el número de casos que caen dentro de otra categoría.

PPrroommeeddiioo ddeell IInnccrreemmeennttoo..

PP11 == VVaalloorr AAccttuuaall

PP00== VVaalloorr AAnntteerriioorr

NN== NNoo.. ddee ppeerriiooddoo

100*%0

01

P

PPI

100*2

*%01

01

nPP

PPPI

Page 10: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

10

1.10.1.2 Distribuciones de Frecuencia Agrupada

Es la condensación de los puntajes separados en un número de categorías o grupos más pequeños,

donde cada uno contenga más de un puntaje

Procedimiento:

Calcular el rango. El rango es la diferencia entre el valor más grande y el valor más

pequeño. (Xmax-Xmin)-

Determinar el número de intervalos de clase. Significa en cuántas categorías o subgrupos

vamos a clasificar o agrupar nuestros datos. Para determinar el número óptimo de intervalos

de clase, en los cuales nuestros datos quedarán perfectamente distribuidos, aplicamos la

Regla de Sturges:

No. Intervalos = 1 + ( 3.322*(log n))

En donde “n” representa el número total de datos u observaciones que tenemos recopilados.

Evidentemente, el número de intervalos debe ser exacto; es decir, un número entero.

Determinar el ancho del intervalo. Dividiendo el rango entre el número deseado de

intervalos. (w=rango/No. Intervalos).

Especificar los límites del intervalo. Cada intervalo debe comenzar con un múltiplo de w, el

cual debe ser menor o igual Xmin.

Calcular los límites reales del intervalo. A los límites inferiores se les resta 0.5 y a los

límites superiores se les suma 0.5.

Determinar el punto medio. X=(limite inferior+limite superior)/2.

Conteo de los valores. Determinar la frecuencia de cada uno de los intervalos.

Determinar la frecuencia acumulada.Determinar el porcentaje de cada intervalo (%). Determinar el porcentaje acumulado (% acumulado).

Construir una distribución de frecuencia acumulada para las siguientes 40 calificaciones de la materia de Estadística I.

61 67 56 64 71 38 61 63

43 58 46 49 50 50 55 47

50 52 51 56 53 54 51 51

39 50 40 41 58 42 40 41

55 42 61 52 42 59 45 56

Page 11: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

11

1.10.2 Representaciones Gráficas

Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para

informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de

información dependerá de la presentación de los datos, siendo la forma gráfica uno de los más

rápidos y eficientes, aunque también uno de los que más pueden ser manipulados o ser

malinterpretados si no se tienen algunas precauciones básicas al realizar las gráficas.

Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de

ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al

presentar la información.

Entonces, mencionaremos algunas consideraciones que conviene tomar en cuenta al momento de

realizar cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz posible

y sin distorsiones:

1. El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las

ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas al

comparar la altura, longitud o posición de las columnas, barras o líneas que representan las

frecuencias.

2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica

deben ser iguales.

3. El tipo de gráfico debe coincidir por sus características con el tipo de información o el

objetivo que se persigue al representarla, de otra manera la representación gráfica se

convierte en un instrumento ineficaz, que produce más confusión que otra cosa, innecesario

o productor de mal interpretaciones. Por ejemplo, si se desea representar la proporción de

población masculina en un país conviene más usar una gráfica de pastel o circular que una

gráfica de barras al compararla contra la población femenina; por un lado se puede apreciar

dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor.

Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente

de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien

delineada, bien coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta

consideraciones de este tipo que tienen que ver más sobre el objetivo de estas herramientas y la

Estadística: la transmisión eficiente de la información.

1.10.2.1 Tipos de gráficos

Para las distribuciones de frecuencias la representación gráfica más común es el histograma. Un

ejemplo es el que se presenta a continuación y que representa el número de "visitas" que ha tenido

este hipertexto de acuerdo a la hora de la visita.

Page 12: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

12

En el eje horizontal (o de las abscisas) se representan los intervalos de los datos, marcándose de

manera continua las fronteras entre cada uno de los éstos. De esta manera, el histograma está

compuesto rectángulos, cuyo número coincide con la cantidad de intervalos considerados, el ancho

de la base de cada uno de esos rectángulos es la misma siempre y coincide con las fronteras de los

intervalos, y la altura corresponde a la frecuencia de cada intervalo.

Es importante observar que resulta difícil utilizar este tipo de representación cuando existen

intervalos abiertos o cuando los intervalos no son iguales entre sí.

Otra observación es la amplitud de los intervalos, que se puede establecer utilizando la regla de

Sturges, pues al cambiarla la presentación visual de un histograma puede variar.

Un tipo de gráfico muy parecido al histograma es la gráfica de columnas. Para este tipo de gráfica,

elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas

equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener

una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas

entre sí.

Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas

escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de

varias observaciones. Esto produce una gráfica con varias series, correspondiendo cada una de ellas

a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente

que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero

distinta de las demás.

El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos de

preparatoria. Las series (cada una de las calificaciones parciales) están coloreadas con diferente

Page 13: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

13

color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con

respecto a los demás. Es interesante observar que la escala horizontal no es continua (es nominal).

Existe la posibilidad, y si los recursos lo permiten, de representar gráficos compuestos de una

manera "tridimensional", es decir, con gráficos que posean no sólo dos ejes, sino tres; y en los que

los rectángulos son sustituidos por prismas de base rectangular (ocasionalmente el software en el

mercado permite utilizar prismas cuya base son polígonos regulares de más de cuatro lados,

pirámides o cilindros). Un ejemplo es el siguiente:

donde se representa el porcentaje del PIB gastado en docencia e investigación por cinco países en el

lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12). Es importante

considerar que este tipo de gráficos puede complicarse mucho, haciendo que la información sea

menos legible.

Page 14: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

14

También es posible realizar gráficas de barras horizontales, los cuales se parecen mucho a las

gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambian y el

eje horizontal queda destinado a las frecuencias y el eje vertical a las clases.

Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida

en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la población de un país

ficticio llamado "Timbuctulandia":

A este tipo de gráficos en particular se le llama pirámide de edades por su forma. Incluso, cuando

se compara la población masculina y femenina por estratos de edades, se estila utiliza el lado

izquierdo para la población de un sexo y el lado derecho para el otro, el resultado es una "pirámide"

casi simétrica (dependerá de la población en particular).

Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe cierta continuidad

entre las observaciones (como por ejemplo el crecimiento poblacional, la evolución del peso o

estatura de una persona a través del tiempo, el desempeño académico de un estudiante a lo largo de

su instrucción escolar, las variaciones presentadas en la medición realizada en algún experimento

cada segundo o minuto) se pueden utilizar las gráficas de líneas, que consisten en una serie de

puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose

consecutivamente con líneas:

Page 15: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

15

Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo

largo de cinco observaciones anuales. Al igual que en el caso de las gráficas de columnas (y de otras

más) es posible presentar varias series de observaciones (en este caso cada serie de observaciones

son los pesos de un individuo).

Otra forma de representación de un uso menos común, y muy parecida a las gráficas de líneas, es el

polígono de frecuencias. La diferencia fundamental entre ambas es que en el polígono de

frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra

después de la última. El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y

lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono.

El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigación durante

el año de 1990 en cinco países (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

El Excel no crea automáticamente polígonos de frecuencias, sino que produce gráficas de líneas. Sin

embargo, es posible arreglárselas para hacerlas.

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar

parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen:

ojiva mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la

aplicación de la técnica es parcial):

1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con

el extremo izquierdo; para la ojiva menor que, con el derecho.

2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.

Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que,

utilizando los datos que se usaron para ejemplificar el histograma:

Page 16: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

16

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre

la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas

(en cuestiones temporales se diría: después de las 4:00 horas). De forma análoga, en la ojiva menor

que la frecuencia que se representa en cada frontera de clase son el número de observaciones

menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la

hora que señala la frontera).

Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o

menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente

ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribución porcentual:

En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una llamada gráfica de

áreas, la cual consiste en rellenas el área que se encuentre debajo de las líneas que resultan de una

gráfica de líneas.

El ejemplo que se presenta es la comparación del total de las especies de las familias del orden

Carnívora y las que están amenazadas, en México, (fuente: Revista "Ciencia y Desarrollo", 1994,

XIX(114):58):

Page 17: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

17

Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con

respecto al total, es decir, cuando se está usando una escala categórica, conviene utilizar una gráfica

llamada de pastel o circular.

Por ejemplo, para ilustrar la matrícula en licenciatura (en México) por áreas de conocimiento en el

año de 1992 se puede usar algo así como sigue (Fuente: ANUIES,1995):

De hecho, si se desea resaltar una de las categorías que se presentan, es válido tomar esa "rebanada"

de la gráfica y separarla de las demás:

Page 18: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

18

Para hacer una gráfica de este tipo en papel.

Hay que tomar algunas precauciones al utilizar este tipo de gráficos. Por un lado, comparar dos

gráficos circulares (por ejemplo, si se quisieran comparar las proporciones de matrículas en

licenciatura por áreas de conocimiento en licenciatura para dos años distintos) resulta muy difícil y,

por tanto, no es muy aconsejable.

Por otro lado, en ocasiones existen categorías con pocas frecuencias (por ejemplo, dos o tres con

frecuencias relativas menores al 1% cada una), haciendo que la gráfica resulte "pesada" y las

etiquetas se encimen. Una posible solución es juntarlas en una sola categoría (por ejemplo, la típica

"otras" o "varias"), pero entonces habría que ponderar si se hace una gráfica extra con dichas

observaciones únicamente, haciendo la anotación pertinente, o simplemente se ignoran por no

resultar significativas.

Actualmente, y mucho en los medios masivos de comunicación, se utilizan gráficos para ilustrar los

datos o los resultados de alguna investigación. Regularmente se utilizan dibujos para representar

dicha información, y el tamaño o el número de estos dibujos dentro de una gráfica queda

determinado por la frecuencia correspondiente. A este tipo de gráfica se le llama pictograma y éstos

son dos ejemplos:

El de la izquierda representa la población de los Estados Unidos (cada hombrecillo representa a dos

millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro sistema solar

Page 19: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

19

tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus

tiene masa menor y Neptuno tiene más 17 veces más masa que la Tierra).

Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de gráficas, las

posteriores sí. Otros programas contemporáneos (como el Corel Draw o el Harvard Graphics) sí

son capaces.

Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas

cosas como correlaciones se puede utilizar una gráfica de dispersión. Por ejemplo, el ejemplo de la

izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias

exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales

entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

La gráfica de la derecha es resultado de comparar el diámetro (en miles de kilómetros) de los

planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centímetro

cúbico). Es interesante observar que los puntos parecen "seguir" una línea imaginaria que se asemeja

a una recta, con excepción de un caso atípico: Mercurio.

Uno de los usos de este tipo de gráficas es precisamente encontrar si las observaciones siguen algún

patrón lineal (una línea de tendencia) o si existen valores atípicos. Para el caso del Excel, el

programa es capaz de graficar las líneas de tendencias que siguen un conjunto de datos.

Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas, en las cuales se

presenta la dispersión de las observaciones de la misma forma que aquéllas, pero se le añade la

posibilidad de visualizar otra variable representada en el tamaño del punto, pues éstos se convierten

en círculos (burbujas) con radios proporcionales a las magnitudes que representan.

Page 20: 1 INTRODUCCIÓN. - estadisticasoctys.freetzi.comestadisticasoctys.freetzi.com/Estadistica1/Estadisticadescriptiva/...... Sociología y Psicología Estadística Descriptiva Aplicada

Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología

20

Este ejemplo compara la distancia que existe en cada uno de los planetas interiores de nuestro

sistema solar al Sol contra el tiempo que necesitan para recorrer sus órbitas, y el tamaño de las

burbujas indica la masa de cada planeta.

Además existen otros tipos de gráficos, cada uno con características particulares que les

proporcionan cierta intencionalidad para su uso, como son las gráficas de radar y las gráficas

polares.