36
Carrera de Relaciones Laborales Facultad de Derecho – Universidad de la República Estadísticas Laborales – Profas. Mariela Quiñones y Mariana Cabrera INTRODUCCIÓN: CONCEPTOS PREVIOS Objetivos del módulo 1: 1. Presentar la disciplina Estadística como ciencia y como ciencia auxiliar, resaltando su utilidad en los estudios empíricos de las ciencias sociales y en particular en el área de las relaciones laborales. 2. Hacer una lectura global de los contenidos del curso, los alcances y límites del mismo, así como el fundamento de los temas que se van a tratar. 3. Familiarizarse con algunos conceptos básicos de la estadística y la metodología cuya comprensión es fundamental para seguir el curso. 4. Complementario: Repasar o incorporar algunos conocimientos matemáticos necesarios para una mejor comprensión de los contenidos del curso. Conceptos clave del módulo 1: Estadística Estadística descriptiva y Estadística inferencial Estadístico Población y muestra Unidades de análisis Variables, sistema de categorías Matriz de datos y estructura tripartita de los datos Medición Escalas de medición Escala nomina, Escala ordinal Escala interval Escala de razón

Medicion y Escalas e Medicion (1)

Embed Size (px)

Citation preview

Page 1: Medicion y Escalas e Medicion (1)

Carrera de Relaciones Laborales

Facultad de Derecho – Universidad de la RepúblicaEstadísticas Laborales – Profas. Mariela Quiñones y Mariana Cabrera

INTRODUCCIÓN: CONCEPTOS PREVIOS

Objetivos del módulo 1:

1. Presentar la disciplina Estadística como ciencia y como ciencia auxiliar, resaltando su utilidad en los estudios empíricos de las ciencias sociales y en particular en el área de las relaciones laborales.

2. Hacer una lectura global de los contenidos del curso, los alcances y límites del mismo, así como el fundamento de los temas que se van a tratar.

3. Familiarizarse con algunos conceptos básicos de la estadística y la metodología cuya comprensión es fundamental para seguir el curso.

4. Complementario: Repasar o incorporar algunos conocimientos matemáticos necesarios para una mejor comprensión de los contenidos del curso.

Conceptos clave del módulo 1:

EstadísticaEstadística descriptiva y Estadística inferencialEstadísticoPoblación y muestraUnidades de análisisVariables, sistema de categoríasMatriz de datos y estructura tripartita de los datosMediciónEscalas de mediciónEscala nomina,Escala ordinal Escala interval

Escala de razón

Page 2: Medicion y Escalas e Medicion (1)

1.1 INTRODUCCION

Para muchos parece una materia lejana, pero la Estadística y muchas de sus herramientas nos

acompañan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de

ver ejemplos muy familiares y entender algunos términos que escuchamos y manejamos diariamente.

Este primer módulo nos introducirá en el mundo de la estadística, particularmente la estadística

descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los próximos

temas. También repasaremos algunos procedimientos matemáticos que usaremos durante todo el curso..

1.2 LA CIENCIA ESTADISTICA

¿Qué es la ESTADISTICA? Estadística, es algo más que la recolección y publicación (tal cual se ven

en revistas y diarios) de hechos y datos numéricos. Es la aplicación del método científico de análisis de

datos numéricos, con el fin de tomar decisiones racionales.

Estadística será tratada aquí como una Ciencia que trata de la recopilación, presentación, análisis e

interpretación de datos numéricos (estadísticas) con el fin de realizar una toma de decisiones más

efectiva.

Si quieres ver algunas definiciones adicionales, puedes acceder a:Carrasco Arroyo, S (2005): Aproximación a la Estadística desde las Ciencias Sociales.Valencia, España.http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf

Zavrostsky, A: Varias definiciones de la Estadística. Revista de Economía. Facultad de Ingeniería.Universidad de Los Andes, Venezuela.http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf

Su origen en la historia… La estadística científica tal como se entiende actualmente tiene sus

origenes en el SXIX, cada vez más vinculada a la teoría de la probabilidad. Dos puntos de referencia

básicos son los trabajos de F. Galton, fundador de la biometría, y de K. Pearson que sentó las bases de

la estadística moderna.

Sin embargo, los orígenes de las herramientas estadísticas pueden ser rastreados al menos hasta el

antiguo Egipto y más atrás aún. El interés por el registro sistemático sobre la población y los recursos

económicos y la elaboración de instrumentos matemáticos de resumen de la información aparecen desde

la antigüedad vinculados con la administración y la política de los gobiernos.

Si te interesa conocer más sobre la historia de la estadística te recomendamos leer:

Ruiz Muñoz, David (2004):Manual de Estadística. Ediciones Eumed·net. Cap. 1. Historia de la estadística.

2

Page 3: Medicion y Escalas e Medicion (1)

http://www.eumed.net/cursecon/libreria/drm/cap1.pdf

El origen de la palabra… La palabra "estadística" procede del latín statisticum collegium ("consejo de

Estado") y de ella deriva el término italiano statista ("hombre de Estado" o "político"). A su vez, el término

alemán Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de la

constitución política de los principales países y pueblos europeos, asociándolo con el análisis de datos del

Estado, es decir, "la ciencia del Estado" . Sin embargo, recién a partir del siglo XIX el término comienza a

ser utilizado en su acepción moderna.

Papel de la Estadística para las ciencias sociales

Para las ciencias sociales la estadística se ha convertido en una ciencia auxiliar fundamental,

permitiendo:

- Encontrar relaciones y características no previstas en una población, que permiten pensar en

nuevas teorías e hipótesis.

- Resumir los datos y extraer información relevante, esto es de las mediciones observadas

- Ayudar en la búsqueda y evaluación de los modelos y pautas que ofrecen los datos, pero que se

encuentran ocultos por la inherente variabilidad de los mismos.

- Facilitar la comunicación entre los científicos, ya que siempre será más fácil comprender la

referencia a un procedimiento estándar, sin necesidad de mayor detalle.

Estadística Descriptiva y Estadística Inferencial

Para entender el alcance que tiene el presente curso debemos en primer lugar entender los conceptos de

ESTADISTICA DESCRIPTIVA y ESTADISTICA INFERENCIAL o INDUCTIVA.

Estadística Descriptiva: Consiste en un conjunto de instrumentos y temas relacionados con la

descripción de colecciones de observaciones estadísticas, se refiere tanto al total de la población como a

la muestra, y su finalidad es “resumir” un conjunto de datos numéricos.

Estadística Inferencial o Inductiva: Se ocupa de la lógica y el procedimiento para la inferencia y la

inducción de propiedades de una población en bases a resultados obtenidos de una muestra conocida.

¿Porqué es importante esta distinción?

Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido básico

por herramientas de estadística descriptiva.

3

Page 4: Medicion y Escalas e Medicion (1)

Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadística está

dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de

probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.

“Si el único propósito del investigador es describir los resultados de un experimento concreto, los métodos descriptivos pueden considerarse suficientes. No obstante, si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los cuales implican el uso de la teoría de la probabilidad.La probabilidad constituye por sí misma un concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar: los fenómenos aleatorios, que suponen unas ciertas reglas de comportamiento. El nexo que une la teoría de la probabilidad y la estadística es la noción de variable aleatoria, mostrando de esta manera cómo puede emplearse la teoría de la probabilidad para extraer conclusiones precisas acerca de una población sobre la base de una muestra extraída de ella. Muchos de los análisis estadísticos son, de hecho, estudio de las propiedades de una o más variables aleatorias.”

Rodriguez, Mayte: Estadística aplicada a las Ciencias Sociales II.Licenciatura de Sociología. Curso 2001/02.Universidad

autónoma de Madrid

http://www.uam.es/personal_pdi/ciencias/mayter/docencia/sociolog/apuntes.pdf

Con las herramientas estadísticas que vamos a trabajar durante este curso vamos a describir el

comportamiento de conjuntos de individuos, instituciones, países, etc. pero no vamos a utilizarlas para

generalizar los resultados a una población mayor. Esto lo veremos con detenimiento al hablar del

concepto de POBLACION y MUESTRA.

Sin embargo, veremos que estos instrumentos y métodos nos habilitan a realizar análisis sumamente

útiles, a partir de la descripción de nuestra población. Y, por otra parte, como plantea el texto de Mayte

Rodríguez, constituyen el punto de partida para los procedimientos de la Estadística Inferencial.

Por ejemplo:

Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las

características de todos los empleados, con lo cual no necesitamos “inferir” ninguno de los

resultados. Alcanza con generar formas de resumen de la información para describir el

comportamiento de toda la plantilla de trabajadores. Es una aplicación de la estadística

descriptiva.

Pero, si la empresa fuera muy grande, podríamos optar por encuestar o averiguar la información

sólo de un subconjunto de esos trabajadores. En este caso, tendríamos que recurrir a la teoría

4

Page 5: Medicion y Escalas e Medicion (1)

de muestreo para tener mecanismos que me “garanticen” una elección al azar de los empleados

entrevistar y a la teoría de la probabilidad para a partir de los resultados obtenidos para ese

grupo, generalizar a toda la plantilla de trabajadores. En este caso, entonces, estaríamos frente

a procedimientos propios de la Estadística Inferencial.

1.3 ¿ CUÁLES INSTRUMENTOS VEREMOS EN EL CURSO?

Por una parte, en lo que queda de este módulo veremos algunos conceptos fundamentales que nos

permiten comenzar a trabajar con las herramientas estadísticas. Entender qué es una población y una

unidad y cómo caracterizo a esas unidades a través de variables, que tienen un sistema de

categorías y una escala de medición. A partir de estos conceptos podemos elaborar la idea de

matriz de datos originales, que contiene toda la información que tengo sobre la población.

En los módulos 1, 2, 3 y 4 aprenderemos cómo describir una población en base a una de sus

características (descripción univariada), sea a través de tablas, gráficos y medidas resumen

(estadísticos).

En el módulo 5, veremos como describir una población en base a dos características simultáneamente.

Los últimos 3 módulos incluyen herramientas más específicas, que pueden ser de mucha utilidad para la

investigación y los análisis en el ámbito de las relaciones laborales:

En el módulo 6, veremos una forma de medir y comparar el grado de concentración de recursos que se

distribuyen en una población (por ejemplo, qué grado de desigualdad hay en la distribución del ingreso

total del país, o la masa salarial de una empresa, entre todos los miembros de esa población).

El módulo 7 está dedicado a la presentación de algunos estadísticos que nos permiten analizar el

comportamiento del mercado de trabajo. Los estadísticos que vamos a estudiar habitualmente se

construyen en base a muestras y constituyen estimaciones de los valores de la población (parámetros),

pero no vamos a profundizar en este aspecto sino que trataremos de entender su construcción y uso.

Finalmente, el módulo 8 presenta dos herramientas que están vinculadas al análisis temporal de datos.

Veremos en primer lugar los números índice nos permiten analizar la evolución de una característica

numérica en el tiempo. Algunos números índice tienen incidencia cotidiana en nuestra vida, como

tendremos oportunidad de ver al llegar a ese módulo final del curso. También nos familiarizaremos con

los conceptos de inflación, precios corrientes y precios constantes, y obtendremos una herramienta que

nos permite comparar precios tomados en distintos momentos del tiempo.

1.4 TERMINOS Y CONCEPTOS BASICOS

Es importante que conozcamos algunos términos especializados de la disciplina estadística.

En primer lugar, muchas veces se confunden los términos “Estadística” con “estadísticas” o “estadísticos”.

5

Page 6: Medicion y Escalas e Medicion (1)

Cuando hablamos de Estadística, nos estamos refiriendo a la disciplina científica.

Los estadísticos, en cambio, son medidas de resumen calculadas sobre los datos provenientes de una

muestra, que en estadística inferencial se utilizan para estimar los valores correspondientes a nivel de la

población (parámetros). Es decir, son herramientas que asumen determinados valores, construidas en

base a los datos de observaciones. También podemos encontrarlas mencionadas como estadísticas.

En el curso aprenderemos a calcular varios estadísticos. No los veremos, sin embargo, en su “función” de

estimación de los valores poblacionales, ya que no trabajaremos con la inferencia estadística.

Antes de seguir adelante, veamos el concepto de POBLACION Y MUESTRA.

POBLACIÓN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar

acotada en espacio y tiempo.

Ejemplos de poblaciones en estudios de ciencias sociales:

habitantes de un barrio o un país, alumnos de una escuela, empresas, organizaciones, partidos políticos,

ciudades, países, etc.

Lo fundamental al definir una población es que sea acorde a los objetivos que nos planteamos en el

estudio y que esté delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos

distinguir entre quienes componen la población y quienes no.

MUESTRA: Al recoger datos relativos a las características de una población muchas veces es difícil,

costoso o poco práctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes.

En ese caso, se relevan los datos sólo para una parte de la población, a la cual se le llama MUESTRA.

Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teoría del

muestro) puede considerarse representativa de la población y los estadísticos que construyamos a partir

de ella permiten realizar estimaciones sobre lo que sucede con esas características en toda la población.

Como ya dijimos, estas estimaciones corresponden a la estadística inferencial, que se basa en la teoría

de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la

población y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la población a

partir de la información obtenida en al muestra. En estos casos, la estadística descriptiva se encarga de

resumir la información y analizar solamente la muestra, sin inferir conclusiones sobre la población.

CENSO: Es un relevamiento de todos los elementos de la población. Puede considerarse un caso

especial de muestra, cuando el tamaño de la misma coincide con el de la población.

Por ejemplo: para estudiar el mercado de trabajo en Uruguay periódicamente, no se entrevista a todos los

habitantes del país sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales

se les aplica la Encuesta Continua de Hogares.

6

Page 7: Medicion y Escalas e Medicion (1)

En cambio, cuando se realiza un Censo de Población, se entrevista a todas las personas que se

encuentran en el país ese día. Dentro de los temas que releva el Censo de Población se incluye el del

mercado de trabajo.

En el caso de la Encuesta de Hogares, obtenemos el número de desocupados de la muestra, el cual sirve

para estimar la desocupación a nivel de toda la población (por lo cual hay una margen de error, una

incertidumbre sobre en qué medida ese valor es el que corresponde a la población). En el caso del

Censo, el número de desocupados nos indica (salvo errores de relevamiento) la desocupación en el país,

sin esa “incertidumbre”.

Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los

elementos de la población, es decir, realizando un CENSO.

Extraído de Bueno, Concepción y Escudero, Tomás: Apuntes de Estadística para profesores.Curso 2006/2007.Instituto de Ciencias de la Educación.Universidad de Zaragoza

La población está compuesta por las UNIDADES DE ANALISIS.

La UNIDAD DE ANALISIS es el elemento mínimo de una población y de una muestra, en tanto se lo

considera como poseedor de ciertas propiedades, atributos o características denominadas variables. Por

ejemplo: los estudiantes univesitarios son unidades de análisis si consideramos su año de ingreso, su

centro de estudios o su edad. O, por ejemplo, los centros de estudio universitario son unidades de análisis

si consideramos su número de estudiantes; cantidad de salones; números de docentes por materia. En

nuestros estudios, nos interesará relevar las carácterísticas de la unidades de análisis y sacar

conclusiones sobre la población en base a esta información.

Para obtener los datos de las unidades de análisis debemos relevar la información. Las herramientas para

relevar la información pueden ser entrevistas (encuestas) pero también podemos obtener información de

registros administrativos, documentos, artículos de prensa, observación directa.

La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la información para la construcción del dato

estadístico. Muchas veces coincide con la unidad de análisis, pero en otros casos no. Por ejemplo, si

7

Page 8: Medicion y Escalas e Medicion (1)

estamos interesados en estudiar características de los hogares (por ejemplo: los ingresos del hogar, el

número de miembros que trabajan, etc.) nuestro relevamiento lo haremos sobre los miembros del hogar

(les preguntaremos por sus ingresos y su condición laboral). Pero cuando construyamos los datos,

tomaremos esa información y caracterizaremos con ella al hogar. En este caso, la unidad de relevamiento

son los miembros del hogar pero la unidad de análisis (que es la que queremos estudiar) son hogares.

Hemos visto que nos interesa caracterizar a nuestra unidades de análisis. De ahora en adelante

hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa caracterización. Una

VARIABLE es una propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar

diferentes valores o categorías.

Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. Este

sistema tiene dos propiedades fundamentales: sus categorías deben ser MUTUAMENTE EXCLUYENTES

y el sistema debe ser EXHAUSTIVO para la población en estudio.

Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al número de

miembros del hogar que trabajan.

Tenemos dos variables.

La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categorías

para ella. Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta

información podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada

uno de los hogares que constituyen nuestra población en estudio.

Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de categorías de esta

variable.

Un sistema de categorías posible podría ser cada uno de los valores obtenidos, por ejemplo: $2000,

$4500, $ 7000, etc.

Para explicitar un sistema de categorías así (que tiene muchos valores posibles), lo mejor es buscar el

valor más bajo y el más alto y expresarlo como:

$ 2000, ….., $ 70000.

Otro sistema de categorías posible, si no nos interesa tener tan desagregada la información, podría ser

identificar a los hogares en esta variable en tramos de ingreso.

Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000.

En este caso tendríamos tres categorías en nuestro sistema y los hogares tendrían como valor o

categoría en esta variable su pertenencia a uno de los tres tramos (nos “olvidamos” de sus valores

originales.

Pero nos interesa entender las propiedades del sistema de categorías. Supongamos que tenemos este

segundo sistema.

Si hubiéramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000,

tendríamos dificultades para saber a qué categoría corresponde un hogar que tiene $10000 como

ingreso. ¿En qué categoría lo coloco? ¿En la primera (2000 a 10000) o en la segunda (10000 a 40000)?

A esto nos referimos con la idea que las categorías deben ser mutuamente excluyentes. Frente al

sistema, no tengo que tener duda de cuál es la categoría que le corresponde a cada unidad.

8

Page 9: Medicion y Escalas e Medicion (1)

Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. ¿Cuál es la

categoría que le corresponde al hogar que gana $2000? No tengo ninguna categoría que lo incluya. La

idea de exhaustividad implica que mi sistema debe “cubrir” todos los valores posibles de la variable para

mi población.

La exhausitividad de un sistema de categorías está relacionado con la población en estudio: si por

ejemplo estamos estudiando el nivel educativo de un país, nuestro sistema de categorías para esa

variable tendría que tener por ejemplo, las siguientes categorías:

Sin instrucción, Primaria, Secundaria-UTU, Terciaria y posterciaria.

Sin embargo si estoy estudiando el nivel educativo de una población de menores de 16 años, alcanza con

tener el siguiente sistema: Sin instrucción, Primaria, Secundaria-UTU, ya que la educación terciaria no ha

de aparecer como categoría para ninguna de las unidades de análisis de esta población por la edad que

tienen.

La información sobre nuestra población la vamos organizar en una MATRIZ DE DATOS. Una matriz de

datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan

a esas unidades. Y cada celda está compuesta por el valor que asume la variable de esa columan para la

unidad de análisis de esa fila.

Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de

análisis. Por esta razón se dice que su estructura es “tripartita”: refiere simultáneamente a la unidad de

análisis, a la variable y a la categoría o valor.

En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las

variables en las columnas y el DATO como “cruce” de esos dos “vectores”.

Siguiendo nuestro ejemplo de los hogares, una matriz de datos podría ser:

Ingresos del

hogar

Número de miembros que

trabajan

Hogar 1 $2000 2

Hogar 2 $70000 4

Hogar 3 $ 4500 0

….

Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el

ingreso es $ 70000 y trabajan 4 miembros, etc.

La matriz de datos tiene tantas filas como el tamaño de la población y tantas columnas como variables.

9

Page 10: Medicion y Escalas e Medicion (1)

«MEDICIÓN Y ESCALAS DE MEDICIÓN»

¿Qué se mide? Respecto a este problema encontramos referencias tales como:

«La medición es un método que permite establecer correspondencias entre magnitudes de un mismo género, y ciertas clases de números (integrales, racionales o reales)» en Russell (1938);

«Medir es asignar numerales a las propiedades de los sistemas materiales según las leyes que presiden esos atributos» (Campbell, 1938);

«Es la atribución de numerales a los objetos o sucesos conforme con leyes o reglas» (Stevens, 1951).

Lo que destaca de cualquiera de estas definiciones es que si bien la medición se realiza sobre los

elementos u objetos (unidades de estudio) son las variables las que posibilitan la división en clases. Esto

nos abre a la necesidad de conocer la naturaleza de las variables para conocer como medir sus

propiedades.

2.1 Las Escalas y los Niveles de Medición

Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las variables.

Dada una población puede decirse cuáles de los individuos son solteros, casados, divorciados o

cualquiera otra categoría de la variable "estado civil". Pero sobre estos mismos individuos se puede decir

cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de las unidades de registro se puede,

además medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc…. Ahora bien, si relevamos

la característica “tener o no tener hijos” es diferente de si relevamos cuantos hijos tiene, a pesar que las

característica de interés es la misma. Lo que difiere son las mediciones en los modos en que se

manifiesta la variable.

En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o análisis que

muestran la presencia o ausencia de un atributo; se le puede asignar un número a esta característica,

pero no es cuantificable. Son características cualitativas. En el segundo caso, se puede estimar

objetivamente no sólo la presencia o ausencia de determinado atributo (tener hijos), sino también la

intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades.

Basándose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de

calidad-cantidad, la Estadística distingue, ya en un grado mayor de complejidad, la medición de acuerdo

al tipo de escala o nivel de medición, en que se encuentran expresados los atributos que queremos medir.

Se trata de operaciones clasificatorias, o sea, ubicación de las unidades de análisis en clases, clases que

tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las

características de la escala mucho más precisas de lo que pueden darse en términos verbales. Estas

propiedades pueden formularse en forma más abstracta de lo hasta aquí expresado, mediante un

10

Page 11: Medicion y Escalas e Medicion (1)

conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los

objetos a que se aplican.

Se distinguen cuatro tipos de escala:

nominal

ordinal

interval

de razón

A. LA ESCALA NOMINAL  

Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles

una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los

objetos o fenómenos.

En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen propiedades

cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la

clasificación no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con

sentido.

La medición se da a nivel elemental en estos casos (se dice que es el nivel más bajo de medición)

En una escala nominal, la operación de escalamiento consiste en partir de una característica dada y

formar un subconjunto de clases que se excluyen mutuamente. La única relación implicada es la de

equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida.

La relación de equivalencia es reflexiva (x = x para todo x), simétrica (x = y luego y = x) y transitiva (x = y

et y = z luego x = z).

Los símbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin

alterar la información esencial de la escala; debido a esto, las estadísticas de tipo descriptivo admisibles

son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporción, etc. Se

pueden desarrollar procesos analíticos acerca de la distribución de las categorías, así como la posible

relación entre dos o más características clasificadas mediante este tipo de escala que llamaremos

“variables cualitativas”.

Ejemplo de escala nominal: variable estado civil

11

Page 12: Medicion y Escalas e Medicion (1)

  Otros ejemplos de escala nominal: Sexo (1. masculino; 2. femenino) Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4.

cooperativa)Departamento de origen (1. Artigas; 2. Canelones; 3. Colonia,

etc….) Conformidad (1. Si; 0. No)

B. LA ESCALA ORDINAL

Para las mismas personas también se pueden medir propiedades donde la clasificación debe seguir un

orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o

fenómenos en estudio respecto a alguna característica de interés, sin que se reflejen distancias entre

ellos.

Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son ordinales. Note que una valoración de 1 no indica que el servicio es dos veces mejor que cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es preferiblemente mejor que 2, y así en los demás casos.

Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los

objetos de otra categoría de la escala, sino que están relacionados entre sí, guardan una relación de

jerarquía. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican

exclusivamente la posición en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas

de la escala.

Las relaciones entre los elementos en clasificación, pueden formularse con el signo >, mayor que, o sea

que axiomáticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta última

incorpora no solamente la relación de equivalencia (=) sino también la relación ''mas grande que'' (>).

Esta relación es irreflexiva (no es verdad para ninguna x tal que x > x), asimétrica ( x > y luego x < y ) y

transitiva (x > y et y > z luego x > z ).

Puesto que cualquier transformación tendiente a conservar el orden no altera la información contenida en

una escala ordinal, se dice que la escala es "única hasta una transformación monotónica". Esto es, no

12

Page 13: Medicion y Escalas e Medicion (1)

importa que números se den a una pareja de clases o a los miembros de esas clases, siempre que el

número mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse

números menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera

clase); en tanto se sea consecuente, es indiferente el uso del número mayor o menor para denotar

"mayor" o "mas preferido".

Fundamentalmente, las escalas ordinales se estudian en Estadística, con base en las llamadas

"estadísticas de orden" o "estadísticas de rango": máximos, mínimos, mediana, percentiles, etc…

Ejemplo de escala ordinal: satisfacción con el resultado

3º4º

Muy Satisfecho

Satisfecho

Insatisfecho

Muy insatisfecho

  C. LA ESCALA DE INTERVALO  

Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores. No sólo se

establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la

distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en

el sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es

tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se

ha obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de

medida común y constante que asigna un número real a todos los pares de objetos en un conjunto

ordenado. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la

unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son

arbitrarios.

Axiomáticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de

una escala de intervalo son tales que las diferencias en la escala son isomórficas a la estructura de la

aritmética. Los números pueden asociarse con las posiciones de los objetos de tal manera que las

operaciones de la aritmética puedan realizarse significativamente con las diferencias entre los números.

La consecuencia de cualquier cambio de los números asociados con los objetos medidos en una escala

de intervalo debe preservar no solamente el orden de los objetos sino también las diferencias relativas

13

Page 14: Medicion y Escalas e Medicion (1)

entre ellos. Esto es, la escala de intervalo es "única hasta una transformación lineal". La escala de

intervalo es la primera escala verdaderamente cuantitativa. Las estadísticas paramétricas, son las

aplicables a estudios en estas escalas.

Ejemplo de variable interval: etapas cronológicas

2050

2000

1950

1900

Suponga que se está interesado en algún período histórico específico y se están haciendo proyecciones

demográficas. Se quiere conocer el crecimiento poblacional cada 50 años. Obviamente los datos pueden

ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s

sucesivamente. Además , las diferencias entre los valores ordenados pueden ser comparadas. Aquí el

intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 años,

y lo mismo en los demás intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto

o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.

La presente base de datos tiene por objeto presentar información detallada de la población de los 20 países de América Latina, desglosada por edades simples y años calendario, correspondiente al período 1950 - 2050. Estas estimaciones se generan a partir de las proyecciones nacionales utilizando un procedimiento diseñado en el Área de Demografía del Centro Latinoamericano y Caribeño de Demografía- División de Población (CEPAL/CELADE). Una parte de esta información (1995 - 2005) se publica en este Boletín Demográfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo así las publicadas en el Boletín Demográfico No. 60 de julio de 1997.

año Población Total América Latina

1950 160.685.269

2000 507.932.043

2050 800.592.305

  D: LA ESCALA DE RAZON  Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real

en su origen, se llama escala de razón. Además de distinción, orden y distancia, ésta es una escala que

14

Page 15: Medicion y Escalas e Medicion (1)

permite establecer en que proporción es mayor una categoría de una escala que otra. El cero absoluto o

natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores

numéricos en una escala de razón son correspondientes a una escala isomórfica de la estructura de la

aritmética. Por consiguiente las operaciones de la aritmética son permisibles en los valores numéricos

asignados a los objetos mismos, así como también en los intervalos entre los números como sucede en

las escalas de intervalo. Implican que las relaciones de equivalencia, relación de mayor a menor,

proporción conocida de dos intervalos y proporción conocida de dos valores de la escala, sean posibles

de obtener operacionalmente. Los números asociados con los valores de la escala de razón son

"verdaderos" números con un verdadero cero; solo la unidad de medida es arbitraria. Así la escala de

razón es "única hasta la multiplicación por una constante positiva". Además de los procesos paramétricos

básicos de las escalas de intervalo, en las de razón pueden utilizarse estadísticas como la media

geométrica, el coeficiente de variación, las que requieren el conocimiento del verdadero valor cero

15

Page 16: Medicion y Escalas e Medicion (1)

Ejemplo de variable de razón: número de miembros del hogar ocupados

3

2

1

0

Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una

empresa de servicios. Los valores relevados han sido, 2, 1 – 2, 2 – 2,3 …… en miles de pesos. El orden

(ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero también el

incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que

el que existe entre 2.2 y 2.3 miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles

de pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más que quien gana 2, 0 miles

de pesos.

El Número como Nombre, Orden o Medida (tomado de Bar; 2000)

Para Cohen y Nagel (1979), los números pueden tener por lo menos tres usos distintos, como rótulos o marcas de identificación; como signos que indican la posición de un grado en una serie de grados; o como signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que sólo la última de las acepciones relaciona el número con la medición.

Esta forma de concebir los números conduce a una clasificación de variables o escalas en función de los atributos que presenta una serie numérica. Dichos atributos son, el orden, la distancia y el origen.

Las escalas nominales carecen de todas estas propiedades, y en este caso el número sólo puede adoptarse como nombre o identificación. Las escalas ordinales, como su nombre lo indica, sólo poseen orden, es decir que organizan sus datos a través de las relaciones de igualdad, mayor o menor. Las escalas interválicas poseen atributos de orden, y distancia o estimación precisa de las unidades. Pero carecen de origen, o cero natural, o ausencia de la propiedad. No obstante estas escalas acuden a la utilización del cero convencional. Las escalas proporcionales o racionales son las únicas que cuentan con las tres propiedades y, por lo tanto, se constituyen en verdaderas series numéricas. Las dos últimas clases de escalas son las que realmente miden, no obstante, al carecer las interválicas de cero natural, no pueden establecerse proporciones.

A menudo, datos provenientes de escalas ordinales numéricas son tratados como si fuera información verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque sí clasifican. En este caso se encuadran los tests psicométricos, (las evaluaciones de desempeño, las calificaciones de los alumnos en la facultad1), los cuales únicamente pueden estimar el orden de puntuación, pero nunca la distancia entre dos valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables interválicas y, consecuentemente, el cálculo de medidas de tendencia central y dispersión, además de otras operaciones derivadas de ellas. Dichas operaciones no son válidas por cuanto asignan a las escalas un status que en realidad no tienen.

1 El texto entre paréntesis es agregado del autor

16

Page 17: Medicion y Escalas e Medicion (1)

EJERCICIOS

1. En este módulo es importante entender algunos conceptos básicos antes de seguir adelante. Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del módulo.

¿Cuál es la diferencia entre Estadística y Estadísticos?

Piensa ejemplos de Estadísticos que puedan resultar útiles para aplicar en el campo de las relaciones laborales.

Explica la diferencia entre Estadística Descriptiva y Estadística Inferencial.

Distingue entre población y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar con toda la población (censo) o con muestras. Fundamenta.

¿Qué relación hay entre las unidades de análisis y la población?

Piensa ejemplos de variables con sus sistemas de categorías. Identifica el nivel de medición.

2. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de categorías que se les ha asignado.

Variable Categorías Escala de mediciónNivel educativo Ninguno

PrimariaSecundariaTerciaria

Nivel educativo 0 año aprobado1 año aprobado2 años aprobados……

Categoría de ocupación

PatrónEmpleado públicoEmpleado privadoCooperativistaTrabajador por cuenta propiaTrabajador familiar no remunerado

3. Se quiere realizar un estudio para conocer el perfil de la plantilla de trabajadores de una empresa comercial del área del supermercadismo.Imagina qué características podrían ser de interés estudiar. Identifica las variables que se corresponden con esas características y el sistema de categorías que les asignarías. Menciona el nivel de medición de cada variable.Construye la estructura de la matriz de datos en la cual se volcaría la información recogida.

17

Page 18: Medicion y Escalas e Medicion (1)

4.La figura siguiente muestra una de las páginas del formulario de la Encuesta Nacional de Hogares Ampliada, con preguntas que se relevan de cada integrante del hogar.

Identifica las variables que aparecen, así como sus sistemas de categorías y niveles de medición.

18

Page 19: Medicion y Escalas e Medicion (1)

ANEXO: REPASANDO ALGUNOS CONCEPTOS MATEMATICOS

Sumatoria:

Cuando queremos escribir en forma simplificada la suma de un conjunto grande (e incluso

infinito) de sumandos utilizamos una notación especial representada por la letra griega sigma ( Σ )

Si tenemos n sumandos, representamos a cada uno con la letra X.

El primer sumando es X1, el segundo es X2, … el último es Xn.

Entonces, una suma de X1+ X2+…+ Xn la representamos de la forma:

Xi es el “i-ésimo” sumando. En la notación de sumatoria estamos expresando que vamos a ir sumando

las X, desde la que tiene subíndice 1 (i=1) hasta la que tiene subíndice n (i=n). La letra “i” representa el

índice de la sumatoria.

Por ejemplo:

Tenemos los siguientes datos y queremos obtener su suma:

3, 8, 17, 5 . La forma “no simplificada” de representar esta suma sería: 3+ 8 + 17 + 5

Pero si identificamos cada dato de la siguiente forma:

X1=3; X2=8; X3=17; X4=5;

Podemos expresar la suma como una sumatoria: , lo cual simplifica la notación y está

representando la misma suma:

Veremos que esta notación es importante para expresar varias de las herramientas estadísticas que

veremos durante el curso.

Algunas propiedades de las sumatorias que utilizaremos en el curso:

19

Page 20: Medicion y Escalas e Medicion (1)

La suma de una expresión que es la suma de dos ó más términos es igual a la suma de las

sumas de los términos por separado:

Ejemplo: X1=2, X2=4; Y1=5, Y2=1, Z1=8, Z2=1.

• La suma de una constante multiplicada por una variable es igual que la constante multiplicada por la

suma de la variable, esto es

Donde a es una constante, es decir, un número que no está “indexado” en la sumatoria.

Ejemplo:

a=3; X1=5; X2=4; X3=2

La suma de una constante, es igual a n veces la constante, esto es:

Ejemplo:

Sea a=4, y n=3,

20

Page 21: Medicion y Escalas e Medicion (1)

Fracciones, Razones, Proporciones y Porcentajes:

En el curso es importante manejar el concepto de proporcionalidad y algunas herramientas matemáticas

asociadas.

Operando con fracciones

Recordemos algunas propiedades de la operatoria con fracciones:

ejemplo:

ejemplo:

Uniendo ambas propiedades:

ejemplo:

Proporcionalidad y regla de tres

Una razón entre dos cantidades es una comparación por cociente, para lo cual nos servimos de las

fracciones: , tanto para expresarla como para calcularla. Sin embargo, muchas veces encontramos esta

otra notación: a:b.

En las razones el numerador no es necesariamente un subconjunto del denominador.

Por ejemplo:

Decimos que hay una razón de 12 obreros cada 5 administrativos en una determinada empresa. En este

caso los obreros están en un conjunto distinto al de los administrativos. En cambio si decimos hay una

razón de 8 obreros cada 20 empleados de la empresa, estamos comparando un subconjunto (obreros)

con el conjunto total (empleados).

La igualdad entre dos razones se denomina proporción.

21

Page 22: Medicion y Escalas e Medicion (1)

La propiedad: , se denomina propiedad fundamental de las proporciones.

La forma de verificar la proporcionalidad es comprobar que los productos cruzados son iguales.

Por ejemplo, el jornal diario de una determinada categoría laboral en una empresa es de $200 por 4 horas

de trabajo. Se paga por hora trabajada, sin que el valor hora se modifique por jornadas con distinta carga

horaria. Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar $300.

En este caso, utilizamos la idea de proporcionalidad:

y esto lo podríamos verificar haciendo el producto cruzado, que debe dar el mismo resultado:

200*6=300*4=1200.

La propiedad fundamental de la proporcionalidad permite aplicar la llamada “regla de tres”, para hallar

un valor que es proporcional a otro.

En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan $200, y que el jornal es

proporcional al número de horas, entonces podemos hallar cuánto gana alguien que trabaja 6 horas

usando la regla de tres:

4 ----- 200

6 ------ x

Que leemos como: “4 es a 200, como 6 es a x”, haciendo referencia a la idea de proporcionalidad.

Como sabemos que los productos cruzados deben ser iguales:

6*200=4*x, lo cual nos permite despejar nuestra incógnita (x):

Es decir: a ---- b

c ---- x

Nos van a interesar en particular dos tipos de razones:

Las proporciones a 1: Estas proporciones son fracciones que comparan un número con 1.

22

Page 23: Medicion y Escalas e Medicion (1)

Para hallar la proporción de a en relación a n: . Por ejemplo, si queremos saber qué proporción de

integrantes de un hogar trabajan, a sería el número de integrantes del hogar y n el total de integrantes del

hogar (dentro de los cuales están incluidos los miembros que trabajan).

Proporción que trabaja = número de integrantes que trabajan/total integrantes del hogar

Los porcentajes: son fracciones que se obtienen al comparar un número con 100.

En el ejemplo anterior:

% que trabaja = número de integrantes que trabajan*100/total integrantes del hogar

Cuando se tiene una proporción, alcanza con multiplicar ésta por 100 para obtener el porcentaje.

En el próximo módulo utilizaremos estas dos herramientas para construir las distribuciones de frecuencias

relativas y las frecuencias relativas porcentuales

23