82
1.3 ¿Qué es la estadística? Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc. Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determistas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre. La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

estadistica xx.doc

  • Upload
    roberto

  • View
    230

  • Download
    3

Embed Size (px)

Citation preview

1.3 ¿Qué es la estadística? Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc.

Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determistas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre.

La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos,

con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio.

Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un

conjunto mayor de datos.

1.5 Elementos. Población. Caracteres Establecemos a continuación algunas definiciones de conceptos básicos y fundamentales básicas como son: elemento, población, muestra, carácteres, variables, etc., a las cuales haremos referencia continuamente a lo largo del texto

Individuos o elementos: personas u objetos que contienen cierta información que se desea estudiar.

Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes.

Muestra: subconjunto representativo de una población.

Parámetro: función definida sobre los valores numéricos de características medibles de una población.

Estadístico: función definida sobre los valores numéricos de una muestra.

En relación al tamaño de la población, ésta puede ser:

Finita, como es el caso del número de personas que llegan al servicio de urgencia de un hospital en un día;

Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de caras y cruces obtenida en el lanzamiento repetido de una moneda al aire.

1.5.0.1 Ejemplo Consideremos la población formada por todos los estudiantes de la Universidad de Málaga (finita).

La altura media de todos los estudiantes es el parámetro . El conjunto formado por los alumnos de la Facultad de Medicina es una muestra de dicha población y la altura media de esta muestra,

, es un estadístico.

Caracteres: propiedades, rasgos o cualidades de los elementos de la población. Estos caracteres pueden dividirse en cualitativos y cuantitativos.

Modalidades: diferentes situaciones posibles de un carácter. Las modalidades deben ser a la vez exhaustivas y mutuamente excluyentes --cada elemento posee una y sólo una de las modalidades

posibles.

Clases: conjunto de una o más modalidades en el que se verifica que cada modalidad pertenece a una y sólo una de las clases.

Variables estadísticas

Cuando hablemos de variable haremos referencia a un símbolo (X,Y,A,B,...) que puede tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos dominio de la variable o rango. En función del tipo de dominio, las variables las clasificamos del siguiente modo:

Variables cualitativas, cuando las modalidades posibles son de tipo nominal. Por ejemplo, una variable de color

Variables cuasicuantitativas son las que, aunque sus modalidades son de tipo nominal, es posible establecer un orden entre ellas. Por ejemplo, si estudiamos la llegada a la meta de un corredor en una competición de 20 participantes, su clasificación C es tal que

Otro ejemplo de variable cuasicuantitativa es el nivel de dolor, D, que sufre un paciente ante un tratamiento médico:

Variables cuantitativas son las que tienen por modalidades cantidades numéricas con las que podemos hacer operaciones aritméticas. Dentro de este tipo de variables podemos distinguir dos grupos: Discretas, cuando no admiten siempre una modalidad intermedia entre dos cualesquiera de sus modalidades. Un ejemplo es el número de caras X, obtenido en el lanzamiento repetido de una moneda. Es obvio que cada valor de la variable es un número natural

Continuas, cuando admiten una modalidad intermedia entre dos cualesquiera de sus modalidades, v.g. el peso X de un niño al nacer. En este caso los valores de las variables son números reales, es decir

Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisión del aparato de medida de esa variable, v.g. si medimos la altura en metros de personas con una regla que ofrece dos decimales de precisión, podemos obtener

En realidad lo que ocurre es que con cada una de esas mediciones expresamos que el verdadero valor de la misma se encuentra en un intervalo de radio . Por tanto cada una de las observaciones de X representa más bien un intervalo que un valor concreto.

Tal como hemos citado anteriormente, las modalidades son las diferentes situaciones posibles que puede presentar la variable. A veces éstas son muy numerosas (v.g. cuando una variable es continua) y conviene reducir su número, agrupándolas en una cantidad inferior de clases. Estas clases deben ser construidas, tal como hemos citado anteriormente, de modo que sean exhaustivas e incompatibles, es decir, cada modalidad debe pertenecer a una y sólo una de las clases.

Variable cualitativa: Aquella cuyas modalidades son de tipo nominal.

Variable cuasicuantitativa: Modalidades de tipo nominal, en las que existe un orden.

Variable cuantitativa discreta: Sus modalidades son valores enteros.

Variable cuantitativa continua: Sus modalidades son valores reales.

1.7.4 Tablas estadísticas

Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas modalidades han sido agrupadas en un número k de clases, que denotamos

mediante . Para cada una de las clases ci, , introducimos las siguientes magnitudes:

Frecuencia absoluta

de la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase.

Frecuencia relativa

de la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de observaciones, es decir

Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci.

Multiplicado por representa el porcentaje de la población que comprende esa clase.

Frecuencia absoluta acumulada

Ni, se calcula sobre variables cuantitativas o cuasicuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci:

Frecuencia relativa acumulada

, Fi, se calcula sobre variables cuantitativas o cuasicuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir,

Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que

o lo que es lo mismo,

Frecuencia absoluta (ni): Número de elementos que presentan la clase xi.

Frecuencia relativa: .

Frecuencia absoluta acumulada: .

Frecuencia relativa acumulada:

Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente:

Modali. Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu.

C ni fi Ni Fi

c1 n1 N1 = n1

... ... ... ... ...

cj nj

... ... ... ... ...

ck nk Nk = n Fk = 1

n 1

1.7.4.1 Ejemplo Calcular los datos que faltan en la siguiente tabla:

li-1 -- li ni fi Ni

0 -- 10 60 f1 60

10 -- 20 n2 0,4 N2

20 -- 30 30 f3 170

30 -- 100 n4 0,1 N4

100 -- 200 n5 f5 200

n

Solución:

Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n=200.

Como N3=170 y n3=30, entonces

N2=N3-n3=170-30=140.

Además al ser n1=60, tenemos que

n2=N2-n1=140-60=80.

Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa correspondiente:

Así:

N4=n4+N3=20+170 =190.

Este último cálculo nos permite obtener

n5=N5-N4=200-190=10.

Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:

Escribimos entonces la tabla completa:

li-1 -- li ni fi Ni

0 -- 10 60 0,3 60

10 -- 20 80 0,4 140

20 -- 30 30 0,15 170

30 -- 100 20 0,1 190

100 -- 200 10 0,05 200

200

1.7.4.2 Elección de las clases

En cuanto a la elección de las clases, deben seguirse los siguientes criterios en función del tipo de variable que estudiemos:

Cuando se trate de variables cualitativas o cuasicuantitativas, las clases ci serán de tipo nominal;

En el caso de variables cuantitativas, existen dos posibilidades:

o Si la variable es discreta, las clases serán valores numéricos ;

o Si la variable es continua las clases vendrán definidas mediante lo que denominamos intervalos. En este caso, las modalidades que contiene una clase son todos los valores numéricos posibles contenidos en el intervalo, el cual viene normalmente definido de la forma

o bien

En estos casos llamaremos amplitud del intervalo a las cantidades

ai = li-li-1

y marca de clase ci, a un punto representativo del intervalo. Si éste es acotado, tomamos como marca de clase al punto más representativo, es decir al punto medio del intervalo,

La marca de clase no es más que una forma abreviada de representar un intervalo mediante uno de sus puntos. Por ello hemos tomado como representante, el punto medio del mismo. Esto está plenamente justificado si recordamos que cuando se mide una variable continua como el peso, la cantidad con cierto número de decimales que expresa esta medición, no es el valor exacto de la variable, sino una medida que contiene cierto margen de error, y por tanto representa a todo un intervalo del cual ella es el centro.

En el caso de variables continuas, la forma de la tabla estadística es la siguiente:

Interv. M. clase Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum.

C ni fi Ni Fi

l0 -- l1 c1 n1 N1 = n1 F1 = f1

... ... ... ... ... ...

lj-1 -- lj cj nj Nj= Nj-1+nj Fj = Fj-1 + fj

... ... ... ... ... ...

lk-1 -- lk ck nk Nk=n Fk =1

n 1

1.7.4.3 Elección de intervalos para variables continuas

A la hora de seleccionar los intervalos para las variables continuas, se plantean varios problemas como son el número de intervalos a elegir y sus tamaños respectivos. La notación más común que usaremos para un intervalo sea

El primer intervalo, l0 -- l1, podemos a cerrarlo en el extremo inferior para no excluir la observación más pequeña, l0

Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos.

El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos un k que nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados:

Por ejemplo si el número de observaciones que tenemos es n=100, un buen criterio es

agrupar las observaciones en intervalos. Sin embargo si tenemos

n=1.000.000, será mas razonable elegir intervalos, que

.

La amplitud de cada intervalo

ai = li -li-1

suele tomarse constante, considerando la observación más pequeña y más grande de la

población (respectivamente y ) para calcular la amplitud total, A, de la población

A= lk - l0

de forma que la amplitud de cada intervalo sea:

Así la división en intervalos podría hacerse tomando:

1.7.4.4 Observación

Podría ocurrir que la cantidad a fuese un número muy desagradable a la hora de escribir los intervalos (ej. a=10,325467). En este caso, es recomendable variar simétricamente los

extremos, , de forma que se tenga que a es un número más simple (ej. a=10).

Recorrido:

Amplitud: ai= li - li-1

Marca de clase:

Frecuencias rectificadas: ;

1.7.4.5 Ejemplo Sobre un grupo de n=21 personas se realizan las siguientes observaciones de sus pesos, medidos en kilogramos:

58 42 51 54 40 39 49

56 58 57 59 63 58 66

70 72 71 69 70 68 64

Agrupar los datos en una tabla estadística.

Solución:

En primer lugar hay que observar que si denominamos X a la variable ``peso de cada persona'' esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una tabla estadística, esto se ha de hacer agrupándolos en intervalos de longitud conveniente. Esto nos lleva a perder cierto grado de precisión. Para que la perdida de información no sea muy relevante seguimos el criterio de utilizar

intervalos (no son demasiadas las observaciones). En este punto podemos tomar bien k=4 o bien k=5. Arbitrariamente se elige una de estas dos posibilidades. Por ejemplo, vamos a tomar k=5.

Lo siguiente es determinar la longitud de cada intervalo, ai . Lo más cómodo es tomar la misma longitud en todos los intervalos, ai=a (aunque esto no tiene por qué ser necesariamente así), donde

Entonces tomaremos k=5 intervalos de longitud a=6,6comenzando por l0=xmin=39 y terminando en l5=33:

Intervalos M. clase f.a. f.r. f.a.a. f.r.a.

li-1 -- li ci ni fi Ni Fi

i=1 39 -- 45,6 42,3 3 0,1428 3 0,1428

i=2 45,6 -- 52,2 48,9 2 0,0952 5 0,2381

i=3 52,2 -- 58,8 55,5 6 0,2857 11 0,5238

i=4 58,8 -- 65,4 62,1 3 0,1428 14 0,6667

i=5 65,4 -- 72 68,7 7 0,3333 21

21

Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades más simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir l0 y l5 no es muy estricta podemos hacer la siguiente elección:

ya que así la tabla estadística no contiene decimales en la expresión de los intervalos, y el exceso d, cometido al ampliar el rango de las observaciones desde A hasta A', se reparte del mismo modo a los lados de las observaciones menores y mayores:

Intervalos M. clase f.a. f.r. f.a.a. f.r.a.

li-1 -- li ci ni fi Ni Fi

i=1 38 -- 45 41,5 3 0,1428 3 0,1428

i=2 45 -- 52 48,5 2 0,0952 5 0,2381

i=3 52 -- 59 55,5 7 0,3333 12 0,5714

i=4 59 -- 66 62,5 3 0,1428 15 0,7143

i=5 66 -- 73 69,5 6 0,2857 21

21

1.9 Representaciones Gráficas Hemos visto que la tabla estadística resume los datos que disponemos de una población, de forma que ésta se puede analizar de una manera más sistemática y resumida . Para darnos cuenta de un sólo vistazo de las características de la población resulta aún más esclarecedor el uso de gráficos y diagramas, cuya construcción abordamos en esta sección.

1.9.2 Gráficos para variables cualitativas

Los gráficos más usuales para representar variables de tipo nominal son los siguientes:

Diagramas de barras:

Siguiendo la figura 1.1, representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura 1.2. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.

Figura: Diagrama de barras para una variable cualitativa.

Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha

de tener en cuenta que la altura de cada barra es proporcional al número de observaciones

(frecuencias relativas).

Diagramas de sectores

(también llamados tartas). Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa (figura 1.3).

Figura: Diagrama de sectores.

El arco de cada porción se calcula usando la regla de tres:

Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular, al igual que en

la figura 1.4. Sean los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las areas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:

Figura: Diagrama de sectores para comparar dos poblaciones

Pictogramas

Expresan con dibujos alusivo al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la figura 1.5.

Figura: Pictograma. Las áreas son proporcionales a las frecuencias.

El escalamiento de los dibujos debe ser tal que el área1.1 de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una explicación compleja.

1.9.4 Gráficos para variables cuantitativas

Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:

Diagramas diferenciales:

Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.

Diagramas integrales:

Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.

Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.

1.9.4.1 Gráficos para variables discretas

Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la figura 1.6.

1.9.4.2 Ejemplo Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniendose los siguientes resultados:

Representar gráficamente el resultado.

Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades:

Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura 1.6.

Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama

integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a

cada punto del eje de abcisas.

xi ni fi Ni Fi

0 1 1/8 1 1/8

1 3 3/8 4 4/8

2 3 3/8 7 7/8

3 1 1/8 8 8/8

n=8 1

1.9.4.3 Ejemplo Clasificadas 12 familias por su número de hijos se obtuvo:

Número de hijos (xi) 1 2 3 4

Frecuencias (ni) 1 3 5 3

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente.

Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:

Variable F. Absolutas F. Relativas F. Acumuladas

xi ni fi Ni

1 1 0,083 1

2 3 0,250 4

3 5 0,416 9

4 3 0,250 12

12 1

Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra en la figura 1.7. Como puede verse es identico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información procedente de las columnas xi y Ni.

Figura: Diagramas de frecuencias para una variable discreta

1.9.4.4 Gráficos para variables continuas

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.

Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de la gráficas sobre un intervalo son idénticas. Veanse ambas gráficas diferenciales representadas en la parte superior de la figura 1.8.

El diagrama integral para una variable continua se denomina también polígono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma. Véase la parte

inferior de la figura 1.8, en la que se representa a modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente:

Intervalos ci ni Ni

0 -- 2 1 2 2

2 -- 4 3 1 3

4 -- 6 5 4 7

6 -- 8 7 3 10

8 - 10 9 2 12

12

Figura: Diagramas diferenciales e integrales para una variable continua.

1.9.4.5 Ejemplo La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:

Duración en horas Número de tubos

300 -- 500 50

500 -- 700 150

700 -- 1.100 275

más de 1.100 25

Total 500

Representar el histograma de frecuencias relativas y el polígono de frecuencias. Trazar la curva de frecuencias relativas acumuladas.

Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas.

Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una variable continua se tratase. La consecuencia es una ligera perdida de precisión.

El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas1.2.

Antes de realizar el histograma conviene hacer una observación importante. El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un rectángulo de base doble (lo que reduce su áltura a la mitad).

Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura del histograma. Los gráficos requeridos se representan en las figuras 1.9 y 1.10.

Intervalos ai ni fi fi' Fi

300 -- 500 200 50 0,10 0,10 0,10

500 -- 700 200 150 0,30 0,30 0,40

700 -- 1.100 400 275 0,55 0,275 0,95

1.100 -- 1.300 200 25 0,05 0,05 1,00

n=500

Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en

todos con fisalvo en el intervalo 700 -- 1.100 en el que

ya que la amplitud de ese intervalo es doble a la de los demás.

Figura: Diagrama acumulativo de frecuencias relativas

Por otro lado, mirando la figura 1.9 se ve que sumando frecuencias relativas, hasta las 900 horas de duración hay

0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.

Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas (figura 1.10).

Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900

horas es , redondeando, 338 tubos.

Tabla: Principales diagramas según el tipo de variable.

Tipo de variable Diagrama

V. Cualitativa Barras, sectores, pictogramas

V. Discreta Diferencial (barras)

Integral (en escalera)

V. Continua Diferencial (histograma, polígono de frecuencias)

Integral (diagramas acumulados)

1.11 Problemas Ejercicio 1..1. Clasificar las siguientes variables: 1. Preferencias políticas (izquierda, derecha o centro). 2. Marcas de cerveza. 3. Velocidad en Km/h. 4. El peso en Kg. 5. Signo del zodiaco. 6. Nivel educativo (primario secundario, superior). 7. Años de estudios completados. 8. Tipo de enseñanza (privada o pública). 9. Número de empleados de una empresa. 10. La temperatura de un enfermo en grados Celsius. 11. La clase social (baja, media o alta).

12. La presión de un neumático en Ejercicio 1..2. Clasifique las variables que aparecen en el siguiente cuestionario. 1. ¿Cuál es su edad? 2. Estado civil: (a) Soltero (b) Casado (c) Separado (d) Divorciado (e) Viudo 3. ¿Cuanto tiempo emplea para desplazarse a su trabajo? 4. Tamaño de su municipio de residencia: (a) Municipio pequeño (menos de 2.000 habitantes) (b) Municipio mediano (de 2.000 a 10.000 hab.) (c) Municipio grande (de 10.000 a 50.000 hab.) (d) Ciudad pequeña (de 50.000 a 100.000 hab.) (e) Ciudad grande (más de 100.000 hab.) 5. ¿Está afiliado a la seguridad social? Ejercicio 1..3. En el siguiente conjunto de datos, se proporcionan los pesos (redondeados a libras) de niños nacidos en cierto intervalo de tiempo: 4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5. 1. Construir una distribución de frecuencia de estos pesos. 2. Encontrar las frecuencias relativas. 3. Encontrar las frecuencias acumuladas. 4. Encontrar las frecuencias relativas acumuladas. 5. Dibujar un histograma con los datos del apartado a. 6. ¿Por qué se ha utilizado un histograma para representar estos datos, en lugar de una gráfica de barras?

La Estadística se divide en dos ramas:

La estadística descriptiva, que se dedica a los métodos de recolección, descripción,

visualización y resumen de datos originados a partir de los fenómenos en estudio. Los

datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de

descriptores numéricos son la media y la desviación estándar. Resúmenes gráficos

incluyen varios tipos de figuras y gráficos.

La inferencia estadística, que se dedica a la generación de los modelos, inferencias

y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e

incertidumbre en las observaciones. Se usa para modelar patrones en los datos y

extraer inferencias acerca de la población de estudio. Estas inferencias pueden tomar

la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de

características numéricas (estimación), pronósticos de futuras observaciones,

descripciones de asociación (correlación) o modelamiento de relaciones entre variables

(análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de

tiempo y minería de datos.

Variable Cuantitativa

Cuando  los mèdicos  entrevistan a un paciente, les es  importante cuantificar la medida de ciertas variables como por ejemplo: el peso, la estatura, la edad , la frecuenica respiratoria y la frecuenica cardiaca.

El objetivo es completar estas variables y sus escalas de medición en una Base de Datos de los

expedientes de sus pacientes.

Variable Cuantitativa Discreta.

Cuántas pulsaciones por minuto tienes o bién cuantas respiraciones por minuto. Esta medición

siempre es un entero. Por lo tanto son variables cuantitativas discretas.

El médico podría preguntar cuantos hijos hay en una familia, por lo cual el resultado es siempre

un número entero.

Las variables cuantitativas se clasifican entonces como discretas en este caso. Ejemplos:

cuantas piezas dentales tiene, cuantos dedos tiene, cuantos riñones tiene,cuantas pérdidas   ha

tenido una madre,etc.

Variable Cuantitativa Contínua:

Cuando medimos una variable como el peso necesitamos discriminar si la medición es un 

entero o bién un con número con decimales.  El médico podría indicarle que se coloque en una

balanza, a fín de conocer cuanto pesa.

La escala del peso se expresa en libras-onzas, por lo cual el paciente podría tener un peso de

130.5 lb. En forma similar, la variabler  estatura de un futbolista se mide utilizando una escala 

métrica, por ejemplo 1.90 mt.

Analizando la variable edad, ésta se mide en años- meses-dias. La edad de un bebé entonces, es

6 meses, la edad de un niño puede ser 18 meses, lo cual equivale a 1.5 años. Aunque la edad se

expresa en números enteros, se cuantifica en escala cuantitativa contínua.

El estudiante podría practicar clasificar diferentes variables asociando su escala de medición

correspondiente asi:

No. de glóbulos Blancos                       Cuantitativa contínua

No. de Cursos Asignados                        cuantitativa discreta.

Nivel de medidaEl nivel de medida de una variable en matemáticas y estadísticas, también llamado escala de medición, es una clasificación acordada con el fin de describir la naturaleza de la información contenida dentro de los números asignados a los objetos y, por lo tanto, dentro de una variable. Según la teoría de las escalas de medida, varias operaciones matemáticas diferentes son posibles dependiendo del nivel en el cual la variable se mide. [editar] Escalas de medición

Escalas de medición son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales. Según pasa de una escala a otra el atributo o la cualidad aumenta. Las escalas de medición ofrecen información sobre la clasificación de variables discretas o continuas, también mas conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la selección de la gráfica adecuada.

Niveles de clasificaciónB

La medición puede definirse como la asignación de numerales a objetos o sucesos siguiendo ciertas reglas Stevens (1946). El autor de esta definición desarrolló un método para clasificar los diferentes resultados de las mediciones en lo que llamó niveles de medición. Un nivel de medición es la escala que representa una jerarquía de precisión dentro de la cual una variable puede evaluarse, en función de las características que rigen las escalas. Por ejemplo, la variable estatura puede analizarse en diferentes niveles de medida. Un conjunto de personas pueden clasificarse en altos y bajos, A y B respectivamente, creando dos grupos. Para ello no es necesario recurrir a ninguna cinta métrica, simplemente basta observar quienes destacan sobre los demás (el grupo de altos) y el resto completarán el grupo de bajos. El nivel de medición que corresponde a esta forma de medir es nominal.

También podrían alinearse a los sujetos y ordenarlos según su altura, el primero sería el más alto y el último el más bajo, el resto se organizaría de forma que cada persona tuviese delante a uno más alto y detrás a uno más bajo. El nivel de medición en este caso es ordinal. Hasta el momento no es posible decir cuánto es una persona más alta que otra.

A través del número de personas que hay entre dos sujetos, por ejemplo, Andréa y Juan en la fila ordenada anteriormente. En este caso además del orden se conoce la magnitud de la altura. Si en lugar de utilizar el número de personas se recurre a una regla se puede ofrecer otra medida de la altura. Esta forma de medir es propia del nivel de intervalos, que permite saber la magnitud de los elementos comparando unos con otros.

La cuarta posibilidad es utilizar un metro que sitúa el cero en el mismo suelo y, por lo tanto, la altura se define en función de la distancia desde la cabeza al suelo (valor cero absoluto

donde se sitúa la ausencia de altura). En ciencias sociales es poco frecuente encontrar variables en niveles de razón, normalmente son nominales, ordinales y en ocasiones de intervalos, rara vez de razón. Una característica de esta clasificación es que las propiedades de una escala se cumplen en el nivel superior.

En la estadística descriptiva y con el fin de realizar pruebas de significancia, las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida:

nominal (también categórica o discreta) ordinal

de intervalo o intervalar (continua)

de razón o racional (continua)

Las variables de intervalo y de razón también están agrupadas como variables continuas.

[editar] Medida nominal

El nivel nominal de medición, de la palabra latina nomún (nombre) describe variables de naturaleza categórica que difieren en calidad más que en cantidad (Salkind, 1998: 113). Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta en función de los deseos o conveniencia del investigador. Este nivel de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.

Por ejemplo, los sujetos que son del curso de A de 2º de eso y los de B generan dos grupos. Cada sujeto se asigna a un grupo, y las variables son de tipo cualitativo (de calidad) y no cuantitativo puesto que indica donde está cada sujeto y no "cuanto es de un curso y no de otro". En este ejemplo los números 2 y 3 pueden sustituir las letras A y B, de forma que 2 y 3 son simples etiquetas que no ofrecen una valoración numérica sino que actúan como nominativos.

En esta escala hay que tener en cuenta dos condiciones:

No es posible que un mismo valor o sujeto esté en dos grupos a la vez. No se puede ser de 2º y 3º a la vez. Por lo tanto este nivel exige que las categorías sean mutuamente excluyentes entre sí.

Los números no tienen valor más que como nombres o etiquetas de los grupos.

En este tipo de medidas, se asignan nombres o etiquetas a los objetos. La asignación se lleva a cabo evaluando, de acuerdo con un procedimiento, la similaridad de la instancia a ser medida con cada conjunto de ejemplares nominados o definiciones de categorías. El nombre de la mayoría de los ejemplares nominados o definiciones es el “valor” asignado a la medida nominal de la instancia dada. Si dos instancias tienen el mismo nombre asociado

a ellas, entonces pertenecen a la misma categoría, y ese es el único significado que las medidas nominales tienen.

Esta escala comprende variables categóricas que se identifican por atributos o cualidades. Las variables de este tipo nombran e identifican distintas categorías sin seguir un orden. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número es para identificar. Un número no tiene mayor valor que otro. Un ejemplo son los números de las camisetas de los jugadores de un equipo de béisbol. El número mayor no significa que tiene el mayor atributo que el número menor, es aleatorio o de capricho personal a quien otorga el número. también encontramos escala de altura,escala de perspectiva,escala de anchura,escala de profundidad Para el procesamiento de datos, los nombres pueden ser remplazados por números, pero en ese caso el valor numérico de los números dados es irrelevante. El único tipo de comparaciones que se pueden hacer con este tipo de variables es el de igualdad o diferencia. Las comparaciones “mayor que”o “menor que” no existen entre nombres, así como tampoco operaciones tales como la adición, la substracción, etc.

Ejemplos de medidas nominales son algunas de estas variables: estado marital, género, raza, credo religioso, afiliación política, lugar de nacimiento, el número de seguro social, el sexo, los números de teléfono, entre otros.

La única medida de tendencia central que se puede hacer es la moda. La dispersión estadística se puede hacer con tasa de variación, índice de variación cualitativa, o mediante entropía de información. No existe la desviación estándar.

[editar] Medida ordinal

El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los valores. En este caso las variables no sólo se asignan a grupos sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos.

Por ejemplo, se puede ordenar al conjunto de alumnos del módulo de diversificación curricular en función de la calificación obtenida en el último examen.

Las variables de este tipo además de nombrar se considera el asignar un orden a los datos. Esto implica que un número de mayor cantidad tiene un más alto grado de atributo medido en comparación con un número menor, pero las diferencias entre rangos pueden no ser iguales.

Las operaciones matemáticas posibles son: contabilizar los elementos, igualdad y desigualdad, además de ser mayor o menor que.

En esta clasificación, los números asignados a los objetos representan el orden o rango de las entidades medidas. Los números se denominan ordinales, las variables se denominan ordinales o variables de rango. Se pueden hacer comparaciones como “mayor que”, “menor que”, además de las comparaciones de igualdad o diferencia. Las operaciones aritméticas como la sustracción a la adición no tienen sentido en este tipo de variables.

Ejemplos de variables ordinales son: la dureza de los minerales, los resultados de una carrera de caballos, actitudes como preferencias, conservatismo o prejuicio, el nivel socioeconómico, orden de llegada de los corredores, entre otros. Las medidas de tendencia central de una variable ordinal pueden representarse por su moda o su mediana. La mediana proporciona más información.

[editar] Medida de intervalo o intervalar

El nivel de intervalo procede del latín interval lun (espacio entre dos paredes). Este nivel integra las variables que pueden establecer intervalos iguales entre sus valores. Las variables del nivel de intervalos permiten determinar la diferencia entre puntos a lo largo del mismo continuo. Las operaciones posibles son todas las de escalas anteriores, más la suma y la resta.

En este tipo de medida, los números asignados a los objetos tienen todas las características de las medidas ordinales, y además las diferencias entre medidas representan intervalos equivalentes. Esto es, las diferencias entre una par arbitrario de medidas puede compararse de manera significativa. Estas variables nombran, ordenan y presentan igualdad de magnitud. Por lo tanto, operaciones tales como la adición, la sustracción tienen significado. En estas variables el punto cero de la escala es arbitrario y se pueden usar valores negativos, no significa ausencia de valor y existe una unidad de igualdad entre los valores. Las diferencias se pueden expresar como razones. Las medidas de tendencia central pueden representarse mediante la moda, la mediana al promedio aritmético. El promedio proporciona más información.

Las variables medidas al nivel de intervalo se llaman variables de intervalo o variables de escala.

Ejemplos de este tipo de variables son la fecha, la temperatura, las puntuaciones de una prueba, la escala de actitudes, las puntuaciones de IQ, conjuntos de años, entre otros.

[editar] Medida de razón o racional

El nivel de razón, cuya denominación procede del latín ratio (cálculo), integra aquellas variables con intervalos iguales pueden situar un cero absoluto. Estas variables nombran orden, presentan intervalos iguales y el cero significa ausencia de la característica. El cero absoluto supone identificar una posición de ausencia total del rasgo o fenómeno. Tiene características importantes:

El valor cero no es arbitrario (no responde a las conveniencias de los investigadores). Un ejemplo claro es la temperatura. La existencia de un cero en la escala Celsius no supone la ausencia de temperatura, puesto que el cero grados centígrados está situado por arbitrio de los creadores de la escala. Por el contrario, la escala Kelvin sí tiene un cero absoluto, precisamente allí donde las moléculas cesan su actividad y no se produce por lo tanto roce entre los componentes moleculares. El cero absoluto de la escala Kelvin se sitúa a unos -273 grados centígrados.

La presencia de un cero absoluto permite utilizar operaciones matemáticas más complejas a las otras escalas. Hasta ahora se podía asignar, establecer la igualdad (nominal), mayor o menor que (ordinal), sumar y restar (intervalo) a las que se añade multiplicar, dividir, etc.

Los números asignados a los objetos tienen todas las características de las medidas de intervalo y además tienen razones significativas entre pares arbitrarios de números. Operaciones tales como la multiplicación y la división tienen significado.

La posición del cero no es arbitraria para este tipo de medida. Las variables para este nivel de medida se llaman variables racionales. La mayoría de las cantidades físicas, tales como la masa, longitud, energía, se miden en la escala racional, así como también la temperatura (en Kelvins) relativa al cero absoluto. Las medidas de tendencia central de una variable medida a nivel racional pueden representarse por la moda, la mediana, el promedio aritmético o su promedio geométrico. Lo mismo que con la escala de intervalos, el promedio aritmético proporciona la mayor información.

Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo, la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala de razón comienza desde el cero y aumenta en números sucesivos iguales a cantidades del atributo que está siendo medido.

como también vemos las escalas de: -escala de altura -escala de anchura -escala de perspectiva -escala de profundidad

Definicion De Parametro Estadistico

En estadística se llama parámetro estadístico a un valor representativo de una población,

como la media aritmética, una proporción o su desviación típica.

El parámetro es el calculo de valores en la población. Un parámetro es un sumario descriptivo de alguna caracteristica de una población, por ejemplo: la media aritmetica, mediana, desviación estandar. También se puede decir que es el resultado que generaliza las características de la población; se puede dar en porcentaje o en promedio.

MEDIDAS DE ASOCIACIÓN PARA VARIABLES CUANTITATIVAS

Para variables cuantitativas, es decir, aquellas que se miden en una escala de intervalo o de razón, las medidas de asociación más

utilizadas son la covarianza y el coeficiente de correlación de Pearson. Ambas medidas hacen referencia a un tipo particular de

asociación: la asociación lineal.

El análisis conjunto de dos variables cuantitativas puede ir acompañado del análisis unidimensional de cada una de ellas por

separado, así como de gráficos que pongan de manifiesto el patrón de comportamiento conjunto de ambas variables.

Para realizar el análisis conjunto de dos variables y la secuencia es:

Analizar

Correlaciones

Bivariadas

 

Aparece el siguiente cuadro de diálogo:

Por defecto, están activadas las opciones Coeficiente de correlación de Pearson, Prueba de significación Bilateral y Marcar las

correlaciones significativas. Otras medidas de asociación son los coeficientes Tau-b de Kendall y Spearman para variables ordinales,

a los que ya se ha hecho referencia en el epígrafe anterior.

 

COEFICIENTE DE CORRELACIÓN DE PEARSON

El coeficiente de correlacion de Pearson es la principal medida de asociación lineal entre dos variables cuantitativas

y se define como:

Este coeficiente, cuyo valor no depende de las unidades de medida de las variables, está acotado entre -1 y +1; su signo indica la

dirección, positiva o negativa, de la asociación lineal y su valor absoluto la intensidad de la misma. En caso de asociación lineal

perfecta toma el valor |1| ; si no hay asociación lineal toma el valor 0, lo cual no implica que no pueda haber asociación de otro tipo.

La prueba de significación del coeficiente de correlación de Pearson puede plantearse:

Bilateral (a doble cola) si se contrasta la hipótesis nula de ausencia de asociación lineal sin especificar de antemano en la

hipótesis alternativa la dirección o sentido de la asociación, en caso de que ésta exista.

Unilateral (a una sola cola) si se contrasta la hipótesis nula especificando de antemano en la hipótesis alternativa la

dirección de la asociación. Si se desea un contraste unilateral es necesario activar la opción correspondiente.

OPCIONES

Al activar el botón Opciones se abre el cuadro de diálogo siguiente.

Este cuadro permite incluir en los resultados los siguientes Estadísticos:

Medias y desviaciónes típicas de cada una de las variables análizadas.

Productos cruzados y covarianzas. La suma de los productos cruzados es el numerador del coeficiente de correlación lineal

que dividido por n-1 recibe el nombre de covarianza cuya expresión es:

La covarianza es una medida de asociación lineal cuyo signo indica la dirección o sentido de la asociación, pero cuyo valor numérico

es de difícil interpretación porque depende de las unidades de medida de las variables.

El cuadro de diálogo Opciones permite modificar la forma en que se gestionan los valores missing. Por defecto, está activada la

opción Excluir casos según pareja con la que se calculan los coeficientes de correlación utilizando todos los casos para los que existe

información sobre las dos variables. Como alternativa puede activarse la opción Excluir casos según lista con la que se calculan los

coeficientes de correlación utilizando únicamente los casos para los que se dispone de información sobre todas las variables. Si

únicamente se han seleccionado dos variables en el cuadro de diálogo Correlaciones bivariadas ambas opciones proporcionan los mismos resultados.

Dato estadístico

Un dato estadístico es cada uno de los valores que se ha obtenido al real izar un estudio estadíst ico.

Si lanzamos una moneda al a i re 5 veces obtenemos 5 datos : cara, cara, cruz, cara, cruz.

Tipos de variables

Variable independiente

Una variable independiente es aquella cuyo valor no depende del de otra variable.

La variable independiente en una función se suele representar por x .

La variable independiente se representa en el eje de abscisas.

Variable dependiente

Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable.

La variable dependiente en una función se suele representar por y .

La variable dependiente se representa en el eje ordenadas.

La variable y está en función de la variable x .

Variables estadísticas

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números . Podemos distinguir dos tipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden . Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no númericas , en las que existe un orden . Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...

Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número , por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta

Una variable discreta es aquella que toma valores aislados , es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre dos números . Por ejemplo:

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Variable aleatoria

Se llama variable aleatoria a toda función que asocia a cada elemento del espacio muestral E un número real.

Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas minúsculas (x, y, ...) para designar valores concretos de las mismas.

Variable aleatoria discreta

Una variable aleatoria discreta es aquella que sólo puede tomar valores enteros .

Ejemplos

El número de hijos de una familia, la puntuación obtenida al lanzar un dado.

Variable aleatoria continua

Una variable aleatoria continua es aquella que puede tomar todos los valores posibles dentro de un cierto intervalo de la recta real.

Ejemplos

La altura de los alumnos de una clase, las horas de duración de una pila.

Variable aleatoria binomial

La variable aleatoria binomial , X , expresa el número de

éxitos obtenidos en cada prueba del exper imento.

La variable binomial es una variable aleatoria discreta ,

só lo puede tomar los valores 0, 1, 2, 3, 4, . . . , n suponiendo que

se han real izado n pruebas.

Ejemplo

k = 6, a l lanzar una moneda 10 veces y obtener 6 caras.

Variable aleatoria normal

Una variable aleatoria continua , X , s igue una

distribución normal de media μ y desviación típica σ , y se

designa por N(μ, σ) , s i se cumplen las s iguientes condic iones:

1. La var iable puede tomar cualquier valor: ( -∞, +∞ )

2. La función de densidad , es la expresión en términos de

ecuación matemática de la curva de Gauss .

Variable estadística bidimensional

Una variable bidimensional es una var iable en la que cada

indiv iduo está def in ido por un par de caracteres, (X, Y) .

Estos dos caracteres son a su vez variables estadísticas en

las que s í existe re lación entre el las, una de las dos var iables es

la var iable independiente y la otra var iable dependiente.

Variable estadística

Una variable estadística es cada una de las

características o cualidades que poseen los individuos de una

población .

Variable cualitativa

Las variables cualitativas se ref ieren a características o

cualidades que no pueden ser medidas con números . Podemos

dist inguir dos t ipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades

no numéricas que no admiten un criterio de orden . Por

e jemplo:

El estado c iv i l , con las s iguientes modal idades: sol tero,

casado, separado, d ivorc iado y v iudo.

Variable cualitativa ordinal o variable

cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no

númericas , en las que existe un orden . Por e jemplo:

La nota en un examen: suspenso, aprobado, notable,

sobresal iente.

Puesto conseguido en una prueba deport iva: 1º, 2º, 3º, . . .

Medal las de una prueba deport iva: oro, p lata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un

número , por tanto se pueden real izar operaciones aritméticas

con el la . Podemos dist inguir dos t ipos:

Variable discreta

Una variable discreta es aquel la que toma valores

aislados , es decir no admite valores intermedios entre dos

valores especí f icos. Por e jemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua

Una variable continua es aquel la que puede tomar valores

comprendidos entre dos números . Por e jemplo:

La a l tura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práct ica medimos la a l tura con dos decimales, pero

también se podr ía dar con tres decimales.

Muestra estadística

Una muestra es un conjunto representat ivo de la población

de referencia.

El número de indiv iduos de una muestra es menor que el de

la población .

Muestreo

El muestreo es la reunión de datos que se desea estudiar ,

obtenidos de una proporción reducida y representat iva de la

población .

Podemos dist inguir var ios t ipos de muestreo:

Muestreo aleatorio simple

En un muestreo aleatorio simple para obtener una

muestra , se numeran los e lementos de la población y se

seleccionan al azar los n elementos que cont iene la muestra .

Muestreo aleatorio sistemático

En un muestreo aleatorio sistemático se e l ige un

indiv iduo al azar y a part i r de él , a intervalos constantes, se

el igen los demás hasta completar la muestra.

       Por e jemplo s i tenemos una población formada por 100

elementos y queremos extraer una muestra de 25 elementos, en

pr imer lugar debemos establecer e l intervalo de selección que

será igual a 100/25 = 4. A cont inuación elegimos el e lemento de

arranque, tomando aleator iamente un número entre el 1 y e l 4, y

a part i r de él obtenemos los restantes elementos de la muestra.

2, 6, 10, 14,.. . , 98

Muestreo aleatorio estratificado

En un muestreo aleatorio estratif icado se div ide la

población en c lases o estratos y se escoge, a leator iamente, un

número de indiv iduos de cada estrato proporcional a l número de

componentes de cada estrato.

En una fábr ica que consta de 600 trabajadores queremos

tomar una muestra de 20. Sabemos que hay 200 trabajadores en

la sección A, 150 en la B, 150 en la C y 100 en la D.

Individuo

Un individuo o unidad estadística es cada uno de los

e lementos que componen la población.

CONCEPTO

Escalas de medición son una sucesión de medidas que permiten organizar datos en orden

jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las

características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales.

Según pasa de una escala a otra el atributo o la cualidad aumenta. Las escalas de medición

ofrecen información sobre la clasificación de variables discretas o continuas. Toda vez que dicha

clasificación determina la selección de la gráfica adecuada.

Todo problema de investigación científica, aún el más abstracto, implica de algún modo una tarea

de medición de los conceptos que intervienen en el mismo. Porque si tratamos con objetos como

una especie vegetal o un comportamiento humano nos veremos obligados ya sea a describir sus

características o a relacionarse éstas con otras con las que pueden estar conectadas: en todo caso

tendremos que utilizar determinadas variables –tamaño, tipo de flor, semilla, o las variables que

definan el comportamiento de estudio- y tendremos que encontrar el valor que éstas asumen en el

caso estudiado. En eso consiste, desde el punto de vista lógico más general, la tares de medir.

DEFINICIÓN DE ESCALA

Cualquier recurso para determinar la magnitud o cantidad de un objeto o hecho de cualquier clase;

instrumento para asignar un número o guarismo que indicará cuánto hay de algo; un recurso de

medición que provee un conjunto de normas (numeradas de acuerdo con ciertas reglas de trabajo)

con las que se puede comparar el objeto que será medido, para asignarle un número o valor

matemático que represente su magnitud. El término es de amplia aplicación: una escala de alguna

clase está incluida en toda medición o estimación. Implícito en cada caso hay un conjunto de reglas

para asignar números o valores: son estas reglas las que dan significado a las cantidades. Los

objetos pueden ser perceptuales o conceptuales.

Una escala puede concebirse como un continuo de valores ordenados correlativamente que admite

un punto inicial y otro final. Si evaluamos el rendimiento académico de estudiantes podemos

asignar el valor cero al mínimo rendimiento imaginable al respecto; al mayor rendimiento posible

podemos atribuirle un valor de 100, 20, 10 o 7 puntos, según resulte más práctico. Con estos dos

valores tendríamos ya marcados los límites de nuestra escala; para concluir de confeccionarla será

necesario asignar a los posibles rendimientos intermedios puntajes también intermedios. Con ello

obtendremos una escala capaz de medir la variable rendimiento académico a través de los

indicadores concretos de los trabajos presentados por los estudiantes, de sus exámenes, pruebas

y otras formas de evaluación posibles.

TIPOS DE ESCALAS DE MEDICIÓN

La escala de medida de una característica tiene consecuencias en la manera de presentación de la

información y el resumen. La escala de medición -grado de precisión de la medida de la

característica- también determina los métodos estadísticos que se usan para analizar los datos.

Por lo tanto, es importante definir las características por medir. Las escalas de medición más

frecuentes son las siguientes:

ESCALA NOMINAL.-

No poseen propiedades cuantitativas y sirven únicamente para identificar las clases. Los datos

empleados con las escalas nominales constan generalmente de la frecuencia de los valores o de la

tabulación de número de casos en cada clase, según la variable que se está estudiando. El nivel

nominal permite mencionar similitudes y diferencias entre los casos particulares. Los datos

evaluados en una escala nominal se llaman también "observaciones cualitativas", debido a que

describen la calidad de una persona o cosa estudiada, u "observaciones categóricas" porque los

valores se agrupan en categorías. Por lo regular, los datos nominales o cualitativos se describen en

términos de porcentaje o proporciones. Para exhibir este tipo de información se usan con mayor

frecuencia tablas de contingencia y gráficas de barras.

ESCALA ORDINAL.-

Las clases en las escalas ordinales no solo se diferencian unas de otras (característica que define

a las escalas nominales) sino que mantiene una especie de relación entre sí. También permite

asignar un lugar específico a cada objeto de un mismo conjunto, de acuerdo con la intensidad,

fuerza, etc.; presentes en el momento de la medición. Una característica importante de la escala

ordinal es el hecho de que, aunque hay orden entre las categorías, la diferencia entre dos

categorías adyacentes no es la misma en toda la extensión de la escala. Algunas escalas

consisten en calificaciones de múltiples factores que se agregan después para llegar a un índice

general.

Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala de posición",

donde las observaciones se clasifican de mayor a menor (o viceversa). Al igual que en las escalas

nominales, se emplean a menudo porcentajes y proporciones en escalas ordinales.

ESCALA DE INTERVALO.-

Refleja distancias equivalentes entre los objetos y en la propia escala. Es decir, el uso de ésta

escala permite indicar exactamente la separación entre 2 puntos, lo cual, de acuerdo al principio de

isomorfismos, se traduce en la certeza de que los objetos así medidos están igualmente separados

a la distancia o magnitud expresada en la escala.

ESCALA DE RAZÓN.-

Constituye el nivel óptimo de medición, posee un cero verdadero como origen, también

denominada escala de proporciones. La existencia de un cero, natural y absoluto, significa la

posibilidad de que el objeto estudiado carezca de propiedad medida, además de permitir todas las

operaciones aritméticas y el uso de números representada cantidades reales de la propiedad

medida.

Con esto notamos que esta escala no puede ser usada en los fenómenos psicológicos, pues no se

puede hablar de cero inteligencia o cero aprendizaje, etc.

En estadistica¿que es escala de medida de intervalo y de razon?alguien que me explique?CLASIFICACIÓN DE LAS ESCALAS DE MEDIDA.

La más simple es la “NOMINAL”, en ella la operación empírica básica se establece por la determinación de igual y el sistema formal por la correlación de los números. Ejemplo: los números de clase, los números de los futbolistas, etc.(1, 2, 3, 4, 5, ...)

En un aspecto más importante de escala, tenemos la escala “ORDINAL” en ella la operación empírica que se lleva a cabo es la determinación de mayor o menor respecto a otro. Ejemplo: el sistema empírico, nos dice que en las personas difiere el grado de dolor, más o menos dolor. Habrá que crear un sistema formal que recoja este hecho utilizando el termino mayor o menor (X = Y; X< Y, X> Y)

Más compleja la “ESCALA DE INTERVALO O DE DISTANCIA”, se utiliza cuando se determina la igualdad de intervalo entre los puntos, se precisa el orden jerárquico en función de un atributo. Ejemplo: medición de la temperatura:

El agua se congela a 0ºC y hierve a 100ºC.

En un nivel todavía más completo tenemos la “ESCALA DE RAZÓN”, se utiliza cuando se determina la igualdad de razones. En la misma debe haber igual distancia entre los grados sucesivos, supone un cero racional, suministra información sobre el orden jerárquico según un atributo, a los intervalos entre ellos y la magnitud absoluta a cada objeto (-30, -15, 0, 15, 30)

Escala de intervalo Cuando además de distinguir diferencias en grado, en la propiedad de un objeto, también se pueden distinguir diferencias iguales entre objetos, se tiene una medida de intervalo. Una forma de distinguir variables que se miden en esta escala, es que el cero no indica que hay ausencia de la variable. Un ejemplo típico de una variable que se mide en esta escala, es la temperatura cuando se mide en grados Fahrenheit o en grados Centígrados, pues éstas como es ya conocido, no son escalas absolutas, sino relativas. Sabemos que la diferencia entre 30º C y 35º C es la misma que entre 45º C y 50º C y si se dice que un líquido se encuentra a 0º C, no significa que no tiene temperatura. Escala de razón o proporcional En esta escala se cumplen todas las características que en las anteriores, además de que el cero sí indica una ausencia de la variable, por ejemplo, si la variable son los gastos semanales de una

persona y nos dice que no tuvo gastos durante la semana, entonces es válido decir que sus gastos semanales fueron iguales a cero. Hay muchas variables de interés en la economía y administración que se evalúan en una escala de razón, otra podría ser la antigüedad de una persona en una empresa; si sabemos de alguien que apenas va a entrar a trabajar ahí y no tiene antigüedad se puede decir que su antigüedad es igual a cero años o meses

El resultado de un proceso de medición, asignar números a los grados en que se manifiesta una propiedad o característica (modalidad), es un vector numérico denominado variable.

    Normalmente se simboliza con letras mayúsculas del alfabeto latino, utilizándose frecuentemente en su denotación las últimas letras (ej:X,Y,Z,...).

    Supongamos el siguiente caso, observando a 5 sujetos e identificados atendiendo a la característica sexo, obtenemos los grados:     varón, varón, mujer, mujer, varón.

    Ahora estamos en condiciones de asignar valores numéricos a los grados de la propiedad, por ejemplo el 1 a los varones y el 2 a las mujeres, pudiendo simbolizar el vector numérico como X. De esta forma obtendremos el siguiente vector:    X=(1 1 2 2 1)

    Este vector numérico, susceptible de ser operado matemáticamente (ej: sumatorio), tendrá las restricciones propias de la escala de medida utilizada. Es decir, las propiedades de los números dependerán de forma directa del tipo de relaciones que a nivel formal hemos establecido en la escala de medida.

    Por supuesto las propiedades de una variable dependen directamente del tipo de escala utilizado en el proceso de medición. Así, atendiendo al tipo de escala utilizado se suele distinguir cuatro tipos distintos de variables:

1. Utilizando una escala nominal, decimos que la variable resultante es cualitativa o categórica.2. Si la escala es ordinal, la variable se denomina cuasi-cuantitativa. 3. Cuando utilizamos una escala de intervalo o de razón, entonces la variable se conoce como    cuantitativa. A su vez, las variables cuantitativas se diferencian en:    3.1 Variables discretas (solo valores enteros)        ej:el número de hijos en una familia (0 1 2 ...).    3.2 Variables continuas (admite valores decimales)        ej:la altura (1,25 1,60 1,94 ...).

     Transformación de escalas y variables.

    En ciertas situaciones al investigador le interesa transformar el tipo de escala o variable, en este caso hay que tener en cuenta que este tipo de modificación plantea la siguiente restricción:

Una escala de medida o variable puede ser transformada en otro tipo de escala o variable siempre que sea de rango inferior a la utilizada inicialmente.

     Así de una escala de razón podremos pasar a una escala de intervalo, ordinal o nominal. Pero nuca en sentido inverso, por ejemplo pasar en una propiedad medida a nivel de escala nominal a una escala de intervalo (ej: el sexo).

    Si estamos con variables, el proceso será el mismo, es decir se admite la posibilidad de transformar una variable cuantitativa continua en discreta, ordinal o categórica, pero no en sentido inverso.

Clasificación de variables — Presentation Transcript 1. Metodología De las Ciencias Sociales III Temas Clasificación de Variables 2. 312¿En qué consiste la clasificación de variables?

3. ¿En qué consiste la clasificación de variables?312Los datos que deben manejarse en una investigación científica para describir los objetos de interés son, en general de naturaleza diversa. La consideración de estas diferencias es esencial para decidir el método de análisis estadístico adecuado.1

4. ¿En qué consiste la clasificación de variables?312Los datos son valores o categorías especificas de las variables inherentes al problema.2

5. ¿En qué consiste la clasificación de variables?312Se presentarán criterios diferentes (no excluyentes y complementarios) para clasificar variables.3

6. Variable NominalVariable OrdinalSegún Nivel de MediciónVariable IntervalarVariable de RazónClasificaciónde Variables Variable Discreta o DiscontinuaSegún Naturaleza de la VariableVariable ContinuaDicotómicaVariable CualitativaSegún Tipode VariablePolicotómicaVariable Cuantitativa

7. Variable NominalVariable OrdinalSegún Nivel de MediciónVariable IntervalarVariable de RazónClasificaciónde Variables Variable Discreta o DiscontinuaSegún Naturaleza de la VariableVariable ContinuaDicotómicaVariable CualitativaSegún Tipode VariablePolicotómicaVariable Cuantitativa

8. Según nivel de mediciónVariable NominalEsta es una variable cualitativa y sólo permite distinguir entre clases, es decir, permite nombrar y diferenciar, además se pueden utilizar frecuencias, porcentajes, gráficos y moda. Ejemplo: Nacionalidad, Estado Civil,color de pelo, marca de las calculadoras, etc.

9. Variable NominalVariable OrdinalSegún Nivel de MediciónVariable IntervalarVariable de RazónClasificaciónde Variables Variable Discreta o DiscontinuaSegún Naturaleza de la VariableVariable ContinuaDicotómicaVariable CualitativaSegún Tipode VariablePolicotómicaVariable Cuantitativa

10. Variable NominalVariable OrdinalSegún Nivel de MediciónVariable IntervalarVariable de RazónClasificaciónde Variables Variable Discreta o DiscontinuaSegún Naturaleza de la VariableVariable ContinuaDicotómicaVariable CualitativaSegún Tipode VariablePolicotómicaVariable Cuantitativa

11. Según nivel de mediciónVariable OrdinalEsta es también una variable cualitativa, pero además existe una relación de orden en el recorrido de la variable, es decir, nombra, ordena, diferencia y jerarquiza, de aquí se pueden calcular frecuencias, porcentajes, gráficos de tortas y moda. Ejemplo: Nivel Socioeconómico, Grado en la Fuerzas Armadas, cargos, niveles jerárquicos, etc.

12. Según nivel de mediciónVariable IntervalarEsta es una variable cuantitativa, que permite sumar, restar, multiplicar y dividir, el cero en estas variables no es absoluto, es decir, no hay ausencia de atributo y de aquí se puede calcular las medidas de tendencia

central, medidas de posición, medidas de dispersión, estadísticos de forma y gráficos. Ejemplos: temperatura, niveles de autoestima, puntajes de CI, niveles de ansiedad, etc.

17. Según nivel de mediciónVariable de razón4.- De Razón: Esta es también una variable cuantitativa que permite sumar, restar, multiplicar y dividir, el cero en estas variables es absoluto, es decir, hay ausencia de atributo y de aquí se puede calcular las medidas de tendencia central, medidas de posición, medidas de dispersión, estadísticos de forma y gráficos. Ejemplo: Número de hijos, número de artefactos eléctricos que existenen el hogar, etc.

18. Variable NominalVariable OrdinalSegún Nivel de MediciónVariable IntervalarVariable de RazónClasificaciónde Variables Variable Discreta o DiscontinuaSegún Naturaleza de la VariableVariable ContinuaDicotómicaVariable CualitativaSegún Tipode VariablePolicotómicaVariable Cuantitativa

19Según naturaleza de la variableVariable Discreta o DiscontinúaLa variable tiene recorrido finito o a lo más numerable. Ejemplos: Número de hijos, número de artefactos eléctricos que existen en el hogar, estado civil, nivel socioeconómico, sexo, etc.

21. Según naturaleza de la variable2.- Variable continúa: La variable tiene un recorrido infinito no numerable. Si una variable es continua, entre dos valores potencialmente observables siempre existe otro valor potencialmente observable. Ejemplos: Temperatura corporal, altura de los árboles, notas, etc.

27. Según tipo de variableVariable CualitativaEs aquella que expresa un atributo, cualidad o característica y puede ser dicotómica y policotómica. Ejemplos: nacionalidad, sexo, estado civil, color de ojos.

30. Variable NominalVariable OrdinalSegún Nivel de MediciónVariable IntervalarVariable de RazónClasificaciónde Variables Variable Discreta o DiscontinuaSegún Naturaleza de la VariableVariable ContinuaDicotómicaVariable CualitativaSegún Tipode VariablePolicotómicaVariable Cuantitativa

31. Según tipo de variableVariable CuantitativaEs aquella que podemos expresar numéricamente. Ejemplos: Número de hijos, edad, altura, etc.

Psicología Experimental: Conceptos, Clasificación de Variables y Representación Gráfica

Medición y escalas de medida

Medición es el proceso por el cual se asignan números a objetos o características según determinadas reglas.

Una escala de medida es, en un sentido general, un procedimiento mediante el cual se relacionan de manera biunívoca un conjunto de modalidades (distintas) con un conjunto de números (distintos).

Estos es, a cada modalidad le corresponde un sólo número, y a cada número le corresponde una sola modalidad.

Atendiendo a las relaciones que puedan verificarse empíricamente entre las modalidades de los objetos o características pueden distinguirse cuatro tipo de escalas de medida: nominal, ordinal, de intervalos y de razón.

Otro concepto relacionado con las escalas de medidas es el de transformación admisible, el cual hace referencia al problema de la unicidad de la medida y que puede plantearse de la siguiente forma: ¿son las representaciones numéricas que hacemos de las modalidades las únicas posibles? NO.

Escala nominal

Se utiliza en todas aquellas modalidades o características en las que la única comprobación empírica que puede hacerse es la de igualdad o desigualdad.

Supongamos que se dispone de un conjunto de n elementos (o1, o2, ., on) con una determinada característica que adopta k modalidades diferentes.

A la modalidad de un objeto genérico oI, la representamos por m(oi), y al número que asignamos a dicha modalidad lo representamos por n(oi).

La regla de asignación de números a los objetos, de modo que se preserven las relaciones empíricas observadas entre estos debe cumplir las siguientes condiciones:

Si n(oi) = n(oj), entonces m(oI) = m(oj)

Si n(oi) ¹ n(oj), entonces m(oI) ¹ m(oj)

La transformación admsible es: cualquiera que preserve las relaciones de igualdad-desigualdad de los objetos respecto a una determinada característica.

Escala ordinal

Los objetos pueden manifestar determinada característica en mayor grado unos que otros. Ej. La dureza de los minerales.

Supongamos que se dispone de un conjunto de n objetos (o1, o2, ., on)y cada uno posee una cierta magnitud de una determinada característica [m(o1), m(o2), ., m(on)].

La escala para asignar números a los objetos [n(o1), n(o2), ., n(on)],de modo que reflejen esos diferentes grados en que los objetos presenten la característica, ha de cumplir las siguientes condiciones:

Si n(oi) = n(oj), entonces m(oi) = m(oj)

Si n(oi) > n(oj), entonces m(oi) > m(oj)

Si n(oi) < n(oj), entonces m(oi) < m(oj)

Transformación admisible: cualquier tranformación es válida siempre que preserve el orden de magnitud, creciente o decreciente, en que los objetos presentan determinada característica.

Escala de intervalos

Permite establecer la igualdad o desigualdad de las diferencias entre las magnitudes de los objetos medidos. Ej. Termómetro, calendario.

Supongamos que los valores asignados a los objetos sean una representación numérica correcta de sus relaciones empíricas.

Para todo cuarteto de objetos genéricos, oI, oj, ok, ol, los valores asignados n(oi), n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:

Si n(oi) - n(oj) = n(ok) - n(ol),

entonces m(oi) - m(oj) = m(ok) - m(ol).

Si n(oi) - n(oj) > n(ok) - n(ol),

entonces m(oi) - m(oj) > m(ok) - m(ol).

Si n(oi) - n(oj) < n(ok) - n(ol),

entonces m(oi) - m(oj) < m(ok) - m(ol).

Las transformaciones admisibles deben seguir una condicion del tipo:

t[n(oi)] = a + b . n(oi), siempre que b > 0.

Es decir, una trasformación lineal tal de los valores iniciales de una escala de intervalo deja la escala invariante respecto a las condiciones estipuladas en el párrafo anterior.

Este tipo de transformación supone un cambio en los dos aspectos que caracterizan la escala de intervalo.

Por un lado, el valor a, como constante aditiva, provoca un cambio en el origen.

Por otro lado, el factor b provoca un cambio en la unidad de medida que se toma para construir la escala (sólo cuando b = 1 la unidad de medida no se altera).

Escalas de razón

Las escalas de intervalo sirven para medir características en las que el valor cero no significa ausencia de dicha característica.

Los valores en una escala de razón tienen un valor absoluto, no arbitrario, o valor cero absoluto que sí significa ausencia de característica.

Para todo cuarteto de objetos genéricos, oi, oj, ok, ol, los valores asignados n(oi), n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:

Si n(oi)/n(oj) = n(ok)/n(ol),

entonces m(oi)/m(oj) = m(ok)/m(ol).

Si n(oi)/n(oj) > n(ok)/n(ol),

entonces m(oi)/m(oj) > m(ok)/m(ol).

Si n(oi)/n(oj) < n(ok)/n(ol),

entonces m(oi)/m(oj) < m(ok)/m(ol).

Al tener un origen de escala absoluto, la única transformación admisible para la escala de razón es del tipo: t[n(oi)] = a . n(oI), siendo a > 0.

Tipo de escala

Conclusiones acerca de Transformación admisible Ejemplos

NOMINAL Relaciones del tipo "igual Cualquiera que preserve la Sexo, raza, estado civil,

que" o "distinto de" igualdad/desigualdad diagnostico clínico

ORDINAL Relaciones del tipo "mayor que", "menor que" o "igual que"

Cualquiera que preserve el orden o grado de magnitud de los objetos

Dureza minerales, prestigio socia de profesiones, ubicación ideológica.

INTERVALO Igualdad o desigualdad de diferencias

a + b.x (b>0) Calendario, temperatura, inteligencia

RAZON Igualdad o desigualdad de razones

b.x (b>0) Longitud, masa, tiempo

Variables.Clasificación y Notación

Una variable, en su acepción estadística, es una representación numérica de una característica.

Cuando una característica presenta una sola modalidad decimos que se trata de una constante.

CLASIFICACIÓN

Clasificación por el tipo de escala de medida:

- Variables nominales - Variables ordinales

- Variables de intervalo

- Variables de razón

Este tipo de clasificación rara vez se utiliza, en su lugar se distinguen tres grandes tipos de variables, que engloban las cuatro derivadas del tipo de escala:

Cualitativa

- Dicotómica, cuando la variable presenta sólo dos categorías (ej. Sexo) - Politómica, si presenta más de dos categorías.

En general, cualquier variable medida a un nivel superior de escala nominal es susceptible de ser categorizada; cuando esto sucede se dice que la variable ha sido dicotomizada, si se han establecido sólo dos categorías y politomizada si se han establecido más.

Cuantitativa

- Discreta, si los valores que puede asumir la variable son números enteros.(ej. Hijos de una pareja)

- Continua,si la variable puede tomar cualquier valor de la escala de números reales. Las variables continuas, por razón del nivel de precisión de los instrumentos de medida, puede considerarse a efectos prácticos estadísticos como variables discretas.(al pesar un objeto con una balanza de precisión de 1 gramo, el peso que se lee se conoce como valor informado o valor aparente, mientras que los valores que acotan el intervalo (30,5 y 31,5) se conocen como límites exactos de la medida.

Cuasicuantitativa

En el ámbito de la metodología científica se emplea otra clasificación:

- V. independiente - V. dependiente

- V. contaminante o V. intermedia .

NOTACIÓN DE VARIABLES

Para simbolizar las variables estadísticas se utilizan letras mayúsculas del alfabeto latino, afectadas por un subíndice, para diferenciarlas de los valores constantes.

El Símbolo de Sumar o Sumatorio

Sean una serie de n números, simbolizados por X1, X2, ., Xn. la expresión (X1 + X2) indica la suma del primer número de la serie y el segundo.

La expresión (X1 + X2 + . + Xn) indica la suma de los n valores de la serie.

Reglas de sumatorio

1. Si los valores de una variable se multiplican por una constante, su sumatorio quedará multiplicado por dicha constante.

2. El sumatorio de una constante c un número n veces es igual a n veces dicha constante.

3. El sumatorio de una suma con cualquier número de términos es igual a la suma de los sumatorios de dichos términos tomados por separado.

Consecuencias del sumatorio

Consecuencia 1: El sumatorio de una variable mas una constante es igual a la suma de la variable mas n veces la constante

Consecuencia 2: La suma de los cuadrados de una variable no es igual al cuadrado de la suma de la variable.

Consecuencia 3: La suma de productos de dos variables no es igual al producto de sus sumas

Doble sumatorio

Supongamos que un grupo total se descompone en k grupos con n1, n2, ., nk personas respectivamente donde Xij representa la puntuación de la persona I que pertenece al grupo j.

Dicho en palabras, este doble sumatorio significa el sumatorio de los sumatorios de las puntuaciones de las personas en cada grupo:

Organización y Representación GráficaDISTRIBUCIÓN DE FRECUENCIAS

Ej.Variable: Procedencia población de inmigrantes

X ni pi Pi

Suramérica 24 0,16 16

Norteáfrica 60 0,40 40

Centroáfrica 12 0,08 8

Esteeuropa 18 0,12 12

China 21 0,14 14

Surasia 15 0,10 10

n=150 1,00 100

En la columna representada como X se representan todas las modalidades o categorias que representa la variable.

El número de observaciones en cada categoría se conoce como frecuencia absoluta (ni). La frecuencia relativa (pi) se obtiene dividiendo la frecuencia absoluta entre el número total de observaciones no.

La frecuencia relativa también se expresa en porcentajes, para lo cual hay que multiplicar cada una de las proporciones por cien (Pi).

Frecuencia absoluta acumulada: es el número de veces que, en la muestra, se repite cada modalidad o cualquiera de las modalidades anteriores.

Se simboliza por na. Se halla acumulando las frecuencias absolutas en orden ascendente.

Frecuencia relativa acumulada: simbolizada por pa, es el cociente entre la frecuencia absoluta acumulada de cada clase, na, y el total de observaciones, n. Expresado formalmente: pa=na/n.

Porcentaje acumulado: simbolizado por Pa, es el valor de la frecuencia relativa acumulada multiplicado por 100. Expresado formalmente:

Pa=pa*100.

Variable: Preocupación por las cuestiones políticas

X ni pi Pi na pa Pa

Nula 18 0,15 15 18 0,15 15

Mínima 42 0,35 35 60 0,50 50

Moderada 48 0,40 40 108 0,90 90

Máxima 12 0,10 10 120 1,00 100

120 1,00 100

El número total de observaciones, n, debe ser la suma del número de observaciones de cada clase, ni, y debe coincidir con el valor de la frecuencia absoluta acumulada de la última modalidad de la variable.

Se dan casos en los que la variable se expresa en un amplio número de valores, entonces solo cabe la estrategia de agrupar en intervalos estos valores.

Para calcular el número de intervalos aplicaremos (según Sturges):

N° de intervalos = E(1,5 + 3,3 log n)

Donde E representa la parte entera del resultado.

Tambien se puede hallar (según Kaiser), el número de intervalos no debe exceder nunca de la raiz cuadrada de n

Distribución de frecuencias de los datos agrupados en intervalos

X ni pI na pa

63-70 2 0,02 2 0,02

71-78 8 0,08 10 0,10

79-86 8 0,08 18 0,18

87-94 19 0,19 37 0,37

95-102 26 0,26 63 0,63

103-110 17 0,17 80 0,80

111-118 9 0,09 89 0,89

119-126 7 0,07 96 0,96

127-134 4 0,04 100 1,00

100 1,00

Existen otros conceptos:

Valor aparente o informado, es el valor que se lee en el instrumento de medida.

Límites exactos de medida, son los valores que acotan el intervalo en el que se encuentra el valor real.

La distribución de frecuencias de valores que son expresión discreta de una cantidad contínua (5,76) deben realizarse teniendo en cuenta los límites exactos de medida, no los valores informados.

En general, para obtener los valores exactos, o límites, entre los que se encuentra el valor real de la medida, se aplica la siguiente fórmula:

Límites exactos = Valor informado 0,5 * I

Siendo I = Unidad del instrumento de medida.

Por ejemplo, si se mide el tiempo que se emplea en ejecutar una determinada tarea, y para ello se utiliza un cronómetro con precisión de centésimas de segundo (0,01), el tiempo real de un tiempo aparente de 15,63 segundos se encontrará en el intervalo, Intervalo valor real= 15,63 0,01 *0,5 = 15,63 0,005 = 15,625 - 15,635

Conceptos:

Intervalo: sinónimo del concepto de modalidad, es cada uno de los grupos de valores que ocupan una fila en una distribución de frecuencias.

Límites aparentes: virtuales o informados, son los valores mayor y menor de cada intervalo, teniendo en cuenta el nivel de precisión del instrumento de medida.

Límites reales o exactos: son los valores máximo y mínimo que tendría cada intervalo si el instrumento de medida tuviera una precisión perfecta.

Punto medio del intervalo: es la semisuma de los límites exactos o de los límites aparentes.

Amplitud del intervalo: es la diferencia entre el límite exacto superior y el límite exacto inferior.