Upload
carlos-carrion-aguilar
View
3
Download
0
Embed Size (px)
DESCRIPTION
estaistica
Citation preview
FACULTAD DE INGENIERÍA
APUNTES DE ESTUDIO
Hugo Saavedra Saavedra
PRESENTACIÓN
Los años de desempeño como docente en las diferentes carreras
profesionales universitarias nos llevan al convencimiento de que la Estadística
desarrollada fuera de un contexto de aplicación se convierte en una materia
árida y pesada para quienes se inician en su estudio.
La percepción de los estudiantes es que es una disciplina difícil de
entender. Lo que ocurre es que algunas materias tienen en su núcleo de
contenidos, puramente conceptos, unos más complejos que otros, su estudio y
comprensión sólo pasa por una lectura atenta de la literatura respectiva; en
cambio existen materias, entre ellas la Estadística, que además de tener los
elementos conceptuales, implica realizar cálculos mediante fórmulas, lo que
requiere habilidades operatorias, sea en forma manual, con calculadoras de
bolsillo o con un ordenador; un componente adicional es la interpretación de
los resultados de los análisis de datos.
El propósito de elaborar el presente material es el de proporcionar a los
estudiantes de las escuelas de la Facultad de Ingeniería un documento en el
que encuentren los conceptos y procedimientos de la Estadística expuestos de
manera muy simple pero rigurosa.
Hugo Saavedra Saavedra
2
ÍNDICE
PRESENTACIÓN……………………………………………………………………….……… 02
CAPÍTULO I: USOS DE LA ESTADÍSTICA Y CONCEPTOS BÁSICOS...................... 04
1.1. Uso de la Estadística………………………………………………………….….…… 04 1.2. Conceptos básicos…………………………………………………………….……… 051.3. Medición y escalas de medición ……………………………………………….….… 12
CAPÍTULO II: RECOLECCIÓN DE DATOS ESTADÍSTICOS………………… …….…. 142.1. Introducción………………………………………………………………………….….… 142.2. Objetivos…………………………………………………………………………….…..… 142.3. Fuentes de datos………………………………………………………………….……… 14
2.3.1. Fuentes internas………………………………………………………..……… 152.3.2. Fuentes externas………………………………………………………….…... 15
2.4. Métodos Técnicas e Instrumentos de recolección de datos estadísticos………….. 162.5. El método de Observación…………………………………………………..………….. 17
2.5.1. Nivel de observación………………………………………………..………… 192.5.2. Formas de observación……………………………………………..………... 202.5.3. Ventajas de la observación…………………………………………..…….… 212.5.4. Desventajas de la observación……………………………………….…...… 21
2.6. EL MÉTODO DE ENCUESTA…………………………………………………….….… 212.6.1. El proceso de realización de una encuesta………………………….…….. 212.6.2. El Cuestionario………………………………………………………….…….. 232.6.3. Componentes de un cuestionario……………….…………………….…..… 242.6.4. Formas de aplicación de un cuestionario………………………………….. 242.6.5. Diseño de un cuestionario………………………………………….….…..… 24
CAPÍTULO III: ANÁLISIS DESCRIPTIVO DE DATOS ESTADÍSTICOS……………… 353.1. Introducción……………………………………………………………………………. 353.2. Análisis de datos estadísticos mediante técnicas tabulares y gráficas………..… 35
3.2.1. Tabla para una variable cualitativa……………………………………...… 363.2.2. Representaciones gráficas………………………………………………… 403.2.3. Tabla para dos variables cualitativas……………………………….…….. 433.2.4. Tabla para una variable cuantitativa discreta………………………….… 483.2.5. Tabla para una variable cuantitativa continua…………………………… 503.2.6. Uso de EXCEL para construcción de tablas y gráficas………………… 53
3.3. Análisis de datos estadísticos mediante técnicas numéricas…………….…….… 563.3.1. Medidas de posición centra de un conjunto de datos…………….…..… 563.3.2. Medidas de dispersión de un conjunto de datos………………….…..… 623.3.3. Medidas de distribución de un conjunto de datos……………….……… 64
3
CAPÍTULO I
USO DE LA ESTADÍSTICA Y CONCEPTOS BÁSICOS
1.1. USO DE LA ESTADÍSTICA
¿Quiénes usan la Estadística?
El proceso de recoger, organizar, presentar, resumir y analizar datos se presenta como
parte de otros Procesos más generales, tales como el proceso de la investigación
científica, proceso de gestión, de producción, administración, etc., en toda situación en la
que se requiere información cuantitativa como base objetiva para la toma de decisiones.
Actualmente los gobiernos de los países recolectan sistemáticamente datos relativos a su
población, su economía, sus recursos naturales y su situación política y social para tomar
decisiones. En las actividades industriales o comerciales las estadísticas son parte de la
organización, así como en los sectores agrícolas y forestales, estadísticas de
exportaciones, de producción, estadísticas de salud, estadísticas educativas, etc.
La Estadística y el Estado
Un estado necesita conocer su población: en el Perú, al igual que en otros países, los
censos que por lo general se llevan a cabo cada 10 años, permiten obtener estadísticas
demográficas oficiales, así como de viviendas y muchas otras características sociales,
mediante los métodos estadísticos apropiados se pueden hacer predicciones o
estimaciones del comportamiento de dichas características durante el período intercensal.
Para elaborar un plan de mejora de la salud de la población el gobierno tiene que tener
informaciones sobre las necesidades de la población (datos demográficos, enfermedades
según las estaciones, etc.) y un inventario sobre la infraestructura de salud. En función de
estas informaciones se crean nuevos hospitales, se amplían antiguos consultorios, etc.
Para erradicar la pobreza o definir una política de empleo, hay que estudiar el origen del
problema. En el campo de la agricultura, se requiere hacer buenas predicciones de la
producción (de arroz, algodón, ganado vacuno, trigo, por ejemplo) y decidir si estas
permitirán satisfacer la demanda. En la explotación de los bosques es importante estimar
los volúmenes y la calidad de la madera esperada en una zona dada para la planificación
de las cosechas y los requerimientos de la demanda.
4
La Estadística en las empresas
Una fábrica o una empresa de servicios requiere saber de sus recursos, producción,
demanda y la competencia de sus productos. Estos problemas involucran el control de
calidad de los productos en los procesos de fabricación y los estudios de mercado y la
toma de decisiones de marketing, entre otros. Una compañía de Seguros de Vida requiere
estimar la probabilidad de que una persona de una cierta edad y cierto sexo fallezca antes
de alcanzar una determinada edad, con el objetivo de fijar el monto de su póliza. Un
productor de fertilizante tiene que evaluar la eficacia de su producto. Hará, por ejemplo,
un experimento para medir el efecto de su fertilizante sobre la cosecha de choclo.
La Estadística y la Investigación
En la investigación científica y tecnológica, como es el caso de la física, la química, la
biología o las ciencias sociales, se busca verificar empíricamente hipótesis, leyes y
teorías, a través de experimentos que se diseñan y analizan mediante métodos
estadísticos. Un físico busca el valor de una constante
numérica, que aparece en una relación exacta. Sin embargo, el experimento que le
permitirá obtener la constante en el laboratorio conlleva perturbaciones en las mediciones.
Tomar el promedio de varias mediciones será la mejor forma de resolver su problema. En
la clasificación de planta o animales se usan procedimientos de muestreo aleatorio para
contarlos. Las famosas leyes de Mendel, a pesar de referirse a caracteres genéticos
cualitativos, pueden considerarse como leyes estadísticas.
La Estadística y la Educación
Un psicólogo mide las aptitudes mentales de algunos estudiantes y les da un método de
estudio. El rendimiento permitirá evaluar el método de estudio en función de las aptitudes
mentales. La psicometría es la rama de La psicología que trata mediciones relativas a
habilidades mentales de individuos. En educación, la psicometría permite, mediante tests
llevados a escalas numéricas, medir características psicológicas relativas al
comportamiento, el aprendizaje y el rendimiento de los estudiantes.
1.2. CONCEPTOS BÁSICOS
¿Qué es la Estadística?
5
Definición 1.1. Estadística
La Estadística es una rama de las matemáticas aplicadas, una ciencia que se ocupa
del desarrollo y la aplicación de métodos y procedimientos científicos para recoger,
organizar, presentar, resumir y analizar datos. Así como sacar conclusiones válidas
y tomar decisiones razonables, basadas en informaciones objetivas obtenidas
como resultado de los análisis.
Los métodos estadísticos se clasifican tradicionalmente en dos clases:
- Los métodos Descriptivos (Estadística Descriptiva) y
- Los métodos inferenciales (Estadística Inferencial).
Estadística Descriptiva
Parte de la Estadística que, utilizando métodos numéricos y gráficos, se encarga de la
presentación y resumen de conjuntos de datos, sean éstos poblacionales o muestrales; su
objetivo es la caracterización, descripción, de un fenómeno o variable, sin pretender sacar
conclusiones sobre la población.
Estadística Inferencial
Parte de la estadística, que sobre la base de las leyes de la probabilidad, hace inferencias
inductivas acerca de las poblaciones a partir de muestras obtenidas de dichas
poblaciones. La validez de las conclusiones inferenciales tiene un carácter probabilístico.
¿Qué es Población?
Definición 1.2. Población
En el lenguaje cotidiano, se entiende por población en términos de su significado
demográfico, esto es, como una colectividad o conjunto de personas que se encuentran
en un determinado ámbito geográfico o demarcación política, en este sentido, son
corrientes expresiones como “población de la región norte del Perú” o “población de la
Provincia de Chiclayo”, etc. En el contexto de la Estadística suele tener dos significados:
1) En un sentido general, una población es el conjunto constituido por la totalidad de
individuos u objetos de cualquier naturaleza, que poseen ciertas propiedades o
6
características comunes, susceptibles de ser observadas estadísticamente
(medidas, contadas o clasificadas) y que son de interés en una investigación. Así,
de acuerdo al objeto de la investigación las poblaciones pueden ser conjuntos de
personas (consumidores, trabajadores, alumnos, pacientes, turistas, vendedores, etc.),
familias, viviendas, empresas, artículos producidos en una línea de producción, animales,
plantas, etc.
2) En un sentido especial, estadístico, una población estadística es el conjunto de
valores que puede tomar una característica (variable) en cada uno de los elementos
que constituyen la población. La metodología estadística se desarrolla tomando el
significado de población en este sentido especial. Sólo en este sentido tiene caso hablar
de distribución de una población
¿Qué es Muestra?
Definición 1.3. Muestra
Es una parte, subconjunto, de una población, que está disponible o que se selecciona
expresamente para el estudio de dicha población. Bajo esta definición cualquier
subconjunto de una población es una muestra, sin embargo, no cualquier subconjunto
puede tomarse como muestra para conducir una investigación, es preciso que la muestra
cumpla con dos condiciones básicas, a saber, deberá ser representativa y adecuada.
Muestra Representativa
Es aquella que posee las características de la población, una muestra es representativa
cuando la población entera se encuentra expresada o reflejada en su parte que es la
muestra. Es imposible saber si una muestra concreta es o no es representativa de una
población. La estadística usa técnicas especializadas de muestreo y mecanismos de
selección aleatoria que garantizan en gran medida la representatividad y eliminan criterios
(preferencias o prejuicios) de quienes seleccionan los elementos que conformarán la
muestra. La aleatoriedad es un principio fundamental de la ciencia estadística tanto en su
dimensión teórica como práctica.
Muestra Adecuada
La adecuación de una muestra tiene que ver con su tamaño, es decir, con la cantidad de
elementos que son seleccionados de la población para conformar la muestra- El tamaño
7
de una muestra es función de varios factores, siendo los más destacables, además de los
objetivos y el diseño del estudio, la variabilidad de los elementos de la población en las
características o variables que gobiernan la investigación, el margen de error que se está
dispuesto a tolerar, la o las probabilidades de tomar decisiones erráticas y como
consecuencia de las mismas arribar a conclusiones que no guardan congruencia con la
realidad.
¿Qué es un parámetro?
Definición 1.4. Parámetro
Es un valor que expresa alguna característica numérica de una población, generalmente
se simbolizan por las letras del alfabeto griego. Son ejemplos de parámetros:
La media Poblacional, simbolizada por μ.
La desviación estándar de la población, simbolizada por σ.
El coeficiente de correlación lineal simbolizada por ρ.
La proporción poblacional, simbolizada por π.
El cálculo del valor de un parámetro requiere el conocimiento de los valores de toda la
población.
¿Qué es Una estadística?
Definición 1.5. Estadística (Estadístico)
Es un valor numérico que expresa alguna característica de una muestra. Se simbolizan
por las letras latinas. Ejemplos de estadísticas son:
La media muestral, simbolizada por X̄
La desviación estándar muestral, simbolizada por S.
El coeficiente de correlación lineal, simbolizada por r
La proporción muestral, simbolizada por p. etc.
8
Los valores de las estadísticas se calculan a partir de los datos muestrales.
¿Qué es Unidad de Análisis?
Definición 1.6. Unidad de Análisis.
Se denomina Unidad de Análisis a cada elemento u objeto que conforma la población, en
tanto se lo considere como poseedor de ciertas propiedades, atributos o características
denominadas variables que son de interés en una investigación.
¿Qué es Variable Estadística?
Definición 1.7. Variable Estadística.
Es cualquier propiedad, atributo o característica de las unidades de análisis, susceptible
de adoptar diferentes valores o modalidades, que puede ser observada estadísticamente:
medida, contada o clasificada en categorías.
El término variable tiene un amplio uso en el lenguaje científico, así, puede referirse a
fenómenos, procesos o constructos a un nivel teórico, sin una referencia empírica
especial. Las variables estadísticas por el contrario son los indicadores empíricos que se
obtienen como resultado del proceso de operacionalización de variables complejas o
teóricas.
Clases de variables estadísticas
Una clasificación que resulta muy útil es la que se hace teniendo en cuenta la naturaleza
de las variables, según este criterio las variables estadísticas se clasifican en Cualitativas
y Cuantitativas.
Variables Cualitativas
Son atributos o cualidades que no son susceptibles de ser medidas numéricamente, este
tipo de variables presentan un conjunto de categorías y modalidades que permiten la
clasificación o categorización de las unidades de análisis. Son ejemplos de esta clase de
variables: la nacionalidad, color de piel, sexo, estado civil, lugar de residencia, etc.
Variables Cuantitativas
9
Son características que pueden ser medidas, ya sea por medio de algún instrumento o
por un proceso de conteo y como resultado de la medición se obtienen valores numéricos.
Ejemplo: edad, precios de un producto, ingresos anuales de familias, duración de
artículos, número de trabajadores de empresas, número de hijos de matrimonios, cantidad
de glucosa en la sangre, presión arterial sistólica de pacientes, cantidad de pacientes
atendidos en un día en un consultorio de un hospital, número de escolares que faltan a
clases en un día etc. Las Variables Cuantitativas se clasifican a su vez en discretas y
continuas.
Variables Discretas
Son aquellas que sólo pueden tomar ciertos valores, por lo general valores enteros que
resultan del proceso de contar, en un intervalo dado. Ejemplo: número de trabajadores de
empresas, número de hijos de matrimonios, cantidad de pacientes atendidos en un día en
un consultorio de un hospital, número de escolares que faltan a clases en un día etc.
Variables Continuas
Estas variables pueden tomar cualquier valor real, enteros con parte decimal: décimos,
centésimos, milésimos, etc. Ejemplo: Ejemplo: edad, precios de un producto, ingresos
anuales de familias, duración de artículos, cantidad de glucosa en la sangre, presión
arterial sistólica de pacientes, la velocidad a la que recorren los vehículos de transporte,
etc.
¿Qué es Dato Estadístico?
Definición 1.8. Dato estadístico
Es el resultado de practicar una medición del valor de una variable cuantitativa o el
resultado de determinar la modalidad si la variable es cuantitativa, n una unidad de
análisis.
La siguiente tabla contiene un pequeño segmento de un archivo de datos obtenidos a
través de una encuesta a una muestra de trabajadores del departamento de Lambayeque.
10
En la primera columna se tiene los nombres de los encuestados, unidades de análisis;
las columnas 2, 6 y 7 contienen datos de las variables cualitativas sexo, distrito de
residencia y grado de satisfacción con el trabajo; los datos que corresponden a las
variables cuantitativas continuas edad, sueldo mensual, y tiempo de servicios se
encuentran en las columnas 3, 4 y 5, nótese que en el caso de las variables edad y
tiempo de servicios, aun cuando se midan con enteros, las variables son continuas,
pues en realidad, un trabajador que reporta una edad de 48 años, por ejemplo, en
realidad puede tener 48 años y 3 meses, que se escribiría como 48.25 años, otra persona
que declara tener 29 años, teniendo en realidad 29 años y 20 días, tiene en realidad
29 + 20/365 = 29.05794521 años de edad; el hecho de que reportemos la edad
remitiéndonos a los años cumplidos, que se expresa con números enteros, no implica que
la variable edad sea discreta; en cambio la variable número de miembros del hogar es
cuantitativa discreta, porque no admite más que valores enteros, como los que
aparecen en la última columna de la tabla, así no es posible que un hogar tenga, por
ejemplo, 5.25 ni 7.125 miembros.
11
1.3. MEDICIÓN Y ESCALAS DE MEDICIÓN
¿Qué es medición?
Hasta este punto está claro que la materia prima de la Estadística aplicada son los datos
estadísticos y estos son resultados de mediciones, conviene, entonces, decir algo sobre lo
que es la medición y las escalas que se emplean para realizar las mediciones.
Definición 1.9. Medición
La medición es un proceso de asignación de números u otros signos a las
características de los objetos, de acuerdo con ciertas reglas especificadas con
anticipación.
Se miden características de objetos (unidades de análisis) usando instrumentos
apropiados y reglas precisas para asignar números o símbolos. La tabla que sigue
contiene algunos ejemplos de medición de diferentes variables en diferentes tipos de
unidades de análisis.
12
Escalas de medición. Todo proceso de medición consiste en la asignación de números a observaciones de modo tal que los
números sean factibles de análisis por operaciones matemáticas.
Las escalas de medición son cuatro, cada una posee ciertas propiedades que todo investigador debe conocer a fin de aplicar la
metodología estadística de manera apropiada. Las cuatro escalas constituyen también cuatro niveles de medición.
13