88
UNIVERSIDAD “GABRIEL RENE MORENO” FACULTAD POLITECNICA UNIDAD DE POSTGRADO ESTADISTICA APLICADA Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. Educación Superior [email protected] 24/07 al 21 de Agosto http://www.docstoc.com/profile/fmartinezsolaris/APUNTES DE ESTADISTICA APLICADA 2010

Curso de estadistica aplicada julio2010

Embed Size (px)

Citation preview

Page 1: Curso de estadistica aplicada julio2010

UNIVERSIDAD “GABRIEL RENE MORENO”FACULTAD POLITECNICA UNIDAD DE POSTGRADO

ESTADISTICA APLICADA

Por: Ing. M.Sc. Francisco Martínez SolarisMgs. Educación Superior

[email protected]/07 al 21 de Agosto

http://www.docstoc.com/profile/fmartinezsolaris/APUNTESDE ESTADISTICA APLICADA 2010

Page 2: Curso de estadistica aplicada julio2010

CURSO DE ESTADISTICA APLICADA

• INTRODUCCION/NOCIONES GENERALES

• ORGANIZACIÓN DE LA INFORMACIÓN

– Métodos Tabulares

– Métodos Gráficos

• METODOS NUMÉRICOS

– Medidas de Tendencia Central

– Medidas de Dispersión

• DEFORMACION DE CURVAS

• REGRESION Y CORRELACION LINEAL SIMPLE

• PROBABILIDAD

Page 3: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADANociones Generales

0

10

20

30

40

50

5 6 7 8 9 10 11 12 13

Núm

ero

de e

stud

iant

es

Edad (años) de los estudiantes

Normal

37.50%

Leve

43.48%

Moderada

17.39%

Severa

1.63%

Número de

especies

parásitas

Tipo de AnemiaTotal

Leve Moderada Severa

n % n % n % n %

1 3 100 0 0 0 0 3 2.61

2 12 70.59 5 29.41 0 0 17 14.78

3 30 69.77 11 25.58 2 4.65 43 37.39

4 21 67.74 9 29.03 1 3.23 31 26.96

5 11 68.75 5 31.25 0 0 16 13.91

6 3 60.00 2 40.00 0 0 5 4.35

Total 80 69.57 32 27.83 3 2.61 115 100

Page 4: Curso de estadistica aplicada julio2010

ESTADÍSTICA

DESCRIPTIVA

PROPOSITO

METODOS

INFERENCIAL

PROPOSITO

METODO

• TABULARES• GRAFICOS• NUMERICOS

PROBABILISTICO

¿Qué es?...

ESTADISTICA APLICADA

Nociones Generales

Características

Page 5: Curso de estadistica aplicada julio2010

Ciencia encargada de la Recolección,Manipulación, Organización yPresentación de información demanera tal que ésta tenga unaConfiabilidad determinada

ESTADISTICA APLICADANociones Generales

Page 6: Curso de estadistica aplicada julio2010

PoblaciónN

Parámetros µ, σ2, p, etc

Muestran=?

EstadísticosEstadígrafos

Deducción

TECNICAS DE MUESTREO

INFERENCIA

ESTIMACION

ESTADISTICA APLICADANociones Generales

Page 7: Curso de estadistica aplicada julio2010

PoblaciónN

Parámetros µ, σ2, p, etc.

Muestran=?

EstadísticosEstadígrafos

INFORMACIÓN

ESTADISTICA APLICADANociones Generales

CENSO MUESTREO

Page 8: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADANociones Generales

MUESTRA Tipos

Probabilística

No Probabilística

Azar

Arbitraria

MUESTREO

Probabilístico

No Probabilístico

MAS, MAP y MAE

Page 9: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADANociones Generales

CUÁNDO SE USA CENSO O MUESTREO

CENSO MUESTREO

Cuando la verificación de la información no daña o perjudica la unidad de análisis

Cuando la verificación de la información daña o perjudica la unidad de análisis

Se tienen los recursos necesarios para hacerlo (económico, humano, tiempo)

Cuando es imposible estudiar la población completa o bien no se poseen los recursos

Page 10: Curso de estadistica aplicada julio2010

POBLACION

ESTADISTICA APLICADANociones Generales

MUESTRA

Atributo

Variable

Cambiar

• Nombre

• Definición

• Rango de Valores

• Clasificación

Elementos

Tipos

Cualitativas

Cuantitativas

Categorías

Discretas

Continuas

Page 11: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADANociones Generales

Variable

• Nombre

• Definición

• Rango de Valores

• Clasificación

Elementos

Medirse

Escalas de Medición

Nominal

De Razón

+

Ordinal

De Intervalo

Page 12: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMétodos Tabulares

DESCRIPTIVA

METODOS

TABULARES

Sea X y Y dos variables y sea x1, x2, … xn yy1, y2, … yn, valores que toman las variablesX y Y, y sean “a” y “b” dos constantes.Entonces:

Sumatoria

Propiedades

x1 + x2 + x3 + …xn y1 + y2 + y3 + …yn

n

iyi

1

n

ixi

1

Page 13: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAPropiedades de Sumatoria

Page 14: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMétodos Tabulares/Ordenamiento

17

18

18

16

21

15

17

19

20

18

16

18

Edad (años)

Ordenándolo

15

16

16

17

17

18

18

18

18

19

20

21

Edad (años)

Valores extremos

Valores mas frecuente

Valores extremos

Desventaja

Page 15: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACuadro de Frecuencia

Edad (años)

fi fr Fia Fra

15 1 8.3 1 8.3

16 2 16.7 3 25.0

17 2 16.7 5 41.7

18 4 33.3 9 75.0

19 1 8.3 10 83.3

20 1 8.3 11 91.7

21 1 8.3 12 100

Total 12 100

Cuadros de Frecuencia

Page 16: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACuadro de Frecuencia

EC MC EC BC MC CD CD CD

EC BC MC EC CD BC BC MC

BC EC BC MC MC MC EC CD

BC MC MC BC BC CD MC MC

EC Excelente Calidad

BC Buena Calidad

MC Mediana Calidad

CD Calidad Deficiente

Page 17: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACuadro de Frecuencia

Calidad Frecuencia %

Excelente Calidad 6 18.75

Buena Calidad 9 28.125

Mediana Calidad 11 34.375

Calidad Deficiente 6 18.75

Total 32 100

Page 18: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACuadro de Frecuencia

67.7 39.2 52.5 42.3 69.8 61.2

63.9 37.2 45.7 41.7 69.1 55.5

64.9 38.9 52.4 41.9 69.2 58.9

68.3 39.2 52.6 42.7 70.0 61.9

68.3 39.2 53.3 45.5 70.1 63.2

Cuadro deFrecuencia

La Estadística ofrece otraalternativa Tablas deFrecuencias Absolutas yRelativas

BajaEficiencia

Page 19: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADATabla de Frecuencia

Procedimiento

Definir el Número de Intervalos

K = 1 + 3.33* log10 n

≥ 5 ó ≤ 20 ó 25

Sturges

Tipo de Intervalos (Li - LS]

Ac = A/kA = Valor Máx.- Valor Mín.

Ac = Ajustada

MD = (RI – A)/2

RI = Ac*K > A

Page 20: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADATabla de Frecuencia

Intervalos de Clases PMC fi fr Fia Fra

37.1 a 42.6 39.85 8 0.27 8 0.27

42.6 a 48.1 45.35 3 0.10 11 0.37

48.1 a 53.6 50.85 4 0.13 15 0.50

53.6 a 59.1 56.35 2 0.07 17 0.57

59.1 a 64.6 61.85 4 0.13 21 0.70

64.6 a 70.1 67.35 9 0.30 30 1

30 1

Page 21: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMétodos Gráficos

Métodos Gráficos Clásicos

Diagrama de Puntos

Histograma

Polígono de Frecuencias

Ojiva

Diagrama de Sectores

Page 22: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADADiagrama de Puntos

15 16 17 18 19 20 21

Edad (años)

Page 23: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAHistograma

0

1

2

3

4

5

6

7

8

9

10

fi

Intervalos de clases

Histograma de Frecuencias Absolutas

Page 24: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAPolígono de Frecuencias

0

1

2

3

4

5

6

7

8

9

10

34.35 39.85 45.35 50.85 56.35 61.85 67.35 72.85

fi

Puntos Medios de Ckases

Polígono de Freecuencia Absoluta

Page 25: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAOjiva

05

101520253035

37.1 42.6 48.1 53.6 59.1 64.6 70.1

Fia

Tiempo (minutos)

Ojiva o Polígono de Frecuencias

Acumuladas (menor que)

Page 26: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADADiagrama de Sectores

137-------360

19 ------- x

(19*360)

X= = 49.9

137

Lugar de realización de estudios Postgraduales

n Grados

Extranjero 19 49.927

Universidad de Interés 87 228.613

Otras universidades bolivianas 31 81.460

Total 137 360

Page 27: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADADiagrama de Sectores

Extranjero ,

49.92701

Universidad

de Interés ,

228.61314

Otras

universidades

bolivianas ,

81.45985

Diagrama de Sectores

Page 28: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMétodos Numéricos (Medidas de Tendencia Central)

Cuando se desea comparar dos o más poblaciones o bien muestras, y si las variables de interés son de carácter numérico …

Los métodos tabulares no son los más recomendables

La Estadística oferta otra herramienta

llamada Métodos Numéricos

Page 29: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Métodos Numéricos

Medidas de Tendencia Central

Medidas de Dispersión

Localizan el centro deuna base de datosnuméricas

Cuantifican cuánto sedispersan los datos de unamedida de tendenciacentral

Page 30: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Medidas de Tendencia Central

Promedio

Moda

Media Ponderada

Mediana

Page 31: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central/Promedio

Promedio

Población

Muestra

Media µ Poblacional

Es la sumatoria de las observaciones que toma una variable dividido entre el total de éstas

Se interpreta como el punto de equilibrio de una base de datos numéricas

Media Muestral

x

Page 32: Curso de estadistica aplicada julio2010

Tiempo (minutos)

52.6

38.9

68.3

67.2

63.9

64.9

68.3

39.2

42.3

61.9

567.5

56.75

Suma

Promedio

Desviaciones

-4.15

-17.85

11.55

10.45

7.15

8.15

11.55

-17.55

-14.45

5.15

0Suma

Propiedad

ESTADISTICA APLICADAMedidas de Tendencia Central

01

n

i

xxi

xxi

Page 33: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Media en datos tabulados

Si la tabla no presenta clases abierta es posible hacer una estimación de la media tomando en cuenta lo siguiente:

• PMC es el promedio de las observaciones de las observaciones que caben dentro del intervalos.

• PMC*fi proporciona una estimación de la suma de las observaciones que caben en el intervalo y como una tabla tiene k-ésimo intervalos entonces:

Page 34: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Intervalos de Clases PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

30

PMC*fi

318.8

136.05

203.4

112.7

247.4

606.15

1624.5

1624.5= = 54.15

30 x

Page 35: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Cargo fi Salario

Rector 1 2000

Asesores 2 1200

Vic. Académico 1 1150

Vic. Administrativo 1 1250

Jefe de Carrera C.S 2 1000

Jefe de Carrera 5 800

Administrativo 2 600

Secretarias 9 120

Cuando los datos tienen diferente peso dentro de labase de datos, si desea obtener el promedio, la mediaaritmética no es la más indicada

Page 36: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Cargo fi (wi)Salario

(xi)

Rector 1 2000

Asesores 2 1200

Vic. Académico 1 1150

Vic. Administrativo 1 1250

Jefe de Carrera C.S 2 1000

Jefe de Carrera 5 800

Administrativo 2 600

Secretarias 9 120

Xiwi

2000

2400

1150

1250

2000

4000

1200

1080

15080

15080= = 655.65

23wx

Page 37: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Mediana (Me)

Datos sin tabular

Datos tabulados

Si los datos no se distribuyen simétricamente (curva simétrica) el promedio no es la mejor medida para localizar el centro de los mismos

(b-a)(0.5- c)Me = a +

d

Me = xn/2 + 0.5

•Ordenar

Impar

Par

n

Me = (xn/2 + x n/2 + 1 )/2

Page 38: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

n es impar

Me

Me = xn/2 + 0.5

Page 39: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

68.3

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

68.3

n es par

Me = (xn/2 + x n/2 + 1 )/2

61.9 + 63.9Me = = 62.9

262.9

Mediana es aquella medida de tendencia central que antes y después de ella no existe más del 50% de la información

Page 40: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

(b-a)(0.5- c)Me = a +

d

a = Límite inferior de la clase de la Me

b = Límite superior de la clase de la Me

c = Fra una clase antes de la clase de la Me (Nj-1)

d = fr de la clase de la Me

Clase de la Mediana

• Complete la columna Fia

• Localice la menor Fia >n/2

• La clase a la quepertenece esta frecuenciaes la clase de la mediana(Nj)

• La Clase antes de Nj esNj -1

Page 41: Curso de estadistica aplicada julio2010

Intervalos

de ClasesPMC fi fr Fia Fra

37.1 a 42.6 39.85 8 0.27 8 0.27

42.6 a 48.1 45.35 3 0.10 11 0.37

48.1 a 53.6 50.85 4 0.13 15 0.50

53.6 a 59.1 56.35 2 0.07 17 0.57

59.1 a 64.6 61.85 4 0.13 21 0.70

64.6 a 70.1 67.35 9 0.30 30 1

ESTADISTICA APLICADAMedidas de Tendencia Central

(b-a)(0.5- c)Me = a +

d

a = Límite inferior de la clase de la Me

b = Límite superior de la clase de la Me

c = Fra una clase antes de la clase de la Me (Nj-1)

d = fr de la clase de la Me

n = 30

n/2 = 15

Nj = 17… (53.6 – 59.1)

Nj- 1 = (48.1 – 53.6)

(59.1-53.6)(0.5- 0.5)Me = 53.6 + = 53.6

0.07

Ubicación de la clase de la Me

Page 42: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

Connotancia de Moda (Mo) en Estadística

En caso de existir es la (s) observación (nes) que más se repiten en una base de datos

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

68.3

Distribuciones:

Unimodales

Bimodales

Etc.

Mo

Page 43: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Tendencia Central

(ficmo- ficpremo)

Mo = Licmo + Acmo

(ficmo-ficpremo) + (ficmo – ficpostmo)

Donde:

Licmo: Límite inferior de la Clase Modal

Acmo: Ancho de clase de la Clase Modal

Ficmo: Frecuencia absoluta de la Clase Modal

Ficpremo: Frecuencia absoluta de la Clase Premodal

Ficpostmo: Frecuencia absoluta de la Clase Postmodal

Clase Modal es la (s) que tiene(n) la mayor (es) fi

Page 44: Curso de estadistica aplicada julio2010

Intervalos

de ClasesPMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

ESTADISTICA APLICADAMedidas de Tendencia Central

(ficmo- ficpremo)

Mo = Licmo + Acmo

(ficmo-ficpremo) + (ficmo – ficpostmo)

(9 - 4)

Mo = 64.6 + 5.5 = 66.56

(9 - 4) + (9 – 0)

Page 45: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Dispersión

Medidas de Dispersión

Rango/Distancia/Amplitud o Recorrido

Varianza (Variancia)

Desviación Típica o Estándar

Coeficiente de Variación

Una medida de tendencia central por si sola no es tan importante. Por esta razón debe estar acompañada de una medida de dispersión

Page 46: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Dispersión

Rango Rango = Valor Máximo – Valor Mínimo

Varianza

Población ( σ²)

Muestra (S²)

Es el promedio de las desviaciones al cuadrado de las observaciones que toma una variable respecto a su media

2

12

N

xiN

i

Page 47: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Dispersión

xi (Desviaciones)2

52.6 17.2225

38.9 318.6225

68.3 133.4025

67.2 109.2025

63.9 51.1225

64.9 66.4225

68.3 133.4025

39.2 308.0025

42.3 208.8025

61.9 26.5225

Sumatoria 567.5 1372.725

Promedio 56.75

1372.725

S² = = 152.525mi²/est²

10 - 1

Desventaja

Desviación Típica S = √S²

S = √152.525 = 12.35 min/est

Interpretación x ± S

56.75 ± 12.35 min/est.

Page 48: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADA

Intervalos de Clases

PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

Si la tabla no presenta clases abierta es posible hacer una estimación de la varianza de la siguiente forma:

Page 49: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Dispersión

Intervalos de Clases

PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

PMC*fi PMC2*fi

318.8 12704.18

136.05 6169.8675

203.4 10342.89

112.7 6350.645

247.4 15301.69

606.15 40824.203

1624.5 91693.475

5103.128130

30

5.1624475.91693

2

2

S

3362.115103.128 S

Page 50: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Dispersión

Todas las medidas de dispersión expuestas anteriormente son dimensionales (toman las unidades de medidas de las variables)

Existe otra medida de dispersión pero adimensional llamadas Coeficiente de Variación o Dispersión Relativa

x

SVC. 100*.

x

SVC

Page 51: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADAMedidas de Dispersión

Las medidas de dispersión cuantifican cuánto sedispersan los datos alrededor de una medida detendencia central, pero, ¿Para donde se desvían losdatos?, a la izquierda de la media, a la derecha o sedistribuyen simétricamente.

Existen otras medidas aplicable solo a curvasunimodales que tratan de las deformación de curvastanto de forma horizontal como vertical

Page 52: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADADeformación de Curvas Unimodales

Asimetría

Asimetría Negativa

Asimetría Positiva

Curvas Simétricas

> Me > Mox

< Me < Mox

= Me = Mox

Page 53: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADADeformación de Curvas Unimodales

Page 54: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADADeformación de Curvas Unimodales

Curtosis

Curva Platicúrtica

Curva Leptocúrtica

Curva Mesocúrtica

Kur > 3

Kur < 3

Kur = 3

Page 55: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple

Y

X1

X2...

Xi

En el desarrollo de los eventos,puede ser que una variable seaafectada por el comportamiento deotra (s) variable (s)

Es de interés poder cuantificareste tipo de relación de maneraque se pueda predecir una variableen función de otra

En Regresión Lineal Simple es deinterés cuando una variable afectael comportamiento de otra variable

Y: Variable Dependiente

X: Variable Independiente

Y = f(X)Propósito de la R.L.S: Predicción

Page 56: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple

Por análisis de regresión se entiende al conjunto de métodosestadísticos que tratan con la formulación de modelosmatemáticos que describen la relación entre variables y eluso de estas relaciones modeladas con el propósito depredecir e inferir.

Por Regresión Lineal Simple se entiende …

Supuestos del Análisisde Regresión LinealSimple

“Y” es una variable aleatoria cuyadistribución probabilística dependede “X”Modelo de la Línea Recta

Homogeneidad de Varianza

Normalidad

Independencia

Page 57: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Diagrama de Dispersión

Llamado también Ploteo de Datos, tiene como propósitomostrar la posible tendencia (en caso de existir) entre lasvariables “X” y “Y”.

Consiste en llevar los pares de valores “x, y” a un sistema decoordenadas (bidimensional)

Y

X

(x, y)

Page 58: Curso de estadistica aplicada julio2010

Rango de Sueldo (X) Inasistencias (Y)11 1810 178 295 369 119 267 283 3511 148 207 322 399 168 266 313 40

Page 59: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Diagrama de Dispersión

0

5

10

15

20

25

30

35

40

45

0 2 4 6 8 10 12

Ina

sis

ten

cia

Rango de Salario

Page 60: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Métodos de Mínimos Cuadrados

El supuesto No 2 de RLS plantea que de existir una relaciónentre “X” y “Y”, ésta es una línea recta, por lo tanto se puedepensar en una ecuación de la siguiente forma:

De tal manera que se llegue a obtener una ecuación de lasiguiente naturaleza:

Parámetros

Estimación

Page 61: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Métodos de Mínimos Cuadrados

Uso de la Técnica deMínimos Cuadrados (CarlGauss)

A partir de muestras (x1, y1), (x2, y2), …(xi, yi) de las variables “X” y “Y”, se trata de obtener los estimadores . Para ello la Técnica de Mínimos Cuadrados minimiza la suma de cuadrado de las distancias entre los valores observados y los estimados de tal manera que :

Page 62: Curso de estadistica aplicada julio2010

Y

X

Page 63: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Recta de Estimación

Estimada una vez la recta de Predicción y teniendo en cuentaque el propósito de la R.L.S es la predicción, se hacenecesario estar seguro que la ecuación estimada es capaz depredecir.

Por esta razón es necesario validar la ecuación estimada

Page 64: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Validación de la Recta de Estimación

Validación

Cálculo de Coeficientede Determinación R²

Análisis de Varianzade la Regresión “ANARE”

Cuantifica la cantidad de la variabilidad de “Y” que puede ser explicada por “X”

R² ≥ 70%

Page 65: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADARegresión Lineal Simple/Validación de la Recta de

Estimación/ANARE

Por análisis de Varianza se entiende, de forma general, a lapartición de la variación total en fuente de variación conocidaque en el caso de R.L.S son de acuerdo al siguiente modeloaditivo lineal:

xi= Variación debida a Regresión

εi = Variación debida al Error

FV gl SC CM Fc Ft (Pr>F)

Regresión 1 SCRegresión CMRegresiónCMRegresión

/CMError

Error n-2 SCError CMError

Total n.1 SCTotales

Regla de Decisión

NRHo : Fc ≤ Ft

RHo : Fc > Ft

Page 66: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACorrelación Lineal Simple

Así como existen técnicas que cuantifican los cambios de unavariable dependiente por un único cambio de la variableindependiente, existen técnicas que cuantifican la asociaciónlineal entre dos variables, esta técnica es llamada CorrelaciónLineal Simple que se exprese como el coeficiente decorrelación (r)

Este coeficiente indica el sentido de la asociación comotambién la magnitud de ésta, partiendo del hecho que elcoeficiente de correlación lineal simple toma valores en elrango de: r es -1 ≤ r ≤ 1. Entre más se acerca a 1 el valor der mayor es la asociación entre dichas variables.

Page 67: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACorrelación Lineal Simple

-1 ≤ r < -0.8 Asociación

fuerte y

negativa

0 ≤ r < 0.4 No hay

asociación

-0.8 ≤ r < -0.4 Asociación

débil y

negativa

0.4 ≤ r < 0.8 Asociación

débil y

positiva

-0.4 ≤ r ≤ 0 No hay

asociación

0.8 ≤ r ≤ 1 Asociación

fuerte y

positiva

Page 68: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACorrelación Lineal Simple

Page 69: Curso de estadistica aplicada julio2010

ESTADISTICA APLICADACorrelación Lineal Simple

Regresión Lineal Simple Correlación Lineal Simple

Mide la cantidad de cambios en “Y”por un único cambio en “X”.

Mide asociación linealentre dos variables

Existe una variable dependiente yotra independiente

Es indistinto x, y ó y, x

β1 puede tomar cualquier valor en larecta numérica

El coeficiente decorrelación toma valores enel intervalo -1 ≤ r ≤ 1

Page 70: Curso de estadistica aplicada julio2010

Probabilidad

PROBABILIDADES

Experimentos Aleatorios

Espacio Muestral,Eventos y Sucesos

Tipos de Experimentos Aleatorios

Relaciones entre Eventos

Enfoques de Probabilidad/Teoremas Básicos de Probabilidad

Eventos Dependientes/Independientes

Probabilidad Total/Teorema de Bayes

Page 71: Curso de estadistica aplicada julio2010

Experimentos

Determinísticos

No Determinísticos

Sus resultados se conocen con anticipación sin necesidad de realizar el experimento

Sus resultados se conocen una vez que el experimento ha finalizado

Es un proceso planificado a través del cual se obtiene una observación (o una medición) de un fenómeno

Se pueden describir los posibles resultados pero no se puede decir cuál de ellos ocurrirá

Experimentos AleatoriosSon experimentos no determinísticos cuyos resultados están regidos por el azar

PROBABILIDADES

Page 72: Curso de estadistica aplicada julio2010

Supóngase que se lanzan dos monedas legales al mismo tiempo y que a una cara de cada moneda se la llama “Cara” a la otra “Sol” entonces:

={CC, CS, SC, SS}

Supóngase ahora que se lanza un dado legal. Entonces:

={1, 2, 3, 4, 5, 6,}

Experimentos Aleatorios

Son aquellos experimentos no determinísticos cuyos resultados están regidos por la casualidad (azar)

PROBABILIDADES

Page 73: Curso de estadistica aplicada julio2010

M = {CC, CS, SC, SS}

O bien en el caso del lanzamiento del dado

M = {1, 2, 3, 4, 5, 6,}

Espacio Muestral

Retomando el caso del lanzamiento de las dos monedas, ¿hay otro posible resultado en este experimento?.

Son todos los resultados que están asociados a un experimento aleatorio

Supóngase que el lanzamiento del dado se está interesado en la ocurrencia de una cara impar

A = {1,3,5} Evento

Es subconjunto del espacio muestral, es decir, sus resultados pertenecen al espacio muestral

PROBABILIDADES

Page 74: Curso de estadistica aplicada julio2010

Espacio Muestral

Evento

2

1

3

4

5

6

M

A

Suceso (wi)

Letras Mayúsculas del Alfabeto

A= (wiεA /wi ε M

PROBABILIDADES

Page 75: Curso de estadistica aplicada julio2010

Experimentos

Aleatorios

Simples

Compuestos

Un solo experimento aleatorio

Cuando ocurren dos o más experimentos simples al mismo tiempo o bien uno después del otro

Unidos por la partícula “ó” (v)

Unidos por la partícula “y” ( )

Los experimentos simples que lo componen ocurren de forma sucesiva

Los experimentos simples que lo componen ocurren al mismo tiempo

M = {M1∩M2…Mi} M = {M1UM2U…Mi}

PROBABILIDADES

Page 76: Curso de estadistica aplicada julio2010

Experimentos

Aleatorios

Simples

Compuestos

Un solo experimento aleatorio

Cuando ocurren dos o más experimentos simples al mismo tiempo o bien uno después del otro

M = {1, 2, 3, 4, 5, 6,}

M = {CC, CS, SC, SS}

PROBABILIDADES

Page 77: Curso de estadistica aplicada julio2010

M2

M1 C S

C CC CS

S SC SS

Experimentos compuestos unidos por la partícula “y”

M3

M1*M2 C S

CC CCC CCS

CS CSC CSS

SC SCC SCS

SS SSC SSS

El espacio muestral es el producto cartesiano de los espacios muestrales simples que lo conforman

PROBABILIDADES

Page 78: Curso de estadistica aplicada julio2010

Experimentos compuestos unidos por la partícula “y”

C

S

C

S

C

S

C

S

C

S

C

S

C

S

M

CCC

CCS

CSC

CSS

SCC

SCS

SSC

SSS

Diagrama del Árbol

Diagrama de Senderos

1ra Moneda

2da Moneda

3era Moneda

PROBABILIDADES

Page 79: Curso de estadistica aplicada julio2010

De acuerdo a cómo ocurren los eventos se pueden establecer algunas relaciones entre ellos tales como:

AUB

A B M

AUB

A B M

AΠB

A B MM

AA´

PROBABILIDADES

Page 80: Curso de estadistica aplicada julio2010

Enfoques de

Probabilidades

Clásico

Frecuencia Relativa

Probabilidad A priori. Llamada También Probabilidad de Laplace

Probabilidad A posteriore

Subjetivo

PROBABILIDADES

Page 81: Curso de estadistica aplicada julio2010

Probabilidad

Clásica

Supuesto

Frecuencia Relativa

Probabilidad A posteriore

Subjetivo

Todos los sucesos de unexperimento aleatorio tienenla misma posibilidad deocurrir, entonces:

M

naAP

10 AP

Si en la realización deexperimento aleatorio apareceun evento A “n veces ≤N”,entonces:

N

nAP

PROBABILIDADES

Page 82: Curso de estadistica aplicada julio2010

Teoremas Básicos de

Probabilidades

P[AUB] = P [A] + P [B]

P[AUB] = P [A] + P [B] – P[AΠB]

P[Ø] = 0

P[M] = 1

%1000/10 APAP

APAP c 1

PROBABILIDADES

Page 83: Curso de estadistica aplicada julio2010

Cuando la ocurrencia de un evento está en dependencia de otro evento, se dice que éste es dependiente.

Sea A y B dos eventos en el espacio muestral “M”, se dice que A es un evento dependiente de B sí;

o bien: 0; BPB

APAP 0; APA

BPBP

Estas probabilidades se pueden calcular de dos formas:

• Respecto al espacio muestral original

• Respecto al espacio muestral del evento condicionante

0;

BPBP

BAPB

AP

0;

APAP

ABPA

BP

PROBABILIDADESEventos Dependientes

Page 84: Curso de estadistica aplicada julio2010

En una institución de Educación Superior se tiene 300 docentes, de los cuales 100 son casados y 30 divorciados. En dicha institución hay 200 hombres, 85 de los cuales son casados y 95 son solteros. Determinar cual es la probabilidad de seleccionar un docente al azar:a. Que sea mujerb. Que sea soltero (a)c. Que sea un hombre y esté casado (a)d. Que sea una mujer divorciadae. Dado que el docente es casado (a), ¿cuál es la probabilidad

que sea hombre?f. Si el docente seleccionado es hombre, ¿cuál es la probabilidad

que sea casado?

PROBABILIDADES

Page 85: Curso de estadistica aplicada julio2010

En una universidad el 70% de los estudiantes son de Ciencias, 30% de Letras. De los estudiantes de Ciencias el 60% son varones y los de Letras son varones el 40%. Si se elige al azar un estudiante, calcule la probabilidad que:a. Sea mujerb. Se estudiante varón dado si es de Cienciasc. Sea estudiante de Ciencias dado que es varónd. Sea estudiante de Ciencias y varón.

PROBABILIDADES

Page 86: Curso de estadistica aplicada julio2010

Cuando la ocurrencia de un evento no está en dependencia de la ocurrencia de otro evento, se dice que éstos son independientes.

Sea A y B dos eventos en el espacio muestral “M”, se dice que A es un evento independiente de B sí se cumple con cualquiera de las siguientes condiciones:

BPAPBAP *

0;

APBPAP

ABPA

BP

0;

BPAPBP

BAPB

AP

PROBABILIDADESEventos Independientes

Page 87: Curso de estadistica aplicada julio2010

Sea A1, A2, …, Ak, eventos que forman una partición del espacio muestral M y sea B, un evento en M. Si las probabilidades P[A1], P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak] son probabilidades conocidas entonces:

]/[][...]2/[]2[1/1 AkBPAkPABPAPABPAPBP

Probabilidad Total = AkBPAkPBPk

i/

1

PROBABILIDADESProbabilidad Total

Page 88: Curso de estadistica aplicada julio2010

Sea A1, A2, …, Ak, eventos que forman una partición del espacio muestral M y sea B, un evento en M. Si las probabilidades P[A1], P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak]. Si B ya ha ocurrido y se está interesado en saber a cual de los eventos que forman la partición muestral se ha debido su ocurrencia, entonces se usa el denominado Teorema de Bayes

k

i AkBPAkP

AkBPAkP

BAkP

1

PROBABILIDADESTeorema de Bayes