Click here to load reader
View
82
Download
1
Embed Size (px)
Citation preview
MÉTODOS NUMÉRICOS
CAPÍTULO 4: REGRESIÓN POR
MÍNIMOS CUADRADOS.
LINEALIZACIÓN. MODELO
EXPONENCIAL.
Ing. Willians Medina.
Maturín, Junio de 2015.
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 50
4.4.- LINEALIZACIÓN DE RELACIONES NO LINEALES.
La regresión lineal ofrece una poderosa técnica para ajustar una mejor línea a los
datos. Sin embargo, se considera el hecho de que la relación entre las variables dependiente
e independiente es lineal. Éste no es siempre el caso, y el primer paso en cualquier análisis
de regresión deberá ser graficar e inspeccionar los datos en forma visual, para asegurarnos
que sea posible usar un modelo lineal. Por ejemplo, la figura 4.12 muestra algunos datos
que obviamente son curvilíneos. En algunos casos, las técnicas como la regresión
polinomial, que se describen en la sección 4.3 son apropiadas. En otros, se pueden utilizar
transformaciones para expresar los datos en una forma que sea compatible con la regresión
lineal.
Figura 4.12. Diagrama de dispersión. Tendencia no lineal.
4.5.- MODELO EXPONENCIAL.
Un ejemplo es el modelo exponencial.
xbeay 1
1 (4.18)
0
1
2
3
4
5
6
7
8
0 5 10 15 20 25
y
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 51
donde 1a y 1b son constantes. Este modelo se emplea en muchos campos de la ingeniería
para caracterizar cantidades que aumentan ( 1b positivo) o disminuyen ( 1b negativo), a una
velocidad que es directamente proporcional a sus propias magnitudes. Por ejemplo, el
crecimiento poblacional o el decaimiento radiactivo tienen este comportamiento. Como se
ilustra en la figura 4.13, la ecuación representa una relación no lineal (para 01 b ) entre y
y x.
Figura 4.13. Diagrama de dispersión del modelo exponencial.
Hay técnicas de regresión no lineal disponibles para ajustar esta ecuación de manera
directa a datos experimentales. Sin embargo, una alternativa simple consiste en usar
manipulaciones matemáticas para transformar las ecuaciones en una forma lineal. Después,
se utiliza la regresión lineal simple para ajustar las ecuaciones a los datos.
Por ejemplo, la ecuación (4.18) se linealiza al aplicar el logaritmo natural. Se
obtiene
)(lnln 1
1
xbeay
0
500
1000
1500
2000
2500
3000
3500
4000
0 0.5 1 1.5 2 2.5
y
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 52
)(lnlnln 1
1
xbeay
Pero como xbexb
1)(ln 1
xbay 11lnln (4.19)
Así, una gráfica de yln contra x dará una línea recta con una pendiente 1b y una
intersección con el eje de las ordenadas igual a 1ln a (Figura 4.14).
Figura 4.14. Gráfica de yln contra x en ejes rectangulares del modelo exponencial.
Graficar y (en escala logarítmica) contra x (en escala lineal) en una gráfica
semilogarítmica (Figura 4.15) equivale a graficar yln contra x en ejes rectangulares. Si la
gráfica es lineal en cualquiera de estos casos, x y y estarán relacionadas por una función
exponencial xb
eay 1
1 .
Obsérvese que la escala horizontal en el papel semilogarítmico (Figura 4.15) es
uniforme (igualmente espaciada), mientras que el eje vertical se encuentra en escala no
uniforme. Cada una de las líneas verticales se enumeran de tal manera que abarquen la
6.00
6.50
7.00
7.50
8.00
8.50
0 0.5 1 1.5 2 2.5
lny
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 53
gama de valores de la variable independiente con la escala apropiada. Cada una de las
líneas horizontales se enumeran tomando en cuenta la base del logaritmo. Si es un
logaritmo de base 10, los valores sucesivos de cada línea vertical podrían ser 1100 ,
10101 , 100102 , 1000103 , 10000104 y así sucesivamente hasta completar la
gama de valores de la variable dependiente. De igual manera los valores podrían ser 0.001,
0.01, 0.1, 1, 10, 100,… Si la base del logaritmo es 2, entonces la escala vertical tendrá los
valores 120 , 221 , 422 , 823 , 1624 y así sucesivamente. De igual manera los
valores podrían ser 0.125, 0.25, 0.5, 1, 2, 4, 8, 16…
Figura. 4.15. Papel semilogarítmico.
En este caso aparece ahora un problema lineal y las soluciones para 1ln a y 1b
pueden encontrarse modificando apropiadamente las ecuaciones (4.4) y (4.5):
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 54
2
11
2
1111
2
1
)(
)(ln)(ln
ln
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xxn
xyxyx
a (4.20)
2
11
2
111
1
)(
)(ln)(ln
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
xxn
yxyxn
b (4.21)
El coeficiente de correlación se determina aplicando la modificación apropiada de la
ecuación (4.10).
2
11
22
11
2
111
)](ln[)(ln)(
)(ln)(ln
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r (4.22)
Se debe recordar, sin embargo, que la aproximación obtenida de esta manera no es la
aproximación de mínimos cuadrados para el problema original y que esta aproximación
puede, en algunos casos, diferir significativamente de la aproximación de mínimos
cuadrados del problema original.
Ejemplo 4.4.
[CC] Ajuste un modelo exponencial a los siguientes datos:
i x y
1 0.4 750
2 0.8 1000
3 1.2 1400
4 1.6 2000
5 2.0 2700
6 2.3 3750
Grafique los datos y la ecuación en papel milimétrico, así como en semilogarítmico.
Analice sus resultados.
Solución.
El modelo exponencial se corresponde a la ecuación
xbeay 1
1 (4.18)
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 55
cuya forma linealizada es
xbay 11lnln (4.19)
El diagrama de dispersión (en escala milimétrica) de los datos se muestra en la figura 4.16.
Figura 4.16. Diagrama de dispersión de los datos del ejemplo 4.4.
En la figura 4.16 se observa que los datos se ajustan a una curva exponencial.
El diagrama de dispersión (en escala logarítmica) de los datos se muestra en la figura 4.17.
0
500
1000
1500
2000
2500
3000
3500
4000
0 0.5 1 1.5 2 2.5
y
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 56
Figura 4.17. Diagrama de dispersión en escala logarítmica de los datos del ejemplo 4.4.
En la tabla siguiente se completa la columna de yln con el objeto de linealizar el modelo
exponencial de acuerdo con la ecuación (4.19).
i ix iy iyln
1 0.4 750 6.6200732
2 0.8 1000 6.9077553
3 1.2 1400 7.2442275
4 1.6 2000 7.6009025
5 2.0 2700 7.9010071
6 2.3 3750 8.2295111
La gráfica de yln vs x se muestra en la figura 4.18.
100
1000
10000
0 0.5 1 1.5 2 2.5
y
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 57
Figura 4.18. yln vs x para los datos del ejemplo 4.4.
En la figura 4.18 se observa que yln vs x se ajusta a un modelo lineal.
Para encontrar la recta de mínimos cuadrados que aproxima a estos datos (Ecuación 4.19),
extendemos la tabla y sumamos las columnas como se muestra en las cuatro últimas
columnas de la tabla
i ix iy iyln 2
ix ii yx ln 2)(ln iy
1 0.4 750 6.6200732 0.16 2.6480293 43.8253693
2 0.8 1000 6.9077553 0.64 5.5262042 47.7170830
3 1.2 1400 7.2442275 1.44 8.6930730 52.4788323
4 1.6 2000 7.6009025 2.56 12.1614439 57.7737182
5 2 2700 7.9010071 4 15.8020141 62.4259124
6 2.3 3750 8.2295111 5.29 18.9278756 67.7248533
8.3 11600 44.5034766 14.09 63.7586401 331.9457684
Al sustituir en las ecuaciones (4.20) y (4.21), obtenemos:
6.00
6.50
7.00
7.50
8.00
8.50
0 0.5 1 1.5 2 2.5
lny
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 58
2
11
2
1111
2
1
)(
)(ln)(ln
ln
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xxn
xyxyx
a (4.20)
21)3.8(09.146
3.87586401.635034766.4409.14ln
a
2528609.6ln 1 a
De esta manera:
2528609.6
1 ea
4969134.5191 a
2
11
2
111
1
)(
)(ln)(ln
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
xxn
yxyxn
b (4.21)
21)3.8(09.146
5034766.443.87586401.636
b
8417243.01 b
La mejor ecuación exponencial en el sentido de mínimos cuadrados es, de acuerdo con la
ecuación (4.18):
xbeay 1
1 (4.18)
xey 8417243.04969134.519
En la figura 4.19 se muestran los datos y la curva de regresión.
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 59
Figura 4.19. Diagrama de dispersión y curva de mínimos cuadrados de los datos del ejemplo 4.4..
La tabla siguiente muestra los valores observados con los valores obtenidos usando
esta aproximación.
i ix iy xey 8417243.04969134.519ˆ
2)ln(ln yyi 2)ˆln(ln yyi
1 0.4 750 727.4538611 0.6354846 0.0009316
2 0.8 1000 1018.6569090 0.2595809 0.0003417
3 1.2 1400 1426.4298450 0.0299354 0.0003498
4 1.6 2000 1997.4361187 0.0337297 0.0000016
5 2 2700 2797.0187684 0.2340247 0.0012463
6 2.3 3750 3600.4952468 0.6597745 0.0016552
8.3 11600 11567.4907491 1.8525297 0.0045262
El error estándar del estimado es, de acuerdo con la ecuación (4.6):
2/
n
SS r
xy
26
0045262.0/
xyS
0
500
1000
1500
2000
2500
3000
3500
4000
0 0.5 1 1.5 2 2.5
y
x
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 60
0336385.0/ xyS
El coeficiente de determinación es, de acuerdo con la ecuación (4.9):
t
rt
S
SSr
2 (4.9)
8525297.1
0045262.08525297.12 r
9975567.02 r
Y el coeficiente de correlación es
2rr
9975567.0r
9987776.0r
El coeficiente de correlación es, de acuerdo con la ecuación (4.22):
2
11
22
11
2
111
)](ln[)(ln)(
)(ln)(ln
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r (4.22)
22 )5034766.44()9457684.331(6)3.8()09.14(6
5034766.443.87586401.636
r
1151809.1165.15
1729848.13
r
9987776.0r
Todos estos cálculos se pueden resumir con el uso de la calculadora CASIO fx-570 ES
PLUS.
- Entrar en el modo Estadística y a los cálculos de regresión exponencial.
MODE 3 5
- Ingresar los datos.
- Obtener los parámetros de la regresión exponencial.
Intersección:
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 61
AC SHIFT 1 5 1 =
Display:
A
519.4969134
Pendiente:
AC SHIFT 1 5 2 =
Display:
B
0.8417242672
Coeficiente de correlación:
AC SHIFT 1 5 3 =
Display:
R
0.998777617
El modelo de regresión exponencial es xey 8417243.04969134.519 .
La calculadora CASIO fx-570 ES PLUS NO muestra las sumas requeridas por las
ecuaciones (4.20), (4.21) y (4.22) que permiten calcular la intersección con el eje y, la
pendiente y el coeficiente de correlación. Las sumas que se muestran son en base a los
datos originales tal como si se tratara de una regresión lineal. El menú para las sumas se
encuentra con la siguiente secuencia de teclas:
AC SHIFT 1 3
Pero los valores encontrados allí no son de utilidad alguna en los cálculos para este tipo de
regresión exponencial.
Una forma alternativa de regresión exponencial es utilizada por la calculadora CASIO fx-
570 ES PLUS en el menú
MODE 3 6
El modelo estudiado allí no es de la forma
xbeay 1
1 (4.18)
Sino su forma matemáticamente equivalente:
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 62
xbay 11
En la cual 1
1
beb
En este sentido, para el ejemplo 4.4 procedemos a obtener el modelo indicado.
Parámetros de la regresión exponencial.
Intersección:
AC SHIFT 1 5 1 =
Display:
A
519.4969134
Pendiente:
AC SHIFT 1 5 2 =
Display:
B
2.320364458
Coeficiente de correlación:
AC SHIFT 1 5 3 =
Display:
R
0.998777617
El modelo de regresión exponencial modificado es xy )320364458.2(4969134.519 .
Obsérvese que la única diferencia ocurre en la pendiente “B”, pues para la regresión
exponencial se obtuvo 0.8417242673, mientras que para este modelo modificado el valor es
2.320364458. Puede verificarse sin dificultad que 8417242673.0320364458.2 e .
Nuevamente, en este modelo modificado la calculadora CASIO fx-570 ES PLUS NO
muestra las sumas requeridas por las ecuaciones (4.20), (4.21) y (4.22) que permiten
calcular la intersección con el eje y, la pendiente y el coeficiente de correlación. Las sumas
que se muestran son en base a los datos originales tal como si se tratara de una regresión
lineal. El menú para las sumas se encuentra con la siguiente secuencia de teclas:
AC SHIFT 1 3
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 63
Pero los valores encontrados allí no son de utilidad alguna en los cálculos para este tipo de
regresión exponencial modificado.
Ejercicios propuestos.
39. [BF] Construir la aproximación de mínimos cuadrados de la forma xb
eay 1
1 a los
datos del problema 3 y calcular el error.
40. [BF] Construir la aproximación de mínimos cuadrados de la forma xb
eay 1
1 a los
datos del problema 4 y calcular el error.
41. [CC] La población (p) de una pequeña comunidad en los suburbios de una ciudad crece
con rapidez en un periodo de 20 años:
t 0 5 10 15 20 p 100 212 448 949 2009
Como ingeniero que trabaja en una compañía de servicio usted debe pronosticar la
población que habrá dentro de 5 años, para poder anticipar la demanda de energía. Emplee
el modelo exponencial y regresión lineal para realizar su predicción.
Ingeniería Química / Bioingeniería.
42. [CC] Abajo se proporcionan los datos tomados de un reactor baten (intermitente o por
lotes) para crecimiento bacteriano (una vez superada la fase de retraso). Durante las
primeras 2.5 horas se deja que las bacterias crezcan tan rápido como sea posible, después se
les induce a producir una proteína, la cual reduce significativamente el crecimiento
bacteriano.
El crecimiento de las bacterias se describe en forma teórica mediante
Xtd
Xd
donde X es el número de bacterias y es la rapidez específica de crecimiento de las
bacterias durante el crecimiento exponencial. Basándose en los datos estime la rapidez
específica de crecimiento de las bacterias durante las primeras 2.5 horas de crecimiento.
Después, hágalo durante las primeras 4 horas de crecimiento.
Tiempo, h Células, g/L
0.0 0.1
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 64
0.5 0.18221188
1.0 0.33201169
1.5 0.60496475
2.0 1.10231764
2.5 1.3463738
3.0 1.64446468
3.5 2.00855369
4.0 2.45325302
4.5 2.99641
5.0 3.65982344
5.5 4.47011845
6.0 5.459815
6.5 6.6686331
Sugerencia: La solución de la ecuación diferencial Xtd
Xd es teXX
0
43. Una reacción de primer orden es una reacción cuya velocidad depende de la
concentración del reactivo elevado al a primera potencia. En una reacción de primer orden
tkAA ][ln][ln 0 , donde 0][A y ][A son las concentraciones de A a los tiempos 0t y
tt , respectivamente y k es la constante de velocidad. Este modelo corresponde a un
modelo exponencial:
tkeAA 0][][
a) [RC] El azometano (C2H6N2) en fase gaseosa, se descompone como sigue a cierta
temperatura:
(g)N(g)HC(g)NHC 262262
A partir de los siguientes datos, determine el orden de la reacción y la constante de
velocidad.
Tiempo (min) 0 15 30 48 75
[C2H6N2], (M) 0.36 0.30 0.25 0.19 0.13
b) [RC] La sacarosa (C12H22O11) conocida como azúcar, se hidroliza (reacciona con el
agua) para formar fructosa (C6H12O6) y glucosa (C6H12O6):
glucosa
6126
fructosa
61262112212 OHCOHCOHOHC
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 65
Esta reacción es muy importante en la industria del caramelo. Primero, la fructosa es más
dulce que la sacarosa. Segundo, una mezcla de fructosa y glucosa, denominada azúcar
invertido, no se cristaliza, por lo que los caramelos que contienen este azúcar son blandos y
no quebradizos como los caramelos que contienen cristales de sacarosa. i) A partir de los
siguientes datos, determine el orden de la reacción. ii) ¿Cuánto tiempo tomará para que se
hidrolice el 95% de la sacarosa?
Tiempo (min) 0 60 96.4 157.5
[C12H22O11], (M) 0.500 0.400 0.350 0.280
c) [RF] La reacción BA se lleva a cabo en un reactor de laboratorio. De acuerdo con la
ley de velocidad de reacción propuesta, la concentración de A debe variar con el tiempo de
la siguiente forma:
tk
AA eCC 0
donde CA0 es la concentración inicial de A en el reactor y k es una constante.
Se tomaron los siguientes datos para )(tCA :
(min)t 0.5 1.0 1.5 2.0 3.0 5.0 10.0
)mol/ft-(lb 3
AC 1.02 0.84 0.69 0.56 0.38 0.17 0.02
Capítulo 4. Regresión por mínimos cuadrados. Linealización. Modelo exponencial.
Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 66
RESPUESTA A LOS EJERCICIOS SELECCIONADOS.
39. xey 0.372381824.2587603ˆ , 0.0334331/ xyS , 0.99401442 r , 0.9970027r .
40. xey 2.70729470.0457075ˆ , 0.3146068/ xyS , 0.95857702 r , 0.9790694r .
41. xey 0.14998539100.044670ˆ , 0.0007638/ xyS , 0.99999972 r , 0.9999998r . Para
25x : 44252.44859ˆ y .
Ingeniería Química / Bioingeniería.
42. Durante las primeras 2.5 horas: xey 1.08571430.1079168ˆ , 0.1380131/ xyS ,
0.98544132 r , 0.9926940r .
Durante las primeras 4 horas: xey 0.80000000.1426973ˆ , 0.2981424/ xyS , 0.93913042 r ,
0.9690874r .
43. a) Reacción de primer orden. tey 0.01368870.3669122ˆ , 0.0202259/ xyS ,
0.99808252 r , 0.9990408r .
b) i) Reacción de primer orden. ii) tey 0.00368060.4994650ˆ , 0.0014497/ xyS ,
0.99997632 r , 0.9999881r .
c) tey 0.41372311.2856104ˆ , 0.0282868/ xyS , 0.99964562 r , 0.9998228r .