30
[1 Técnicas de Programación no Lineal Mixta para Ingeniería de Sistemas de Procesos Ignacio E. Grossmann Departamento de Ingeniería Química, Universidad de Carnegie Mellon Pittsburgh, PA 15213, EUA Febrero 1999 RESUMEN Este trabajo tiene como objetivo primordial el presentar un enfoque unificado al tratamiento y derivación de técnicas de programación no lineal mixta entera (PNLME), Ramificación y Acotamiento, Aproximación Exterior, Descomposición Generalizada de Benders y método Extendido de Plano de Cortante, que son aplicables a problemas de optimización no lineal discreta que se expresan en forma algebraica. Se presenta primero la solución de problemas de PNLME con funciones convexas, y a continuación se hace una extensión al caso de no convexidad. También se describe la solución de representaciones basadas en lógica proposicional, conocidas como programas disyuntivos generalizados. Finalmente, se presentan comparaciones numéricas relativas a una red de procesos sencilla con el objeto de confirmar las propiedades teóricas de estos métodos. INTRODUCCIÓN La optimización mixta entera representa una infraestructura poderosa para el modelado matemático de múltiples problemas de optimización que involucran variables continuas y discretas. En los últimos cinco años ha habido un crecimiento pronunciado en el desarrollo de estos modelos en ingeniería de sistemas de proceso (Grossmann et al, 1996; Grossmann, l996a; Grossmann y Daichendt, 1996; Pinto y Grossmann, 1998; Shah, 1998; Grossmann et al, 1999). Los métodos y códigos de programación lineal mixta entera (PLME), han estado disponibles y se han aplicado a muchos problemas prácticos por más de veinte años (p.j. véase Nemhauser y Wolsey, 1988). El método más común es el de ramificación y acotamiento basado en programación lineal, que se ha implementado en códigos poderosos como OSL, CPLEX y XPRESS. Las tendencias recientes en PLMIE incluyen el desarrollo de métodos de ramificación y corte, como es el de expansión y proyección de Balas, Cena y Cornuejols (1993), en el que como parte de la enumeración de la ramificación y acotamiento se generan planos de corte. 1

Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Embed Size (px)

Citation preview

Page 1: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

[1

Técnicas de Programación no Lineal Mixta

para Ingeniería de Sistemas de Procesos Ignacio E. Grossmann

Departamento de Ingeniería Química, Universidad de Carnegie Mellon

Pittsburgh, PA 15213, EUA

Febrero 1999

RESUMEN

Este trabajo tiene como objetivo primordial el presentar un enfoque unificado al tratamiento y derivación de técnicas de programación no lineal mixta entera (PNLME), Ramificación y

Acotamiento, Aproximación Exterior, Descomposición Generalizada de Benders y método

Extendido de Plano de Cortante, que son aplicables a problemas de optimización no lineal

discreta que se expresan en forma algebraica. Se presenta primero la solución de problemas de PNLME con funciones convexas, y a continuación se hace una extensión al caso de no

convexidad. También se describe la solución de representaciones basadas en lógica

proposicional, conocidas como programas disyuntivos generalizados. Finalmente, se presentan

comparaciones numéricas relativas a una red de procesos sencilla con el objeto de confirmar las propiedades teóricas de estos métodos.

INTRODUCCIÓN

La optimización mixta entera representa una infraestructura poderosa para el modelado matemático de múltiples problemas de optimización que involucran variables continuas y

discretas. En los últimos cinco años ha habido un crecimiento pronunciado en el desarrollo de estos modelos en ingeniería de sistemas de proceso (Grossmann et al, 1996; Grossmann, l996a;

Grossmann y Daichendt, 1996; Pinto y Grossmann, 1998; Shah, 1998; Grossmann et al, 1999).

Los métodos y códigos de programación lineal mixta entera (PLME), han estado disponibles y

se han aplicado a muchos problemas prácticos por más de veinte años (p.j. véase Nemhauser y Wolsey, 1988). El método más común es el de ramificación y acotamiento basado en programación lineal, que se ha implementado en códigos poderosos como OSL, CPLEX y

XPRESS. Las tendencias recientes en PLMIE incluyen el desarrollo de métodos de ramificación y corte, como es el de expansión y proyección de Balas, Cena y Cornuejols (1993), en el que

como parte de la enumeración de la ramificación y acotamiento se generan planos de corte.

1

Page 2: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

No es sino hasta recientemente que se ha podido contar con varios métodos y códigos nuevos

para problemas de programación no lineal mixta entera (PNLME) (Grossmann y Kravanja,

1977). En este trabajo se hará una revisión de los diversos métodos, enfatizando un tratamiento

unificado para su derivación. Como se mostrará, los diferentes métodos se pueden derivar de

tres subproblemas básicos de programación no lineal (PNL) y un problema de PLME de plano

cortante, los cuales corresponden esencialmente a los subproblemas básicos del método de

Aproximación Exterior. Primero se consideran propiedades de los algoritmos para el caso en el

que las funciones no lineales son convexas en las variables continuas y discretas, y a

continuación se presentan extensiones para el manejo de ecuaciones no lineales y no

convexidades. Finalmente, el trabajo considera propiedades y algoritmos de las representaciones

recientes basadas en lógica proposicional para la optimización discretalcontinua que son

conocidas como programas disyuntivos generalizados. Se presentan resultados numéricos de un ejemplo sencillo para comparar los diversos algoritmos.

ELEMENTOS BÁSICOS DE LOS MÉTODOS DE PNLME

La forma más básica de un problema de PNLMIE cuando se representa en forma algebraica es la siguiente:

min Z = f(x,y)

s.a. g3 (x,y) ~ 0 j EJ (Pl)

X E X, y E Y

donde J(), go son funciones dferenciab/es convexas, J es el conjunto de índices de desigualdades, y (x, y) son variables continuas y discretas respectivamente. X comúnmente se considera como un conjunto compacto convexo, p.j. x = {x x E R, Dx ~ d, x' <_ x <

mientras que Y corresponde a un conjunto discreto poliédrico de puntos enteros, Y = {y 1 yEr', Ay< a} que en la mayoría de las aplicaciones está restringido a valores de

o y 1, yE {0, 1 }' . En la mayoría de las aplicaciones de interés, la función objetivo y las funciones de restricción fQ, go son lineales en y (p.j. cargos de costos fijos y restricciones lógicas).

Los métodos enfocados a la solución del problema (Pl) incluyen el de Ramificación y Acotamiento (RA) (Gupta y Ravindran, 1985; Nabar y Schrage, 1991; Borchers y Mitchell,

1994; Stubbs y Mehrotra, 1996; Leyffer, 1998), el de Descomposición Generalizada de Benders (DGB) (Geoffrion, 1972), el de Aproximación Exterior (AE) (Duran y Grossmann, 1986; Yuan

et al., 1988; Fletcher y Leyffer, 1994), el de ramificación y acotamiento basado en PL/PNL (Quesada y Grossmann, 1992), y el Extendido de Plano Cortante (EPC) (Westerlund y Pettersson, 1995).

2

Page 3: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Subproblemas PNL. Existen tres subproblemas básicos de PNIL que pueden considerarse para el problema (Pl):

Relajación PNL

n,in Z k = .f(X, y) CI

s.a. g3 (x, y) :~ 0 j c J

XEX,YEYR (PNL1)

y~ a,k iEI1

y~ ji ¡EJFS

donde YR es la relajación continua del conjunto Y, e I, I son los subconjuntos de

índices de las variables enteras yj, ¡J , las cuales están restringidas por cotas inferior y

superior, ak, ü7, en el paso k del procedimiento de enumeración de ramificación y

acotamiento. Debe notarse que a k = LY j,/J y , 1< k, ni < k donde y ,y, , son los

valores no enteros del paso previo, y [j, fi, son las funciones piso y techo, respectivamente.

Hay que notar también que si I k = Ik = 0, (k = 0), entonces (PNL1) corresponde a la

relajación continua PNL de (Pl). Excepto para unos cuantos casos especiales, la solución a este problema da en general como resultado un vector no entero de variables discretas. El problema (PNLI) también corresponde al paso k en la búsqueda de ramificación y acotamiento. La función objetivo óptima Z proporciona una cota inferior absoluta para (Pl); para m > k, la cota es válida solamente para I ci I, I ci I.

Subproblema PNIL para y/C fijo:

minZ =f(x,y " )

sa. g3 (x, y) ~ 0 j E J (PNL2)

XEX

el cual da como resultado una cota superior Zk para (Pl) siempre y cuando (PNL2) tenga una solución factible. Cuando este no sea el caso, se considera el subproblema siguiente:

Subproblema de factibilidad parayk fijo:

min u

sa. g1 (x, yk) ~ u j E J (PNLF)

X E X,u E R 1

3

Page 4: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

que puede interpretarse como la minimización de la medida de norma-infinito de no factibilidad

del subproblema correspondiente de PNL. Nótese que para un subproblema no factible, la

solución de (PNLF) da como resultado un valor estrictamente positivo de la variable escalar u.

Función Objetivo Convexa

f(x)

xl x2 X

Función Objetivo Subestimada

Región Factibi Conve

x

Región Factible Sobreestimada

Fig. 1. Interpretación geométrica de linearizaciones en el problema maestro (M-PME)

Plano Cortante PLME. La convexidad de las funciones no lineales se explota sustituyéndolas por hiperplanos de soporte derivados en la solución de los subproblemas de PNL. En particular, los nuevos valores y' (o (xK , yK)) se obtienen de un problema PLME de plano cortante que está

basado en los K puntos, (x', y'), k=1 ... K generados en los K pasos previos:

miii Zf = a

rk1

sa. a ~ f(xk,yk)+Vf(xk,y _

k Ly-yj

(M - PMIE) [l

g(xk,yk)+Vg1(xk,yk x_xk

)i kk0 jEJkI

L -

J J x E X,y E Y

ni

Page 5: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

(h) DGB, AE

donde JA cf. Cuando se incluye sólo un subconjunto de linearizaciones, éstas comúnmente

corresponden a las restricciones violadas en el problema (Pl). Alternativamente, es posible

incluir todas las linearizaciones en (M-PM1E). La solución de (M-PMIE) da como resultado una cota inferior válida Z/' para el problema (Pl). Esta cota no decrece con el número de puntos de linearización K. Nótese que como las funcionesf(x,y) y g(x,y) son convexas, las linearizaciones en (M-PME) corresponden a aproximaciones exteriores de la región factible no lineal en el

problema (Pl). En la figura 1 se muestra una interpretación geométrica, donde se puede ver que

la función objetivo convexa es subestimada y la región factible convexa sobreestimada con estas

linearizaciones.

Algoritmos. Los diferentes métodos para resolver problemas de PNLME se pueden clasificar de acuerdo al uso que hacen de los subproblemas (PNL1), (PNL2) y (PNLF), y a la especialización

específica del problema (M-PME) de PLME como se observa en la figura 2. Debe notarse que en los métodos DGB y AE (caso (b)), y en el de ramificación y acotamiento basado en PL/PNL

(caso (d)), si se encuentran subproblemas de no factibilidad, se resuelve el problema (PNLF). A

continuación se explican cada uno de los métodos en términos de los subproblemas básicos.

Enumeración 1 PNL]

Arborescente 1 1

(a) Ramificación y Acotamiento

(c) EPC

M-PME PNIL2 44

(d) Ramificación y acotamiento basada en PL/PNL

Fig. 2. Pasos Principales en los Diferentes Algoritmos

1. Ramificación y Acotamiento. Mientras que el trabajo original en ramificación y acotamiento (RA) se orientó primordialmente a problemas lineales (Dakin, 1965; Garfinkel y

Nemhauser, 1972; Taha, 1975), recientemente también se ha concentrado en problemas no lineales (Gupta y Ravindran, 1985; Nabar y Schrage, 1991; Borchers y Mitchell, 1994; Stubbs y

Page 6: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Mehrotra, 1996; Leyffer, 1998). El método de RA se inicia resolviendo primero la relajación

continua PNL. Si todas las variables discretas toman valores enteros, se suspende la búsqueda.

En caso contrario, se ejecuta una búsqueda arborescente en el espacio de las variables enteras

y, i EJ . Éstas se fijan sucesivamente en los nodos correspondientes del árbol, dando lugar a

subproblemas PNL relajados de la forma (PNL1) que generan cotas inferiores para los

subproblemas en los nodos descendentes. Los nodos se cortan cuando la cota inferior excede la

cota superior vigente, cuando el subproblema es no factible o cuando todas las variables enteras

yi toman valores discretos. En este último caso se genera una cota superior del problema

original.

El método RA generalmente sólo resulta atractivo si los subproblemas PNL se resuelven con poco esfuerzo, o cuando sólo se necesitan resolver unos cuantos de estos subproblemas. Esto

sucede, ya sea debido a la baja dimensionalidad de las variables discretas, o a que el traslape de

integralidad de la relajación continua PNL de (Pl) es pequeño.

II. Aproximación-Exterior (Duran y Grossmann, 1986; Yuan et al., 1988; Fletcher y Leyffer, 1994). El método AE surge cuando los subproblemas (PNL2) de PNL y los problemas maestros

(M-PMIE) de PLME con Jk = .1 se resuelven sucesivamente en un ciclo de iteraciones para

generar los puntos (x y). Para su derivación, el algoritmo AE se basa en el siguiente teorema (Duran y Grossmann, 1986):

Teorema 1. El Problema (P) y el siguiente problema maestro (M-A de PLIvIE tienen la misma solución óptima (x , y

min Z1 = a

IY - Y

1 s.a. a f(xk,yk)+Vf(x,yk)

_ k

]

k k E K* (M - AE)

IX_Xklg1(xk,yk)+Vg3(xk,y

k ~ O JEJ YY] J

X E X, y E Y

donde K*={k para todo ykEY, (x1', yk) factible, es la solución óptima para el problema (PNL2)}.

en

Page 7: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Como el problema maestro (M-AE) requiere la solución de todas las variables discretas yk, se considera la siguiente relajación PLME, suponiendo que se tiene disponible la solución de K subproblemas PNIL:

Min zf = a

1 1 sa. a ~ f(xkyk)+Vf(xky

_ k IY - Y jj

(MIR-AE) _k1 g(xk,yk)+Vg(xk,y

k° jEJ

IY - y] j X E X, y E Y

Con la premisa de convexidad de las funciones f(x,y) y g(x,y), es fácil establecer la propiedad siguiente,

Propiedad 1. La solución del problema (MR-A.), Zf, corresponde a una cota inferior de la solución de/problema (Pj).

Nótese que esta propiedad se puede verificar en la figura 1. También, dado que las linearizaciones de las funciones se acumulan conforme avanzan las iteraciones, los problemas

maestros (MR-AE) generan una secuencia no decreciente de cotas inferiores, Zj'.. <Z1k -o5:.

ya que las linearizaciones se acumulan conforme proceden las iteraciones k.

El algoritmo AE, de acuerdo a la propuesta de Duran y Grossmann (1986), consiste en la ejecución de un ciclo de iteraciones mayores, k=1,..K, en las cuales el subproblema (PNTLI) se

resuelve para las y 1 fijas correspondientes, y el problema maestro PLIVIE relajado (MIR.-AE) se

actualiza y resuelve con las linearizaciones de las funciones correspondientes en el punto (xk,y '),

para el cual se resuelve el subproblema correspondiente PNL2. Si es factible, la solución a ese

problema se utiliza para construir el primer problema maestro de PLME; en caso contrario, se resuelve un problema de factibilidad (PNLF) para generar el punto continuo correspondiente. El problema maestro

(M1R-AE) inicial de PLME genera entonces un nuevo vector de variables discretas. Los

subproblemas (PNL2) generan una cota superior que se utiliza para definir la mejor solución hasta el momento, CSK= m in(Zsk) . El ciclo de iteraciones continúa hasta que esta cota superior y la cota inferior del problema maestro relajado, Zí, quedan dentro de una tolerancia especificada.

El método AE en general requiere de relativamente pocos ciclos de iteraciones mayores. Una razón para este comportamiento proviene de la siguiente propiedad:

7

Page 8: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Propiedad 2. El algoritmo AE converge trivialmente en una iteración si f(x,y) y g,y) son lineales.

La prueba se deriva simplemente de que sif(x,y) y g(x,y) son lineales en x y eny, el problema maestro (MIR-AE) de PLME es idéntico al problema original (Pl).

También es importante notar que el problema maestro MIPLE no tiene que resolverse hasta la

optimalidad. De hecho, dadas la cota superior CSK y una tolerancia e, es suficiente para generar el nuevo (yK, xK) mediante la solución de:

nin Zf = Oa

sa. a ~ CSK_ e

[1 1 a > f(xk,yk)±Vf(xk,y X X

k LY

k Y] (MIR-AEF) 1

g1(xk,yk)+Vg1(xk,y _

k ° JEJ

Iy - y] x c X, y c Y

Mientras que en (MR-AB) la interpretación del nuevo punto y K es que éste representa la mejor solución entera al problema maestro de aproximación, en (IVIIR-AEF) representa una solución

entera cuyo objetivo de acotamiento inferior no excede la cota superior vigente, CSK; en otras palabras, es una solución factible de (MIR-AE) con una función objetivo por debajo del estimado vigente. Nótese que en este caso, las iteraciones AE se terminan cuando (MIR-AEF) es no factible.

Iii. Descomposición Generalizada de Benders (Geoffrion, 1972). El método DGB (Flippo y Kan 1993) es de naturaleza similar al de Aproximación Exterior. La diferencia se presenta en la

definición del problema maestro (M-PME) de PLMIE. En el método DGB sólo se consideran las

desigualdades activas J' = {j lgj (x1, yk) = O} y el conjunto XEX se desecha. En particular, se

asume una aproximación exterior en un punto dado (xk, yk) ,

[l a ~ f(x k , y k )+Vf(x k k,y

)T X - X

1 LY

- yk]

(AB k )

IY-Y 1g(xk,yk)+Vg(xk,yk) T X_X

k I < o J

[]

Page 9: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

donde para un yk fijo, el punto xk corresponde a la solución óptima del problema (PNL2).

Haciendo uso de las condiciones de Karush-Kuhn-Tucker y eliminando las variables continuas

x, las desigualdades en (AEk) se pueden reducir como a continuación se indica (Quesada y Grossmann (1992)):

a ~: .f (x k , y k )+vf (x k , y k ) T (y_y k )+( )T[g(xkyk)+vg (x k ,y k ) T (yy k )I (CLk)

que corresponde al corte Lagrangiano proyectado en el espacio-)). Esto se puede interpretar

como una restricción subrogada de las ecuaciones (k), ya que se obtiene como una combinación lineal de éstas.

Para el caso donde no existe solución factible del problema (PNL2), si el punto xk se obtiene del

subproblema de factibilidad (PNLF), se podrá obtener el siguiente corte de factibilidad

proyectado en y, utilizando un procedimiento similar,

(Al)' [g(x k ,y k) + v g (xk,yk)T (k)1< O (CFk)

De esta manera, el problema (M-PIVH) se reduce a un problema proyectado en el espacio-y:

nún Zf = a

sa. a ~ f(x k , y k )+V f(x k , y k )T_yk)

+ T [g(x k ,y k)+vg (xk,yk)_yk)] k EKSF (MR

(2k)T{g(xk,yk)+vg(xkyk)_yk)] kEKSNF

X E X, a E R 1

donde KSF es el conjunto de subproblemas de factibilidad (PNL2) y KSNF el conjunto de subproblemas de no factibilidad cuya solución está dada por (PNLF). También

KSF u KSNF 1 = K. Como el problema maestro (MIR-DGB) se puede derivar del problema

maestro (MR-AE), en el contexto del problema (Pl), la Descomposición Generalizada de Benders se puede considerar como un caso particular del algoritmo de Aproximación Exterior.

De hecho, la siguiente propiedad aplica a los dos métodos (Duran y Grossmann, 1986):

Page 10: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Propiedad 3. Dado el mismo conjunto de K suhprohlenias, la cota inferior predicha por el

problema maestro relajado (MR-A) es mayor o igual a la que se predice por el problema

maestro relqjado (MR-DGB).

La prueba de esta propiedad surge del hecho de que los cortes Lagrangiano y de factibilidad,

(CLk) y (CFk), son subrogados de las aproximaciones exteriores (AEk). Dado que las cotas

inferiores de DGB son generalmente más débiles, este método requiere comúnmente de un

mayor número de ciclos o iteraciones mayores. Conforme aumenta el número de variables 0-1,

esta diferencia se hace más pronunciada. Esto es de esperarse ya que sólo se genera un nuevo

corte por iteración. Por lo tanto, más a menudo se deben añadir restricciones de usuario al

problema maestro para fortalecer las cotas. Como en el algoritmo AE, el compromiso se da

entre una predicción generalmente más fuerte de las cotas inferiores que en DGB, y un costo

computacional mayor para resolver el problema maestro (M-AE), ya que el número de

restricciones añadidas por iteración es igual al número de restricciones no lineales más la función objetivo no lineal.

La siguiente propiedad de convergencia aplica al método DGB (Sahinidis y Grossmann, 1991):

Propiedad 4. Si e/problema Pl) tiene una separación de integralidad cero, el algoritmo DGB

converge en una sola iteración una vez que se encuentra el óptimo (x*, y)

La propiedad anterior implica que el único caso en el que se puede esperar que el método DGB termine en una iteración, es cuando el vector discreto inicial es el óptimo, y cuando el valor de

la función objetivo de la relajación PNL del problema (Pl) es el mismo que el de la función

objetivo de la solución óptima mixta entera. Dada la relación del método DGB con el algoritmo

AE, la Propiedad 4 también la hereda el método AE.

Una propiedad adicional de los algoritmos AE y DGB es la siguiente (Turkay y Grossmann, 1996):

Propiedad S. El corte obtenido al ejecutar una iteración de Benders en el problema maestro (VIR-AI de PLME es equivalente al corte obtenido del algoritmo DGB.

Haciendo uso de esta propiedad, en vez de resolver el problema (MR-AE) de PLME hasta la optimalidad, por ejemplo con el método de ramificación y acotamiento basado en PL, es posible

generar un corte DGB con la simple ejecución de una iteración de Benders ( 1962) en PLME. Como se discutirá posteriormente, esta propiedad se encontrará útil al derivar una versión basada en lógica proposicional del algoritmo DGB.

10

Page 11: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Método Extendido de Plano Cortante (Westerlund y Pettersson, 1995). El método EPC, que es una extensión del algoritmo de plano cortante de Kelley para PNL convexa

(Kelley, 1960), no depende del uso de subproblemas y algoritmos de PNL. Depende

sólo de la solución iterativa del problema (M-PMIE) mediante la incorporación

sucesiva de una linearización de la restricción más severamente violada en el punto predicho

(xk,yk) :i k{ 5 5 G arg{ mcix 91(xk,yk) D. La convergencia se alcanza cuando la

JJ

violación de restricciones máxima se encuentra dentro de la tolerancia especificada. El valor

óptimo de la función objetivo de (M-PME) genera una secuencia no decreciente de cotas

inferiores. Por supuesto, también es posible ya sea agregar a (M-PMIE) linearizaciones de todas

las restricciones violadas en el conjunto J', o linearizaciones de todas las restricciones no linealesj E.!

Nótese que ya que las variables discretas y continuas convergen simultáneamente, el método

EPC puede requerir un gran número de iteraciones. También, la función objetivo tiene que

definirse como lineal, lo que se puede realizar sencillamente con la introducción de una nueva

variable para transferir las no linearidades de la función objetivo como una desigualdad.

Ramificación y Acotamiento basada en PL/PNL (Quesada y Grossmann, 1992). Este método evita la solución completa del problema maestro (M-AE) de PLME en cada iteración

mayor. El método empieza por resolver un subproblema inicial de PNL que es linearizado como en (M-AE). La idea básica consiste entonces en aplicar el método de ramificación y acotamiento

basada en PL para (M-AE), en donde los subproblemas (PNIL2) de PNL se resuelven en aquellos

nodos en los que se encuentran soluciones enteras factibles. La necesidad de reiniciar la

búsqueda arborescente, se evita actualizando la representación del problema maestro en los

nodos abiertos vigentes del árbol con la incorporación de las linearizaciones correspondientes.

Este método también se puede aplicar a los métodos DGB y EPC. El método PL/PNL comúnmente reduce en forma muy significativa el número de nodos a enumerar. El compromiso, sin embargo, está en que podría aumentar el número de subproblemas de PNL. La

experiencia computacional ha indicado que a menudo el número de subproblemas de PNL no se altera. Por lo tanto, este método resulta más apropiado para problemas en los cuales el cuello de botella está en la solución del problema maestro de PLMIE. Leyffer (1993) ha reportado ahorros

substanciales con este método.

11

Page 12: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

EXTENSIONES DE LOS MÉTODOS DE PNLME

En esta sección se dará una descripción general de algunas de las extensiones más importantes

de los métodos presentados en la sección anterior.

Problemas Maestros Cuadráticos. En la mayoría de los casos de interés, el problema (Pl) es

lineal en y: f(x,y) = O(x) + cTy, g(x,y) = h(x) + By. Cuando esto no es así, Fletcher y Leyffer (1994) sugirieron la inclusión de una aproximación cuadrática a (MR-AEF) de la forma:

rninZK=a+ 1 2y—y y—y ) K

sa. a< CSK_ s

a f(x k ,yk)+Vf(x k ,yk)T x_x 1 ly-Y kj

(M-PCME) r_i ¡

g(xk,yk)+Vg(xk,yk)T

] k

Ly-y j X E X,y E Y,a E R1

donde V2 (xK,yI') es la matriz Hessiana del Lagrangiano del último subproblema de PNL

Nótese que ZK, en este caso, no predice cotas inferiores válidas. Como se hizo notar por Ding-Mei y Sargent (1992), quienes desarrollaron un problema maestro similar a M-PCMIE, las aproximaciones cuadráticas pueden ayudar a reducir el número de las iteraciones mayores, ya

que se obtiene una representación mejorada del espacio continuo. También hay que notar que para funciones/(x, y) y g(x,y) convexas, el uso de (M-PCME) conduce a soluciones rigurosas ya

que las aproximaciones exteriores se mantienen válidas. También, si la función f(x,y) es no lineal eny, siendo y una variable entera general, Fletcher y Leyffer (1994) han mostrado que el algoritmo original AE podría requerir un mucho mayor número de iteraciones para converger

que cuando el problema maestro (M-PCME) es usado. Sin embargo, esto se obtiene a expensas de tener que resolver un problema de PCME en lugar de otro de PLME. Por supuesto, la

situación ideal es cuando el problema original (Pl) es cuadrático en la función objetivo y lineal en las restricciones, ya que así (M-PCME) es una representación exacta de tal programa

cuadrático mixto entero.

12

Page 13: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Reducción de la dimensionalidad del problema maestro en AE. El problema maestro (MR-AE) puede involucrar un número grande de restricciones, como consecuencia de la

acumulación de linearizaciones. Una opción es conservar sólo el último punto de linearización,

aunque esto puede conducir a que no se logre la convergencia aun en problemas convexos, ya

que entonces no se puede garantizar el crecimiento monotónico de la cota inferior. Una ruta

rigurosa para reducir el número de restricciones sin mayor sacrificio de la fortaleza de la cota

inferior, se puede lograr en el caso del problema de PNILIVÍE altamente lineal:

min Z = aT w+r(v)+cry

sa. Dw+t(v)+Cy:z~ 0 (PL)

Fw + Gv + Ey < b

W E W, V E V, y E Y

donde (w, y) son variables continuas, y (r(v) , 1(v) )

funciones convexas no lineales. Como fue

mostrado por Quesada y Grossmann (1992), se pueden agregar aproximaciones lineales de la

función objetivo no lineal y de las restricciones no lineales con el siguiente programa maestro de PLME:

neinZf =aTw+/3+cTy

sa. [DW k=1,..X (M-PLffi) Fw + Gv + Ey < b

WEW,VEV,yEY,/3ER'

Los resultados numéricos han mostrado que la calidad de las cotas no se degrada mayormente

con el problema de PLME anterior, como podría suceder si se aplicara el método DGB a (PL).

tncorporación de cortes. Una forma de acelerar la convergencia en los algoritmos AE y DGB cuando las variables discretas del problema (Pl) son 0-1, o de asegurar su convergencia sin tener que resolver los subproblemas de factibilidad (PNLF), es con la introducción de los

siguientes cortes enteros, cuyo propósito es hacer no factible la elección de los valores 0-1 previos generados en las Kiteraciones anteriores (Duran y Grossmann, 1986):

Jyi -

~ —1 k = 1,...K (CorteE) iBk iEN1

donde Bk={ ¡ = 1}, N"={ i 1 yik = 0}, k=l, ... K. Este corte se hace muy débil conforme

aumenta la dimensionalidad de las variables 0-1. Sin embargo, tiene la útil característica de

asegurar que se generen nuevos valores 0-1 en cada iteración mayor. De esta manera, el algoritmo no regresará a un punto entero previo cuando se alcanza la convergencia. Al usar el

13

Page 14: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

corte entero de arriba, la terminación ocurre tan pronto como Zf 2> CSK. También, en el caso del método DGB a veces es posible generar múltiples cortes a partir de la solución de un

subproblema de PNL con el propósito de fortalecer la cota inferior (Magnanti y Wong, 1981).

Manejo de restricciones de igualdad. Para el caso cuando se añaden a (Pl) igualdades lineales de la forma h(x, y) = O, no se presenta mayor dificultad, ya que éstas son invariantes a los

puntos de linearización. Sin embargo, si las ecuaciones son no lineales, se tienen dos

dificultades. Primero, no es posible forzar las igualdades linearizadas en los puntos K. Segundo, las ecuaciones no lineales pueden, en general, introducir no convexidades, a menos que se

relajen como desigualdades convexas (Bazaara et al, 1994). Kocis y Grossmann (1987)

propusieron una estrategia de relajación de igualdades, en la que las igualdades no lineales se

sustituyen por desigualdades,

_k1

TkVh(x,yk)T ~ O I(1) -

k j

donde T' = {t}, y = signo(2Jc) siendo 2 el multiplicador asociado a la ecuación h1(x, y) = O. Nótese que éste es un procedimiento riguroso, si las ecuaciones se relajan como

desigualdades h(x, y) < O para toda y, siendo h(x, y) convexa. De otra manera, se podrían generar soportes sin validez. Hay que notar también que en el problema maestro GDB, (MR-GDB), no se requiere un tratamiento especial para el manejo de las ecuaciones, ya que

éstas simplemente se incluyen en los cortes Lagrangianos. Sin embargo, si las ecuaciones no se

relajan como desigualdades convexas, surgen dificultades similares a las del método AE.

Manejo de no convexidades. Cuando f(x,y) y g(x,y) son no convexas, se presentan dos dificultades. Primero, los subproblemas de PNIL (PNL1), (PNIL2) y (PNILF) podrían no tener una solución única de óptimo local. Segundo, el problema maestro (M-PME) y sus variantes (p.j. M-PMEF, M-DGB, M-PCME), no garantizan una cota inferior válida Zf o una representación de acotamiento válida con las que- el óptimo global pueda ser eliminado. Un enfoque para enfrentar este problema es el de suponer una estructura especial en el problema de PNLMIE y recurrir a métodos de optimización global (Horst y Pardalos, 1995; Quesada y Grossmann, 1995; Grossmann, 1996b; Zamora y Grossmann, 1998). Con la combinación de técnicas de optimización global, que usualmente toman la forma de métodos de ramificación y acotamiento espacial, y con subproblemas convexos de PNLMIE, es posible la determinación rigurosa del óptimo global. La otra opción es aplicar una estrategia heurística, tratando de reducir hasta donde sea posible el efecto de las no convexidades. No es un método riguroso, pero requiere de un esfuerzo computacional mucho menor. Aquí, sólo se describirá el segundo enfoque en el que el objetivo es reducir el efecto de las noconvexidades al nivel del problema maestro de PLME.

14

Page 15: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Viswanathan y Grossmann (1990) propusieron la incorporación de variables de holgura en el

problema maestro de PLIVIE para reducir la probabilidad de cortar soluciones factibles. Este

problema maestro (Penalización Aumentada ¡Relajación de Igualdades) (PARI) tiene la forma:

mm ZK= a + ±[wpk +wqk]

sa. a ~

X _ Xk

f(xk,yk)+Vf(xk,yk)T - k

yy

k ] :~~ TkVh(xk,yk)T = 1,...K (M -PI)

ly-Y k

r_k1XX g(xk , yk)+Vg(xk , yk)TI R q k LyykJ

y—y 1 ~ B-1 k=l,...K , E Bk iNk

X E X,y E Y,a E R', pkqk >- o

donde wp' y w11 son factores de peso que se escogen suficientemente grandes (p.j. 1000 veces la magnitud del multiplicador de Lagrange). Nótese que si las funciones son convexas, entonces

el problema maestro (M-PARI) de PLME predice cotas inferiores rigurosas para (Pl) ya que todas las variables de holgura se ajustan a cero. También es de mencionarse que el programa

DTCOPT (Viswanathan y Grossmann, 1990), que actualmente es el único programa comercial

disponible para la solución de problemas de PNLMIE (como parte del sistema de modelado

GAMS (Brooke et al., 1988)), está basado en el problema maestro anterior. Este código también usa el subproblema relajado (PNLI) para generar la primer linearización del problema maestro

anterior, con lo cual el usuario no necesita especificar un valor entero inicial. También, como las

propiedades de acotamiento de (M-PARI) no se pueden garantizar, la búsqueda en problemas no

convexos se termina cuando ya no mejora la función objetivo en los subproblemas factibles de PNL Es ésta una regla heurística que, sin embago, funciona razonablemente bien en muchos

problemas.

También debe notarse que otra modificación para reducir los efectos indeseables de las no convexidades en el problema maestro consiste en la aplicación de pruebas globales de

convexidad seguidas de una validación adecuada de linearizaciones. Una posibilidad es la de

aplicar las pruebas a todas las linearizaciones con respecto al vector de solución vigente ( yK, xK)

(Kravanja y Grossmann, 1994). Las condiciones de convexidad que tienen que verificarse son las siguientes:

15

Page 16: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

rK_k1 1 —a ~ sI

LY K Yk ] r K _k1

Tkvh(xkYk)T[K _yk] ~ S k=1,...K-1 (PGC)

rK_k1 g(xk,yk)+Vg(xk,yk)TI I~ B

LYK Y k ]

donde E es un vector de tolerancias pequeñas (pi. 1010) . Nótese que la prueba se omite para las

linearizaciones vigentes K, ya que éstas son siempre válidas para el punto de solución (yK, xK)

Con base en esta prueba, se efectúa una validación de las linearizaciones, y aquéllas en las que

no se satisface la verificación de arriba son simplemente desechadas del problema maestro. Esta

prueba se apoya en la suposición de que las soluciones de los subproblemas de PNL se están acercando al óptimo global, y que las validaciones sucesivas, en forma progresiva, van

definiendo restricciones válidas de factibilidad alrededor del óptimo global. También hay que

notar que si los coeficientes del lado derecho de las linearizaciones se modifican para validar la

linearización, la prueba corresponde a una de la estrategia de dos fases de Kocis y Grossmann (1988).

MÉTODOS BASADOS EN LÓGICA PROPOSICIONAL

Recientemente, ha habido una tendencia a representar los problemas de optimización discreta lineal y no lineal, por modelos que consisten en restricciones algebraicas, disyunciones lógicas y

relaciones lógicas (Balas, 1985; Beaumont, 1991; Raman y Grossmann, 1993, 1994; Turkay y

Grossmann, 1996; Lee y Grossmann, 1999). En particular, el programa mixto entero (Pl)

también se puede formular como un programa generalizado disyuntivo, de acuerdo a lo expuesto

por Raman y Grossmann (1994):

min Z =Ck +f(x)

sa. g(x) = O

' zk

y hk(x)0 kESD (PGD)

Ck = Yik

fl (Y) 4 7erdadero

X E R, C E R', Y c {verdadero, falso}m

16

Page 17: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

en donde YJ.k son las variable booleanas que establecen si un término dado en una disyunción es

verdadero [h,7 (x) ~ O], mientras que Q(Y) son las relaciones lógicas que se suponen para

expresarse en forma de lógica proposicional, incluyendo sólo variables booleanas. YJk son

variables auxiliares que controlan la parte del espacio factible en la que se encuentran las

variables continuas, x, y las variables ck representan cargos fijos que se activan a un valor Yik Si el término correspondiente de la disyunción es verdadero. Finalmente, las condiciones lógicas,

Q(Y), expresan relaciones entre los conjuntos disyuntivos. En el contexto de problemas de

síntesis de procesos, las disyunciones en (PGD) surgen para cada unidad ¡ en la forma siguiente:

Y,

h(x)O y B'x=O ¡El (2)

c=O

en la cual aplican las desigualdades h, incurriéndose en un costo fijo si la unidad es

seleccionada (Y,); en caso contrario (-7Y) no hay costo fijo, y un subconjunto de las variables x

se ajusta a cero con la matriz B'.

Es importante notar que cualquier problema formulado como (PGD) siempre se puede

reformular como otro de PNLMIE de la forma del problema (Pl), y cualquier problema de la forma (Pl) se puede expresar en la forma de (PGD). Sin embargo, para propósitos de modelado,

resulta ventajoso iniciar con el modelo (PGD) ya que éste captura en forma más directa tanto la

parte cualitativa (lógica) como la parte cuantitativa (ecuaciones) de un problema. Para

transformar (PGD) en (Pl), el camino más directo es el de reemplazar las variables booleanas

Y/fr por variables binarias Yifr, y las disyunciones por restricciones del tipo "M-mayor" de la

forma,

h k (x) ~ M(l - Yk), ¡ E Dk , k E SD

(3) iEDk

donde M es una cota superior válida. Finalmente, las proposiciones lógicas Q(y) = Verdadero, se convierten en desigualdades lineales como se describe por Williams (1985) y Raman y Grossmann (1991).

Se consideran primero los algoritmos correspondientes a AE y DGB para problemas expresados en la forma de (PGD). Como se describe por Turkay y Grossmann (1996) para valores fijos de

las variables booleanas, Yfk = verdadero y Y/k = falso para i :#- ¡ , el subproblema PNL

correspondiente es el siguiente:

17

Page 18: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

minZ = 1 Ck+f(x) kSD

sa. g(x)<0

h. (x) < 01 para = verdadero ¡ E Dk , k E SD (PNLD)

Ck = 71k J

B'X=0}para =falso iEDk ,i ~T,kESD Ck -0

X E R, C1 E

Nótese que para cada disyunción k E SD sólo se imponen restricciones correspondientes a la

variable booleana Yk que sean verdaderas. También, los cargos fijos yk se aplican sólo a

estos términos. Suponiendo que se resuelven K subproblemas de (PNLD) en los cuales se generan conjuntos de linearizaciones / =1, . .. K para subconjuntos de términos de disyunción

Lk = { / 1 Y'jk = verdadero }

, es posible definir el siguiente problema maestro AE disyuntivo:

min Z C + f(x)

sa. a ~ f(x1)+Vf(xl)T(x_xl)l

g(x1)+Vg(x1)T(x_xl)<0j L

rk 1 kESD (MPGD) V

iDk /ELÍk

] L Ck = Yik

(Y) =Verdadero

a E R, X E R, CE Rm, YE {verdadero,falso}m

Debe tomarse en cuenta que antes de aplicar el problema maestro anterior, es necesario resolver

varios subproblemas de (PNILD) de tal manera de que se produzca al menos una aproximación lineal de cada uno de los términos en las disyunciones. Como se mostró por Turkay y Grossmann (1996), el seleccionar el menor número de subproblemas es equivalente a la

solución de un problema de cobertura de conjuntos, que es de tamaño pequeño y fácil de

resolver. En el contexto de problemas de síntesis de esquemas de proceso, otra forma de

generar las linearizaciones en (MIPGD) consiste en partir de un diagrama de flujo inicial y suboptimizar los subsistemas remanentes como en la estrategia de modelado/descomposición (Kocis y Grossmann, 1989; Kravanja y Grossmann, 1990).

18

Page 19: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

El problema anterior (MIPGD) se puede resolver con los métodos descritos por Beaumont

(1991), Raman y Grossmann (1994), y Hooker y Osorio (1996). También es interesante notar que para el caso de estructuras de proceso, Turkay y Grossmann (1996) han demostrado que si

la representación de la caja convexa de las disyunciones en (2) se utiliza en (MIPGD), entonces

al asumir que B' = 1, y convertir las relaciones lógicas Q(Y) en las desigualdades Ay -:5- a, se llega al problema IVIPLE,

miii Zck+f(x)

sa. a ~ f(x)+Vf(x')T(x-x1)1

g(x1)+Vg(x1)T(x—x1) ~ 0 (PMEDF)

J Vh1 (x l ) T x+v h(x 1 ) T x[_h1 (x 1 )+Vh1 (x l ) T x 1 1 lcK,iEI

XN. 7

XA - XN + X 1

0~ xI xZy1

0<x 2 ~ x(l—y)

Mi

Ay ~ a

xER,x ~ 0,x ~ o,y{o,1}mNi

donde el vector x se fracciona en las variables (x x . ,XN. ) para cada disyunción i, de

acuerdo a la definición de la matriz B. El conjunto de linearizaciones está dado por

KL 1 = [1 Y111 = Verdadero, 1= 1, .... L} que denota el hecho de que sólo un subconjunto de

desigualdades fueron forzadas para un subproblema 1 dado. Es interesante notar que el algoritmo de Aproximación Exterior basado en lógica proposicional representa una

generalización de la estrategia de modelado/descomposición de Kocis y Grossmann (1989) para la síntesis de diagramas de flujo de proceso.

Turkay y Grossmann (1996) también han demostrado que mientras que un método generalizado de Benders basado en lógica proposicional (Geoffrion, 1972) no se puede derivar como en el caso del algoritmo AE, sí se puede aprovechar la propiedad de los problemas PNLIVIE de que ejecutar una iteración de Benders (Turkay y Grossmann, 1996) en el problema maestro PLME

del algoritmo AE, es equivalente a generar un corte generalizado de Benders. Por lo tanto, una versión basada en lógica proposicional del método generalizado de Benders consiste en la

ejecución de una iteración de Benders en el problema maestro (PMEDF) de PLMIE (véase la propiedad 5). Finalmente, también debe notarse que se pueden introducir variables de holgura a (MIPGD) y a (PMEDF) para reducir el efecto de las no convexidades como en el problema

maestro de penalización aumentada PLME (Viswanathan y Grossmann, 1990).

19

Page 20: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

En un enfoque alternativo para resolver el problema (PGD), Lee y Grossmann (1999) han

mostrado, con base en el trabajo de Stubbs y Mehrotra (1994), que la caja convexa de la

disyunción en el Programa Generalizado Disyuntivo (PGD), está dado por el siguiente teorema:

Teorema 2. La caja convexa de cada disyunción k E SD en el problema (PGD),

y h.k (x) ~ 0 (4) icDk

ck Yik

donde h/(í'ç) -:~- O son desigualdades convexas, es un conjunto convexo y está dado por,

X = V )k, 2 k _ 1

i€Dk iDk

Ck = ik (CHk) iDk

2kkk(vIk IÁ k )O iEDk

Esta prueba se hace realizando una linearización exacta de (4) con las variables no negativas

ik, y con base en la prueba de Mehrotra y Stubbs (1994) en la que se demuestra que Áh(v/)i) es

una función convexa si h(x) es una función convexa. En (CHk) las variables Vik se pueden

interpretar como variables desagregadas que se asignan a cada término disyuntivo, mientras que

2ik, se pueden interpretar como factores de peso que determinan la validez de las desigualdades

en los términos disyuntivos correspondientes. Nótese también que (CHk) se reduce al resultado

de Balas (1985) para el caso de restricciones lineales. Del Teorema 2, se desprende el siguiente

corolario (Lee y Grossmann, 1999):

Corolario. La relajación en programación no lineal de (PGD) está dada por,

min Z' = 2"k2k +f(x)

sa. g(x) <O

X V, Y A,, = 1 k E SD (PDR) iDk i€Dk

2 h, h.k (v lk / 21k) 0 i E Dk , k E SD

A2a

X E R, Vjk =0,0 <2ik ~ 1, i E D k , k E SD

y da como resultado una cota inferior válida para la solución del problema (PGD).

20

Page 21: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

El problema de relajación (PDR) se puede utilizar como base para construir un método de

ramificación y acotamiento de propósito especial, como se propuso por Lee y Grossmann

(1999). En forma alterna, el problema (PDR) se puede usar para reformular el problema (PGD)

como un problema ajustado de PNLME de la forma,

minZL —71k2lk +f(x)

sa. g(x) <0

XV,k, 2lk=1 kESD iEDk iDk

(21k +s)hlk (v lk I(21k +s))::~ O i cDk , k c SD (PME-DP)

—U Ik ~Vjk <UJk

A2 ~ a

xER, Vk ~:O, 2 k _{0,1}, /EDk, kESD

en el cual E es una tolerancia pequeña para evitar dificultades numéricas, y 2/k son variables

binarias que representan las variables booleanas Yik. Todos los algoritmos que se discutieron en

la sección sobre métodos de PNLME se pueden aplicar para resolver este problema. Para el caso en el que las disyunciones tienen la forma de (2), Lee y Grossmann (1999) hicieron notar que

existe la relación siguiente entre el problema (PME-PD) con la aproximación exterior basada en

lógica proposicional de Turkay y Grossmann (1996). Si se consideran valores fijos de 2j-, se

llega a un subproblema de PNL de la forma (PNLD). Si, entonces, se efectúa una linearización

en el problema (PME-PD), se llega al problema (PMEDF) de PLME.

21

Page 22: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Ejemplo

Se presentan aquí resultados numéricos sobre un problema ejemplo que trata de la síntesis de

una red de procesos que fue originalmente formulada por Duran y Grossmann (1986) como un problema de PNLMIE, y después por Turkay y Grossmann (1986) como otro de PGD. En la figura 3 se muestra la superestructura que involucra la posibilidad de selección, o no, de 8

procesos. Las variables Booleanas 1' j denotan la existencia o no existencia de los procesos 1-8.

La solución óptima global es Z' = 68.01, y consiste en la selección de los procesos 2,4,6, y 8.

c

x7 E

Fig. 3. Superestructura para el ejemplo de red de procesos

El modelo en la forma de un problema PGD involucra disyunciones para selección de las unidades, y lógica proposicional para la relación entre estas unidades. Cada disyunción contiene las ecuaciones de cada unidad. El modelo es el siguiente:

Función objetivo:

min Z = cl+c2+c3+c4+c5+c6+c7+c8

+X2-10X3+X4-1 5x5-40x9+1 5x10+15x14+80x17

-65x 8+25X1 9-60X20+3 5x2 1-80x22-3 5x25+ 122

22

Page 23: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Balances de materia en los puntos de mezclaldivisión de corrientes:

X3+X5-X6-X11 = o

X13-X19-X21 = O

X17-X9-X16-X25 = O

X11-X12-X15 = O

X6-X7-X8 = O

X23-X20-X22 = O

X23-X14-X24 = O

Especificaciones en los flujos:

X1O -O. 8X17 < O

X1O-0 . 4X17 > O

X12-5X14 < O

X12-2X14 > O

ir -, i Unidadi: exp(x 3 )-1—x 2 0vx 2 =x3 =0

L c1 5 i L c1=O ]

r y2 ir Unidad 2: exp(x 5 /1.2)-1—x 4 O V1 x4 = x 5 =0

[ c2=8 1 L c2=0 j r y3 ir

Unidad 3 1 1.5x g —x8 +x10 = O VX8 = x9 = x10 = O

L c 3 =6 1 L c 3 =0 ]

r y4 ir Unidad 4: 1.5(x 12 +x14 )—x 13 = O v x 12 = x 13 =X 14 = O

L c4=1O ] [ c4= 0 ]

23

Page 24: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

ir -1Y5

x 15 -2x 16 =0vx 15 =x16 =O Unidad 5:

=6 1 [ C5

Y 6 ir -1y 6

Unidad 6: exp(x 20 11.5)-1—x 19 =0 V l X19=x20

L c6=7 ] L c6=0 ] i

Unidad 7: [exP(x22) — 1 — x 21 0 V x 21 = x 22 O

c7=4 ] L c 7 =O j

r y8 ir Unidad 8: exp(x 18 )-1—x 10 —x 17 =0 vx 10 =x17 =x18 =0

c8=5 i L c8=0 ]

Lógica proposicional [=(Yi)]:

Y1Y3vY4vY5

Y2Y3vY4vY5

Y3Y1vY2

Y3Y8

Y4Y1vY2

Y4=Y6vY7

Y5=Y1vY2

Y5Y8

Y6Y4

Y7Y4

Y8Y3VY5V(-1Y3A--X5)

24

Page 25: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Especificaciones:

Y1LY2

Y4LY5

Y6LY7

Variables:

Xj, c=0, Yi={ Verdadero, Falso} i=l,2, ... ,8, j=1,2, ... ,25

Como se observa en la Tabla 1, el algoritmo de ramificación y acotamiento (RA) de Lee y

Grossmann (1999) llega al óptimo en sólo 5 nodos en comparación con 17 nodos del método

estándar de ramificación y acotamiento aplicado a la formulación PNLME con restricciones de!

tipo M-mayor. Una diferencia mayor entre estos dos métodos es la cota inferior que se predice

por la PNL relajada. Es claro que la cota en el nodo raíz del método RA propuesto, que está

dada por el problema (PRD), es mucho más fuerte (62.48 vs. 15.08). En la Tabla 2 se muestra la

comparación con otros algoritmos cuando el problema se reformula como un problema apretado

de PNLME (PME-PD). Nótese que el algoritmo RA propuesto y el RA estándar generan la

misma cota inferior (62.48), ya que ambos inician con la solución del mismo problema de relajación. La diferencia entre el número de nodos, 5 vs. 11, es debida a las reglas de

ramificación, que se usan de mejor forma en el método de ramificación y acotamiento especial

de Lee y Grossmann (1999). Los métodos de AE, DGB y EPC parten de una suposición inicia!

Y ° = [1,0, 1, 1,0,0,1 , 1]. Nótese que en !os métodos de DGB y AE, una iteración mayor consiste en un subprob!ema de PNL y un problema maestro de PLME. De acuerdo a lo que predice la

teoría, el método AE basado en lógica proposicional genera una cota inferior, 8.541, que es más

fuerte que la del método DGB. Por lo tanto, la AE requiere 3 iteraciones mayores contra 8 de la

DGB. El método EPC requiere 7 iteraciones, cada una involucrando la solución de un problema

en PLME. De esta manera, estos resultados muestran la mejora que se puede obtener con la

formulación basada en lógica proposicional, como es el caso del programa disyuntivo generalizado (PDG). También muestra que el algoritmo de AE requiere menos iteraciones

mayores que los métodos DGB y EPC.

Tabla 1. Comparación de métodos de Ramificación y Acotamiento

Modelo MMayor BM PME-PD

Solución Método

RA Algoritmo RA

Óptima Estándar Propuesto

- No. denodos 17

68.01 Óptimo Relajado 15.08 62.48

IMI

Page 26: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Tabla 2. Comparación de varios algoritmos de reformulación PME-PD.

Métod o * RA RA AE GBD ECP Estándar Propuesto (Mayores) (Mayores) (Mayores)

No. denodos 11 5 3 8 7

/ Iteraciones (Nodos) (Nodos) (Iter.) (Iter.) (Iter.)

Óptimo Relajado 62.48 62.48 8.541 -55 1.4 -5.077

*Todos los métodos resuelven el problema reformulado (PME-PD) de PNILME.

CONCLUSIÓN

En este trabajo se ha presentado un enfoque unificado al tratamiento y derivación de los

diferentes algoritmos de PNLMIE que se han reportado en la literatura. Como se ha mostrado

para el caso en que el problema se expresa en forma algebraica, el método de Ramificación y

Acotamiento, el Generalizado de Benders, el de Aproximación Exterior, el Extendido de Plano Cortante y el de Ramificación y Acotamiento basado en PL/PNL se pueden derivar fácilmente

de tres subproblemas básicos de PNL y un problema maestro de PLME. Se pueden obtener derivaciones similares para el caso en el que el problema se expresa como uno de optimización

disyuntiva generalizado. Se han presentado las propiedades teóricas más importantes de estos métodos, así como extensiones a problemas no convexos. Los resultados numéricos del ejemplo

sencillo han confirmado las propiedades teóricas que se discutieron en el trabajo.

AGRADECIMIENTOS

El autor desea expresar su agradecimiento a la Academia Mexicana de Ingeniería por la oportunidad de preparar este trabajo, que agrupa en forma resumida gran parte de su carrera académica. También desea agradecer al Ing. Julián Castellanos quien lo introdujo a la investigación, y a sus estudiantes mexicanos Marco Duran, Ignacio Quesada, Hector Yeomans y

Juan Zamora por hacer posible este trabajo por conducto de sus contribuciones en esta área.

26

Page 27: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Bibliografíáa

Balas, E. ,"Disjunctive Programming and a hierarchy of relaxafions for discrete optimization problerns", SIAM J. AIg. Disc. Meth., 6, 466-486 (1985).

Balas, E., Cena, S. and Cornuejois, G. A Lift-and-Project Cutting Plane Algonithm for Mixed 0-1 Programs, Aíathernatical Prograrnrning, 58, 295-324 (1993).

Bazaraa, M.S., H.D. Sherali and C.M. Shetty, "Nonlinear Programming," John Wiley (1994).

Beaumont, N. "An Algorithm for Disjunctive Programs," European Journal of Operations Research, 48, 362-371 (1991).

Benders J.F., Partitioning procedures for solving mixed-variables programniing problems. Numen. Math., 4, 238- 252 (1962).

Biegler, L.T., I.E. Grossmaim and A.W. Westerberg, "Systematic Methods for Chemical Process Design", Prentice-Hall (1997).

Borchers, B. and J.E. Mitchell, "An Improved Branch and Bound Algonithm for Mixed Integer Nonlinear Prograrnming", Computers and OperationsResearch, 21, 359-367 (1994).

Brooke. A., Kendrick, D. md Meeraus, A., "GAMS - A User's Guide", Scientific Press, Palo Alto (1992).

Dakin, R.J., "A Tree Search Algorithm for Mixed-Integer Programming Problems", Computen Journal, 8, 250-255 (1965).

Ding-Mei and R.W.H. Sargent, 'A Combined SQP and Branch and Bound Algorithni for MINLP Optirnization", interna! Rcport. Centre for Process Systems Engineening, London (1992).

Duran, M. A. and I.E. Grossmaim, "AII Outer-Approximation Algorithm for a Class of Mixed-integer Nonlinear Prograrns," Malli Programming 36,307 (1986).

Fletcher, R. and S. Leyffer, "Solving Mixed Integer Nonlinear Programs by Outer Approxirnation", Math Program,ning 66. 327 (1994).

Flippo, O.E. and A.H.G. Rinnoy Kan, "Decomposition in General Mathematical Programming", Mathematical Programming, 60, 3 61-3 82 (1993).

Garfinkel, R. S and G.L. Nemhauser, "Integer Prograinming", John Wiley, New York (1972).

Geoffrion, A. M., "Generalized Benders Decomposition," Journal of Optimization Theory a;id Applications, 10(4), 237-260 (1972).

Grossrnann, lE., "Mixed-Integer Nonlinear Prograniming Teclmiques for the Synthesis of Engineering Systems," Res. Eng. Dey. 1, 205 (1990).

Grossmann, lE., "Mixed-Integer Optimization Techniques for Algoritliniic Process Synthesis", Advances in Chemical Engineering, Vol. 23, Process Synthesis, pp.l71-246 (1996a).

Grossmann, lE. (ed.), "Global Optimization in Engineering Design", Kluwer, Dordrecht (1996b).

Grossmann. lE.. J.A. Caballero and H. Yeomans, "Advances in Mathematical Programming for Automated Design, Integration and Operation of Chemical Processes," Proceedngs of the International Conference on Process Integration (P199), Copenhagen, Denmark (1999).

27

Page 28: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Grossmaim, I.E. and M.M. Daichendt, "New Trends in Optimization-based Approaches for Process Synthesis", Computers and Chemical Engineering, 20, 665-683 (1996).

Grossmaim. I.E. and Z. Kravanja, "Mixed-integer Nonlinear Programrning: A Survey of Algorithms and Applications", The IMA Volumes in Mathemaiics and its Applications, Vol.93, Large-Scale Optirnization with Applications. Part IT: Optimal Design and Control (eds, Biegler, Coleman, Conn, Santosa) pp.73-100, Springer Verlag (1997).

Grossmann, TE., J. Quesada, R Raman and V. Voudouris, "Mixed Integer Optimization Techiuiques for thc Desigia and Scheduling of Batch Processes," Batch Processing Systems Engineering (Eds. G.V. Reklaitis, A.K. Sunol, D.W.T. Rippin, O. Hortacsu), 45 1-494, Springer-Verlag, Berlin (1996).

Gupta, O. K. and Ravindraii, y.. "Branch and Bound Experiments in Convex Nonlinear Integer Programrning", Management Science, 31(12), 1533-1546 (1985).

Hooker, J.N. and M.A. Osorio, "Mixed logical.linear programining", presented at INFORMS Meeting, Atlanta (1996).

Horst, R. and P.M. Pardalos (eds.), Handbook of Global Optimization, Kluwer, 1995.

Kelley Jr., J.E., "The Cutting-Plane Method for Solving Convex Programs", Journal of SIAM 8, 703 -712 (1960).

Kocis, G.R. and I.E. Grossmann, "Relaxation Strategy for the Structural Optimization of Process Flowsheets," md. Eng. C'hem. Res. 26, 1869 (1987)

Lee, S. and I.E. Grossinann, "Nonlinear Convex Huli Reformulation and Algorithtn for Generalized Disjunctivc Programniing," submitted for publication (1999).

Magnanti, T. L. and Wong, R. T. (1981). Accierated Benders Decomposition: Algorithm Enhancement and Model Selection Critena, OperationsResearch, 29, 464-484.

Mawengkwang, H. and B.A. Murtagh, "Solving Nonlinear Integer Programs with Large-Scale Optirnization Software", Annais of Operations Research, 5, 425-437 (1986).

Leyffer, S., "Detenninistic Methods for Mixed-Integer Nonlinear Programming," Ph.D. thesis, Department of Mathematics and Computer Science, University of Dundee, Dundee (1993).

Leyffer. S.. "Integrating SQP and Branch and Bound for Mixed Integer Nomnear Prograrnming," submitted for publication (1998).

Nabar, S. and Schrage, L., "Modeling and Solving Nonlinear Integer Programming Problems", Presented at Annual AIChE Meeting, Chicago (1991).

Nemhauser, G. L. and Wolsey, L. A.,"Integer and Combinatorial Optimization," Wiley-Interscience, New York (1988).

Paules, G. E. and Flondas, C. A. "Apros: Algorithmic development methodology for discrete-continuous optimization problems", Operations. Research, 37, 902-915 (1989).

Pinto, J. and I.E. Grossmann, "Assignment and Sequencing Modeis for the Scheduling of Chentical Processes", Annais of Operations Research 81 433-466. (1998).

Quesada, 1. and I.E. Grossmann, "An LP/NLP Based Branch and Bound Algoriflun for Convex MINLP Optimization Problems," Comp uters and Chemical Engineering 16, 937-947 (1992).

110

Page 29: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Quesada, I.E. and lE. Grossmann, "A Global Optimization Algorithm for Linear Fractional and Bilinear Prograins." Journal of Global Optimization, 6, 39-76 (1995).

Rarnan, R. and I.E. Grossmann, "Relation Between MILP Modelling and Logical Inference for Chemical Process Synthesis," Computers and Chemical Engineering 15, 73(1991).

Raman, R. and I.E. Grossmann, "Symbolic Integration of Logic un Mixed Integer Linear Programming Techniques for Process Synthesis," Computers and Chemical Engineering, 17, 909 (1993).

Raman, R. and I.E. Grossmann, "Modelling and Computational Techniques for Logic Based Integer Programming," C'omputers and Chemical Engineering, 18, 563 (1994).

Reklaitis, G.V. "Progress and Issues in Computer-Aided Batch Process Design," in Foundations of Computer-.Aided Design, J. J. Siirola, I.E. Grossmaiin and G. Stephanopoulos (Eds.), Cache-Elsevier, Amsterdam (1990).

Sahinidis, N.V. and I.E. Grossmann, "Convergence Properties of Generalized Benders Decomposition," C'omputers and Chemical Engineering, 15, 481 (1991).

Shah, N."Single and Multisite Planning and Scheduling: Current Status and Future Challenges,"FOCAPO Proceedings (1998).

Stubbs, R.A. and S.Mehrotra, "A Branch and Cut Method for 0-1 Mixed Convex Programrning", presented at INFORMS Meeting, Washington (1996).

Taha, HA., "Integer Programming-Theory, Applications and Coinputations", Academic Press, London (1975).

Turkay, M. and I.E. Grossmann, "A Logic Based Outer-Approximation Algorithm for MINLP Optimization of Process Flowsheets", Computers and Chemical Enginering, 20, 959-978 (1996).

Westerlund, T. and F. Pettersson, "A Cutting Plane Method for Solving Convex MINLP Problerns", Cornpuiers and Chemical Engineering, 19, S 131 -S 136 (1995).

Williarns, H.P., "Mathematical Building in Mathematical Programming", John Wiley, Chichester (1985).

Vecchietti, A. and I.E. Grossmaim, "LOGMIP: A Discrete Continuous Nonlinear Optimizer", Computer.v aiid Chemical Engineering 21, S427-S43 2 (1997).

Viswanathan, J. and I.E. Grossmann, "A Combined Penalty Function and Outer-Approximation Method for MINLP Optimization," Comput. chen,. Engng. 14, 769 (1990).

Yuan, X., S. Zhang, L. Piboleau and S. Domenech, "Une Methode d'optimisation Nonlineare en Variables pour la Conception de Procedes", OperationsResearch, 22, 331 (1988).

Zamora. J.M. and I.E. Grossmaim, "A Branch and Contract Algorithm for Problerns with Concave Univariate, Bilinear and Linear Fractional Terms," accepted for publication, Journal of Gohal Optimization (1998).

MM

Page 30: Técnicas de programación no lineal mixta para ingeniería de sistemas de procesos

Técnicas de Programación no Lineal Mixta

para Ingeniería de Sistemas de Procesos Ignacio E. Grossmann

Departamento de Ingeniería Química, Universidad de Carnegie Mellon

Pirtsburgh, PA 15213, EUA

Febrero 1999

RESUMEN

Este trabajo tiene como ob!etivo primordial el presentar un enfoque unificado al tratamiento y

derivacion de técnicas de programación no Lineal mixta entera (PYL). Ramificación

Acotamiento, Aproxirnacion Exterior, Descomposición Generalizada de Benders y método

Extendido de Plano de Cortante, que son aplicables a problemas de optimización no lineal

ciscreta que se expresan en forma algebraica. Se presenta primero la solución de problemas de PYL con funciones convexas, y a continuación se hace una extensión al caso de no

convexidad. Tambien se describe la solución de representaciones basadas en 1 o2ica procosictonal. conocidas como proamas o1siuntivos generalizados. Finalmente, se presentan

comparaciones numéricas relativas a una red de procesos sencilla con el objeto de conñrrnar las propiedades teóricas de estos métodos.