34
etodo de separaci´ on de variables Jos´ e Rodellar y Andr´ es Encinas Departamento de Matem´ atica Aplicada III Notas preparadas para las asignaturas “Ecuaciones Diferenciales” del tercer curso de las titu- laciones de Ingeniero de Caminos Canales y Puertos y de Ingeniero Ge´ ologo impartidas en la E.T.S.E.C.C.P. de Barcelona. Octubre de 2002. 1 Introducci´ on En este cap´ ıtulo se presenta una introducci´ on al m´ etodo de separaci´ on de variables. Se trata de un m´ etodo cl´ asico cuyos or´ ıgenes se remontan a la soluci´ on de los primeros problemas ısicos descritos mediante ecuaciones en derivadas parciales. En efecto, los trabajos pioneros de Bernoulli, Euler y D’Alembert en la segunda mitad del siglo XVIII sobre la modelaci´ on del comportamiento de cuerdas el´ asticas y otros sistemas similares dieron lugar a la soluci´ on de la ecuaci´ on diferencial de la cuerda el´ astica mediante superposici´ on de soluciones elementales y a la introducci´ on de los desarrollos en series de funciones basados en funciones trigonom´ etricas. Estas ideas fueron explotadas por Fourier en el contexto del estudio de la conducci´ on de calor. En su famoso libro “Th´ eorie Analytique da la Chaleur”, publicado en 1822, di´ o las bases del etodo de separaci´ on de variables, desarrollando constructivamente la soluci´ on de diversos problemas en forma de series basadas en conjuntos de funciones trigonom´ etricas ortogonales. En este contexto, contribuy´ o tambi´ en a motivar el inter´ es por la representaci´ on de funciones mediante las series de Fourier, que tantas aplicaciones han tenido y tienen hoy en d´ ıa en multitud de problemas. En este cap´ ıtulo se sigue una presentaci´ on del m´ etodo en forma constructiva. En vez de plantear inicialmente un problema gen´ erico en abstracto, se considera como motivaci´ on y prototipo la ecuaci´ on del calor en una barra. En primer lugar, el Apartado 2 considera el problema con unas condiciones de contorno con temperatura nula en los extremos. Para este caso, se construye la soluci´ on en variables separadas y se van encontrando de forma natural los problemas de autovalores, las autofunciones ortogonales y, finalmente, la soluci´ on del problema como una serie infinita. El mismo proceso se repite para dos ejemplos m´ as con otras condiciones de contorno. De estos ejemplos se deduce la necesidad de la representaci´ on de funciones mediante series 1

M etodo de separaci on de variables - … · Notas preparadas para las asignaturas \Ecuaciones Diferenciales" del tercer curso de las titu- ... f sicos descritos mediante ecuaciones

Embed Size (px)

Citation preview

Metodo de separacion de variables

Jose Rodellar y Andres Encinas

Departamento de Matematica Aplicada III

Notas preparadas para las asignaturas “Ecuaciones Diferenciales” del tercer curso de las titu-

laciones de Ingeniero de Caminos Canales y Puertos y de Ingeniero Geologo impartidas en la

E.T.S.E.C.C.P. de Barcelona. Octubre de 2002.

1 Introduccion

En este capıtulo se presenta una introduccion al metodo de separacion de variables. Se tratade un metodo clasico cuyos orıgenes se remontan a la solucion de los primeros problemasfısicos descritos mediante ecuaciones en derivadas parciales. En efecto, los trabajos pionerosde Bernoulli, Euler y D’Alembert en la segunda mitad del siglo XVIII sobre la modelacion delcomportamiento de cuerdas elasticas y otros sistemas similares dieron lugar a la solucion de laecuacion diferencial de la cuerda elastica mediante superposicion de soluciones elementales y ala introduccion de los desarrollos en series de funciones basados en funciones trigonometricas.Estas ideas fueron explotadas por Fourier en el contexto del estudio de la conduccion de calor.En su famoso libro “Theorie Analytique da la Chaleur”, publicado en 1822, dio las bases delmetodo de separacion de variables, desarrollando constructivamente la solucion de diversosproblemas en forma de series basadas en conjuntos de funciones trigonometricas ortogonales.En este contexto, contribuyo tambien a motivar el interes por la representacion de funcionesmediante las series de Fourier, que tantas aplicaciones han tenido y tienen hoy en dıa enmultitud de problemas.

En este capıtulo se sigue una presentacion del metodo en forma constructiva. En vezde plantear inicialmente un problema generico en abstracto, se considera como motivaciony prototipo la ecuacion del calor en una barra. En primer lugar, el Apartado 2 considerael problema con unas condiciones de contorno con temperatura nula en los extremos. Paraeste caso, se construye la solucion en variables separadas y se van encontrando de formanatural los problemas de autovalores, las autofunciones ortogonales y, finalmente, la soluciondel problema como una serie infinita. El mismo proceso se repite para dos ejemplos mas conotras condiciones de contorno.

De estos ejemplos se deduce la necesidad de la representacion de funciones mediante series

1

Separacion de variables 2

de Fourier. El Apartado 3 presenta en forma breve los conceptos basicos sobre conjuntosde funciones ortonormales y series de Fourier, con especial atencion a la representacion defunciones en media cuadratica.

El proceso de separacion de variables construido para los tres ejemplos con la ecuaciondel calor en una barra se extiende a una clase mas amplia de problemas parabolicos en elApartado 4. En este problema se considera una ecuacion diferencial mas general, de la cualla ecuacion del calor resuelta anteriormente es un caso particular. Asimismo se presentande forma unificada las condiciones de contorno de Dirichlet, de Neumann, de Robin y lasperiodicas. Con esto el metodo de separacion de variables queda visto de forma general paraproblemas parabolicos no homogeneos.

El Apartado 5 aborda la solucion del problema parabolico general pero cuando la ecuaciony las condiciones de contorno son no homogeneas. En primer lugar, se ilustra la imposibi-lidad de aplicar el proceso de separacion de variables tal cual ha sido desarrollado en losapartados precedentes cuando el problema es no homogeneo. Posteriormente, se presenta unmetodo que obtiene la solucion del problema no homogeneo como un desarrollo en serie delas autofunciones del problema homogeneo y que incluye la separacion de variables como casoparticular.

2 Ejemplos introductorios

2.1 Conduccion del calor en una barra con temperatura nula en los ex-

tremos

Consideremos el siguiente problema de valores iniciales y de contorno con la ecuacion delcalor en una barra:

(a) ρc ut − k uxx = 0, x ∈ (0, `), t > 0;

(b) u(0, t) = u(`, t) = 0, t > 0;

(c) u(x, 0) = f(x), x ∈ (0, `).

(1)

En este problema la ecuacion es homogenea (no hay fuente termica), las condiciones decontorno de Dirichlet son tambien homogeneas y los parametros densidad (ρ), calor especıfico(c) y conductividad termica (k) son constantes. Este problema nos servira de vehıculo paraintroducir el metodo de separacion de variables de forma constructiva y simple.

El objetivo inicial es buscar soluciones no triviales (u 6= 0) expresadas en variables sepa-

radas, es decir que tengan la forma

u(x, t) = X (x)T (t). (2)

Para ello, se sustituye esta expresion en el problema (1) y se buscan las funciones X y T .Sustituyendo (2) en la ecuacion diferencial (a), se obtiene

ρcXT ′ − kX ′′T = 0,

Separacion de variables 3

donde aparecen las derivadas (′) de las funciones X y T . Dividiendo por XT , teniendo encuenta que este producto no es nulo, se obtiene

T ′

T=

k

ρc

X ′′

X.

Observemos que la parte izquierda de esta igualdad es funcion unicamente de la variablet, mientras que la parte derecha lo es solo de x. Esta igualdad ha de ser cierta para todox ∈ (0, `) y para todo t > 0 y ambas variables son independientes. La unica posibilidad pueses que ambas funciones coincidan con una constante, es decir

T ′

T=

k

ρc

X ′′

X= −λ.

De aquı resultan dos ecuaciones diferenciales ordinarias, cada una respecto de una de lasvariables del problema:

T ′ + λT = 0, kX ′′ + λpX = 0, (3)

donde p = ρc.

La constante λ se conoce como constante de separacion y, en este punto, tiene un valorarbitrario. La introduccion del signo negativo es unicamente por razones de conveniencia,como se apreciara mas adelante.

La imposicion de la condicion de contorno (b) en x = 0 a u = XT , se traduce enX (0)T (t) = 0. Como esto ha de cumplirse para todo t > 0, la unica posibilidad de solucionno trivial requiere que X (0) = 0. Procediendo analogamente con el extremo x = `, se obtieneX (`) = 0. Estas condiciones, junto con la segunda de las ecuaciones en (3), definen el siguienteproblema:

{

kX ′′ + λpX = 0, x ∈ (0, `)

X (0) = X (`) = 0.(4)

Este es un problema de contorno que pertenece a la clase de los denominados problemas de

Sturm-Liouville. Se sabe que estos problemas tienen soluciones X no triviales para deter-minados valores reales de λ, que se llaman autovalores. La busqueda de estas solucionespasa por determinar dichos valores y obtener las funciones X correspondientes, las cuales sedenominan autofunciones.

Si imponemos la condicion inicial (c) de (1), se tiene X (x)T (0) = f(x). De esta expresionno podemos obtener en general una condicion inicial para la funcion T independiente de lavariable x. Por tanto, una vez resuelto el problema de contorno (4), se tiene que resolver laecuacion diferencial

T ′ + λT = 0 (5)

libre de condicion inicial alguna para cada uno de los autovalores λ obtenidos. Finalmente,para cada autovalor, el producto de la autofuncion X (x) por la correspondiente funcion T (t)nos definira una funcion u(x, t) = X (x)T (t) que sera solucion de la ecuacion (a) y de lascondiciones de contorno (b) del problema (1).

Solucion del problema de contorno: Vamos a resolver ahora el problema de contorno(4). Consideremos el polinomio caracterıstico ks2 + λp = 0 de la ecuacion diferencial (4),cuyas raıces determinan la forma de la solucion.

Separacion de variables 4

Si µ < 0, las raıces son dos valores reales y distintos y la ecuacion diferencial tiene las dossoluciones independientes e

√−µ x y e−

√−µ x respectivamente. La solucion general se forma

con una combinacion lineal de la forma

X (x) = C1 e√−µ x + C2 e−

√−µ x,

donde C1 y C2 son constantes arbitrarias. Estas constantes pueden determinarse al imponerlas condiciones de contorno, de lo que resulta el siguiente sistema de ecuaciones:

X (0) = C1 + C2 = 0; X (`) = C1e√−µ ` + C2e

−√−µ `.

La solucion de este sistema es C1 = C2 = 0, de lo que se obtiene la funcion X (x) = 0 comounica solucion del problema (4). De esto se concluye que no existen autovalores-autofuncionescon µ < 0.

Teniendo en cuenta que

sinh θ =eθ − e−θ

2y cosh θ =

eθ + e−θ

2,

el caso con µ < 0 puede estudiarse tambien considerando la solucion general de la ecuacionen la forma D1 cosh

√−µx + D2 sinh√−µx, llegandose obviamente a la misma conclusion.

El caso con µ = 0 corresponde a una raız doble s = 0 y la solucion general de la ecuaciondiferencial (ahora simplemente X ′′ = 0) es de la forma

X (x) = C1 + C2 x.

Imponiendo las condiciones de contorno, resulta inmediatamente que las constantes se de-terminan en la forma C1 = C2 = 0, de lo que se concluye que no existen autovalores-autofunciones para µ = 0.

Analicemos por ultimo el caso µ > 0. Ahora las raıces del polinomio caracterıstico sonun par de valores imaginarios puros s = ±i

õ y la solucion general tiene la forma

X (x) = C1 cos√

µx + C2 sin√

µx.

Imponiendo la condicion de contorno X (0) = 0, resulta C1 = 0, de lo que queda la solucionX (x) = C2 sin

õx. Imponiendo ahora X (`) = 0, resulta C2 sin

õ ` = 0. La posibilidad

C2 = 0 queda descartada ya que nos llevarıa a una solucion X (x) = 0 con ausencia deautovalores-autofunciones. La otra posibilidad es

sin√

µ ` = 0,

lo que puede ocurrir para√

µ ` = nπ para cualquier n = 1, 2, 3, . . ..

Ası pues los autovalores λ son de la forma

λ =k

pµ =

k

p

n2π2

`2

y las autofunciones correspondientes tienen la forma

X (x) = C2 sin√

µx = C2 sinnπx

`.

Separacion de variables 5

Observando que existen infinitos autovalores y autofunciones formando dos sucesiones alconsiderar n = 1, 2, . . ., puede ser mas conveniente introducir a partir de ahora la siguientenotacion:

λn =k

p

n2π2

`2y Xn(x) = Cn sin

nπx

`, n = 1, 2, . . . . (6)

Como veremos, resulta de gran utilidad definir un producto interno entre dos funciones.Consideremos un cierto conjunto de funciones en el intervalo [0, `]. Sea p una funcion continuapositiva en [0, `]. Definimos el denominado producto interno de las funciones f y g con peso

p como el numero dado por la expresion

< f, g >=

∫ `

0

f(x)g(x)p(x) dx.

Se dice que dos funciones f y g son ortogonales en [0, `] cuando < f, g >= 0. Asociado alproducto interno, tenemos el concepto de norma de una funcion definida en la forma

‖f‖ =√

< f, f >.

Podemos ver que las autofunciones {Xn(x) = Cn sin nπx` }n=1,2,... forman un conjunto ortogo-

nal de funciones en [0, l], es decir que son ortogonales dos a dos. En efecto, puede comprobarseque

< Xn,Xm >= CnCm p

∫ `

0

sinnπx

`sin

mπx

`dx =

{

0 si n 6= m

C2n p `

2si n = m.

Por otro lado, dado que Cn es una constante arbitraria, podemos elegir su valor a voluntad.Una forma conveniente es elegirla de manera que las autofunciones tengan norma unidad, esdecir imponiendo que

‖Xn‖ =√

< Xn,Xn > = Cn

p`

2= 1.

Ası elegimos Cn =√

2

p` . Con ello las autofunciones quedan en la forma

Xn(x) =

2

p`sin

nπx

`, n = 1, 2, . . . . (7)

Decimos que {Xn(x)}n=1,2,... es un conjunto ortonormal de funciones.

Problema temporal: Para cada uno de los autovalores λn, tenemos ahora una ecuaciontemporal (5) que podemos escribir en la forma

T ′n + λnTn = 0. (8)

Su solucion es de la formaTn(t) = θne−λnt, (9)

donde θn es una constante arbitraria que podemos tomar igual a 1 por simplicidad.

Separacion de variables 6

2.2 Superposicion. Solucion en serie

Con el proceso anterior hemos obtenido una sucesion de funciones un(x, t) = Xn(x)Tn(t)que satisfacen la ecuacion diferencial (a) y las condiciones de contorno (b) del problema (1).Consideremos una combinacion lineal de un numero N finito de estas funciones, siendo N yBn unos valores arbitrarios:

uN (x, t) =N∑

n=1

Bn un(x, t) .

Es inmediato ver que uN (x, t) satisface las condiciones de contorno. Sustituyendo las derivadas

uNt=

N∑

n=1

Bn [un(x, t)]t y uNxx=

N∑

n=1

Bn [un(x, t)]xx (10)

en la ecuacion diferencial, es facil ver que uN la satisface. Esto no es sino un reflejo delprincipio de superposicion de soluciones que verifica toda ecuacion diferencial lineal: cualquiercombinacion lineal de soluciones es tambien solucion.

Dado que disponemos de una sucesion infinita de funciones de la forma un(x, t), parecenatural definir una funcion u(x, t) como la suma de una serie infinita en la forma

u(x, t) =∞∑

n=1

Bn un(x, t) =∞∑

n=1

BnXn(x)e−λnt, (11)

y que esta funcion sea tambien solucion de la ecuacion (a) y de las condiciones de contorno(b) del problema (1). Es inmediato comprobar que esta funcion satisface las condiciones decontorno. Sin embargo, el hecho de que la funcion escrita en (11) sea solucion de la ecuaciondiferencial es mas delicado. En primer lugar, el paso de una suma finita a una serie infinita defunciones requiere comprobar que la serie sea convergente para asegurarnos de que la funcion(11) existe. En segundo lugar aparece la cuestion de la existencia de las derivadas ut y uxx

obtenidas derivando termino a termino la serie anterior, es decir en la forma

ut(x, t) =∞∑

n=1

Bn [un(x, t)]t y uxx(x, t) =∞∑

n=1

Bn [un(x, t)]xx . (12)

Mientras que para una suma finita las expresiones (10) son triviales, las igualdades en (12)pueden no ser ciertas a menos que las funciones un y sus derivadas cumplan ciertas condicionesde regularidad. Es directo comprobar que, si las derivadas expresadas en (12) son efectiva-mente ciertas, entonces la funcion u(x, t) dada en (11) es solucion de la ecuacion diferencialdel problema (1). No obstante, podemos dejar de lado estas cuestiones y considerar dichafuncion como una “candidata” natural a ser solucion de la ecuacion diferencial. Para queesta funcion pueda ser solucion de todo el problema (1), debe satisfacer tambien la condicioninicial (c). Por tanto, ha de cumplir

u(x, 0) = f(x) =∞∑

n=1

BnXn(x) =∞∑

n=1

Bn

2

p`sin

nπx

`. (13)

Esto significa que la funcion f ha de poder expresarse como una “combinacion lineal” detodas las infinitas autofunciones Xn. Esta expresion se conoce como la serie de Fourier de

Separacion de variables 7

la funcion f en el conjunto de autofunciones Xn en [0, `]. Para que la igualdad anterior seavalida para cada punto x ∈ [0, `], la funcion f debe satisfacer ciertas condiciones. Pasemospor alto por el momento esta cuestion y aceptemos que la funcion f , que vendra dada comodato del problema, puede expresarse en la forma (13) para todo x ∈ [0, `]. En tal caso, loscoeficientes Bn pueden determinarse de forma unica tal como se indica a continuacion.

Expresando el producto interno de la funcion f en la forma (13) por la autofuncion Xm,podemos escribir

< f,Xm >=

∫ `

0

∞∑

n=1

BnXn(x)Xm(x)p dx.

Suponiendo que la serie puede integrarse termino a termino y recordando la ortonormalidadde las autofunciones Xn, se obtiene

< f,Xm >=∞∑

n=1

Bn

∫ `

0

Xn(x)Xm(x)p dx = Bm, (14)

al anularse todos los sumandos excepto el del termino m.

Con todo, la solucion del problema (1) expresada en la serie (11) queda finalmente en laforma

u(x, t) =∞∑

n=1

BnXn(x)e−λnt =∞∑

n=1

Bn

2

p`sin

nπx

`e−λnt, (15)

donde

Bn =< f,Xn >=

∫ `

0

f(x)Xn(x)p dx = p

2

p`

∫ `

0

f(x) sinnπx

`dx. (16)

Para aligerar la notacion, esta solucion puede reescribirse en la forma

u(x, t) =∞∑

n=1

bn sinnπx

`e−λnt,

bn =2

`

∫ `

0

f(x) sinnπx

`dx.

(17)

2.3 Conduccion del calor en una barra con extremos aislados

Consideremos de nuevo la ecuacion del calor en una barra como en el problema (1), peroahora con los extremos aislados, es decir con unas condiciones de Neumann homogeneas. Elenunciado completo del problema es

(a) p ut − k uxx = 0, x ∈ (0, `), t > 0;

(b) ux(0, t) = ux(`, t) = 0, t > 0;

(c) u(x, 0) = f(x), x ∈ (0, `).

(18)

Procediendo de igual forma que en el caso anterior, buscamos una solucion de la formau(x, t) = X (x)T (t). Sustituyendo esta expresion en la ecuacion (a) y en las condiciones

Separacion de variables 8

de contorno (b) del problema, se llega a la ecuacion diferencial T ′ + λT = 0 y al siguienteproblema de autovalores:

{

kX ′′ + λpX = 0, x ∈ (0, `)

X ′(0) = X ′(`) = 0.(19)

Sea µ = λpk . Si µ < 0 la solucion general de la ecuacion diferencial de este problema es de

la formaX (x) = C1 e

√−µ x + C2 e−

√−µ x.

Imponiendo las condiciones de contorno a la derivada de esta funcion, se obtiene facilmenteque C1 = C2 = 0, lo que demuestra que no existen autovalores-autofunciones para µ < 0.

En el caso µ = 0, la solucion es de la forma X(x) = C1 + C2x. Como su derivada esX ′(x) = C2, las dos condiciones de contorno se cumplen simultaneamente con C2 = 0. Portanto, para este caso existe una solucion de la forma X (x) = C1, quedando C1 como unaconstante arbitraria.

Sea ahora µ > 0, en cuyo caso la solucion general de la ecuacion en (19) se expresa en laforma

X (x) = C1 cos√

µx + C2 sin√

µx.

Imponiendo las condiciones de contorno nulas en x = 0 y en x = ` a la derivada

X ′(x) = −C1

õ sin

õx + C2

õ cos

õx,

resulta C2 = 0 y sin√

µ` = 0. De aquı se obtienen los autovalores λ y las autofunciones Xde la forma

λ =k

pµ =

k

p

n2π2

`2y X (x) = C1 cos

õx = C1 cos

nπx

`

para cualquier n = 1, 2, . . ..

Los resultados obtenidos pueden recopilarse rehaciendo la notacion en la forma siguiente:

Autovalores : λ0 = 0; λn =k

p

n2π2

`2para n = 1, 2, . . .

Autofunciones : X0 = C0; Xn(x) = Cn cosnπx

`para n = 1, 2, . . .

(20)

siendo C0 y Cn unos coeficientes arbitrarios.

Podemos observar que estas funciones son ortogonales en el mismo sentido que las auto-funciones obtenidas en el problema anterior, es decir

< X0,Xn >= C0Cnp

∫ `

0

cosnπx

`dx = 0 para n = 1, 2, . . .

y

< Xn,Xm >= CnCmp

∫ `

0

cosnπx

`cos

mπx

`dx = 0 para n,m = 1, 2, . . . (n 6= m).

Separacion de variables 9

Por otro lado,

‖X0‖ =√

< X0,X0 > = C0

p` y ‖Xn‖ =√

< Xn,Xn > = Cn

p`

2.

Escogiendo C0 =√

1

p` y Cn =√

2

p` , podemos redefinir las autofunciones de manera que son

ortonormales en la forma

X0(x) =

1

p`; Xn(x) =

2

p`cos

nπx

`para n = 1, 2, . . . . (21)

Ahora consideramos la ecuacion diferencial temporal T ′ + λT = 0 para cada uno delos autovalores obtenidos. Para λ0 = 0, tenemos T ′

0 = 0, cuya solucion es una constantearbitraria que, por conveniencia, podemos elegir la unidad:

T0(t) = 1.

Para n > 0, la ecuacion es T ′n + λnTn = 0 y su solucion se expresa en la forma

Tn(t) = e−λnt.

Tomando todos los productos posibles de las autofunciones (21) con las funciones tempo-rales correspondientes, podemos formar la serie

u(x, t) = A0X0(x)T0(t) +∞∑

n=1

AnXn(x)Tn(t) = A0

1

p`+

∞∑

n=1

An

2

p`cos

nπx

`e−λnt (22)

como la solucion de la ecuacion diferencial (a) y las condiciones de contorno (b) del problema(18), siendo A0 y An constantes arbitrarias.

Para que esta serie cumpla tambien la condicion inicial (c) del problema, es necesario que

u(x, 0) = f(x) = A0

1

p`+

∞∑

n=1

An

2

p`cos

nπx

`. (23)

Esto significa que la funcion f ha de poder expresarse en serie de Fourier de las autofuncionesanteriores en (0, `). Suponiendo que esto sea ası, con los productos internos de f por lasautofunciones, tal como se ha detallado en el ejemplo del apartado anterior, los coeficientesA0 y An quedan determinados en la forma unica siguiente:

A0 =< f,X0 >= p

1

p`

∫ `

0

f(x) dx y An =< f,Xn >= p

2

p`

∫ `

0

f(x) cosnπx

`dx. (24)

Utilizando estos coeficientes en (22), la solucion queda completamente determinada.

Para simplificar la notacion, esta solucion puede reescribirse en la forma

u(x, t) = a0 +∞∑

n=1

an cosnπx

`e−λnt,

a0 =1

`

∫ `

0

f(x) dx; an =2

`

∫ `

0

f(x) cosnπx

`dx.

(25)

Separacion de variables 10

2.4 Conduccion del calor en un anillo circular

Supongamos que la barra de los Apartados 2.1 y 2.3 tiene ahora forma circular con longitud` tal como se ilustra en la Figura 1. El problema a resolver es ahora el siguiente:

(a) p ut − k uxx = 0, x ∈ (0, `), t > 0;

(b) u(0, t) = u(`, t); ux(0, t) = ux(`, t), t > 0;

(c) u(x, 0) = f(x), x ∈ (0, `).

(26)

En este planteamiento suponemos, como en los problemas (1) y (18), que la seccion delanillo es muy pequena y la temperatura u varıa unicamente a lo largo del anillo como resultadode una conduccion longitudinal del calor. Es natural elegir un punto x = 0 como origen yconsiderar el arco x ∈ (0, `) como la coordenada espacial. Como se ilustra en la Figura 1, elanillo se puede asimilar a una barra longitudinal con extremos x = 0 y x = `. Las condicionesdadas en (b) expresan que los extremos de esta barra son el mismo punto del anillo y, portanto han de ser iguales la temperatura y el flujo termico en ambos extremos.

Las condiciones dadas en (b) se conocen como condiciones de contorno periodicas.

Figura 1: Barra conductora en forma circular.

Procediendo como en los dos problemas anteriores, es decir proponiendo una solucionu(x, t) = X (x)T (t), se llega al siguiente problema de autovalores:

X ′′ + µX = 0, x ∈ (0, `)

X (0) = X (`); X ′(0) = X ′(`).(27)

con µ = λpk .

Dejamos al lector la comprobacion de que no existen autofunciones para el caso µ < 0como en los dos problemas anteriores.

Para el caso µ = 0 la solucion de (27) es de la forma X (x) = C1 + C2x. La condicionX (0) = X (`) implica que C2 = 0, mientras que X ′(0) = X ′(`) se cumple cualquiera que seala constante C1.

La solucion de (27) para el caso µ > 0 es de la forma X (x) = C1 cos√

µx + C2 sin√

µx.

Separacion de variables 11

Imponiendo X (0) = X (`), y X ′(0) = X ′(`), se obtiene

C1 = C1 cos√

µ ` + C2 sin√

µ `

C2

√µ = −C1

õ sin

õ ` + C2

õ cos

õ ` .

Esto puede escribirse en la forma(

cos√

µ ` sin√

µ `− sin

õ ` cos

õ `

) (

C1

C2

)

=

(

C1

C2

)

.

Para que se cumpla esta igualdad, puede que sea C1 = C2 = 0 o bien que la matriz sea laidentidad. El primer caso queda descartado porque nos llevarıa a la solucion trivial X (x) = 0.La segunda posibilidad nos lleva a

cos√

µ ` = 1, y sin√

µ ` = 0 ,

lo que ocurre para√

µ ` = 2nπ para n = 1, 2, . . ., quedando C1 y C2 con valores arbitrarios.

Ası pues, se tienen los infinitos valores de µ de la forma µ = 4n2π2

`2, con n = 1, 2 . . . y a los

autovalores λ = kp

4n2π2

`2.

Para cada uno de los valores de µ obtenidos, la funcion

X (x) = C1 cos√

µx + C2 sin√

µx

es solucion del problema (27) cualesquiera que sean los valores de C1 y C2. Dado que elvalor de C2 es arbitrario, podemos considerar C2 = 0, en cuyo caso la funcion C1 cos

õx

es solucion del problema para cualquier valor de C1. Por otro lado, como C1 es tambienarbitrario, podemos tomar C1 = 0. En tal caso la funcion C2 sin

õx es tambien solucion

del problema cualquiera que sea el valor de C2.

En definitiva, las dos funciones

C1 cos√

µx y C2 sin√

µx

son autofunciones independientes asociadas al mismo autovalor.

Recopilando, los resultados obtenidos como solucion del problema (27) pueden presentarsecon una notacion adecuada en la siguiente forma:

Autovalores : λ0 = 0; λn =k

p

4n2π2

`2para n = 1, 2, . . .

Autofunciones : X0 = C0;

Xnc(x) = Cnc cos2nπx

`

Xns(x) = Cns sin2nπx

`

para n = 1, 2, . . .

(28)

donde C0, Cnc y Cns son constantes arbitrarias.

Es facil comprobar que estas autofunciones son ortogonales en [0, `] y que pueden re-

definirse con norma unidad tomando C0 =√

1

p` y Cnc = Cns =√

2

p` , quedando en la forma

X0(x) =

1

p`, Xnc(x) =

2

p`cos

2nπx

`, Xns(x) =

2

p`sin

2nπx

`para n = 1, 2, . . . .

(29)

Separacion de variables 12

Para cada autovalor λ se tiene una ecuacion diferencial T ′ + λT = 0, de lo que resultanlas funciones temporales de la forma

T0(t) = 1 y Tn(t) = e−λnt.

Con todos los productos posibles de estas funciones con las correspondientes autofuncionesdadas en (29), podemos formar la serie

u(x, t) = A0X0(x)T0(t) +∞∑

n=1

AnXnc(x)Tn(t) +∞∑

n=1

BnXns(x)Tn(t)

= A0

1

p`+

∞∑

n=1

[

An

2

p`cos

2nπx

`+ Bn

2

p`sin

2nπx

`

]

e−λnt

(30)

como la solucion de la ecuacion diferencial (a) y las condiciones de contorno (b) del problema(26), siendo A0, An y Bn coeficientes arbitrarios.

Para que esta serie cumpla tambien la condicion inicial (c) del problema, es necesario que

u(x, 0) = f(x) = A0

1

p`+

∞∑

n=1

[

An

2

p`cos

2nπx

`+ Bn

2

p`sin

2nπx

`

]

. (31)

Esto significa que la funcion f ha de poder expresarse en serie de Fourier de las autofuncionesanteriores en el intervalo [0, `]. Suponiendo que esto sea ası, con los productos interiores def por las autofunciones, tal como se ha detallado en el ejemplo del apartado anterior, loscoeficientes A0, An y Bn quedan determinados en la forma unica siguiente:

A0 =< f,X0 >= p

1

p`

∫ `

0

f(x) dx

An =< f,Xnc >= p

2

p`

∫ `

0

f(x) cos2nπx

`dx

Bn =< f,Xns >= p

2

p`

∫ `

0

f(x) sin2nπx

`dx

(32)

Utilizando estos coeficientes en (30), la solucion del problema (26) queda completamentedeterminada.

Para simplificar la notacion, esta solucion puede reescribirse en la forma

u(x, t) = a0 +∞∑

n=1

[

an cos2nπx

`+ bn sin

2nπx

`

]

e−λnt,

a0 =1

`

∫ `

0

f(x) dx; an =2

`

∫ `

0

f(x) cos2nπx

`dx;

bn =2

`

∫ `

0

f(x) sin2nπx

`dx.

(33)

Separacion de variables 13

3 Conjuntos de funciones ortogonales y series de Fourier

En los problemas anteriores nos hemos encontrado con la necesidad de representar las fun-ciones que describen las condiciones iniciales mediante una serie de Fourier en un conjuntode funciones ortonormales para poder encontrar la solucion unica del problema.

Dependiendo del tipo de condiciones de contorno han aparecido distintos conjuntos: enel caso de las condiciones de Dirichlet (temperatura nula en los extremos) el conjunto deautofunciones es

{

2

p`sin

nπx

`

}

n=1,2,...x ∈ [0, `].

Para la barra con extremos aislados (condiciones de Neumann) las autofunciones son

{

1

p`,

2

p`cos

nπx

`

}

n=1,2,...x ∈ [0, `].

En el ejemplo del anillo, las condiciones de contorno son periodicas y el conjunto de autofun-ciones es

{

1

p`,

2

p`cos

2nπx

`,

2

p`sin

2nπx

`

}

n=1,2,...x ∈ [0, `].

Como veremos mas adelante, la misma necesidad se encontrara al abordar problemasmas generales. Por tanto, vamos a presentar algunos conceptos basicos que son particular-mente relevantes sobre la representacion de funciones mediante series de Fourier en conjuntosortonormales de funciones. Para tener una base geometrica que nos pueda dar cierta in-tuicion, vamos a considerar primero la representacion de vectores en conjuntos de vectoresortogonales.

3.1 Conjuntos de vectores ortogonales

Consideremos el espacio euclıdeo tridimensional (el de la fısica) con los vectores unitarios i, j,k, segun cada una de las direcciones de los ejes de coordenadas cartesianas x, y, z. Cualquiervector de este espacio puede expresarse en la forma

f = f1i + f2j + f3k, (34)

donde f1, f2, f3 son las componentes que definen de forma unica al vector f.

En este espacio se define el producto interno (o producto escalar) de dos vectores f, g enla forma

〈f, g〉 =3∑

i=1

figi. (35)

Este producto tiene las siguientes propiedades:

[1] 〈f, g〉 = 〈g, f〉[2] 〈kf, g〉 = k〈f, g〉, ∀ k ∈ IR[3] 〈f, f〉 = 0 si f = 0; 〈f, f〉 > 0 si f 6= 0

[4] 〈f + g, u〉 = 〈f, u〉 + 〈g, u〉 .

(36)

Separacion de variables 14

Con el producto interno se define la norma (magnitud o longitud) de un vector en la forma

‖f‖ =√

〈f, f〉 , (37)

que siempre tiene un valor positivo excepto para f = 0, cuando vale 0.

Esta norma define la nocion de distancia entre los extremos de dos vectores f y g en laforma

d(f, g) = ‖f − g‖ . (38)

Se dice que dos vectores f y g son ortogonales (perpendiculares) si

〈f, g〉 = 0 . (39)

Sean v1, v2, v3 vectores no nulos. Se dice que forman un conjunto ortogonal de vectores

si son ortogonales dos a dos, es decir 〈vn, vm〉 = 0 para cualquier n 6= m. Dado un conjuntocualquiera de vectores ortogonales, puede definirse otro conjunto formado por vectores en lasmismas direcciones que los anteriores pero unitarios, es decir con norma unidad. Para ello,basta definir los nuevos vectores en la forma

un =vn

‖vn‖, n = 1, 2, 3 . (40)

Este nuevo conjunto se denomina base ortonormal y se caracteriza por

〈un, um〉 =

{

0, para n 6= m1, para n = m.

(41)

Cualquier vector f puede expresarse como una combinacion lineal de los vectores {un} enla forma

f =3∑

n=1

cnun , (42)

donde los coeficientes cn ∈ IR pueden calcularse facilmente con la siguiente operacion:

〈f, ui〉 = 〈3∑

n=1

cnun, ui〉 =3∑

n=1

〈cnun, ui〉 =3∑

n=1

cn〈un, ui〉 = ci . (43)

Ası puescn = 〈f, un〉 . (44)

Estos coeficientes tienen un claro significado geometrico: son las proyecciones del vector f enlas direcciones definidas por los vectores unitarios un.

3.2 Conjuntos de funciones ortogonales

Los conceptos vistos en la seccion anterior para el caso de vectores van a extenderse aquı alcaso de ciertas clases de funciones. En primer lugar, lo que antes era un espacio vectorial dedimension finita ahora sera un espacio de funciones. Esto es un conjunto de funciones tales

Separacion de variables 15

que cualquier combinacion lineal de funciones del conjunto es tambien una funcion del mismoconjunto. Lo que antes era la descomposicion de un vector en una base ortonormal ahora serael desarrollo de una funcion en serie de Fourier en un conjunto de funciones ortonormales.

Existen diferentes espacios de funciones sobre los que desarrollar los conceptos de productointerno, ortogonalidad y desarrollo en series de Fourier. Dependiendo de la clase de funcionesconsideradas, puede ser mas o menos difıcil el profundizar en la teorıa. Aquı consideraremosfunciones reales definidas sobre un intervalo I = [0, `] con la propiedad de ser continuas atrozos.

Se dice que una funcion es continua a trozos (tambien se dice seccionalmente continua)en I si la funcion es continua en todos los puntos excepto posiblemente en un numero finitode puntos en los que la discontinuidad es de salto. Una caracterıstica de estas funciones esque son acotadas en I y ademas integrables Riemann.

Las funciones continuas a trozos sirven para modelar una amplia gama de situaciones enla practica y forman un espacio de funciones para el que existen buen numero de resultadosteoricos sobre desarrollos en series de Fourier que requieren conocimientos razonablementeelementales del analisis matematico.

Denotemos por Cs(I) al espacio de funciones continuas a trozos en el intervalo I ∈ IR. Seauna funcion estrictamente positiva p ∈ Cs(I) a la que denominaremos funcion de peso.

Se define el producto interno de dos funciones f, g ∈ Cs(I) con respecto al peso p como elescalar resultado de la siguiente operacion:

〈f, g〉 =

∫ `

0

f(x)g(x)p(x)dx. (45)

Puede comprobarse que esta operacion cumple las propiedades (36).

En particular puede ser p(x) = 1 ∀x ∈ I.

Si pensamos en una funcion f como en un vector de dimension infinita y en los valoresf(x) como las infinitas componentes al dar valores a la funcion en los infinitos puntos x ∈ I,el producto interno

〈f, g〉 =

∫ `

0

f(x)g(x)p(x)dx (46)

puede verse como la extension natural de la suma de los productos de componentes quedefinıa el producto interno de vectores en (35).

Como en (37), se define la norma de una funcion en la forma

‖f‖ =√

〈f, f〉 =[

∫ `

0

f(x)2p(x)dx]1/2

. (47)

Si ‖f‖ = 0, entonces f(x) = 0 para todo x ∈ [0, `].

Asimismo se define la distancia entre dos funciones f y g como

d(f, g) = ‖f − g‖ =[

∫ `

0

[f(x) − g(x)]2p(x)dx]1/2

, (48)

Separacion de variables 16

que es una medida de la distancia entre las graficas de ambas funciones. Si d(f, g) = 0,entonces f(x) = g(x) para todo x ∈ [0, `].

Se dice que dos funciones f y g son ortogonales si

〈f, g〉 =

∫ `

0

f(x)g(x)p(x)dx = 0 . (49)

La ortogonalidad en el espacio de la seccion anterior significaba que los vectores eran per-pendiculares. Cuando hablamos de la ortogonalidad de funciones se pierde aquel conceptogeometrico, aunque puede darse una cierta interpretacion grafica a la misma: para que elproducto (49) sea nulo, es necesario que los valores de f y g en el intervalo I tengan signosrelativos tales que el producto fg tenga partes de su grafica con valores positivos y partescon valores negativos de manera que su integral sea nula.

Sea {ϕn}n=1,2,... un conjunto de funciones. Se dice que es un conjunto ortogonal si〈ϕn, ϕm〉 = 0 siempre que n 6= m. Suponiendo que ninguna de las funciones tenga normanula, pueden normalizarse para obtener otras funciones φn con norma unidad:

φn(x) =ϕn(x)

‖ϕn(x)‖ , n = 1, 2, . . . . (50)

Estas funciones forman un conjunto ortonormal, es decir

〈φn, φm〉 =

Iφn(x)φm(x)dx =

{

0, para n 6= m1, para n = m.

(51)

3.3 Ejemplos

Ejemplo 1:

{

sinnπx

`

}

n=1,2,...es un conjunto ortogonal en I = [0, `] con respecto al peso

p(x) = 1.

En efecto, podemos comprobar que

sinnπx

`, sin

mπx

`

=

∫ `

0

sinnπx

`sin

mπx

`dx =

{

0, para n 6= m`/2, para n = m.

La norma de todas estas funciones es√

`/2. Por tanto las funciones

φn(x) =

2

`sin

nπx

`, n = 1, 2, . . . (52)

forman un conjunto de funciones ortonormales en [0, `].

Ejemplo 2: De igual forma se comprueba que las funciones

φ0(x) =1√`

, φn(x) =

2

`cos

nπx

`, n = 1, 2, . . . (53)

forman un conjunto de funciones ortonormales en [0, `].

Separacion de variables 17

Ejemplo 3: Analogamente puede verse que las funciones

φc0(x) =1√2`

, φcn(x) =1√`

cos2nπx

`, φsn(x) =

1√`

sin2nπx

`, n = 1, 2, . . . (54)

forman un conjunto de funciones ortonormales en [0, `].

Observese que en todos los casos se tienen infinitas funciones en forma de sucesion quese denotan a nuestra conveniencia. En el primer ejemplo, las contamos a partir de n = 1,mientras que en el segundo las enumeramos empezando en n = 0. En el tercero distinguimoslas funciones de la forma coseno de las de la forma seno para hacer mas explıcita la notacion.

3.4 Series de Fourier

Sea {φn(x)}n=1,2,... un conjunto ortonormal de funciones en Cs(I). Dada una funcion f ∈Cs(I), se plantea la cuestion de si esta puede expresarse como una serie infinita en terminosde las funciones ortonormales en la forma

f(x) =∞∑

n=1

cn φn(x) (55)

con unos coeficientes cn apropiados.

Esta expresion es la extension natural de la descomposicion de un vector en una baseortornormal como en (42). Sin embargo, la situacion aquı es mas compleja, por cuanto no sedispone de una base con un numero finito de vectores, sino que se requieren infinitas funcionesφ1, φ2, . . . para descomponer la funcion f . Ante una expresion en serie como la propuesta en(55) hay que plantearse dos preguntas esenciales:

1) Es valida la igualdad para todo x ∈ [0, `] ?

2) Que valores han de tener las constantes cn?

Tomemonos por el momento la licencia de que la expresion (55) es valida. Esto nos permitirahacer cierta operacion como veremos a continuacion. En efecto, con el producto interno dela funcion f por una cualquiera de las funciones φi, de modo analogo a lo que se hizo en (43),podemos escribir

〈f, φi〉 =⟨

∞∑

n=1

cnφn, φi

=

∫ `

0

[

∞∑

n=1

cnφn(x)]

φi(x)p(x)dx .

Suponiendo que la serie pueda integrarse termino a termino, podemos continuar la operacionen la forma

〈f, φi〉 =∞∑

n=1

cn

∫ `

0

φn(x)φi(x)p(x)dx = ci ,

donde se ha utilizado la ortonormalidad (51) de las funciones φn(x).

Separacion de variables 18

En definitiva, suponiendo que la expresion (55) sea valida, los coeficientes cn de (55) debencalcularse mediante las formulas

cn = 〈f, φn〉 =

∫ `

0

f(x)φn(x)p(x)dx . (56)

Observese que esta expresion es analoga a la que en (44) da la componente de un vector f enla direccion de un vector un de una base ortonormal como la proyeccion en dicha direccion.Ası el coeficiente cn puede interpretarse como una “proyeccion” de la funcion f sobre lafuncion φn del conjunto ortonormal.

El que la expresion (55) sea valida y la serie pueda integrarse termino a termino deter-minan unıvocamente el valor de los coeficientes cn en la forma (56). Por desgracia, dada unafuncion f(x), puede no ser facil encontrar argumentos para demostrar a priori que se cumplenambas condiciones. Por suerte, una inspeccion directa de las formulas (56) permite observarque estas pueden utilizarse independientemente de que la serie (55) converja en todo punto ala funcion f(x). Basta con que los productos de la forma f(x)φn(x)p(x) sean integrables en[0, `] para que las constantes cn existan en la forma calculable con las formulas (56). Esto noes especialmente restrictivo ya que existen muchas clases de funciones que lo satisfacen, porejemplo, las funciones seccionalmente continuas que venimos considerando como prototipo.

En la practica podemos operar de una forma inversa a la que hemos seguido para ir desdela igualdad (55) hasta las expresiones (56). En efecto, dada una funcion f(x) definida enun intervalo I, podemos calcular unos coeficientes cn asociados a dicha funcion mediante lasexpresiones

cn = 〈f, φn〉 =

∫ `

0

f(x)φn(x)p(x)dx , n = 1, 2, . . . , (57)

y construir la serie infinita

f(x) ∼∞∑

n=1

cn φn(x) . (58)

Esta se denomina serie de Fourier de f con respecto al conjunto de funciones ortornormales

{φn}. Las constantes cn se denominan coeficientes de Fourier de la funcion.

Con esta operacion hemos obtenido una sucesion de numeros cn que, multiplicados porlas funciones ortonormales φn(x), determinan una serie de Fourier asociada a una funcionf(x) dada. La notacion (∼) utilizada en (58) es una forma grafica de indicar la asociacionentre la serie de Fourier y la funcion sin prejuzgar que exista una identificacion punto a puntoentre ambas. Esto constituye una forma de representar la funcion como una descomposicionlineal en un conjunto infinito de funciones ortonormales. Es clara la analogıa entre estarepresentacion de una funcion y la representacion de un vector mediante sus componentes enuna base ortornormal. Los coeficientes de Fourier cn son las “componentes” de la funcion enel conjunto de funciones ortonormales {φn}n=1,2....

En el caso de un vector f, dadas sus componentes c1, c2, c3 en la base de vectores ortonor-males u1, u2, u3, se satisface la identidad

f =3∑

n=1

cnun . (59)

Separacion de variables 19

La identidad analoga a la anterior en el caso de una funcion f es

f(x) =∞∑

n=1

cn φn(x) , ∀x ∈ I . (60)

Sin embargo, la situacion es ahora mas compleja que en el caso de un vector. Dados loscoeficientes de Fourier cn de una funcion f en el conjunto ortonormal de funciones {φn},puede ocurrir que la serie de Fourier no sea convergente en todo el dominio I, o que, si loes, la serie no coincida con la funcion en todos los puntos del dominio. En el mejor de loscasos, se espera que la serie sea convergente y su suma coincida con la funcion f(x) en todoslos puntos del dominio, en cuyo caso podremos escribir la identidad (60). Pero en muchosproblemas practicos, como ocurre en problemas con ecuaciones diferenciales en derivadasparciales, podemos encontrarnos con un buen numero de funciones para las que su serie deFourier diverge en algunos puntos de su dominio y, a pesar ello, es conveniente representarla funcion mediante la serie de Fourier.

En general, por encima de la convergencia y de la identificacion de la serie con la funcionen cada punto de su dominio, la serie de Fourier representa a la funcion en cierto sentidoglobal como se desarrollara en el apartado siguiente.

3.5 Aproximacion en media cuadratica

Consideremos las primeras N funciones φ1, φ2, . . . φN de un conjunto ortonormal en Cs(I) yla combinacion lineal

ΦN (x) = α1φ1(x) + α2φ2(x) + . . . + αNφN (x) (61)

con ciertos coeficientes αi.

Con el valor absoluto |f(x) − ΦN (x)| podemos evaluar el error cometido en cada puntox si se quiere aproximar la funcion f(x) mediante la combinacion ΦN (x). Si se quiere teneruna medida del error no en cada punto sino de forma global en todo el intervalo I, puedeconsiderarse la integral

∫ `

0

|f(x) − ΦN (x)| p(x)dx .

Como el valor absoluto complica los calculos, es mas practico utilizar un cuadrado. Ası puesse define la cantidad

EN = ‖f − ΦN‖2 =

∫ `

0

[f(x) − ΦN (x)]2 p(x)dx (62)

como el error cuadratico medio en la aproximacion de la funcion f por la funcion φN .

Si EN → 0 cuando N → ∞, se dice que la sucesion de funciones {φn(x)} tiende en media

cuadratica a f(x). Esto equivale a decir que la distancia d(f,ΦN ) entre las dos funcionesdefinida en (48) tiende a 0 cuando N → ∞. Esto significa que la funcion f(x) puede rep-resentarse en media cuadratica tanto como se quiera tomando un numero N de terminossuficientemente grande.

Separacion de variables 20

Nos proponemos ahora encontrar las constantes αn que hacen que el error EN sea mınimo.En otras palabras, se trata de buscar la mejor aproximacion de f en media cuadratica, tambienconocida como la aproximacion de mınimos cuadrados. Para ello podemos desarrollar laexpresion (62) en la forma

EN =

∫ `

0

[

f(x) −N∑

n=1

αnφn(x)]2

p(x)dx =

∫ `

0

f(x)2p(x)dx +

∫ `

0

[

N∑

n=1

αnφn(x)]2

p(x)dx

− 2

∫ `

0

f(x)N∑

n=1

αnφn(x)p(x)dx .

La primera integral en la derecha de esta igualdad es ‖f‖2. La segunda integral puedeescribirse en la forma

∫ `

0

[

N∑

n=1

αnφn(x)] [

N∑

m=1

αmφm(x)]

p(x)dx =

∫ `

0

N∑

n=1

[

N∑

m=1

αmφm(x)]

αnφn(x)p(x)dx

=N∑

n=1

αn

N∑

m=1

αm

[

∫ `

0

φm(x)φn(x)p(x)dx]

=N∑

n=1

α2n ,

donde hemos tenido en cuenta la ortonormalidad de las funciones φn(x) expresada en (51)para escribir la ultima igualdad.

La tercera de las integrales puede escribirse en la forma

∫ `

0

f(x)N∑

n=1

αnφn(x)p(x)dx =N∑

n=1

αn cn ,

donde cn son los coeficientes de Fourier de f segun las formulas (56).

Ası pues la expresion (62) queda en la forma

EN = ‖f‖2 +N∑

n=1

α2n − 2

N∑

n=1

αn cn = ‖f‖2 +N∑

n=1

(αn − cn)2 −N∑

n=1

c2n . (63)

A la vista de la expresion anterior, formada por sumandos todos positivos o nulos, quedaclaro que el mınimo valor del error EN se tiene cuando αn = cn, ∀n = 1, 2, . . . , N , es decircuando la funcion se aproxima mediante los N primeros terminos de su serie de Fourier.Ademas dicho error mınimo es

minEN = ‖f‖2 −N∑

n=1

c2n. (64)

De este resultado se extraen algunas propiedades interesantes sobre los coeficientes deFourier. En primer lugar, como minEn ≥ 0, se deduce

N∑

n=1

c2n ≤ ‖f‖2 , (65)

Separacion de variables 21

que se conoce como desigualdad de Bessel.

Si vamos aumentando el valor de N hasta ∞, podemos ver∑N

n=1 c2n como la suma parcial

N -sima de la serie de los cuadrados de los coeficientes de Fourier. Como esta suma parcialesta acotada por ‖f‖2, la serie es convergente y su suma esta tambien acotada por ‖f‖2, esdecir que cumple asimismo la desigualdad de Bessel extendida

∞∑

n=1

c2n ≤ ‖f‖2 . (66)

Dado que el termino n-simo de una serie convergente debe tender a 0, se tiene el siguienteresultado:

limn→∞

cn = limn→∞

〈f, φn〉 = 0 . (67)

Es decir que los coeficientes de Fourier forman una sucesion que tiende a 0 cuando n → ∞.

Como ya hemos visto, la expresion (64) nos da el error cuadratico medio cuando seaproxima la funcion f mediante los N primeros terminos de su serie de Fourier. Este error sehace menor a medida que aumenta el numero N de terminos incluidos. La mejor aproximacionse tiene con infinitos terminos, es decir con la serie de Fourier completa, en cuyo caso el errorcuadratico medio es

E = limN→∞

{minEN} = limN→∞

‖f − ΦN‖2 = ‖f‖2 −∞∑

n=1

c2n . (68)

3.6 Recopilacion

Sea el conjunto de funciones ortonormales {φn(x)}n=1,2,... en Cs(I) y sean los coeficientes yla serie de Fourier de una funcion f :

cn = 〈f, φn〉; f(x) ∼∞∑

n=1

cnφn(x) .

Segun hemos visto, se satisfacen las siguientes propiedades:

1. Se cumple la desigualdad de Bessel

∞∑

n=1

c2n ≤ ‖f‖2 . (69)

2. limn→∞

cn = 0.

3. De entre todas las combinaciones lineales posibles con las funciones {φn(x)}, la seriede Fourier es la mejor representacion en media cuadratica de la funcion, siendo el errorcuadratico medio

E = ‖f −∞∑

n=1

cnφn‖2 = ‖f‖2 −∞∑

n=1

c2n . (70)

Separacion de variables 22

3.7 Base ortonormal

El mejor de los casos ocurre cuando el error cuadratico medio (70) es nulo, ya que entoncespodemos decir que la serie de Fourier tiende en media cuadratica a la funcion f . Estosignifica que, tomando un numero de terminos suficientemente grande, la serie de Fourierpuede aproximar en media a la funcion tanto como se quiera. En tal caso la desigualdad deBessel (69) se convierte en la igualdad

‖f‖2 =∞∑

n=1

c2n , (71)

que se conoce como la identidad de Parseval.

La identidad de Parseval ‖f‖2 = c21 + c2

2 + · · · puede interpretarse como la extensionde la expresion |f| = c2

1 + c22 + c2

3 que da el modulo de un vector f en el espacio euclıdeotridimensional considerado en el Apartado 3.1.

Se dice que un conjunto ortonormal de funciones {φn(x)}n=1,2,... es completo en un espaciode funciones cuando la serie de Fourier de cualquier funcion f de dicho espacio tiende en mediacuadratica a la funcion. Es decir, cuando se cumple la condicion

limN→∞

‖f −N∑

n=1

cnφn(x)‖2 = 0, (72)

o, equivalentemente, se satisface la identidad de Parseval (71) para toda funcion f del espacio.Tambien se dice que el conjunto de funciones {φn(x)}n=1,2,... es una base ortornormal delespacio de funciones.

Claramente, en la practica interesa disponer de funciones que formen una base ortonormal.Aunque la demostracion queda fuera del alcance de estas notas, puede demostrarse que losconjuntos

{

2

p`sin

nπx

`

}

n=1,2,...(73)

{

1

p`,

2

p`cos

nπx

`

}

n=1,2,...(74)

y{

1

p`,

2

p`cos

2nπx

`,

2

p`sin

2nπx

`

}

n=1,2,...(75)

son bases ortornormales del espacio de funciones continuas a trozos en [0, `].

De la identidad de Parseval (71) puede observarse que la unica posibilidad de que todoslos coeficientes de la serie de Fourier de una funcion f se anulen es que sea ‖f‖ = 0, y portanto f = 0. Por tanto, una condicion necesaria para que un conjunto de funciones {φn} seauna base ortonormal es que no exista ninguna funcion con norma no nula que sea ortogonal atodas y cada una de las funciones φn. Cuando esto ocurre se dice que el conjunto de funciones{φn}n=1,2,... es cerrado, ya que no puede ampliarse con ninguna otra funcion ortogonal a todaslas demas.

Separacion de variables 23

Ejemplo: En el caso del conjunto (74), este dejarıa de ser una base ortonormal en [0, `]si la funcion constante φ0(x) = 1/

√` no estuviera incluida en el conjunto. En efecto, en

tal caso cualquier funcion constante serıa entonces ortogonal a todas las funciones φn(x) =√

2/` cos nπx` del conjunto. En tal caso, este conjunto no serıa completo y no servirıa como

base para representar funciones mediante sus series de Fourier.

Consideremos una funcion g con coeficientes de Fourier dn. Entonces, cn − dn son loscoeficientes de Fourier de la funcion diferencia f − g. De la identidad de Parseval se deduceque la unica posibilidad de que sea cn = dn para todo n = 1, 2 . . . es que f(x) = g(x) paratodo x ∈ [0, `]. Este es un resultado importante porque nos dice que los coeficientes de Fourier

identifican completamente la funcion.

De este modo, tenemos una forma de caracterizar una funcion mediante una sucesion denumeros que son unicos y que son “sus componentes” en una base ortornormal de funciones.Tenemos la certeza de que la serie de Fourier es la mejor representacion de la funcion enmedia cuadratica en el dominio [0, `].

En los problemas con ecuaciones en derivadas parciales que hemos resuelto en los aparta-dos anteriores y en los que resolveremos mas adelante, esta sera la forma habitual de carac-terizar las funciones.

4 Problema parabolico mas general

Los tres problemas considerados en los Apartados 2.1, 2.3 y 2.4 son casos particulares de unproblema parabolico mas general donde, como veremos a continuacion, se repite la estructurade la solucion en forma de una serie basada en un conjunto de autofunciones y unos coeficientesque corresponden al desarrollo de la condicion inicial en serie de Fourier.

Consideremos el siguiente problema parabolico:

(a) p(x)ut − [a(x)ux]x + c(x)u = 0, x ∈ [0, `], t > 0;

(b1) U1(u) = 0, t > 0;

(b2) U2(u) = 0, t > 0;

(c) u(x, 0) = f(x), x ∈ [0, `].

(76)

Aquı U1 and U2 representan condiciones de contorno en los extremos. En principio conside-raremos que dichas condiciones tienen la siguiente forma:

U1(u) = a1u(0, t) + a2ux(0, t) = 0, t > 0;

U2(u) = b1u(`, t) + b2ux(`, t) = 0, t > 0.(77)

Las constantes a1, a2 son numeros reales que no son cero simultaneamente y lo mismo ocurrecon las constantes b1, b2. Es decir,

|a1| + |a2| > 0, y |b1| + |b2| > 0 .

Separacion de variables 24

Cuando ninguno de estos coeficientes es cero, las expresiones anteriores definen las condi-

ciones de Robin. Si tenemos a2 = b2 = 0 quedan las condiciones de Dirichlet

U1(u) = u(0, t) = 0 y U2(u) = u(`, t) = 0.

El caso a1 = b1 = 0 corresponde a las condiciones de Neumann

U1(u) = ux(0, t) = 0 y U2(u) = ux(`, t) = 0.

Anulandose uno de los coeficientes en U1 y/o uno de los de U2 quedan unas condiciones mix-

tas, es decir de un tipo en un extremo y de otro tipo en el otro extremo del dominio. Endefinitiva, las expresiones en (77) definen de forma generica un amplio espectro de condi-ciones de contorno de las que aparecen mas habitualmente en la practica: U1 representa unacondicion en el extremo x = 0 y U2 representa otra en el extremo x = `. Las condiciones deesta forma se denominan condiciones de contorno de tipo Sturm Liouville.

Podemos considerar tambien que las condiciones de contorno son periodicas, en cuyo casoU1 y U2 tienen la forma

U1(u) = u(`, t) − u(0, t) = 0, t > 0;

U2(u) = a(`)ux(`, t) − a(0)ux(0, t) = 0, t > 0.(78)

4.1 Separacion de variables

Para cualquiera de las condiciones de contorno definidas en (77) y (78), consideremos lasolucion del problema (76) en la forma u(x, t) = X (x)T (t). Sustituyendo esta en la ecuacion(a) del problema, resulta

pXT ′ − [aX ′]′T + cXT = 0.

Dividiendo por XT (suponiendo que el producto no es nulo) se obtiene

−T ′

T= − [aX ′]′

pX +c

p= λ,

donde λ es una constante. De aquı, como en los casos de los apartados anteriores, se obtienendos ecuaciones en variables separadas de la forma

T ′ + λT = 0; −[aX ′]′ + cX = λpX . (79)

La ecuacion para la funcion X se conoce como la ecuacion diferencial de Sturm-Liouville.

Sustituyendo u = XT en las condiciones de contorno (b1) de (76), se observa que

U1[X (x)T (t)] =[

U1[X (x)]]

T (t) = 0, ∀t > 0,

y lo mismo para las condiciones (b2). De aquı resulta que U1[X (x)] = U2[X (x)] = 0.

Agrupando lo obtenido para la funcion X , tenemos el siguiente problema:

−[a(x)X ′(x)]′ + c(x)X (x) = λ p(x)X (x), x ∈ (0, `);

U1[X (x)] = 0;

U2[X (x)] = 0.

(80)

Separacion de variables 25

Resolver este problema requiere determinar los valores de λ para los cuales existen funcionesX no triviales que satisfagan la ecuacion diferencial y las condiciones de contorno. Los valoresde λ se denominan autovalores y las funciones correspondientes se conocen como autofun-

ciones. Bajo ciertas condiciones sobre las funciones p, a, c, podemos dar algunas propiedadesgenerales sobre los autovalores y las autofunciones. Para ello, vamos a considerar primeroel denominado problema regular de Sturm-Liouville, que corresponde a las condiciones decontorno (77). Posteriormente veremos el problema periodico asociado a las condiciones(78).

4.2 Problema regular de Sturm-Liouville

Consideremos el problema (76) con las condiciones de contorno (77).

Supongamos que p, su derivada p′, a y c, ası como f son funciones continuas en el intervalo[0, `]. Supongamos tambien que a(x) > 0 y p(x) > 0 para todo x ∈ [0, `]. Con estas hipotesis,el problema (76) - (77) se califica como regular y el problema (80) se conoce como problema

regular de Sturm-Liouville.

Puede demostrarse que la solucion de este problema satisface las siguientes propiedades:

1. Todos los autovalores son reales y existe un numero infinito de ellos.

2. Los autovalores forman una sucesion {λn}n=1,2,... con las siguientes caracterısticas:

(a) {λn} es creciente a partir de un valor mınimo:

λ1 < λ2 < · · · < λn < λn+1 < · · · .

(b)∞∑

n=1

1

λ2n

< ∞, y por tanto limn→∞

λn = ∞.

3. Para cada autovalor λn existe una autofuncion Xn que es unica salvo una constantemultiplicativa. Es decir, dada una autofuncion Xn, tambien lo es CnXn, siendo Cn unaconstante cualquiera. La autofuncion Xn tiene n− 1 ceros en el intervalo abierto (0, `).

4. La autofuncion Xn tiene n − 1 ceros en el intervalo (0, `).

5. Las autofunciones asociadas a diferentes autovalores son ortogonales con respecto a lafuncion peso p, es decir

< Xn,Xm >=

∫ `

0

Xn(x)Xm(x)p(x)dx = 0 si n 6= m.

El hecho de poder multiplicarlas por una constante arbitraria otorga un grado de liber-tad en la definicion de las autofunciones. Esta libertad puede usarse para normalizar lasautofunciones, expresandolas todas con norma unidad. En efecto, dada una autofuncionXn, podemos calcular su norma en la forma

‖Xn‖ =√

< Xn,Xm > 6= 0.

Separacion de variables 26

Es inmediato comprobar que la nueva autofuncion

1

‖Xn‖Xn(x)

tiene norma unidad. De esta forma se tiene un conjunto ortonormal de autofunciones.En la practica es habitual trabajar con las autofunciones ortonormales.

6. Las autofunciones {Xn} (las consideramos normalizadas) forman un conjunto completoo base ortonormal en el conjunto de funciones continuas a trozos en el intervalo [0, `].Esto permite representar cualquier funcion f de este conjunto mediante su serie deFourier

f(x) ∼∞∑

n=1

cnXn(x); cn = 〈f,Xn〉 . (81)

en el sentido de la convergencia en media cuadratica visto en los Apartados 3.5, 3.6 y3.7.

Los problemas de autovalores (4) y (19) encontrados respectivamente al resolver los pro-blemas (1) y (18) de la ecuacion del calor en una barra son casos particulares del problemaregular de Sturm-Liouville (76) - (77) en el intervalo [0, `]. En el caso del problema (1), losautovalores y las autofunciones son

λn =k

p

n2π2

`2y Xn(x) =

2

p`sin

nπx

`, n = 1, 2, . . . .

En el caso del problema (18), se tienen

λ0 = 0 ; X0(x) =

1

p`

λn =k

p

n2π2

`2; Xn(x) =

2

p`cos

nπx

`para n = 1, 2, . . .

En este ultimo caso, las sucesiones de autovalores y autofunciones se enumeran a partir delındice 0 por conveniencia.

Podemos ver que en ambos casos se satisfacen las propiedades anteriores. En efecto losautovalores crecen indefinidamente a partir de un valor mınimo y existe una unica autofuncionpara cada uno de los autovalores. Vemos que X0 y las dos funciones de la forma X1 notienen ceros en el intervalo abierto (0, `), mientras que las de la forma X2 tienen un cero y,sucesivamente, las funciones Xn tienen n − 1 ceros en (0, `). Por ultimo, los conjuntos deautofunciones anteriores son bases ortornormales en Cs(I).

4.3 Problema periodico

Sea ahora el problema (76) con las condiciones de contorno periodicas (78). Supongamos lasmismas condiciones de regularidad del problema anterior en el Apartado 4.2. Es decir, que

Separacion de variables 27

las funciones p, p′, a, c y f son continuas en [0, `], siendo a(x) > 0 y p(x) > 0 para todox ∈ [0, `]. Supongamos ademas ahora la condicion p(0) = p(`).

Para este problema periodico se demuestra tambien la existencia de una sucesion realcreciente de autovalores que satisfacen las propiedades 1 y 2 del Apartado 4.2.

La propiedad 3 del problema regular de Sturm-Liouville es ahora diferente, en el sentidode que no esta garantizada la existencia de una unica autofuncion asociada a cada autovalor.En el problema periodico, cada autovalor λn puede tener asociada una o dos autofuncioneslinealmente independientes que son unicas salvo una constante multiplicativa. Si existen dosautofunciones, estas pueden escogerse de forma que sean ortogonales.

La propiedad 4 se satisface de la misma forma: las autofunciones asociadas a λn tienenn − 1 ceros en (0, `).

Como en el caso de las propiedades 5 y 6 del Apartado 4.2, las autofunciones correspon-dientes a autovalores distintos son ortogonales. Asimismo, el conjunto formado por todas lasautofunciones es una base ortonormal en el conjunto de las funciones continuas a trozos enel intervalo [0, `].

El problema de autovalores (27) encontrado al resolver el problema (26) de la ecuaciondel calor en el anillo es un caso particular del formulado en (76) - (78) y puede verse que sesatisfacen las propiedades anteriores. En dicho problema, se han hallado los autovalores

λ0 = 0; λn =k

p

4n2π2

`2para n = 1, 2, . . . . (82)

Para el autovalor λ0 = 0 existe una unica autofuncion

X0(x) =

1

p`, (83)

mientras que, para cada uno de los sucesivos autovalores λn (n = 1, 2, . . .), existen dosautofunciones independientes

Xnc(x) =

2

p`cos

2nπx

`; Xns(x) =

2

p`sin

2nπx

`. (84)

4.4 Solucion en serie

Retomamos aquı el proceso de separacion de variables iniciado en el Apartado 4.1. Supon-gamos que hemos resuelto el problema (80) y que disponemos por tanto de los autovalores yde la base ortonormal de autofunciones. Por simplicidad, notamos con n = 1 el primero delos autovalores λn y consideramos una unica autofuncion Xn para cada autovalor.

Asociada a cada λn, tendremos una funcion temporal Tn(t) que debera ser solucion de laecuacion diferencial

T ′n + λnTn = 0 (85)

encontrada en (79) al separar las variables. Su solucion es

Tn(t) = θn e−λnt, (86)

Separacion de variables 28

donde θn es una constante arbitraria que se toma 1 por simplicidad.

Siguiendo un razonamiento constructivo similar al seguido en el Apartado 2.1 y repetidoen los Apartados 2.3 y 2.4, formamos la serie infinita

u(x, t) =∞∑

n=1

DnXn(x)Tn(t) (87)

como “candidata” a solucion de la ecuacion diferencial (a) y de las condiciones de contorno(b1)-(b2) del problema (76). Para que esta expresion satisfaga tambien la condicion inicial(c) ha de cumplirse

u(x, 0) = f(x) =∞∑

n=1

DnXn(x)Tn(0) =∞∑

n=1

DnXn(x). (88)

Esto significa que la funcion f ha ser igual a su serie de Fourier en las autofunciones Xn

en todo punto del dominio [0, `]. Suponiendo que esto sea cierto, la ortonormalidad de lasautofunciones nos lleva a determinar los coeficientes Dn de forma unica como sigue:

Dn =< f,Xn >=

∫ `

0

f(x)Xn(x)p(x)dx. (89)

Con estos coeficientes, la funcion (87) candidata a solucion del problema (76) queda finalmentedeterminada en la forma

u(x, t) =∞∑

n=1

DnXn(x)e−λnt . (90)

Podemos observar que, fijado un valor de t, u(x, t) es una funcion de la variable x y laserie en (90) es su serie de Fourier en las autofunciones {Xn}, siendo Dne−λnt los coeficientesde Fourier. Como sabemos que las autofunciones son una base ortornormal, estos coeficientesson unicos, segun hemos visto en el Apartado 3.7. De esta observacion podemos concluir que,si la expresion (90) es solucion del problema (76), entonces la solucion es unica.

No obstante queda abierta la cuestion de que la serie (90) sea la solucion en todo eldominio de definicion del problema. Para poder asegurar que efectivamente lo es, deberıamospoder derivar termino a termino la serie, sustituir las derivadas en la ecuacion diferencial(a) de (76) y ver que esta se satisface en todo el dominio. Ademas deberıamos asegurar quela serie de Fourier de la funcion f en (88) coincide con la funcion en todo x ∈ [0, `]. Estascuestiones no son faciles de verificar en un caso general y quedan fuera del objetivo de estecurso.

Para el tipo de problemas vistos en este Capıtulo y los que veremos posteriormente, nosconformaremos con seguir un procedimiento sistematico para la construccion de la serie enla forma dada en (90). Es importante remarcar que todos los elementos de esta serie quedandeterminados de forma unica a partir de los datos del problema. En efecto, las condicionesde contorno determinan un problema de autovalores del que resulta la base ortonormal defunciones Xn(x) y los autovalores λn; y la condicion inicial determina de forma unica loscoeficientes Dn. A la serie obtenida de esta forma podemos llamarla solucion formal del

problema.

Separacion de variables 29

5 Problema parabolico no homogeneo

Hasta aquı hemos considerado problemas homogeneos, tanto en la ecuacion diferencial comoen las condiciones de contorno, y hemos hallado constructivamente soluciones a traves de laseparacion de las variables x y t partiendo de la forma u(x, t) = X (x)T (t).

A modo ilustrativo, revisitemos el caso sencillo del problema (1), pero ahora con laecuacion no homogenea en la forma

ρc ut − k uxx = f(x, t) .

Sustituyendo la expresion X (x)T (t) en esta ecuacion, obtendremos

ρcT ′

T− k

X ′′

X=

f(x, t)

X (x)T (t).

Claramente, ahora no podemos romper esta ecuacion en dos ecuaciones separadas en x y ent como en (3) debido al termino de la derecha de la ecuacion, en el que aparecen las dosvariables acopladas.

Consideremos unas condiciones de contorno no homogeneas, por ejemplo del tipo deDirichlet

u(0, t) = h1(t), u(`, t) = h2(t) ,

y sustituyamos en ellas la expresion u(x, t) = X (x)T (t). El resultado es

X (0)T (t) = h1(t), X (`)T (t) = h2(t), ∀t > 0.

De aquı no podemos despejar unas condiciones de contorno para la funcion X (x) en x = 0 nien x = `.

Lo mismo ocurrirıa si consideraramos cualquiera de los problemas vistos en los apartadosprecedentes. En definitiva, el procedimiento de separacion de variables iniciado proponiendosoluciones de la forma X (x)T (t) puede aplicarse unicamente cuando el problema es comple-tamente homogeneo.

No obstante, la experiencia obtenida con el procedimiento anterior puede aprovecharsepara obtener la solucion de problemas no homogeneos. Consideraremos en primer lugarproblemas donde la ecuacion diferencial es no homogenea pero las condiciones de contorno sonhomogeneas. Posteriormente ampliaremos el problema con la consideracion de condiciones decontorno no homogeneas. Para ello, usaremos como prototipo el problema parabolico generalvisto en el Apartado 4.

5.1 Problema no homogeneo en la ecuacion diferencial

Consideremos el siguiente problema parabolico:

(a) p(x)ut − [a(x)ux]x + c(x)u = F (x, t), x ∈ [0, `], t > 0;

(b1) U1(u) = 0, t > 0;

(b2) U2(u) = 0, t > 0;

(c) u(x, 0) = f(x), x ∈ [0, `].

(91)

Separacion de variables 30

Este problema es el mismo que el planteado en (76) pero con la inclusion de la funcion F (x, t)que representa una fuente. Supondremos que F es continua en [0, `] × [0,∞). Supondremosasimismo las condiciones de regularidad anteriores: p, p′, a, c y f son funciones continuas en[0, `], con a(x) > 0 y p(x) > 0 para todo x ∈ [0, `].

En cuanto a las condiciones de contorno, supondremos que son del tipo general de Sturm-Liouville definidas en (77). No obstante, el mismo procedimiento que veremos a continuacionpuede seguirse para resolver el problema con las condiciones periodicas dadas en (78).

La solucion obtenida para el problema homogeneo tenıa la forma de una serie infinita

u(x, t) =∞∑

n=1

DnXn(x)e−λnt ,

donde Xn era las autofunciones obtenidas en el proceso de separacion de variables y Dn eranlos coeficientes de la serie de Fourier de la condicion inicial f en la base ortonormal formadapor dichas autofunciones.

El proceso que vamos a seguir ahora para obtener la solucion del problema no homogeneo(91) se inspira en la forma de la solucion anterior. Buscaremos tambien una solucion en formade serie, pero donde el papel de las funciones exponenciales sera jugado por otras funcionestemporales a determinar. Este procedimiento se conoce como desarrollo en autofunciones.

5.2 Solucion mediante desarrollo en autofunciones

Supongamos que tenemos resuelto el siguiente problema:

−[a(x)X ′(x)]′ + c(x)X (x) = λ p(x)X (x), x ∈ (0, `),

U1[X (x)] = U2[X (x)] = 0 .(92)

Este es el problema de autovalores que ya obtuvimos para el caso homogeneo. Su solucionnos dara una sucesion de autovalores λn y una sucesion de autofunciones ortonormales Xn

que forman una base ortonormal, es decir que sirve para representar una funcion continuaa trozos en serie de Fourier. Por simplicidad consideraremos que el primer termino de estassucesiones se denota por n = 1.

Buscaremos una solucion del problema no homogeneo (91) en la siguiente forma:

u(x, t) =∞∑

n=1

Tn(t)Xn(x) , (93)

donde Xn(x) son las autofunciones del problema homogeneo obtenidas al resolver (92) y Tn(t)son unas funciones que hay que determinar.

Es directo ver que la expresion (93) cumple las condiciones de contorno (b1)-(b2) de (91).

Observemos que, para cada valor de t fijo, u(x, t) es una funcion de la variable x, demanera que (93) representa la serie de Fourier de u(x, t) en las autofunciones en cada instantede tiempo t. Los coeficientes de Fourier son aquı variables con el tiempo: las funciones Tn(t).Nuestro objetivo ahora es determinar estas funciones.

Separacion de variables 31

Para ello, procederemos por sustitucion directa de (93) en el problema (91). Para sustituir(93) en la ecuacion diferencial, hay que derivar la serie termino a termino. Como ya se hacomentado en otras situaciones similares, la derivacion de una serie de funciones requiere quese cumplan ciertas condiciones. Aquı daremos por hecho que la derivacion de la serie en (93)esta justificada, ya que el proceso de sustitucion directa nos llevara de forma sencilla a lasfunciones Tn que estamos buscando. Por otro lado, existe otro procedimiento mas rigurosopara llegar al mismo resultado, lo que en buena medida valida el proceso sencillo que veremosa continuacion.

Sustituyendo (93) en la ecuacion (a) de (91), se obtiene

p∞∑

n=1

T ′n Xn −

[

a∞∑

n=1

TnX ′n

]′+ c

∞∑

n=1

TnXn = F

y∞∑

n=1

T ′npXn +

∞∑

n=1

Tn[

−(aX ′n)′ + cXn

]

= F .

Notemos que−(aX ′

n)′ + cXn = λnpXn, ∀n = 1, 2, . . .

al ser Xn solucion del problema (92). Por tanto, nos queda

∞∑

n=1

[

T ′n(t) + λnTn(t)

]

Xn(x) =F (x, t)

p(x).

Fijado un instante de tiempo t, la expresion anterior es la serie de Fourier de la funcionF (x, t)/p(x) en las autofunciones Xn(x). Por tanto podemos despejar los coeficientes deFourier en la forma

T ′n(t) + λnTn(t) =

∫ `

0

F (x, t)Xn(x)dx ≡ Fn(t) .

Imponiendo ahora la condicion inicial (c) del problema (91) a la expresion (93), se obtiene

u(x, 0) = f(x) =∞∑

n=1

Tn(0)Xn(x) .

Esta es la serie de Fourier de la funcion f y los valores Tn(0) son los correspondientes coefi-cientes. Por tanto,

Tn(0) =

∫ `

0

f(x)Xn(x)p(x)dx ≡ fn .

En resumen, cada una de las funciones Tn ha de ser solucion del siguiente problema devalores iniciales:

T ′n + λnTn = Fn(t), t > 0

Tn(0) = fn

(94)

donde

Fn(t) =

∫ `

0

F (x, t)Xn(x)dx, fn =

∫ `

0

f(x)Xn(x)p(x)dx . (95)

Separacion de variables 32

La solucion de este problema se escribe en la forma

Tn(t) = e−λnt[

fn +

∫ t

0

eλns Fn(s)ds]

. (96)

Con estas funciones Tn(t) la solucion del problema (91) queda finalmente determinada enla forma

u(x, t) =∞∑

n=1

Tn(t)Xn(x) . (97)

Como caso particular, consideremos que F (x, t) = 0. Entonces, se tiene Fn(t) = 0 paratodo n = 1, 2, . . . y por tanto las funciones Tn se reducen a

Tn(t) = fne−λnt .

Con ellas, la solucion del problema queda en la forma

u(x, t) =∞∑

n=1

fnXn(x)e−λnt .

Observamos que esta solucion coincide con la obtenida en (90) mediante el proceso de se-paracion de variables desarrollado en el Apartado 4. De esta forma, podemos considerar elprocedimiento visto aquı como un metodo mas general aplicable tanto en el caso de que laecuacion sea homogenea como cuando no lo sea.

5.3 Problema completamente no homogeneo

Consideremos el problema (91) del apartado anterior pero ahora con unas condiciones decontorno no homogeneas:

(a) p(x)ut − [a(x)ux]x + c(x)u = F (x, t), x ∈ [0, `], t > 0;

(b1) U1(u) = h1(t), t > 0;

(b2) U2(u) = h2(t), t > 0;

(c) u(x, 0) = f(x), x ∈ [0, `],

(98)

donde, ademas de las condiciones de regularidad ya conocidas, suponemos que h1 y h2 sonfunciones continuas en [0,∞).

Vamos a buscar una solucion de este problema en la forma

u(x, t) = v(x, t) + w(x, t) ,

donde w(x, t) es una funcion que cumple las condiciones de contorno (b1)-(b2) del problema(98). Esto significa que esta funcion satisface las siguientes igualdades:

U1(w(x, t)) = h1(t), U2(w(x, t)) = h2(t) ∀t > 0 . (99)

Separacion de variables 33

Supongamos que disponemos de la funcion w(x, t). Sustituyendo (5.3) en el problema(98), podemos escribir

pvt − [avx]x + cv = −pwt + [awx]x − cw + F

U1(u) = U1(v + w) = U1(v) + U1(w) = h1(t) ⇒ U1(v) = 0

U2(u) = U2(v + w) = U2(v) + U2(w) = h2(t) ⇒ U2(v) = 0

v(x, 0) = −w(x, 0) + f(x) .

Con esto vemos que la funcion v(x, t) ha de ser solucion del siguiente problema:

(a) p(x)vt − [a(x)vx]x + c(x)v = F (x, t), x ∈ [0, `], t > 0;

(b1) U1(v) = 0, t > 0;

(b2) U2(v) = 0, t > 0;

(c) v(x, 0) = f(x), x ∈ [0, `],

(100)

donde las funciones F (x, t) y f(x) son conocidas y tienen la forma

F (x, t) = −p(x)wt(x, t) + [a(x)wx(x, t)]x − c(x)w(x, t) + F (x, t)

f(x) = −w(x, 0) + f(x) .(101)

Este problema se resuelve como se ha visto en el apartado anterior. Una vez obtenida susolucion v(x, t), se escribe la solucion del problema (98) en la forma

u(x, t) = v(x, t) + w(x, t) . (102)

Como hemos dicho anteriormente, un paso previo para llegar a esta solucion es disponerde una funcion w(x, t) que cumpla las condiciones de contorno. Esto es lo que permite pasar alproblema (100) con las condiciones de contorno originales U1 y U2 pero en forma homogenea.

Tal funcion no es unica y cualquiera puede servir para aplicar el proceso de soluciondescrito. A continuacion se dan algunas pautas sobre como elegir w(x, t).

5.4 Homogeneizacion de las condiciones de contorno

Se trata de buscar una funcion w(x, t) tal que

U1(w(x, t)) = h1(t), U2(w(x, t)) = h2(t) . (103)

Podemos seguir un proceso similar al presentado en el Apartado 4.2 de las notas “Problemas

de Contorno Unidimensionales”. La idea ahora es buscar una funcion w(x, t) con forma depolinomio en la variable x pero con unos coeficientes que sean funciones de la variable t. Paraque las expresiones de las funciones F y f en (100) y (101) sean lo mas sencillas posibles,trataremos de elegir dicho polinomio con el menor grado posible.

A continuacion vamos a dar elecciones sencillas de estos polinomios para el caso de lascondiciones de contorno de Sturm-Liouville planteadas en (77) y de las periodicas dadas en(78).

Separacion de variables 34

Condiciones de Dirichlet:

U1(w) = w(0, t) = h1(t) y U2(w) = w(`, t) = h2(t).

w(x, t) =x

`[h2(t) − h1(t)] + h1(t) . (104)

Condiciones de Neumann:

U1(w) = wx(0, t) = h1(t) y U2(w) = wx(`, t) = h2(t).

w(x, t) =x2

2`[h2(t) − h1(t)] + xh1(t) . (105)

Condiciones de Robin:

U1(w) = a1w(0, t) + a2wx(0, t) = h1(t) y U2(w) = b1w(`, t) + b2w(`, t) = h2(t).

w(x, t) =[a1h2(t) − b1h1(t)]x + [b1` + b2]h1(t) − a2h2(t)

a1b1` + a1b2 − b1a2

. (106)

Condiciones periodicas:

U1(w) = w(`, t) − w(0, t) = h1(t) y U2(w) = a(`)wx(`, t) − a(0)wx(0, t) = h2(t).

w(x, t) =x2

2`2(a(0) + a(`)[`h2(t) + 2a(0)h1(t)] +

(x − `)2

2`2(a(0) + a(`))[`h2(t)− 2a(`)h1(t)] . (107)

6 Consideraciones finales

En este capıtulo se ha presentado el metodo de separacion de variables para construir lasolucion de un problema de tipo parabolico. El mismo procedimiento puede seguirse pararesolver otros problemas dentro de las familias de los problemas hiperbolicos y elıpticos. Encualquiera de los casos, se trata de seguir los mismos pasos que hemos visto aquı para elproblema parabolico. Este se ha tomado como prototipo de un problema planteado con unacondicion diferencial en derivadas parciales, una condiciones de contorno y una condicionesiniciales.

Asimismo el procedimiento puede extenderse a problemas con mas de dos variables. Eneste sentido, son casos tıpicos los problemas de la ecuacion del calor en placas y de vibracionesde membranas elasticas, donde se tienen dos variables espaciales (x, y) en un dominio planoy la variable temporal t. Estos problemas y otros similares seran abordados tambien en elcurso. Como se vera, la aplicacion a estos otros problemas del procedimiento visto aquı noaumenta significativamente la dificultad conceptual, aunque sı requiere de un mayor volumende desarrollos y de calculos.