81
Contents 1 Elementi di Analisi Funzionale 1 1.1 Spazi di Banach e Hilbert .............................. 1 1.1.1 Norme e spazi di Banach .......................... 1 1.1.2 Prodotto interno e spazi di Hilbert ..................... 3 1.1.3 Considerazioni cosmiche ........................... 6 1.2 Ortogonalit` a e proiezioni negli spazi di Hilbert .................. 10 1.3 Operatori lineari. Spazio duale ........................... 15 1.3.1 Operatori lineari ............................... 15 1.3.2 Duale ..................................... 17 1.3.3 Teorema di rappresentazione di Riesz ................... 18 1.3.4 Aggiunto di un operatore .......................... 20 1.3.5 Nucleo ed immagine dell’aggiunto ..................... 21 1.4 Problemi variazionali astratti ............................ 23 1.4.1 Forme bilineari ................................ 23 1.4.2 Teorema di Lax-Milgram .......................... 24 1.4.3 Forme bilineari simmetriche ed equazione di Eulero ............ 27 1.4.4 Approssimazione e metodo di Galerkin ................... 28 1.4.5 Una variante del teorema di Lax-Milgram ................. 30 1.5 Compattezza e convergenza debole ......................... 32 1.5.1 Compattezza ................................. 32 1.5.2 Convergenza debole in spazi di Hilbert ................... 34 1.5.3 Dualit` a e compattezza negli spazi di Banach ............... 38 1.5.4 Operatori compatti .............................. 39 1.6 Teorema dell’alternativa di Fredholm ........................ 41 1.6.1 Un esempio preliminare ........................... 42 1.6.2 Il teorema dell’alternativa .......................... 43 1.6.3 Alternativa per problemi variazionali astratti ............... 46 1.7 Spettro di un operatore compatto .......................... 50 1.7.1 Spettro di una matrice ............................ 50 1.7.2 Separazione delle variabili .......................... 50 1.7.3 Risolvente e spettro. Operatori compatti ................. 51 1.7.4 Operatori compatti autoaggiunti ...................... 53 1.7.5 Applicazione ai problemi variazionali astratti ............... 56 2 Teoremi di punto fisso e applicazioni 58 2.1 Teorema delle contrazioni .............................. 58 2.2 Teoremi di Schauder e Leray-Shauder ....................... 60 2.2.1 Il teorema di Schauder ............................ 60 -1

Libro - Analisi Funzionale - Matematica

Embed Size (px)

DESCRIPTION

2 Teoremi di punto fisso e applicazioni 58 2.1 Teorema delle contrazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.2 Teoremi di Schauder e Leray-Shauder . . . . . . . . . . . . . . . . . . . . . . . 60 2.2.1 Il teorema di Schauder . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 -1 0

Citation preview

Page 1: Libro - Analisi Funzionale - Matematica

Contents

1 Elementi di Analisi Funzionale 11.1 Spazi di Banach e Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Norme e spazi di Banach . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Prodotto interno e spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . 31.1.3 Considerazioni cosmiche . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2 Ortogonalita e proiezioni negli spazi di Hilbert . . . . . . . . . . . . . . . . . . 101.3 Operatori lineari. Spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.3.1 Operatori lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.3.2 Duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.3.3 Teorema di rappresentazione di Riesz . . . . . . . . . . . . . . . . . . . 181.3.4 Aggiunto di un operatore . . . . . . . . . . . . . . . . . . . . . . . . . . 201.3.5 Nucleo ed immagine dell’aggiunto . . . . . . . . . . . . . . . . . . . . . 21

1.4 Problemi variazionali astratti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.4.1 Forme bilineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.4.2 Teorema di Lax-Milgram . . . . . . . . . . . . . . . . . . . . . . . . . . 241.4.3 Forme bilineari simmetriche ed equazione di Eulero . . . . . . . . . . . . 271.4.4 Approssimazione e metodo di Galerkin . . . . . . . . . . . . . . . . . . . 281.4.5 Una variante del teorema di Lax-Milgram . . . . . . . . . . . . . . . . . 30

1.5 Compattezza e convergenza debole . . . . . . . . . . . . . . . . . . . . . . . . . 321.5.1 Compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.5.2 Convergenza debole in spazi di Hilbert . . . . . . . . . . . . . . . . . . . 341.5.3 Dualita e compattezza negli spazi di Banach . . . . . . . . . . . . . . . 381.5.4 Operatori compatti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

1.6 Teorema dell’alternativa di Fredholm . . . . . . . . . . . . . . . . . . . . . . . . 411.6.1 Un esempio preliminare . . . . . . . . . . . . . . . . . . . . . . . . . . . 421.6.2 Il teorema dell’alternativa . . . . . . . . . . . . . . . . . . . . . . . . . . 431.6.3 Alternativa per problemi variazionali astratti . . . . . . . . . . . . . . . 46

1.7 Spettro di un operatore compatto . . . . . . . . . . . . . . . . . . . . . . . . . . 501.7.1 Spettro di una matrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501.7.2 Separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . 501.7.3 Risolvente e spettro. Operatori compatti . . . . . . . . . . . . . . . . . 511.7.4 Operatori compatti autoaggiunti . . . . . . . . . . . . . . . . . . . . . . 531.7.5 Applicazione ai problemi variazionali astratti . . . . . . . . . . . . . . . 56

2 Teoremi di punto fisso e applicazioni 582.1 Teorema delle contrazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582.2 Teoremi di Schauder e Leray-Shauder . . . . . . . . . . . . . . . . . . . . . . . 60

2.2.1 Il teorema di Schauder . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

-1

Page 2: Libro - Analisi Funzionale - Matematica

2.2.2 Il teorema di Leray-Schauder. . . . . . . . . . . . . . . . . . . . . . . . . 622.3 Applicazione ad alcune equazioni ellittiche semilineari . . . . . . . . . . . . . . 63

2.3.1 Un caso semplice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632.3.2 Equazioni ellittiche semilineari . . . . . . . . . . . . . . . . . . . . . . . 64

2.4 Il Modello drift-diffusion per dispositivi a semiconduttore . . . . . . . . . . . . 672.4.1 Equazioni di Maxwell. Equazione di Poisson . . . . . . . . . . . . . . . . 682.4.2 Equazioni di continuita. . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.4.3 Relazioni costitutive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712.4.4 Il modello stazionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.4.5 Cambio di variabili e adimensionalizzazione . . . . . . . . . . . . . . . . 742.4.6 Un teorema di esistenza . . . . . . . . . . . . . . . . . . . . . . . . . . . 752.4.7 Analisi della mappa di Gummel. . . . . . . . . . . . . . . . . . . . . . . 78

0

Page 3: Libro - Analisi Funzionale - Matematica

Chapter 1

Elementi di Analisi Funzionale

1.1 Spazi di Banach e Hilbert

In questo capitolo sviluppiamo gli elementi della teoria degli spazi di Banach e Hilbert, che ciserviranno per la formulazione e la soluzione di un gran numero di problemi al contorno peroperatori differenziali.

1.1.1 Norme e spazi di Banach

Richiamiamo brevemente la nozione di spazio normato. Sia X uno spazio vettoriale sul camporeale o complesso. Una norma in X e un’applicazione

‖·‖ : X → R

tale che, per ogni scalare λ e ogni x,y ∈ X, valgano le seguenti proprieta:

1. ‖x‖ ≥ 0; ‖x‖ = 0 se e solo se x = 0 (annullamento)

2. ‖λx‖ = |λ| ‖x‖ (omogeneita)

3. ‖x+ y‖ ≤ ‖x‖+ ‖y‖ (disuguaglianza triangolare).

Uno spazio normato e anche metrico, con la distanza indotta dalla norma:

d (x, y) = ‖x− y‖ .

Una successione xn di elementi di X si dice fondamentale o di Cauchy se

d (xm, xn) = ‖xm − xn‖ → 0 per m,n→∞

mentre si dice convergente a x ∈ X se

d (xn, x) = ‖xn − x‖ → 0 per n→∞

Come in ogni spazio metrico

xn convergente implica xn fondamentale. (1.1)

Cio segue subito dalla disuguaglianza triangolare per la distanza:

d (xm, xn) ≤ d (xm, x) + d (xn, x) .

1

Page 4: Libro - Analisi Funzionale - Matematica

Se ora, xn e convergente, i due addendi a destra tendono a 0 e quindi anche d (xm, xn) → 0,per cui xn e fondamentale. Per convincersi che l’implicazione opposta non e sempre vera,basta pensare allo spazio metrico Q, dei numeri razionali, con la solita distanza d(x, y) =|x− y|, ed alla successione

xn =(

1 +1n

)nche e fondamentale ma non convergente in Q (converge al numero e /∈ Q).

Se nella (1.1) vale l’implicazione opposta, lo spazio metrico si dice completo.Definizione 1.1. Uno spazio normato completo prende il nome di spazio di Banach.La definizione di limite per funzioni operanti tra spazi metrici o normati si riconduce a

limiti per funzioni reali (le distanze). Siano X, Y spazi normati, con norme rispettive ‖·‖X e‖·‖Y , e sia F una funzione da X a Y . F si dice continua in x ∈ X quando

‖F (y)− F (x)‖Y → 0 se ‖y − x‖X → 0

o, equivalentemente, quando, per ogni successione xn ⊂ X,

‖xn − x‖X → 0 implica ‖F (xn)− F (x)‖Y → 0

F si dice continua in X quando e continua in ogni x ∈ X .

• Ogni norma in uno spazio X e continua in X.

Dimostrazione. Sia ‖·‖ una norma in X. Dalla disuguaglianza triangolare, si ha

‖y‖ ≤ ‖y − x‖+ ‖x‖ e ‖x‖ ≤ ‖y − x‖+ ‖y‖

da cui|‖y‖ − ‖x‖| ≤ ‖y − x‖

Percio se ‖y − x‖ → 0, anche |‖y‖ − ‖x‖| → 0, che esprime la continuita della norma.

Esempi.

1.1. Sia A un sottoinsieme compatto di Rn. Il simbolo C0 (A) indica lo spazio vettorialedelle funzioni continue (reali o complesse) in A. Questo spazio e di Banach con la norma

‖f‖C0(A) = maxA|f |

Si noti che altre norme sono possibili. Per esempio,

‖f‖2 = (∫A

|f |2)1/2

e una possibile norma (integrale di ordine 2), rispetto alla quale, pero, lo spazio non e completo.Sia, per esempio, A = [−1, 1] ⊂ R. La successione

fn(t) =

0 t ≤ 0nt 0 < t ≤ 1

n1 t > 1

n

n ≥ 1

e contenuta in C0 ([−1, 1]), e di Cauchy rispetto alla norma integrale di ordine 2, ma convergein tale norma alla funzione di Heaviside

H(t) =

1 t ≥ 00 t < 0

2

Page 5: Libro - Analisi Funzionale - Matematica

discontinua in t = 0. Naturalmente, la successione fn non e di Cauchy rispetto alla norma‖f‖C0(A).

1.2. Piu in generale, consideriamo lo spazio Ck (A), k ≥ 0 intero, costituito dalle funzionidifferenziabili con continuita in A fino all’ordine k.

Per indicare una generica derivata di ordine m, e comodo introdurre l’n − upla di interinon negativi (o multiindice) α = (α1, ..., αn), di lunghezza |α| = α1 + ...+ αn = m, e porre

Dα =∂α1

∂xα11

...∂αn

∂xαn1

Naturalmente, ricorreremo a questo simbolo solo in caso di stretta necessita!Introduciamo in Ck (A) la norma (norma lagrangiana di ordine k)

‖f‖Ck(A) = ‖f‖C0(A) +k∑

|α|=1

‖Dαf‖C0(A)

Lo spazio che risulta e di Banach. Cio segue dai teoremi di derivazione delle successioni difunzioni uniformemente convergenti.

1.3. Sia Ω un insieme aperto in Rn e p un numero reale p ≥ 1. Indichiamo col simboloLp (Ω) l’insieme delle funzioni p− sommabili in Ω secondo Lebesgue, ritenendo due funzioniidentiche quando differiscono su un insieme di misura (di Lebesgue) nulla1. Lp (Ω) e unospazio di Banach con la norma integrale di ordine p :

‖f‖Lp(Ω) =(∫

Ω

|f |p)1/p

.

1.4. Sia Ω un insieme aperto in RN . Indichiamo col simbolo L∞ (Ω) l’insieme dellefunzioni quasi ovunque limitate in Ω, ritenendo due funzioni identiche quando differiscono suun insieme di misura (di Lebesgue) nulla. L∞ (Ω) e uno spazio di Banach con la norma:

‖f‖L∞(Ω) = supΩ|f | .

1.1.2 Prodotto interno e spazi di Hilbert

Veniamo ora agli spazi di Hilbert. Sia X uno spazio vettoriale sul campo reale. Si dice che Xe uno spazio pre-Hilbertiano oppure uno spazio dotato di prodotto interno se e definita unafunzione

< ·, · >: X ×X → R

detta prodotto interno o scalare, tale che, per ogni x, y, z ∈ X e ogni λ, µ ∈ R si abbia

1. < x, x >≥ 0 e < x, x >= 0 se e solo se x = 0. (annullamento)

2. < x, y >= < y, x > (simmetria)

3. < µx+ λy, z >= µ < x, z > +λ < y, z > (bilinearita).

1Precisamente, si passa al quoziente nell’insieme delle funzioni p − sommabili rispetto alla relazione diequivalenza di uguaglianza quasi ovunque. Si ottiene un nuovo spazio che si indica con Lp (Ω) , i cui elementisono classi di equivalenza. Ad ogni classe appartengono tutte le funzioni p− sommabili che differiscono a duea due per un insieme di misura nulla.

3

Page 6: Libro - Analisi Funzionale - Matematica

La 3. indica che il prodotto interno e lineare rispetto al primo argomento. Dalla 2 sideduce che esso e lineare anche rispetto al secondo. Si dice allora che < ·, · > e una formabilineare da X ×X in R.

Nota 1.1. Se il campo di scalari e quello dei numeri complessi C, allora si ha

< ·, · >: X ×X → C

e la proprieta di simmetria 2 e sostituita dalla seguente:2bis < x, y >= < y, x >

dove la barra sta per coniugato. La proprieta di linearita rispetto al secondo argomento simodifica di conseguenza nel modo seguente:

< z, µx+ λy >= µ < z, x > +λ < z, y >

Si dice allora che < ·, · > e antilineare rispetto al secondo argomento e che e una formasesquilineare da X ×X in C.

Un prodotto interno induce nello spazio una norma tramite la formula

‖x‖ =√< x, x >

ben definita grazie alla proprieta 1 del prodotto scalare. Pertanto uno spazio pre-Hilbertianoe anche normato. Valgono le seguenti importanti proprieta.

• Disuguaglianza di Schwarz

|< x, y >| ≤ ‖x‖ ‖y‖ .

con uguaglianza se e solo se x e y sono linearmente dipendenti.

• Legge del parallelogramma

‖x+ y‖2 + ‖x− y‖2 = 2 ‖x‖2 + 2 ‖y‖2 .

Se si interpreta ‖x ‖ come la lunghezza del vettore x, la legge del parallelogramma affermache la somma dei quadrati della lunghezza delle diagonali di un parallelogramma uguaglia lasomma dei quadrati della lunghezza dei suoi lati.

La dimostrazione di queste proprieta ricalca quella valida in spazi vettoriali a dimensionefinita. Ricordiamo brevemente come si mostra la disuguaglianza di Schwarz.

Per ogni t ∈ R ed ogni x, y ∈ X, si ha, utilizzando le proprieta del prodotto interno,

0 ≤< tx+ y, tx+ y >= t2 ‖x‖2 + 2t < x, y > + ‖y‖2 ≡ P (t) .

Cio significa che il trinomio in P (t) e sempre non negativo e pertanto deve avere discriminantenon positivo, ossia

(< x, y >)2 − ‖x‖2 ‖y‖2 ≤ 0

che equivale alla disuguaglianza di Schwarz. L’uguaglianza si ha solo se tx+ y = 0 ossia se xe y sono dipendenti.

• Sia X pre-Hilbertiano. Allora, per ogni y ∈ X, fissato, la funzione

x 7−→< x, y >

4

Page 7: Libro - Analisi Funzionale - Matematica

e continua in X.

Dimostrazione. Dalla linearita e dalla disuguaglianza di Schwarz:

|< z, y > − < x, y >| = |< z − x, y >| ≤ ‖z − x‖ ‖y‖

e quindi, se ‖z − x‖ → 0, anche il primo membro tende a zero, da cui la continuita richiesta.

Definizione 1.2. Si chiama spazio di Hilbert uno spazio dotato di prodotto interno,completo rispetto alla norma indotta.

Esempi1.5. RN e uno spazio di Hilbert rispetto al prodotto scalare usuale

< x,y >=N∑i=1

xiyi x = (x1, ..., xN ) ,y =(y1, ..., yN )

Piu in generale, se A =(aij)i.j=1,...,N e una matrice quadrata di ordine N , simmetrica edefinita positiva, l’espressione

< x,y >A =N∑i=1

aijxiyj (1.2)

definisce un prodotto scalare in RN . Anzi, si puo mostrare che ogni prodotto scalare in RN

si puo scrivere nella forma (1.2), con un’opportuna matrice A.CN e uno spazio di Hilbert rispetto al prodotto scalare

< x,y >=N∑i=1

xiyi x = (x1, ..., xN ) ,y =(y1, ..., yN )

1.6. Sia l2 l’insieme delle successioni xn a valori in R, tali che

∞∑i=1

x2n <∞

Munito del prodotto scalare

< x,y > =∞∑i=1

xiyj x = xn ,y = yn

l2 e uno spazio di Hilbert.1.7. In riferimento all’esempio c., lo spazio L2(Ω) e uno spazio di Hilbert rispetto al

prodotto scalare

< u, v >=∫

Ω

uv

C0 (A) e spazio pre-Hilbertiano rispetto allo stesso prodotto interno, ma, come abbiamo giadimostrato, non e completo

1.8. Vediamo ora un esempio un po piu elaborato che ci tornera utile in seguito. Consid-eriamo il quadrato Q = [0, 2π] × [0, 2π] ⊂ R2 Ogni u ∈ L2 (Q) puo essere sviluppata in seriedi Fourier doppia (convergente in norma L2):

u(x1, x2) =∑m,n

um,nei(mx1+nx2) m,n interi relativi

5

Page 8: Libro - Analisi Funzionale - Matematica

doveum,n =

1(2π)2

∫Q

u (x1, x2) e−i(mx1+nx2)dx1dx2

sono i coefficienti di Fourier di u. Dall’uguaglianza di Parseval, si puo scrivere

‖u‖L2(Q) = (2π)2∑m,n

|um,n|2

e< u, v >=

∫Q

uv =∑m,n

um,nv−m,−n

Ricordiamo ora che se u e derivabile, i coefficienti di Fourier delle derivate parziali prime eseconde di u sono dati dalle formule

∂x1um,n = imum,n ∂x2um,n = inum,n

∂x1x1um,n = −m2um,n ∂x1x2um,n = −mnum,n ∂x2x2um,n = −n2um,n

Possiamo allora definire in termini di coefficienti di Fourier il sottospazio di L2 (Q) dellefunzioni ”dotate di derivate fino al secondo ordine ”, che indichiamo con H2 (Q), introducendola norma

‖u‖2H2 = (2π)2∑m,n

(m4 + 2m2n2 + n4 +m2 + n2 + 1

)|um,n|2

e ponendoH2 (Q) =

u ∈ L2 (Q) : ‖u‖2H2 <∞

H2 (Q) risulta uno spazio di Hilbert rispetto al prodotto interno

< u, v >2=∑m,n

(m4 + 2m2n2 + n4 +m2 + n2 + 1

)um,nv−m,−n

Ritroveremo questo spazio nel capitolo Spazi di Sobolev.

Problema 1.1. Dimostrare che l2 e uno spazio di Hilbert.

1.1.3 Considerazioni cosmiche

Concediamoci una pausa di riflessione sulle strutture matematiche che il lettore ha avutomodo di incontrare nel proprio corso di studi. Ci limiteremo alle strutture principali ma, inrealta, il panorama e molto piu ricco e complicato. Lo scopo non e, tuttavia, di raggiungerela maggior completezza possibile, bensı di arrivare ad una presa di coscienza di un quadroorganico generale.

Esaminiamo la specie di ”albero genealogico” sottostante, dove, dopo una prima divisionetra strutture di tipo A (”algebriche”), G (”geometriche”), O (”ordinate”), il tutto confluiscein un unico ramo finale, delle strutture complesse. Naturalmente, la ramificazione iniziale epuramente indicativa e riflette il personale punto di vista dello scrivente.

•Tipo A • • Tipo G • • •Tipo Ogruppicampi spazi topologicispazi vettoriali spazi metrici spazi ordinati

6

Page 9: Libro - Analisi Funzionale - Matematica

F Strutture complessecampi ordinatispazi normatispazi dotati di prodotto interno

Nell’interpretazione del quadro adottiamo il seguente punto di vista: ogni struttura e, ingenerale, costituita da un insieme sottostante (a volte piu di uno) ed e dotata di un certonumero di operazioni, caratteristiche della struttura stessa, che permettono di agire suglielementi dell’insieme sottostante. Dal punto di vista delle applicazioni, piu o meno concrete,ogni struttura permette di risolvere problemi connessi con la natura delle operazioni in essapresenti.

Cominciamo dalle strutture di tipo A. Le operazioni previste in queste strutture sonotipiche operazioni di tipo algebrico, tant’e vero che portano i nomi di somma, prodotto ecc.

• Gruppi. Un gruppo e costituito da una coppia (G, ∗) dove G e un insieme e ∗ indicaun’operazione interna binaria, cioe

∗ : G×G→ G

che ha le proprieta:– associativa: per ogni terna g1, g2, g3 di elementi di G

g1 ∗ (g2 ∗ g3) = (g1 ∗ g2) ∗ g3

– esistenza di un elemento neutro e: per ogni elemento g ∈ G

g ∗ e = e ∗ g = g

– esistenza di un unico inverso per ciascun elemento: per ogni elemento g ∈ G, esiste ununico h ∈ G, detto l’inverso di g tale che

g ∗ h = h ∗ g = e

Se vale anche la proprieta commutativa il gruppo si dice abeliano o commutativo.Un esempio di gruppo e la coppia (Z,+), cioe l’insieme dei numeri relativi e un gruppo

abeliano rispetto alla somma. Non e invece un gruppo la coppia (Z, ·), cioe l’insieme dei numerirelativi rispetto al prodotto (perche?).

Altri esempi importanti si trovano in connessione con lo studio della geometria, o megliodelle geometrie. Consideriamo coppia (T, ) dove T indica l’insieme delle roto-traslazioni nelpiano e l’operazione di composizione.

Studiare la geometria euclidea significa studiare cio che le trasformazioni del gruppo las-ciano invariato. Da qui il concetto di congruenza tra figure piane, secondo la quale si possonoidentificare due figure se sovrapponibili mediante una rototraslazione. Ma in geometria eu-clidea ha senso parlare anche di distanza tra due punti, di area, di parallelismo poiche sonoinvarianti rispetto alle trasformazioni del gruppo.

Se cambiamo il gruppo di trasformazioni, cambia la geometria. Se il gruppo di trasfor-mazioni e quello delle similitudini, stiamo studiando un’altra geometria, nella quale due figuresono identificate se sono simili; di conseguenza non ha piu significato, per esempio, l’area diuna figura piana poiche due figure simili hanno in generale aree diverse.

Se il gruppo e quello delle deformazioni continue, stiamo studiando la topologia del piano,nella quale non ha senso parlare di distanze tra punti, area, parallelismo e cosı via. I concettipropri della topologia sono quelli di aperto, chiuso, intorno, connessione ecc. che non vengonoalterati da una deformazione continua.

7

Page 10: Libro - Analisi Funzionale - Matematica

Si vede quindi come la nozione di gruppo sia estremamente feconda.• Campi. La struttura di campo e costituita da una terna (K, ∗, ) dove K indica un

insieme e ∗, due operazioni binarie interne, di solito denominate somma e prodotto, con leproprieta seguenti:

– (K, ∗) e un gruppo abeliano– (K\e, ), cioe K senza l’elemento neutro rispetto alla somma e, e un gruppo abelianoLe due strutture precedenti sono poi legate dalla proprieta distributiva

a (b ∗ c) = (a b) ∗ (a c)

Tra i campi, le star sono certamente (R,+, ·) e (C+, ·). La ragione e che questi, e special-mente C, sono gli ambienti ideali per risolvere equazioni. Sono le proprieta delle operazioniin un campo che permettono di operare tra i membri di un’equazione con i modi ben noti.

• Spazi vettoriali. Un insieme V e uno spazio vettoriale V sul campo di scalari K se:– V e un gruppo abeliano rispetto ad un’operazione binaria interna che viene chiamata

somma. I suoi elementi vengono chiamati vettori.– E’ definita un’altra operazione (prodotto scalare-vettore)

· : K × V → V

legata alla somma da opportune proprieta distributive.I concetti chiave in uno spazio vettoriale sono quelli di combinazione lineare e di dipen-

denza/indipendenza tra vettori, di dimensione, con ovvie applicazioni alla fisica, all’economia,ecc. Tipici spazi vettoriali a dimensione finita su R e C, rispettivamente, sono gli spazi Rn

e Cn. Lo spazio dei polinomi in una variabile a coefficienti reali (complessi), rispetto allecomuni somma tra polinomi e prodotto tra un numero e un polinomio, e un semplice esempiodi spazio vettoriale a dimensione infinita.

Veniamo ora alle strutture di tipo G. In queste, le operazioni sono di natura completamentediversa dalle precedenti. Quella tipica e l’operazione di limite.

•• Struttura topologica. Ne abbiamo gia parlato fugacemente a proposito dei gruppi.Dal nostro punto di vista, l’importanza di tale struttura e dovuta al fatto che permettel’introduzione dell’operazione di limite. Piu precisamente, uno spazio topologico e costituitoda un insieme E, all’interno del quale si e introdotta una particolare famiglia di sottoinsiemi,ai quali si conferisce lo status di aperti. La famiglia di aperti deve essere scelta in modo cheun’unione qualunque di suoi elementi e l’intersezione di un numero finito di suoi elementisia ancora un aperto. A questa famiglia appartengono di diritto E e l’insieme vuoto.

Avendo a disposizione gli insiemi aperti, un intorno di un punto x ∈ E, si definisce comeun aperto che contiene il punto.

Supponiamo ora di considerare una funzione F da uno spazio topologico X in un altrospazio topologico Y . Le nozioni di intorno in X e Y sono quelle che permettono di daresignificato alla scrittura

limx→x0

F (x) = y0 :

per ogni intorno di y0, esiste un intorno di x0 ..... Dunque, ogni volta che si introduce unastruttura topologica nel dominio e nel codominio di una funzione, possiamo parlare di limite.

Piu proprieta hanno gli intorni e piu efficace sara l’operazione di limite. Per esempio unaproprieta estremamente utile e l’unicita del limite. Bene, si avra unicita se si scelgono gliaperti nel codominio in modo che due punti distinti posseggano intorni disgiunti (proprieta diseparazione di Hausdorff ).

8

Page 11: Libro - Analisi Funzionale - Matematica

•• Spazi metrici. La seconda struttura di tipo G e quella di spazio metrico, costituita dauna coppia (M,d) dove M e un insieme e d una funzione distanza

d : M ×M → R+

con le seguenti proprieta: per ogni x, y, z ∈M ,– d(x, y) = 0 se e solo se x = y (annullamento)– d(x, y) = d(y, x) (simmetria)– d(x, y) ≤ d(x, z) + d(z, y) (disuguaglianza triangolare)Mediante d, l’intorno circolare di raggio r di un punto x ∈M e definito da

Br (x) = y ∈M : d(y, x) < r

Gli insiemi aperti sono allora gli insiemi che contengono un intorno circolare di ogni loro punto.Si ottiene cosı una topologia che ha la proprieta di separazione di Hausdorff. Di conseguenzal’operazione di limite per funzioni tra spazi metrici gode dell’unicita.

Anche se abbiamo introdotto le successioni fondamentali nell’ambito degli spazi normati,in realta questo concetto e tipico degli spazi metrici e permette di dividerli in completi e non.In quelli completi, la condizione di Cauchy equivale all’esistenza del limite, ma, poiche non faintervenire direttamente quest’ultimo, si rivela estremamente utile, per esempio, nello studio disuccessioni definite ricorsivamente (o sistemi dinamici discreti) per le quali non sono disponibiliformule chiuse. Queste ultime intervengono in modo naturale per risolvere equazioni di puntofisso, alle quali si riconduce un gran numero di problemi di varia natura, sia teorici sia dallescienze applicate. Il risultato principale e il celebrato teorema delle contrazioni, di Banach-Caccioppoli, uno dei cardini dell’analisi non-lineare, che incontreremo piu avanti e che trovaappunto negli spazi metrici l’ambiente naturale.

Abbiamo inserito una sola tra le strutture di tipo O, la principale. Qui il termine ”oper-azione” va inteso nel senso di relazione tra gli elementi.

• • • Spazi ordinati. Uno spazio ordinato e costituito da una coppia (X,) dove X e uninsieme e e una relazione binaria, detta relazione d’ordine, che permette di confrontaredue elementi2 dell’insieme sottostante e decidere quale dei due e il ”maggiore” o il ”minore”.Questa relazione antisimmetrica e transitiva, per funzionare bene, deve essere, per ogni x, y, z ∈X,

– riflessiva: x x– antisimmetrica x y e y x implica x = y– transitiva: x y e y z implica x z.Abbiamo messo maggiore e minore tra virgolette perche il loro significato non e neces-

sariamente quello usato comunemente nei campi numerici. Per esempio, un ordinamentonell’insieme delle parole della lingua italiana e quello lessicografico o ordine alfabetico. Sec-ondo questo ordinamento, ”maggiore” ha il significato di ”precede” (nell’elenco).

I concetti principali in uno spazio ordinato sono quelli di massimo, minimo, estremo supe-riore ed inferiore che entrano in modo naturale in problemi di ottimizzazione.

Veniamo ora alle strutture che abbiamo catalogato come ”complesse”. Quelle viste finorasi possono considerare come ”monocromatiche”, nel senso che nell’insieme sottostante si puousare solo un tipo di struttura. Il senso dell’aggettivo ”complesso” sta dunque a significare chenell’insieme sottostante sono presenti piu strutture che possono essere usate simultaneamente.

2La relazione d’ordine puo essere totale o parziale. E’ totale quando due elementi qualunque sono con-frontabili tra loro. E’ parziale quando esistono coppie di elementi non confrontabili. Un esempio di relazioned’ordine parziale e quella di ⊂ tra i sottoinsiemi di un dato insieme.

9

Page 12: Libro - Analisi Funzionale - Matematica

Cio conferisce una maggiore ricchezza alla struttura stessa e, in linea di principio, la possibilitadi risolvere un maggior numero di problemi. Uno dei punti chiave e capire come possano essereconnesse due o piu strutture per poter operare contemporaneamente.

F Campi ordinati. Un campo ordinato e una terna (K, ∗, ,) dove le strutture di campoe d’ordine operano insieme. Il legame e assicurato da opportune condizioni di compatibilita.Nel tipico campo ordinato (R,+, ·,≤) per esempio, queste condizioni sono le ben note

a ≤ b⇐⇒ a+ c ≤ b+ c

a ≤ b⇐⇒ c > 0 e ac ≤ bc

che, come si vede, legano l’ordinamento (≤) con le operazioni di campo (+, ·).La popolarita dei campi ordinati e dovuta alla possibilita di risolvere disequazioni. Si noti

che non sempre e possibile legare le due strutture di campo e d’ordine. Per esempio, nessunastruttura d’ordine e compatibile con quella di campo nell’insieme dei numeri complessi. Ciosignifica che in questo ambiente e impossibile risolvere disequazioni con le solite regole.

F Abbiamo richiamato gli spazi normati. In questo ambiente sono presenti la strutturadi spazio vettoriale e quella di spazio metrico (e quindi anche topologico). Che cosa vuol direche le due strutture sono compatibili e possono operare insieme? Vuol dire che le operazionitipiche, di combinazione lineare per una, di limite per l’altra, devono essere compatibili e ciosi esprime attraverso la continuita della somma e del prodotto per uno scalare. L’introduzionedi una norma e un modo (ma non e l’unico) che l’assicura: per esempio, in uno spazio normatoX, siano xn → x, yn → y. Vogliamo far vedere che (continuita della somma)

xn + yn → x+ y

Dalla disuguaglianza triangolare,

‖(xn + yn)− (x+ y)‖ ≤ ‖xn − x‖+ ‖yn − y‖

da cui, immediatamente, ‖(xn + yn)− (x+ y)‖ → 0.Gli spazi normati costituiscono una struttura abbastanza ricca, un po’ piu comoda degli

spazi metrici, nella quale inquadrare e risolvere problemi di varia natura. Naturalmente lemaggiori difficolta derivano, in generale, dal fatto che lo spazio vettoriale sottostante e didimensione infinita. Sarebbe molto utile, in uno spazio vettoriale, parlare di proiezioni, or-togonalita ecc, ma qui non si puo.

F Gli spazi di Hilbert sono l’ambiente ideale per risolvere problemi in dimensione infinita.Unificano, attraverso il prodotto interno e la norma indotta, le strutture di spazio vettorialee metrico in un modo molto piu efficiente di quanto non faccia una norma generica. Sipuo parlare di ortogonalita e di proiezioni, di un teorema di Pitagora infinito dimensionale(un’istanza ne e l’uguaglianza di Parseval o Bessel per le serie di Fourier) e di altre operazioniche rendono la struttura estrememente ricca e comoda da usare.

Questo e l’ambiente piu favorevole alla formulazione variazionale per molti problemi alcontorno per equazioni a derivate parziali.

1.2 Ortogonalita e proiezioni negli spazi di Hilbert

In analogia a quanto accade negli spazi vettoriali a dimensione finita, due elementi x, y di unospazio dotato di prodotto interno < ·, · > si dicono ortogonali se < x, y >= 0 e si scrive x⊥y.

Ora, se si considera un sottospazio V di RN , per esempio un iperpiano passante perl’origine, ogni elemento x ∈ RN ha una proiezione ortogonale su V . Infatti, se dimV = k

10

Page 13: Libro - Analisi Funzionale - Matematica

e i versori v1, v2, ..., vk costituiscono una base ortonormale per V , si puo trovare una baseortonormale per RN data da

v1, v2, ..., vk, wk+1, ..., wN

dove wk+1, ..., wN sono opportuni versori.Dunque, se

x =k∑j=1

xjvj +N∑

j=k+1

xjwj

la proiezione di x su V e data da

PV x =k∑j=1

xjvj

Cio che caratterizza PV x, e che evita il ricorso ad una base dello spazio3, e di essere l’elementodi V a minima distanza da x, nel senso che:

‖PV x− x‖ = infy∈V

‖y − x‖ (1.3)

Infatti, se y =∑kj=1 yjvj , si ha

‖y − x‖2 =k∑j=1

(yj − xj)2 +N∑

j=k+1

x2j ≥

N∑j=k+1

x2j = ‖PV x− x‖2

In questo caso, si vede che l’estremo inferiore in (1.3) e in realta un minimo.Si noti che l’unicita di PV x segue dal fatto che se y∗ ∈ V e

‖y∗ − x‖ = ‖PV x− x‖

necessariamente deve essere∑kj=1(y

∗j − xj)2 = 0 da cui y∗j = xj per j = 1, ..., k e quindi

y∗ = PV x. Poiche(x− PV x)⊥v ∀v ∈ V

si vede che ogni x ∈ RN puo essere scritto in modo unico nella forma

x = y + z

con y ∈ V e z ∈ V ⊥, dove V ⊥ indica il sottospazio dei vettori ortogonali a V . Si dice che RN

e somma diretta dei sottospazi V e V ⊥ e si scrive

RN = V ⊕ V ⊥

Inoltre‖x‖2 = ‖y‖2 + ‖z‖2

che generalizza il teorema di Pitagora.Tutto quanto si puo estendere agli spazi di Hilbert a dimensione non finita, pur di consid-

erare sottospazi chiusi (nella topologia indotta dal prodotto scalare). Si noti che i sottospazidimensione k, finita, sono automaticamente chiusi, essendo isomorfi a Rk (o Ck). Salvo avvisocontrario considereremo spazi di Hilbert sul campo reale. Iniziamo con il seguente importante

3... che in dimensione infinita potrebbe diventare non agevole.

11

Page 14: Libro - Analisi Funzionale - Matematica

Teorema 2.1. (di proiezione) Sia V un sottospazio chiuso di uno spazio di Hilbert H.Allora, per ogni x ∈ H, esiste un unico elemento PV x ∈ V tale che

‖PV x− x‖ = infy∈V

‖y − x‖

Valgono inoltre le seguenti proprieta:

1. PV x = x se e solo se x ∈ V

2. Posto QV x = x− PV x, si ha QV x ∈ V ⊥ e

‖x‖2 = ‖PV x‖2 + ‖QV x‖2

Gli elementi PV x, QV x si chiamano proiezioni ortogonali, su V e V ⊥, rispettivamente.L’estremo inferiore in 1. e in realta un minimo; inoltre, le 1,2 equivalgono all’affermazioneche H e somma diretta di V e V ⊥ :

H = V ⊕ V ⊥

Dalla 1, si ricava poi che

V ⊥ = ∅ se e solo se V = H

Dimostrazione. Siad = inf

v∈V‖v − x‖

Dalla definizione di estremo inferiore, per ogni intero n ≥ 1 esiste vn ∈ V tale che

d ≤ ‖vn − x‖ < d+1n

e quindi ‖vn − x‖ → d, se n→∞.Facciamo vedere che la successione vn e di Cauchy. Infatti, utilizzando la legge del

parallelogramma per i vettori vn − x e vm − x si ha

‖vn + vm − 2x‖2 + ‖vn − vm‖2 = 2 ‖vn − x‖2 + 2 ‖vm − x‖2 (1.4)

Poiche vn+vm

2 ∈ V ,

‖vn + vm − 2x‖2 = 4∥∥∥∥vn + vm

2− x

∥∥∥∥2

≥ 4d2

e quindi, dalla (1.4)

‖vn − vm‖2 = 2 ‖vn − x‖2 + 2 ‖vm − x‖2 − ‖vn + vm − 2x‖2

≤ 2 ‖vn − x‖2 + 2 ‖vm − x‖2 − 4d2

Passando al limite per m,n→∞, il secondo membro tende a zero e quindi anche

‖vn − vm‖ → 0

e pertanto vn e di Cauchy. Essendo H completo, si ha vn → v ed essendo V chiuso, sideduce che v ∈ V e ‖v − x‖ = d, in base alla continuita della norma.

12

Page 15: Libro - Analisi Funzionale - Matematica

Proviamo ora che l’elemento v di V tale che ‖v − x‖ = d e unico. Se infatti ci fosse unaltro elemento w ∈ V tale che ‖w − x‖ = d, usando ancora la legge del parallelogramma, siavrebbe

‖w − v‖2 = 2 ‖w − x‖2 + 2 ‖v − x‖2 − 4∥∥∥∥w + v

2− x

∥∥∥∥2

≤ 2d2 + 2d2 − 4d2 = 0

da cui w = v. Abbiamo cosı dimostrato che esiste un unico elemento v = PV x ∈ V tale che

‖x− PV x‖ = d

Poiche V e chiuso, x ∈ V se e solo se d = 0 ossia se x = PV x.Rimane da dimostrare la 2. Siano QV x = x− PV x, v ∈ V e t ∈ R. Poiche PV x+ tv ∈ V

per ogni t, si ha

d2 ≤ ‖x− (PV x+ tv)‖2 = ‖QV x− tv‖2

= ‖QV x‖2 − 2t < QV x, v > +t2 ‖v‖2

= d2 − 2t < QV x, v > +t2 ‖v‖2

Elidendo d2 e dividendo per t > 0, si ottiene

< QV x, v >≤t

2‖v‖2

che, per l’arbitrarieta di t, implica < QV x, v >≤ 0; dividendo per t < 0 si ottiene

< QV x, v >≥ − t2‖v‖2

che, per l’arbitrarieta di t, implica < QV x, v >≥ 0. Pertanto < QV x, v >= 0 che significaQV x ∈ V ⊥ e implica

‖x‖2 = ‖PV x+QV x‖2 = ‖PV x‖2 + ‖QV x‖2

La dimostrazione e conclusa.Nota 2.1. Nelle stesse ipotesi del teorema, un’altra caratterizzazione di PV x e la seguente:

u = PV x se e solo se 1. u ∈ V2. < x− u, v >= 0 ∀v ∈ V

Nota 2.2. E’ utile sottolineare che se V e un sottospazio anche non chiuso di H, ilsottospazio V ⊥ dei vettori ortogonali a V e sempre chiuso. Infatti se yn → y e yn ⊂ V ⊥, siha, per ogni x ∈ V ,

< y, x >= lim < yn, x >= 0

e quindi y ∈ V ⊥.Esempio 2.1. Sia Ω ⊂ RN , con misura di Lebesgue finita. In L2 (Ω) consideriamo il

sottospazio V generato dalla funzione

f ≡ 1 in Ω.

Essendo uni-dimensionale, tale sottospazio risulta chiuso in L2 (Ω) . Il sottospazio V ⊥ e cos-tituito dalle funzioni ortogonali ad ogni elemento di V e cioe dalle funzioni g ∈ L2 (Ω) taliche

< g, 1 >=∫

Ω

g = 0

13

Page 16: Libro - Analisi Funzionale - Matematica

in pratica, dalle funzioni a media nulla. Inoltre, data f ∈ L2 (Ω) , si puo scrivere

PV f =1|Ω|

∫Ω

f QV f = f − 1|Ω|

∫Ω

f.

Infatti, la proiezione PV f si ottiene risolvendo il problema

minλ∈R

∣∣∣∣∫Ω

(f − λ)2∣∣∣∣

Essendo ∫Ω

(f − λ)2 =∫

Ω

f2 − 2λ∫

Ω

f + λ2 |Ω|

si vede che il minimo si trova esattamente per

λ =1|Ω|

∫Ω

f

• Basi ortonormali. Anche in spazi a dimensione infinita si puo, a volte, parlare di base,per esempio quando H e separabile, ossia quando esiste un sottoinsieme di H numerabile edenso. Una successione wk∞k=1 di elementi di H costituisce una base ortonormale se

< wk, wj >= δkj k, j ≥ 1, ...‖wk‖ = 1 k ≥ 1

e se ogni x ∈ H si puo scrivere nella forma (serie di Fourier generalizzata)

x =∞∑k=1

< x,wk > wk

dove i ck =< x,wk > si chiamano coefficienti di Fourier rispetto alla base considerata. Inoltre(teorema di Pitagora...)

‖x‖2 =∞∑k=1

(< x,wk >)2

Avendo a disposizione una base ortonormale wk∞k=1, e facile controllare che la proiezione diun elemento x ∈ H sul sottospazio V generato, diciamo, da w1, ..., wN e

PV x =N∑k=1

< x,wk > wk

Nelle applicazioni, basi ortonormali sono spesso costituite da soluzioni particolari di problemiellittici (autofunzioni), in relazione al metodo di separazione di variabili. Cio riveste particolareimportanza nei problemi di propagazione di onde dove tali autofunzioni rappresentano modinormali di vibrazione.

Un classico di spazio di Hilbert separabile e L2 (0, 2π). L’insieme di funzioni

1√2π

,cosx√π

,sinx√π

,cos 2x√

π,

sin 2x√π

, ...,cosmx√

π,

sinmx√π

, ...

costituisce una base numerabile ortonormale.Problema 2.1. Dimostrare che in ogni spazio di Hilbert separabile esiste una base ortonor-

male numerabile (procedimento di Gram-Scmidt).

14

Page 17: Libro - Analisi Funzionale - Matematica

1.3 Operatori lineari. Spazio duale

1.3.1 Operatori lineari

Siano H1 e H2 spazi di Hilbert (su R). Un operatore lineare da H1 in H2 e una funzione

L : H1 → H2

tale che ∀α, β ∈ R e ∀x, y ∈ H14

L(αx+ βy) = αLx+ βLy

Per ogni operatore lineare sono definiti nucleo e immagine (o rango).Il nucleo di L, N (L), e la controimmagine del vettore nullo (in H2):

N (L)= x ∈ H1 : Lx = 0

e risulta un sottospazio di H1.L’immagine di L,R (L) , e l’insieme delle immagini:

R (L) = y ∈ H2 : ∃x ∈ H1, Lx = y

e risulta un sottospazio di H2.Definizione 3.1. L’operatore L si dice limitato se esiste una costante C tale che, ∀x ∈ H1,

‖Lx‖H2≤ C ‖x‖H1

(1.5)

La (1.5) indica che la sfera di raggio R in H1 viene trasformata da L in un insieme contenutonella sfera di raggio CR in H2. La costante C si puo dunque interpretare come un controllodel ”tasso di espansione” operato da L. Se, in particolare, C < 1, L opera una contrazionedelle distanze.

Se x 6= 0, usando la linearita di L si puo scrivere la (1.5) nella forma∥∥∥∥∥L(

x

‖x‖H1

)∥∥∥∥∥H2

≤ C

che, poiche x‖x‖H1

ha norma unitaria in H1, equivale a richiedere

sup‖x‖H1

=1

‖Lx‖H2= K <∞ (1.6)

Evidentemente K ≤ C.Microteorema 3.1. Un operatore lineare L : H1 → H2 e limitato se e solo se e continuo.

Dimostrazione. Sia L limitato. Dalla (1.5) si ha,∀x, x0 ∈ H1,

‖L (x− x0)‖H2≤ C ‖x− x0‖H1

e quindi, se ‖x− x0‖H1→ 0 anche ‖Lx− Lx0‖H2

= ‖L (x− x0)‖H2→ 0. Cio mostra la

continuita di L.Sia L continuo. In particolare L e continuo in x = 0 e quindi esiste δ tale che

‖Lx‖H2≤ 1 se ‖x‖H1

≤ δ

4Se un operatore L e lineare, si scrive Lx anziche L (x), quando cio non generi confusione.

15

Page 18: Libro - Analisi Funzionale - Matematica

Se ora y ∈ H1 con ‖y‖H1= 1, posto z = δy, si ha ‖z‖H1

= δ che implica

δ ‖Ly‖H2= ‖Lz‖H2

≤ 1

e cioe‖Ly‖H2

≤ 1δ

che implica la (1.6) con K ≤ 1δ .

Esempi (importanti)

3.1. Sia A una matrice di ordine m × n ad elementi reali. E’ un risultato di algebraelementare che l’operatore

L : x 7−→ Ax

sia lineare e continuo da Rn in Rm.3.2. Sia H = L2 (0, 1). L’operatore da H in R definito da

L : f 7−→∫ 1

0

f

e lineare e continuo. Infatti, per la disuguaglianza di Schwarz:

|Lf | =∣∣∣∣∫ 1

0

f

∣∣∣∣ ≤ ∫ 1

0

|f | ≤

√∫ 1

0

f2 = ‖f‖L2(0,1)

e quindi la (1.5) vale con C = 1.3.3. Sia H = L2 (Ω), Ω aperto in RN . Sia g fissata in L2 (Ω). Il funzionale definito da

Lg : f 7−→∫

Ω

f g

e lineare e continuo. Infatti, per la disuguaglianza di Schwarz:

|Lgf | =∣∣∣∣∫

Ω

fg

∣∣∣∣ ≤√∫

Ω

|f |2√∫

Ω

|g|2 = ‖g‖L2(Ω) ‖f‖L2(Ω)

e quindi la (1.5) vale con C = ‖g‖L2(Ω).3.4. Sia H spazio di Hilbert. Fissato y ∈ H, i funzionali

L1 : x 7−→< x, y >

L2 : x 7−→< y, x >

sono lineari e continui. Cio segue subito dalla disuguaglianza di Schwarz:

|< x, y >| ≤ ‖x‖ ‖y‖

da cui la (1.5), con C = ‖y‖. Si noti che la funzione

x 7−→ ‖x‖

e continua ma non lineare.

16

Page 19: Libro - Analisi Funzionale - Matematica

3.5. Sia V sottospazio chiuso di uno spazio di HilbertH. Le proiezioni definite nel teorema1:

x 7−→ PV x x 7−→ QV x

sono operatori lineari continui da H in H. Infatti, da ‖x‖2 = ‖PV x‖2 + ‖QV x‖2 segue subitoche

‖PV x‖ ≤ ‖x‖ ‖QV x‖ ≤ ‖x‖

per cui vale la (1.5) con C = 1.3.6. Siano V e H spazi di Hilbert, V ⊂ H. Un elemento di V puo dunque essere pensato

come elemento anche di H. Si definisce cosı l’operatore

I : V → H;u 7→ u

che si chiama immersione di V in H. E’ chiaramente un operatore lineare ed e continuo seesiste un numero C tale che

‖u‖H ≤ C ‖u‖V ∀u ∈ V

In tal caso si dice che V e immerso con continuita in H.

1.3.2 Duale

L’insieme degli operatori lineari e continui (o limitati) da uno spazio di Hilbert H1 in un altrospazio di Hilbert H2, si indica col simbolo

L (H1,H2)

Nel caso in cui H2 = R (oppure C, per gli spazi di Hilbert sui complessi), invece di operatoresi usa il termine funzionale. La seguente definizione e importante.

Definizione 3.2. L’insieme dei funzionali lineari e continui su uno spazio di Hilbert Hprende il nome di spazio duale di H e si indica col simbolo H ′ oppure H∗ (anziche L (H,R))

Dati due operatori L, G ∈ L (H1,H2) si possono definire in modo naturale altri dueoperatori nella stessa classe, somma e prodotto per uno scalare:

(G+ L) (x) = Gx+ Lx

(λL)x = λLx

dove x ∈ H1 e λ ∈ R. L’insieme L (H1,H2) risulta cosı dotato di una struttura di spaziovettoriale (reale). Lo si puo normare ponendo

‖L‖L(H1,H2)= sup‖x‖H1

=1

‖Lx‖H2

In particolare, per ogni operatore limitato, avremo

‖Lx‖H2≤ ‖L‖L(H1,H2)

‖x‖H1

Qualora non sorgano ambiguita, potremo scrivere semplicemente ‖L‖ anziche ‖L‖L(H1,H2)o,

nel caso dei funzionali, ‖L‖H′ . Si puo mostrare che lo spazio normato cosı ottenuto e completoe quindi:

Proposizione 3.2. L (H1,H2) e uno spazio di Banach.

17

Page 20: Libro - Analisi Funzionale - Matematica

Calcoliamo le norme degli operatori negli esempi 3.1-3.5.

1. Si ha:‖Ax‖2 =< Ax,Ax > =< A>Ax,x >

La matrice A>A e quadrata di ordine n ed e simmetrica e non negativa. Ora,

sup‖x‖≤1

< A>Ax,x >= sup‖x‖=1

< A>Ax,x >=ΛM

dove ΛM e il massimo autovalore di A>A. Pertanto ‖L‖ =√

ΛM .2. Si ha ‖L‖ = 1. Infatti, abbiamo gia visto che ‖L‖ ≤ 1. Essendo L (1) = 1, deve essere

anche ‖L‖ ≥ 1.3. Si ha ‖Lg‖ = ‖g‖L2(Ω). Infatti, abbiamo gia visto che ‖Lg‖ ≤ ‖g‖L2(Ω). Essendo

Lg(g) = ‖g‖2L2(Ω), deve essere anche ‖L‖ ≥ ‖g‖L2(Ω).4. Il funzionale L1 : x 7−→< x, y >, y fissato, ha norma ‖L1‖H′ = ‖y‖. Infatti, sappiamo

gia che ‖L1‖ ≤ ‖y‖. D’altra parte, se y 6= 0,∣∣∣∣L1

(y

‖y‖

)∣∣∣∣ = ‖y‖

per cui deve essere anche ‖L1‖H′ ≥ ‖y‖. Per L2 il discorso e identico.5. Si ha ‖PV x‖ = ‖QV x‖ = 1.Nota importante sulla simbologia. Dato una spazio di Hilbert H abbiamo sempre

indicato il prodotto scalare in H con il simbolo < ·, · > oppure, se esiste rischio di confusione,con < ·, · >H . Sia ora L ∈ H ′. Abbiamo indicato la sua azione su un elemento x ∈ Hsemplicemente con Lx. A volte e utile mettere in evidenza la dualita tra V e V ′ con lanotazione5

V ′ < L, x >V , che, naturalmente si usa in casi di estrema necessita, oppure <L, x >∗.

1.3.3 Teorema di rappresentazione di Riesz

La determinazione del duale di uno spazio di Hilbert e un problema importante che verrarisolto nel prossimo teorema di Riesz. L’esempio 4 mostra che il prodotto scalare con unelemento y fissato e un elemento del duale. Il teorema di Riesz, indica che ogni elemento delduale e rappresentabile mediante prodotto interno con un opportuno elemento. Si estende cosıun risultato ben noto per gli spazi a dimensione finita. Per esempio, se L e un funzionalelineare in RN , esiste un vettore a ∈ RN tale che, per ogni h ∈ RN , si ha

Lh =< a,h >

Sempre dall’esempio 3.4 si ha ‖L‖ = ‖a‖.

Teorema 3.2 (di rappresentazione). Sia H uno spazio di Hilbert . Per ogni L ∈ H ′

esiste un unico elemento u ∈ H tale che :

1. Lx =< u, x > per ogni x ∈ H

2. ‖L‖H′ = ‖u‖

5Tra i cui pregi non vi sono certamente la comodita e l’estetica.

18

Page 21: Libro - Analisi Funzionale - Matematica

Dimostrazione. Sia N il nucleo di L. Se N = H, la tesi segue scegliendo u = 0. Se N 6= H,allora N e un sottospazio di H, chiuso per la continuita di L (infatti, se xn ⊂ N e xn → x,allora 0 = Lxn → Lx e percio x ∈ N ). Dal teorema di proiezione si deduce che esiste unelemento non nullo z ∈ N⊥ tale che, quindi, Lz 6= 0, e con norma unitaria: ‖z‖ = 1. Bastaprendere un qualunque elemento z0 /∈ N e definire

z =z0 − PN z0‖z0 − PN z0‖

Osserviamo ora che l’elementow = x− Lx

Lzz

appartiene a N . Infatti

Lw = L

(x− Lx

Lzz

)= Lx− Lx

LzLz = 0

Essendo z ∈ N⊥ e ‖z‖ = 1, si ha

0 =< z,w >=< z, x > +Lx

Lz

ossiaLx =< L (z) z, x >

La 1 vale dunque con u = L(z)z. Per l’unicita, osserviamo che, se esistesse v ∈ H, v 6= u, taleche

Lx =< v, x > ∀x ∈ H

sottraendo quest’equazione dalla 1, si avrebbe subito che

< u− v, x >= 0 per ogni x ∈ H

che implica v = u. Infine, per mostrare la 2, basta osservare che, per la disuguaglianza diSchwarz,

|< u, x >| ≤ ‖x‖ ‖u‖

e quindi‖L‖H′ = sup

‖x‖≤1

|Lx| = sup‖x‖≤1

|< u, x >| ≤ ‖u‖

D’altra parte,‖u‖2 =< u, u >= Lu ≤ ‖L‖H′ ‖u‖

da cui, essendo u 6= 0, ‖u‖ ≤ ‖L‖H′ . Dunque ‖L‖H′ = ‖u‖ e la dimostrazione e conclusa.Il teorema di rappresentazione permette, in pratica, di identificare uno spazio di Hilbert

con il suo duale. Precisamente, introduciamo l’operatore

J : H ′ → H

che associa ad ogni elemento L ∈ H ′ l’unico elemento u ∈ H che lo rappresenta, tale cioe cheLx =< u, x > per ogni x ∈ H. L’operatore J e biiettivo ed isometrico:

L u ‖L‖H′ = ‖u‖H

e prende il nome di operatore di Riesz oppure isometria canonica tra H ′ ed H. Ne segue, tral’altro che:

19

Page 22: Libro - Analisi Funzionale - Matematica

• H ′ e uno spazio di Hilbert con prodotto interno definito dalla relazione:

< L1, L2 >H′=< u1, u2 >

dove u1 = JL1, u2 = JL2.Esempio 3.1. L2 (Ω) si puo identificare con il suo duale. Tutti i funzionali lineari e

continui su L2(Ω) sono dunque della forma Lg, come nell’esempio 2.

1.3.4 Aggiunto di un operatore

La nozione di operatore aggiunto generalizza quella di matrice trasposta di una matrice A diordine m× n. La matrice trasposta A> e caratterizzata dalla relazione

< Ax,y >Rm=< x,A>y >Rn

ed e precisamente di questa relazione che ci serviremo. Sia L ∈ L(H1,H2). Se y e un elementofissato in H2, la formula

T : x 7−→< Lx,y>H2

definisce un funzionale lineare e continuo su H1. Infatti,

|Tx| = |< Lx,y>H2 | ≤ ‖Lx‖H2‖y‖H2

≤ ‖L‖L(H1,H2)‖y‖H2

‖x‖H1

e percio la (1.5) vale con C = ‖L‖L(H1,H2)‖y‖H2

.Per il teorema di Riesz, a tale funzionale e associato univocamente un elemento JT di

H1, che denotiamo con w = L∗y. L∗ e un nuovo operatore che si chiama aggiunto di L.Precisamente:

Definizione 3.3. L’operatoreL∗ : H2 → H1

definito dalla relazione

< Lx,y>H2=<x,L∗y>H1 ∀x ∈ H1,∀y ∈ H2 (1.7)

si chiama aggiunto di L.In altri termini, L∗ associa all’elemento y ∈ H2 l’unico elemento w = L∗y tale che la (1.7)

sia valida. Naturalmente, la formula ha senso grazie all’identificazione di H ′1 e H ′

2 con H1 eH2, rispettivamente.

• Se L∗ = L, l’operatore L si dice autoaggiunto.Per gli operatori autoaggiunti, deve necessariamente essere H1 = H2 = H e si ha poi

< Lx,y>H=<x,Ly>H

generalizzando la nozione di matrice simmetrica.• Poiche

<L∗y, x>H1 =< y,Lx>H2 ∀x ∈ H1,∀y ∈ H2

segue subito che L∗ ∈ L(H2,H1) e che L∗∗ = L. Inoltre,

‖L∗‖L(H2,H1)= ‖L‖L(H1,H2)

Infatti

‖L∗y‖H1= sup‖x‖=1

|<L∗y, x>H1 | = sup‖x‖=1

|<y,Lx>H2 | ≤ ‖y‖H2‖L‖L(H1,H2)

20

Page 23: Libro - Analisi Funzionale - Matematica

da cui ‖L∗‖ ≤ ‖L‖ . Applicando a L = L∗∗ lo stesso calcolo si ottiene la disuguaglianzaopposta.

• Se L1 ∈ L(H1,H2) e L2 ∈ L(H2,H3), e facile controllare che vale la formula

(L2L1)∗ = L∗1L

∗2

In particolare, se L e un isomorfismo tra H1 e H2, L∗ e un isomorfismo tra H2 ed H1 e(L−1

)∗= (L∗)−1

Nelle applicazioni agli operatori differenziali, la nozione di aggiunto e legata alle formuled’integrazione per parti. Un semplice esempio dovrebbe chiarire.

Esempio 3.2. Sia T : L2 (0, 1) → L2 (0, 1) definito da

Tu (x) =∫ x

0

u

Usando la disuguaglianza di Schwarz, si ha∫ 1

0

|Tu|2 =∫ 1

0

∣∣∣∣∫ x

0

u (t) dt∣∣∣∣2 dx ≤ ∫ 1

0

(x∫ x

0

u2)dx ≤ 12

∫ 1

0

u2

da cui si vede che T e continuo. Per determinarne l’aggiunto, osserviamo che

< Tu, v >=∫ 1

0

[v (x)∫ x

0

u] dx = integrando per parti

=∫ 1

0

u

∫ 1

0

v −∫ 1

0

[u (x)∫ x

0

v] dx =∫ 1

0

[u∫ 1

x

v] dx =< u, T ∗v >

dove

T ∗v (x) =∫ 1

x

v

1.3.5 Nucleo ed immagine dell’aggiunto

Le relazioni tra nucleo e immagine di L e del suo aggiunto L∗ sono sostanzialmente le stessedel caso finito dimensionale. Abbiamo infatti:

Teorema 3.3 Sia L ∈ L (H1,H2) . Allora

a) R (L) = N (L∗)⊥

b) N (L) = R (L∗)⊥

Dimostrazione. a) Sia z ∈ R (L). Allora z = Lx per qualche x ∈ H1 e, se y ∈ N (L∗) si ha

< Lx, y >H2=< x,L∗y >H1= 0

percio R (L) ⊆ N (L∗)⊥. Essendo N (L∗)⊥ chiuso6 segue anche R (L) ⊆ N (L∗)⊥. D’altraparte, se z ∈ R (L)⊥, per ogni x ∈ H1 si ha

0 =< Lx, z >H2=< x,L∗z >H1

6Nota 2, sezione 1.3

21

Page 24: Libro - Analisi Funzionale - Matematica

per cui deve essere L∗z = 0. Pertanto R (L)⊥ ⊆ N (L∗), che equivale a N (L∗)⊥ ⊆ R (L).b) Dalla a) con L = L∗ si ha R (L∗) = N (L)⊥. Passando agli ortogonali si ottiene la tesi.

Nota 3.1 (importante). Dubbio amletico: identificare o non identificare? . Il teoremadi Riesz permette di calcolare l’azione di un funzionale lineare e continuo T su uno spaziodi Hilbert H mediante il prodotto interno con l’unico elemento zL = JT dove J e l’iniezionecanonica di H ′ in H. Come abbiamo visto, di fatto cio permette di identificare H con il suoduale H ′. Vi sono pero situazioni nelle quali occorre usare molta cautela in questa identifi-cazione. Un caso tipico che incontreremo piu avanti, e quello di una terna Hilbertiana V , H,V ′ dove V e H sono spazi di Hilbert e

V ⊂ H ⊂ V ′

In questa situazione e certamente possibile identificare H e H ′, ma l’identificazione di V e V ′

porterebbe chiaramente ad un assurdo! Per connettere V ′ e V occorre dunque usare semprel’iniezione canonica tra questi spazi, evitando di identificarli.

Nota 3.2. Altra questione. Usando l’iniezione canonica J , abbiamo definito l’operatoreaggiunto di un operatore L tra due spazi di Hilbert H1 e H2 come l’operatore L∗ da H2 adH1 tale che

< Lx, z >H2=< x,L∗z >H1

In situazioni piu generali, per esempio negli spazi di Banach, non esiste nessuna iniezionecanonica. Si puo allora definire l’aggiunto di un operatore senza usare il teorema di Riesz?Il modo c’e ed e abbastanza naturale ma siccome non corrisponde esattamente allo stessooperatore lo chamiamo coniugato. Sia L : H1 → H2. Definiamo l’operatore coniugato di L

L′ : H ′2 → H ′

1

mediante la formula

H′1< L′G, x >H1= H′

2< G,Lx >H2 ∀G ∈ H ′

2, ∀x ∈ H1

In altri termini (per ricordarla meglio):

(L′G)x = G (Lx) .

Vediamo qual e la relazione tra L′ ed L∗. Sia zG = JG. Allora

H′1

< L′G, x >H1=H′1< L′J−1zG, x >H1= (usando il teorema di Riesz)

= < JL′J−1zG, x >H1= < x, JL′J−1zG >H1

mentreH′

2< G,Lx >H2=< zG, Lx >H2

Dunque< zG, Lx >H2=< x, JL′J−1zG >H1

da cuiL∗ = JL′J−1

La formula puo apparire un po oscura, ma esaminandola bene si vede che e ... quasi ovvia.L′ opera direttamente tra i duali mentre L∗ tra gli spazi originali. Gli operatori di Riesz J eJ−1 convertono l’azione di L′ dai duali agli spazi originali.

22

Page 25: Libro - Analisi Funzionale - Matematica

1.4 Problemi variazionali astratti

1.4.1 Forme bilineari

Nella formulazione variazionale dei problemi al contorno per operatori differenziali, un ruoloimportante e svolto dalle forme bilineari. Se V1, V2 sono spazi pre-Hilbertiani, una formabilineare su V1 × V2 e una funzione

a : V1 × V2 → R

che soddisfa le seguenti proprieta.i) per ogni y ∈ V2, fissato, la funzione

x 7−→ a(x, y)

e lineare su V1

ii) per ogni x ∈ V1, fissato, la funzione

y 7−→ a(x, y)

e lineare su V2.Se V1 = V2 diremo semplicemente forma bilineare in V , anziche V × V .Nota 4.1. Se il campo di scalari e C, si parla di forme sesquilineari, anziche bilineari, e

la ii) e sosituita dalla seguenteiibis) per ogni x ∈ V1, fissato, la funzione

y 7−→ a(x, y)

e antilineare7 su V2.Esempi 4.1-4.4.

1. Il prodotto interno in uno spazio di Hilbert V e una forma bilineare in V .

2. In Rn la formula

a(x,y) =n∑

i,j=1

aijxiyj

dove A = (aij) e una matrice quadrata di ordine n, definisce una forma bilineare.

3. In C1 ([a, b]), spazio pre-hilbertiano rispetto alla norma

‖u‖ = ‖u‖L2(a,b) + ‖u′‖L2(a,b) ,

la formula

a (u, v) =∫ b

a

A(x)u′v′dx+∫ b

a

B(x)u′v dx+∫ b

a

C(x)uv dx

definisce una forma bilineare (A, B, C funzioni limitate).

7Cioea (x, αy + βz) = αa (x, y) + βa (x, z)

23

Page 26: Libro - Analisi Funzionale - Matematica

4. Sia Ω un dominio in Rn. In C1 (Ω), spazio pre-hilbertiano rispetto alla norma

‖u‖ = ‖u‖L2(Ω) + ‖∇u‖L2(Ω) ,

la formulaa(u,v) =

∫Ω

α ∇u · ∇v dx (α > 0)

definisce una forma bilineare.

Definizione 4.1 (Importante). Una forma bilineare in V si dice:

a) continua se esiste una costante positiva C tale che

|a(x, y)| ≤ C ‖x‖V ‖y‖V ∀x ∈ V,∀y ∈ V

b) coerciva, cioe esiste una costante α > 0 tale che

a(v, v) ≥ α ‖v‖2 ∀v ∈ V

Problema 4.1. Le quattro forme bilineari considerate sopra sono continue (perche ?).Quali sono coercive?

1.4.2 Teorema di Lax-Milgram

Siano V uno spazio di Hilbert, a = a (u, v) una forma bilineare in V e F ∈ V ′.Chiamiamo problema variazionale astratto il seguente: Trovare u ∈ V

tale chea (u, v) = Fv ∀v ∈ V

(1.8)

Come vedremo molti problemi per equazioni differenziali possono essere formulati in modo darientrare in questa classe. Il teorema fondamentale e il seguente.

Teorema 4.1. (di Lax-Milgram) Se la forma bilineare a e:

i) continua:|a(u, v)| ≤M ‖u‖ ‖v‖ ∀u, v ∈ V

ii) coerciva: esiste α > 0 tale che

a(v, v) ≥ α ‖v‖2 ∀v ∈ V

allora esiste un’unica soluzione u ∈ V del problema (1.8). Inoltre vale la seguente stima distabilita:

‖u‖ ≤ 1α‖F‖V ′ (1.9)

Nota 4.2. La disuguaglianza che esprime la coercivita si presenta spesso come una gen-eralizzazione delle stime dell’energia, che abbiamo gia incontrato nei capitolo precedenti.

Nota 4.3. La disuguaglianza (1.9) si chiama stima di stabilita per il motivo seguente. Ildato nel problema e costituito dal funzionale F, elemento del duale di V . Poiche per ogni Fil teorema assicura l’esistenza di un’unica soluzione uF , la corrispondenza

dati 7−→ soluzione

24

Page 27: Libro - Analisi Funzionale - Matematica

e una funzione (univoca) da V ′ ad V . Siano ora λ, µ ∈ R, F1, F2 ∈ V ′ e u1, u2 le corrispondentisoluzioni. In base alla bilinearita di a, abbiamo che

a(λu1 + µu2, v) = λa(u1, v) + µa(u2, v) == λF1v + µF2v

Si deduce che la soluzione corrispondente ad una combinazione lineare dei dati e la com-binazione lineare delle soluzioni corrispondenti o, in altri termini, la corrispondenza dati-soluzione e lineare. Per il problema (1.8) vale dunque il principio di sovrapposizione. Appli-cando la (1.9) alla differenza u1− u2, le considerazioni precedenti permettono di scrivere

‖u1 − u2‖ ≤1α‖F1 − F2‖V ′

che mostra come la corrispondenza dati-soluzione sia una funzione Lipschitziana con costantedi lipschitz pari a 1

α . Questa costante riveste un ruolo particolarmente importante, perchecontrolla la variazione in norma della soluzione in seguito ad una variazione sui dati, misurataattraverso la norma ‖F1 − F2‖V ′ . Naturalmente, il problema e tanto ”piu stabile” quanto piuelevata e la costante α di coercivita. Tutte queste proprieta si sintetizzano nell’unico enunciatoseguente: l’operatore che associa ad F ∈ V ′ la soluzione uF ∈ V del problema variazionale(1.8) e un isomorfismo tra V ′ e V .

Dimostrazione del teorema 4.1. Per maggior chiarezza dividiamo la dimostrazione in varipassi.

1. Riscrittura del problema (1.8). Fissato u ∈ V , l’applicazione

v 7→ a (u, v)

e lineare e continua (per l’ipotesi i)) e definisce percio un elemento di V ′. In base al teoremadi rappresentazione di Riesz, risulta percio associato ad ogni u ∈ V un unico elemento h =Au ∈ V tale che

a (u, v) =< Au, v > ∀v ∈ V (1.10)

D’altra parte, essendo F ∈ V ′, sempre in base al teorema di rappresentazione esiste un’unicoelemento z = JF ∈ V tale che

Fv =< z, v > ∀v ∈ V

e inoltre, ‖F‖V ′ = ‖z‖. Il problema (1.8) diventa allora: Trovare u ∈ Vtale che

< Au, v >=< z, v > ∀v ∈ V

che equivale a trovare u tale cheAu = z

Occorre dunque esaminare l’operatore A. Vogliamo dimostrare che

A : V → V

e un isomorfismo e cioe un operatore lineare, continuo, iniettivo e suriettivo.

2. Linearita e continuita di A.

25

Page 28: Libro - Analisi Funzionale - Matematica

• Linearita. Per ogni u1, u2, v ∈ V e λ1, λ2 ∈ R si ha:

< A(λ1u1 + λ2u2), v >= a (λ1u1 + λ2u2, v) == λ1a (u1, v) + λ2a (u2, v) = λ1 < Au1, v > +λ2 < Au2, v >== < λ1Au1 + λ2Au2, v >

da cuiA(λ1u1 + λ2u2) = λ1Au1 + λ2Au2

• Continuita. Si ha

‖Au‖2 = < Au,Au >= a(u,Au)≤ M ‖u‖ ‖Au‖

da cui‖Au‖ ≤M ‖u‖

3. A e iniettivo e ha immagine chiusa. In simboli:

N (A) = 0 e R (A) e un sottospazio chiuso di V

Infatti, dalla coercivita di a, si ricava

α ‖u‖2 ≤ a (u, u) =< Au, u >≤ ‖Au‖ ‖u‖

da cui‖u‖ ≤ 1

α‖Au‖ (1.11)

Se percio Au = 0 deve essere u = 0 e quindi N (A) = 0.Per mostrare che R (A) e un sottospazio chiuso di V occorre considerare una successione

yn ⊂ R (A) tale che yn → y ∈ V e mostrare che y ∈ R (A). Essendo yn ∈ R (A) esiste untale che Aun = yn. Dalla (1.11) si ha

‖un − um‖ ≤1α‖un − um‖

per cui, essendo yn di Cauchy, lo e anche un e quindi esiste u ∈ V tale che

un → u

Per la continuita di A, segue che yn = Aun → Au. L’unicita del limite da Au = y, per cuiy ∈ R (A) e R (A) e chiuso.

4. A e suriettivo, cioe R (A) = V . Infatti, se fosse R (A) ⊂ V , essendo R (A) sottospaziochiuso, per il teorema di proiezione esisterebbe z 6= 0, z ∈ R (A)⊥. In particolare, si avrebbe

0 =< Az, z >= a (z, z) ≥ α ‖z‖2

da cui z = 0. Contraddizione. Deve dunque essere R (A) = V .5. Esistenza e unicita della soluzione di (1.8). Poiche A e suriettivo e iniettivo, esiste una

e una sola u ∈ V tale che Au = z. Per quanto visto al punto 1., u e l’unica soluzione delproblema (1.8).

6. Stima di stabilita. Dalla (1.11) con u = u, si trova

‖u‖ ≤ 1α‖Au‖ =

1α‖z‖ =

1α‖F‖V ′

che conclude la dimostrazione.

26

Page 29: Libro - Analisi Funzionale - Matematica

1.4.3 Forme bilineari simmetriche ed equazione di Eulero

Se la forma bilineare a e simmetrica, cioe se

a (u, v) = a (v, u) ∀u, v ∈ V

al problema variazionale astratto (1.8) e associato in modo naturale un problema di minimo.Consideriamo il funzionale

J (v) =12a (v, v)− Fv

Il problema (1.8) e allora equivalente a minimizzare il funzionale J , nel senso espresso nelseguente

Microteorema 4.2. Sia a simmetrica. Allora u e soluzione del problema (1.8) se e solose usl minimizza J , ovvero

J (u) = minv∈V

J (v)

Dimostrazione. Per ogni ε ∈ R e ogni ”variazione” v ∈ V si ha

J (u+ εv)− J (u)

=

12a (u+ εv, u+ εv)− F (u+ εv)

12a (u, u)− Fu

= ε a (u, v)− Fv+

12ε2a (v, v)

Se u e soluzione del problema (1.8), si ha a (u, v)− Fv = 0 e percio

J (u+ εv)− J (u) =12ε2a (v, v) ≥ 0

per cui u minimizza J . Viceversa, se u minimizza J allora

J (u+ εv)− J (u) ≥ 0

che forza l’annullamento del termine in ε e cioe

a (u, v)− Fv = 0 ∀v ∈ V (1.12)

ossia u e soluzione del problema (1.8).

Se a e simmetrica, l’equazione variazionale

a (u, v)− Fv = 0 ∀v ∈ V

si chiama equazione d’Eulero per il funzionale J . Questa equazione puo essere consideratauna versione astratta del principio dei lavori virtuali, mentre il funzionale J rappresenta ingenere un’energia.

Nota 4.4. Se a e simmetrica e coerciva, essa definisce in V un prodotto scalare, avendonetutte le proprieta:

< u, v >a:= a (u, v)

In tal caso, esistenza ed unicita per il problema (1.8) seguono direttamente dal teorema dirappresentazione di Riesz per il funzionale F , in riferimento al prodotto scalare < ·, · >a.Incidentalmente, notiamo anche che esiste un unico elemento u che minimizza il funzionale J .

27

Page 30: Libro - Analisi Funzionale - Matematica

Nota 4.5. (Per chi conosce gia il teorema delle contrazioni). Nella dimostrazione delteorema di Lax-Milgram, i passi 3,4,5 (biunivocita dell’operatore A) possono essere dimostratianche nel modo seguente. Sia t ∈ [0, 1] e Ct : V → V , l’operatore definito da

Ctv = v − t (Av − z)

Si ha:‖Ctv − Ctw‖2 = ‖(v − w)− t [Av −Aw]‖2

= ‖v − w‖2 − 2t < v − w,A(v − w) > +t2 ‖A(v − w)‖2

= ‖v − w‖2 − 2ta (v − w, v − w) + t2 ‖A(v − w)‖2

≤ ‖v − w‖2 − 2αt ‖v − w‖2 + t2M2 ‖v − w‖2

Per cui‖Ctv − Ctw‖ ≤

(1− 2αt+ t2M2

) 12 ‖v − w‖

Se t e positivo abbastanza piccolo, si ha(1− 2αt+ t2M2

) 12 < 1

e quindi Ct e una contrazione. Esiste allora un unico elemento u tale che

u = Ctu = u− t (Au− z)

che equivale aAu = z

1.4.4 Approssimazione e metodo di Galerkin

Nel problema astratto, l’equazione variazionale

a (u, v) = Fv

e valida per ogni elemento v di uno spazio V di Hilbert, che, in genere, e di dimensione in-finita, ma separabile. Nelle applicazioni concrete, e importante poter calcolare approssimazioniaccurate della soluzione. Il metodo di Galerkin consiste nel cercare un’approssimazione”proiettando” l’equazione su opportuni sottospazi di V a dimensione finita. Aumentando ladimensione del sottospazio, in linea di principio dovrebbe migliorare l’approssimazione. Piuprecisamente, si cerca di costruire una successione Vk di sottospazi di V tale che:

a) Ogni Vk e finito dimensionale, per esempio di dimensione k,b) Vk ⊂ Vk+1 (in realta, non strettamente necessario),c) ∪Vk = V.

Per eseguire la proiezione, si seleziona una base ψ1, ψ2, ..., ψk per Vk. Si cerca poi un’approssimazionedella soluzione u nella forma

uk =k∑j=1

cjψj

risolvendo il problemaa (uk, v) = Fv ∀v ∈ Vk (1.13)

Poiche gli elementi ψ1, ψ2, ..., ψk costituiscono una base per Vk, e sufficiente richiedere che

a (uk, ψr) = Fψr r = 1, ..., k (1.14)

28

Page 31: Libro - Analisi Funzionale - Matematica

I coefficienti incogniti c1, c2, ..., ck soddisfano allora le k equazioni lineari algebriche

k∑j=1

cja (ψj , ψr) = Fψr r = 1, 2, ..., k

o, in forma compatta,Ac = F (1.15)

dove

c =

c1c2...ck

, F =

Fψ1

Fψ2

...Fψk

e A e la matrice k × k i cui elementi sono

arj = a (ψj , ψr)

A si chiama matrice di rigidezza o di stiffness e gioca evidentemente un ruolo decisivonell’analisi numerica del problema.

Se la forma bilineare a e coerciva, la matrice A e definita positiva. Infatti, per ogni vettorev =

∑ki=1 viψi∈Vk, si ha, sfruttando prima la bilinearita e poi la coercivita di a :

vTAv =k∑

i,j=1

via (ψi, ψj) vj

=k∑

i,j=1

a (viψi, vjψj) = a

k∑i=1

viψi,

k∑j=1

vjψj

≥ α ‖v‖2 ≥ 0

Cio mostra che A e definita positiva ed in particolare invertibile. Esiste dunque un’unicasoluzione approssimata uk in Vk di (1.15).

Una volta calcolata l’approssimazione uk, occorre naturalmente dimostrare che, se k →∞,uk tende alla vera soluzione u e controllare l’errore commesso ad ogni passo nell’approssimazione.A questo proposito e importante il seguente lemma dovuto a Cea che mostra, tra l’altro, ilpeso delle costanti di continuita (M) e di coercivita (α) della forma bilineare. Questo haconseguenze rilevanti dal punto di vista numerico.

Lemma 4.3. (di Cea). Valgano le ipotesi del lemma di Lax-Milgram. Supponiamoche uk sia soluzione del problema approssimato (1.14) e che u sia la soluzione del problemaoriginale. Allora

‖u− uk‖ ≤M

αinfv∈Vk

‖u− v‖ (1.16)

Dimostrazione. Osserviamo subito che si ha

a (uk, v) = Fv ∀v ∈ Vk

e anchea (u, v) = Fv ∀v ∈ Vk

29

Page 32: Libro - Analisi Funzionale - Matematica

Sottraendo membro a membro si ottiene

a (u− uk, v) = 0 ∀v ∈ Vk

In particolare, essendo uk − v ∈ Vk, si ha

a (u− uk, uk − v) = 0 ∀v ∈ Vk

Allora si puo scrivere, per la coercivita di a,

α ‖u− uk‖2 ≤ a (u− uk, u− uk) = a (u− uk, u− v) + a (u− uk, v − uk)= a (u− uk, u− v) ≤M ‖u− uk‖ ‖u− v‖

da cui, semplificando,

‖u− uk‖ ≤M

α‖u− v‖

Questa disuguaglianza vale per ogni v ∈ Vk con la costante Mα indipendente da k. Vale percio

anche se a secondo membro si passa all’estremo inferiore su v ∈ Vk.Convergenza del metodo. Poiche abbiamo supposto che ∪Vk = V , esiste una successione

wk ⊂ Vk tale che wk → u se k →∞. Dal lemma 3.3, per ogni k si ha

‖u− uk‖ ≤M

αinfv∈Vk

‖u− v‖ ≤ M

α‖u− wk‖

da cui‖u− uk‖ → 0

ossia la convergenza del metodo di Galerkin.

1.4.5 Una variante del teorema di Lax-Milgram

A volte, nella formulazione astratta occorre considerare soluzioni in uno spazio di HilbertV mentre le funzioni test che entrano nell’equazione variazionale devono essere scelte in undifferente spazio di Hilbert V . Esiste una variante (dovuta a J. Necas) del teorema di LaxMilgram utile in questa situazione. Precisamente, la formulazione del problema e la seguente:Siano W e V spazi di Hilbert, a = a (u, v) una forma bilineare in W × V e F ∈ V ′.

Chiamiamo problema variazionale astratto il seguente Trovare u ∈Wtale che

a (u, v) = Fv ∀v ∈ V(1.17)

Teorema 4.4. Se la forma bilineare a e:

i) continua:|a(u, v)| ≤M ‖u‖W ‖v‖V ∀u ∈W,∀v ∈W

ii) esiste una costante α > 0 tale che

sup‖v‖V =1

a(u, v) ≥ α ‖u‖2V ∀u ∈W

iii)supu∈W

a(u, v) > 0 ∀v ∈ V

30

Page 33: Libro - Analisi Funzionale - Matematica

allora esiste un’unica soluzione u ∈ W del problema (1.17). Inoltre vale la seguente stima distabilita:

‖u‖W ≤ 1α‖F‖V ′ (1.18)

La condizione ii) e una coercivita asimmetrica, mentre la iii) assicura che, fissato v in V , laforma bilineare assuma almeno un valore positivo.

Dimostrazione. Dividiamo ancora la dimostrazione in vari passi.1. Riscrittura del problema (1.17). Fissato u ∈W , l’applicazione

v 7→ a (u, v)

e lineare e continua in V (per l’ipotesi i)) e definisce percio un elemento di V ′. In base alteorema di rappresentazione di Riesz, risulta percio associato ad ogni u ∈ W un elementoh = A (u) ∈ V tale che

a (u, v) =< Au, v >V ∀v ∈ V

D’altra parte, essendo F ∈ V ′, sempre in base al teorema di rappresentazione, esiste z ∈ Vtale che

Fv =< z, v >V ∀v ∈ V

e inoltre, ‖F‖V ′ = ‖z‖V . Il problema (1.17) diventa allora: Trovare u ∈Wtale che

< Au, v >V =< z, v >V ∀v ∈ V

che equivale a trovare u tale cheAu = z

Occorre dunque esaminare l’operatore A. Vogliamo dimostrare che

A : W → V

e un isomorfismo (operatore lineare, continuo, iniettivo e suriettivo).2. Linearita e continuita di A.

• Linearita. Si dimostra come nel teorema di Lax-Milgram.

• Continuita. Si ha|< Au, v >V | = |a(u, v)| ≤M ‖u‖W ‖v‖V

da cui‖Au‖V ≤M ‖u‖W .

3. A e iniettivo e ha immagine chiusa. In simboli:

N (A) = 0 e R (A) e un sottospazio chiuso di V

Infatti, dalla ii) si ricava

sup‖v‖V =1

< Au, v >V≥ α ‖u‖2W ∀u ∈W

Se percio Au = 0 deve essere u = 0 e quindi N (A) = 0 .

31

Page 34: Libro - Analisi Funzionale - Matematica

Per mostrare che R (A) e un sottospazio chiuso di V , occorre considerare una successioneyn ⊂ R (A) tale che yn → y ∈ V e mostrare che y ∈ R (A) . Essendo yn ∈ R (A) esistevn ∈W tale che Avn = yn. Dalla ii) si ha

‖vn − vm‖W ≤ 1α

sup‖v‖V =1

< Avn −Avm, v >V≤1α‖yn − ym‖V

per cui, essendo yn di Cauchy in V , lo e anche vn in W e quindi esiste v ∈W tale che

vn → v

Per la continuita di A, segue che yn = Avn → Av. L’unicita del limite da Av = y, per cuiy ∈ R (A) e R (A) e chiuso.

4. A e suriettivo, cioe R (A) = V . Infatti, se fosse R (A) ⊂ V , essendo R (V ) sottospaziochiuso, per il teorema di proiezione esisterebbe z 6= 0, z ∈ R (A)⊥. In particolare, si avrebbe

0 =< Au, z >V = a (u, z) ∀u ∈W

in contraddizione con la 3. Deve dunque essere R (A) = V .5. Esistenza di una soluzione di (1.8). Poiche A e suriettivo, esiste u ∈ V tale che Au = z.

Per quanto visto al punto 1., u e soluzione del problema (1.8).6. Unicita della soluzione. Siano u1 e u2 soluzioni di (1.8):

a (u1, v) = Fv

a (u2, v) = Fv

Sottraendo membro a membro le due equazioni si trova

0 = a (u1 − u2, v) ∀v ∈ V

e dalla ii) si deduce u1 = u2.

7. Stima di stabilita. Dalla ii) si ha

‖u‖V ≤1α

sup‖v‖V =1

< Au, v >V =1α

sup‖v‖V =1

< z, v >V =1α‖z‖V =

1α‖F‖V ′

che conclude la dimostrazione.

1.5 Compattezza e convergenza debole

1.5.1 Compattezza

Nello studio dei problemi al contorno per equazioni a derivate parziali e in particolare nellamessa a punto di metodi numerici per l’approssimazione della soluzione, ci si scontra spessocon problemi di convergenza in varie norme. Una situazione tipica e quella in cui si riesce acostruire una successioni di candidate approssimanti e si vuole sapere se effettivamente questeconvergono in qualche senso opportuno alla soluzione. Spesso, attraverso stime cosiddettedell’energia8, si riesce a mostrare che queste successioni sono limitate in qualche spazio diHilbert e si vorrebbe per lo meno estrarre una sottosuccessione convergente alla soluzione. Inaltri termini stiamo richiedendo alla nostra successione una proprieta di compattezza.

8In genere, si tratta di controllare la norma L2 di una funzione e del suo gradiente.

32

Page 35: Libro - Analisi Funzionale - Matematica

• Compattezza 1. Sia X uno spazio topologico ed E ⊆ X. E si dice compatto se daogni copertura aperta9 di E si puo estrarre una sottocopertura finita.

Negli spazi metrici e quindi, in particolare, negli spazi di Banach e di Hilbert, si possonocaratterizzare gli insiemi compatti mediante altre due condizioni equivalenti. Una di questefa uso di coperture speciali costituite da sfere di raggio ε arbitrariamente piccolo (ε− sfere).

• Compattezza 2. Sia M uno spazio metrico ed E ⊆ M . E e compatto se e solo se ecompleto e, per ogni ε > 0, esiste una copertura finita di E con ε− sfere.

L’altra caratterizzazione fa uso della condizione di Bolzano-Weierstrass: si dice che uninsieme E soddisfa tale condizione se ogni successione infinita di elementi di E contiene unasottosuccessione convergente ad un elemento di E.

In questo caso, si dice anche che E e compatto per successioni o sequenzialmente compatto.• Compattezza 3. Sia M uno spazio metrico ed E ⊆ M . E e compatto se e solo se e

sequenzialmente compatto.

Vediamo alcune relazioni tra chiusura, limitatezza e compattezza. Gli insiemi compatti inRn sono tutti e soli gli insiemi chiusi e limitati. In dimensione infinita le cose cambiano.

Esempio 5.1. Sia

H = l2 =

a = ak∞k=1 :

∞∑k=1

a2k <∞, ak ∈ R

lo spazio di Hilbert delle successioni reali a quadrato sommabile, con

< a,b >=∞∑k=1

akbk e ‖a‖2 =∞∑k=1

a2k

Osserviamo che, se a ∈l2, ak → 0 per k →∞. Sia E l’insieme degli elementi A1 = 1, 0, 0, ...,A2 = 0, 1, 0, ... ecc. ovvero

E =Akk≥1

E costituisce una base ortonormale dello spazio l2 e∥∥Aj −Ak

∥∥ =√

2 se j 6= k. Pertanto,la successione

Akk≥1

non e di Cauchy nello spazio e quindi non e convergente. Stessaconclusione per ogni sottosuccessione estratta da

Akk≥1

: nessuna di esse e convergente.Non vale quindi la condizione di Bolzano-Weierstrass e percio E non e compatto. TuttaviaE costituisce un insieme chiuso (poiche non ha punti di accumulazione) e limitato (poiche∥∥Aj

∥∥ = 1 per ogni j ≥ 1).

Usando l’equivalenza delle definizioni 2 e 3 e facile controllare i seguenti fatti (esercizio);sia B uno spazio normato ed E ⊆ B:

a) se E e compatto allora e chiuso e limitato;b) se E e compatto e K ⊂ E e un suo sottoinsieme chiuso allora K e compatto.

Anche in dimensione infinita e dunque vero che un sottoinsieme compatto di uno spaziodi normato e sempre chiuso e limitato. Il viceversa succede solo negli spazi vettoriali adimensione finita. Precisamente:

Teorema 5.1 Sia B uno spazio di Banach. B ha dimensione finita se e solo se la sferaunitaria x : ‖x‖ ≤ 1 e compatta.

9Una copertura aperta di E e una famiglia di aperti la cui unione contiene E

33

Page 36: Libro - Analisi Funzionale - Matematica

Dimostrazione. (La facciamo solo nel caso in cuiB sia uno spazio di Hilbert, seguendo l’ideadell’esempio 5.1.). Sia B spazio di Hilbert. Dobbiamo solo mostrare che se la sfera unitariachiusa e compatta allora B ha dimensione finita. Equivalentemente, se B ha dimensioneinfinita allora la sfera unitaria chiusa non e compatta. Ma se B ha dimensione infinita, in baseal teorema di proiezione, esiste una successione infinita di versori ortonormali vk. Poiche sej 6= k si ha

‖vj − vk‖2 = 2,

dalla successione dei vk non si puo estrarre alcuna sottosuccessione convergente e quindi lasfera unitaria chiusa non e compatta.

• Criterio di compattezza in L2. Le star tra gli spazi di Hilbert sono certamente glispazi di funzioni a quadrato sommabile secondo Lebesgue e vale la pena almeno di enunciare ilseguente un criterio di compattezza in L2(Ω) dove Ω e un dominio limitato di Rn. E forse piucomodo considerare gli insiemi non necessariamente compatti, ma la cui chiusura e compatta.Questi insiemi si chiamano precompatti o relativamente compatti : un sottoinsieme S di unospazio topologico X e precompatto se la sua chiusura S e compatta.

Teorema 5.2. Siano Ω un dominio limitato di Rn e S ⊂ L2(Ω). S e precompatto se

i) S e limitato. Cioe esiste K tale che

‖u‖L2(Ω) ≤ K, ∀u ∈ S.

ii) Esistono α, L > 0 tali che, pensando u estesa a zero fuori da Ω,∫Ω

|u (x + h)− u (x)|2 dx ≤ L |h|α per ogni h ∈ Rn e u ∈ S.

La seconda condizione implica che

limh→0

‖u (·+ h)− u (·)‖L2(Ω) = 0

in modo uniforme su tutti gli elementi di S: si tratta, in altri termini, di una condizionedi equicontinuita in norma degli elementi di S. Vedremo nel capitolo sugli spazi di Sobolevesempi di compatti in L2(Ω).

1.5.2 Convergenza debole in spazi di Hilbert

Se F ∈ H ′, sappiamo che Fxk → Fx ogni volta che ‖xk − x‖ → 0. Puo darsi pero che

Fxk → Fx

per ogni elemento F del duale, senza che ‖xk − x‖ → 0. Diremo allora che xk convergedebolmente a x. Precisamente:

Definizione 5.1. Una successione xk ⊂ H converge debolmente a x ∈ H e in talcaso scriviamo

xk x

(con la ”mezza freccia”) seFxk → Fx ∀F ∈ H ′

Dal teorema di rappresentazione di Riesz, segue subito che xk ⊂ H converge debolmente ax ∈ H se e solo se

34

Page 37: Libro - Analisi Funzionale - Matematica

< xk, y >→< x, y > ∀y ∈ H.

Problema 5.1. Dimostrare che:a) Se xk x e xk y allora x = y (il limite debole e unico).b) La convergenza in norma (o forte) implica quella debole (esercizio).c) Se xk x e ‖xk‖ → ‖x‖ allora xk → x.d) Le due nozioni di convergenza forte e debole sono equivalenti in spazi vettoriali a di-

mensione finita.

I prossimi esempi mostrano che in generale Le due nozioni di convergenza forte e debolenon sono equivalenti.

Esempi.5.2. Siano H ed

Ak∞k=1

come nell’esempio 5.1. Se b ∈l2, si ha

< Ak,b >= bk → 0

e quindiAk 0

ma abbiamo gia visto cheAk∞k=1

non e fortemente convergente.

5.3. La successione vk∞k=1 = cos kx∞k=1 ⊂ L2 (0, 2π) e debolmente convergente a zero.Infatti, per ogni f ∈ L2 (0, 2π) ,

< f, vk >=∫ 2π

0

f (x) cos kx dx→ 0

per k →∞ (teorema di Riemann-Lebesgue sui coefficienti di Fourier di f). Tuttavia

‖vk‖L2(−π,π) =√π

e quindi vk non converge fortemente.Vale poi il seguente teorema10.Teorema 5.3. Sia xk ⊂ H tale che

xk x

Allora:

1. ‖x‖ ≤ lim infk→∞

‖xk‖ (semicontinuita inferiore debole della norma)

2. xk e limitata.

Ci limitiamo ad osservare che la prima proprieta segue subito dalla disuguaglianza diSchwarz e da

‖x‖2 = limk→∞

< x, xk >= lim infk→∞

< x, xk >≤ ‖x‖ lim infk→∞

‖xk‖ .

L’esempio 3.3 indica che in quest’ultima disuguaglianza ci puo essere il segno di minore stretto.10Molto importante in problemi di ottimizzazione.

35

Page 38: Libro - Analisi Funzionale - Matematica

Nota 3.1. Se L ∈ L (H1,H2) e xk x in H1 non e detto che Lxn → Lx in H2. E’ verotuttavia che Lxn Lx. Infatti, per ogni y ∈ H2,

< L(xn − x), y >H2=< xn − x, L∗y >H1→ 0.

Abbiamo affermato che e utile avere a disposizione criteri di compattezza. Nel paragrafoprecedente abbiamo visto che, in generale, la limitatezza di un insieme non e sufficiente peravere un insieme precompatto in norma (ossia fortemente). Se pero rinunciamo alla conver-genza forte e ci accontentiamo di quella debole, allora le cose migliorano.

Infatti, vale il seguente teorema, che indica come i limitati in uno spazio di Hilbert sianodebolmente compatti per successioni. La dimostrazione e elementare se supponiamo che H siaanche separabile, ossia che esista un insieme numerabile, denso in H. Ci limiteremo a questocaso11.

Teorema 5.4. Ogni successione limitata in uno spazio di Hilbert H contiene una sotto-successione debolmente convergente.

Dimostrazione (nel caso H separabile). Poiche H e separabile esiste una successione zkdensa in H. Sia ora xj una successione limitata: ‖xj‖ ≤ M , ∀j ≥ 1. Dividiamo ladimostrazione in tre passi.

1. Usiamo un tipico procedimento ”diagonale” per costruire una sottosuccessione12x

(j)j

tale che la successione di numeri reali < x

(j)j , zk > sia convergente per ogni zk fissato. La

successione numerica< xj , z1 >

e limitata in R e quindi esiste una sottosuccessionex

(1)j

tale che

< x(1)j , z1 >

e convergente. Per la stessa ragione, da questa si puo estrarre una sottosuccessionex

(2)j

tale che

< x(2)j , z2 >

e convergente. Procedendo induttivamente si costruisce una sottosuccessionex

(k)j

tale che

< x(k)j , zk >

converge. Per la successione diagonalex

(j)j

abbiamo allora che

< x(j)j , zk >

converge per ogni k.2. Usiamo la densita di zk per mostrare che < x

(j)j , z > converge per ogni z ∈ H. Infatti,

fissati ε > 0 e z ∈ H, possiamo trovare zk tale che ‖z − zk‖ < ε. Scriviamo

< x(j)j − x(m)

m , z >=< x(j)j − x(m)

m , z − zk > + < x(j)j − x(m)

m , zk >

11Al quale del resto ci si pua sempre ricondurre considerando, anziche H, la chiusura H0 del sottospaziogenerato dalle combinazioni lineari finite di elementi della successione.

12Usiamo lo stesso indice j per le successioni estratte.

36

Page 39: Libro - Analisi Funzionale - Matematica

Se j ed m sono abbastanza grandi, il secondo termine a secondo membro e minore di ε poiche< x

(j)j , zk > e convergente. Per il primo termine, dalla disuguaglianza di Schwarz si ha∣∣∣< x

(j)j − x(m)

m , z − zk >∣∣∣ ≤ ∥∥∥x(j)

j − x(m)m

∥∥∥ ‖z − zk‖ ≤ 2Mε

Se quindi j ed m sono abbastanza grandi, abbiamo∣∣∣< x(j)j − x(m)

m , z >∣∣∣ ≤ (2M + 1)ε

per cui la successione < x(j)j − x

(m)m , z > e fondamentale in R e percio convergente.

3. Usiamo il teorema di Riesz per identificare il limite debole della successionex

(m)m

.

Definiamo un funzionale lineare T su H ponendo

Tz = limj→∞

< x(m)m , z >

Poiche∥∥∥x(m)

m

∥∥∥ ≤M , si ha|Tz| ≤M ‖z‖

per cui T ∈ H ′. Dal teorema di rappresentazione, esiste alora x∞ ∈ H tale che

Tz =< x∞, z > ∀z ∈ H

Si ha percio< x(m)

m , z >→< x∞, z > ∀z ∈ H

ossia chex(m)m x∞

Procedendo come nell’ultima parte della dimostrazione precedente si dimostra la seguenteproprieta di completezza debole. Diciamo che xn e una successione di Cauchy debole in Hse la successione di numeri reali < xk, z > e di Cauchy per ogni z ∈ H.

Teorema 5.5. Ogni successione xn di Cauchy debole in uno spazio di Hilbert H,converge debolmente ad un elemento x di H.

L’enunciato sembra, a prima vista ... tautologico. In realta, il fatto che le successioninumeriche < xn, z > siano convergenti per ogni z potrebbe, in linea di principio, non implicarel’esistenza di x ∈ H, che rappresenti tutti i limiti, ossia tale che < xn, z >→ < x, z > . Manegli spazi di Hilbert vale il teorema di rappresentazione!

Esempio 5.4. Un importante esempio di spazio di Hilbert separabile e L2 (Ω), Ω aperto diRn. Il teorema 5.3 implica, per esempio, che, se ukk≥1 ⊂ L2 (Ω) e una successione limitata,cioe esiste M > 0 tale che

‖uk‖L2(Ω) ≤M per ogni k ≥ 1,

allora esiste una sottosucessione ukmm≥1 u ∈ L2 (Ω) tale che∫Ω

ukmv →

∫Ω

uv per ogni v ∈ L2 (Ω) , m→ +∞

37

Page 40: Libro - Analisi Funzionale - Matematica

1.5.3 Dualita e compattezza negli spazi di Banach

Alcuni concetti e teoremi validi negli spazi di Hilbert si possono estendere, con qualche nec-essaria modifica, agli spazi di Banach.

Definizione 5.2. L’insieme dei funzionali lineari e continui su uno spazio di Banach Xprende il nome di spazio duale di X e si indica col simbolo X ′ oppure X∗.

Dati due funzionali L, G ∈ X ′ si possono definire in modo naturale altri due funzionalinella stessa classe, somma e prodotto per uno scalare:

(G+ L) (x) = Gx+ Lx

(λL)x = λLx

dove x ∈ X e λ ∈ R. L’insieme X ′ risulta cosı dotato di una struttura di spazio vettoriale(reale). Lo si puo normare ponendo

‖L‖X′ = sup‖x‖X=1

|Lx| .

In particolare, avremo|Lx| ≤ ‖L‖X′ ‖x‖X .

Se non sorgono ambiguita, potremo scrivere semplicemente ‖L‖ anziche ‖L‖X′ . Si puomostrare che lo spazio normato cosı ottenuto e completo e quindi:

Proposizione 3.2. X ′ e uno spazio di Banach.

L’esempio piu importante e il seguente.Esempio 5.5. Se X = Lp (Ω), Ω ⊆ Rn, 1 ≤ p ≤ ∞ allora X ′ = Lq (Ω) dove q, esponente

coniugato di p, e assegnato dalla formula

1p

+1q

= 1.

La dualita tra Lp (Ω) e Lq (Ω) e data da:

< u, v >=∫

Ω

uv

In particolare, se p = 1, q = ∞, se p = ∞, q = 1 e se 1 < p <∞, q = p/ (p− 1) .

Definizione 5.3. Sia X ′′ = (X ′)′ il duale di X ′. Se X ′′ = X si dice che X e riflessivo.Esempi 5.6. Il teorema di rappresentazione di Riesz implica che ohni spazio di Hilbert e

riflessivo. Tutti gli spazi Lp con 1 < p <∞ sono riflessivi. L1 e L∞ non lo sono.

L’importanza della riflessivita e dovuta alla validita del seguente teorema di compattezzadebole, estremamente utile nella applicazioni. Ricordiamo che una successione vk ⊂ Xconverge debolmente a v ∈ X se

Lvk → Lv ∀L ∈ X ′.

Una successione debolmente convergente in X e limitata in X.(X separabile?)Teorema A.4 (di Banach-Aloaglu). Se X e una spazio di Banach riflessivo, la sfera

unitaria in X ′ e debolmente compatta.

38

Page 41: Libro - Analisi Funzionale - Matematica

Il teorema afferma sostanzialmente che, se E e un sottoinsieme limitato in X ′, allora daogni successione vk ⊆ E si puo estrarre una sottosuccessione vks

che converge debolmentein X ′ a un elemento v ∈ X ′, e cioe tale che

Lvks → Lv

per ogni elemento del duale di X ′ e cioe X ′′.

Vediamo sull’esempio degli spazi Lpcome si usa la riflessivita. Supponiamo di sapere cheuna successione uk sia limitata in Lp (Ω) , 1 < p < ∞. Lp (Ω) e il duale di Lq (Ω) conq = p/ (p− 1) . Essendo anche 1 < q < ∞, si ha che Lq (Ω) e riflessivo e quindi il duale diLp (Ω) e ancora Lq (Ω). Il teorema implica che esiste una sottosuccessione uks tale che

uks u

e cioe che ∫Ω

uksv →∫

Ω

uv ∀v ∈ Lq (Ω) .

Ricordiamo infine che gli spazi Lp con 1 ≤ p <∞ sono separabili, contengono cioe un sottoin-sieme denso e numerabile.

1.5.4 Operatori compatti

Una importante classe di operatori quella degli operatori che trasportano insiemi limitati ininsiemi relativamente compatti (cioe a chiusura compatta). Precisamente:

Definizione 5.2. Siano H1 e H2 spazi di Hilbert e L ∈ L (H1,H2). L si dice compattose, per ogni insieme limitato E ⊂ H1, l’immagine L (E) e relativamente compatta in H2.

Ogni operatore lineare tra spazi a dimensione finita (rappresentabile da una matrice) ecompatto, poiche trasporta limitati in limitati, che, in dimensione finita sono relativamentecompatti. Per la stessa ragione, anche ogni operatore che ha rango a dimensione finita ecompatto. In generale, vi sono condizioni equivalenti, a volte piu comode della definizioneprecedente per determinare la compattezza di un operatore. Vale infatti il

Microteorema 5.6. L ∈ L (H1,H2) e compatto se e solo se, per ogni successionexk ⊂ H1,

xk 0 in H1 implica Lxk → 0 in H2 (1.19)

Dimostrazione. Supponiamo che valga la (1.19) e sia E ⊂ H1, limitato. Per il teorema 5.4,esiste in E una sottosuccessione yk debolmente convergente a y ∈ H1. Allora xk = yk−y 0in H1 e, per la (1.19), Lxk → 0 in H2. Essendo Lxk ⊂ L (E) concludiamo che L (E) eprecompatto per successioni e quindi precompatto in H2.

Viceversa, sia L compatto e xk 0 in H1. Essendo debolmente convergente, xke limitata in H1 e quindi Lxk contiene una sottosuccessione (che seguitiamo a chiamareLxk) convergente a y ∈ H2. Deve essere y = 0. Infatti, per ogni z ∈ H2,

< Lxk, z >→< y, z >

e, d’altra parte, se L∗ : H2 → H1 e l’aggiunto di L, si ha anche, essendo xk 0,

< Lxk, z >=< xk, L∗z >→ 0

Quindi y = 0. Ma ora, tutta la successione Lxk → 0 e non solo una opportuna sottosuc-cessione. Sia infatti per assurdo Lxkj

→ x 6= 0. Essendo anche xkj 0, possiamo ripetere

39

Page 42: Libro - Analisi Funzionale - Matematica

il ragionamento precedente per questa successione e dedurre che una sottosuccessione di Lxkj

converge a zero. Contraddizione.

Esempi.5.5. Sia H2 (Q) lo spazio di Hilbert introdotto nell’esempio d. della sezione 1. L’mmersione

di H2 (Q) in L2 (Q), definita da

I : H2 (Q) → L2 (Q) Iu = u

e compatta (dimostrarlo usandoil teorema 5.2)13.5.6. Importante: in base al teorema 5.1, l’operatore identita I : H → H e compatto se

e solo se dimH <∞.5.7. Sia Q = (0, 1)× (0, 1) e k ∈ L2 (Q). Definiamo

Lv (x) =∫ 1

0

k (x, y) v (y) dy (1.20)

Si ha: L2 (Q) → L2 (Q) ed L e continuo. Infatti, per il teorema di Fubini, ‖k (x, ·)‖L2(0,1)

e una funzione in L2 (0, 1) per q.o. x ∈ (0, 1) e

|Lv (x)| ≤∫ 1

0

|k (x, y) v (y)| dy ≤ ‖k (x, ·)‖L2(0,1) ‖v‖L2(0,1) (1.21)

che implica Lv ∈ L2 (0, 1). Inoltre∫ 1

0

|Lv (x)|2 dx ≤ ‖k‖L2(Q) ‖v‖L2(0,1)

che mostra la continuita di L. Per controllare la compattezza, usiamo il microteorema 5.6.Sia vk ⊂ L2 (0, 1), tale che vk 0, cioe∫ 1

0

vkw → 0 per ogni w ∈ L2 (0, 1)

Vogliamo provare che Lvk → 0 in L2 (0, 1). Essendo debolmente convergente, la successionevk e limitata, per cui esiste M tale che ‖vk‖L2(0,1) ≤M per ogni k. Dalla (1.21) si ha

|Lvk (x)| ≤M ‖k (x, ·)‖L2(0,1)

Inoltre, inserendo w (·) = k (x, ·) nella (1.20) si deduce che

Lvk (x) =∫ 1

0

k (x, y) vk (y) dy → 0 q.o. in (0, 1)

Il teorema della convergenza dominata implica allora che Lvk → 0 in L2 (0, 1).

Microteorema 5.7. Sia L : H1 → H2 compatto. Allora

a) l’aggiunto L∗ : H2 → H1 e compatto.

b) Se G ∈ L (H2,H3) oppure G ∈ L (H0,H1) le composizioni G L oppure L G sonocompatte, rispettivamente.

13Usare la disuguaglianza ∣∣eit − 1∣∣ ≤ t2

40

Page 43: Libro - Analisi Funzionale - Matematica

Dimostrazione. a). Usiamo il microteorema 5.6. Sia xn ⊂ H2, xn 0. Abbiamo:

‖L∗xn‖2H1=< L∗xn, L

∗xn >=< xn, LL∗xn >

Essendo L∗ ∈ L (H2,H1) si ha L∗xn 0 inH1 e allora, per la compattezza di L, L(L∗xn) → 0.Poiche ‖xn‖H2

≤M , abbiamo infine

‖L∗xn‖2H1=< L∗xn, L

∗xn >=< xn, LL∗xn >≤M ‖LL∗xn‖H2

→ 0

b) E’ facile e la lasciamo come esercizio.

1.6 Teorema dell’alternativa di Fredholm

Sia A una matrice quadrata di ordine n e sia AT la sua trasposta. Consideriamo i 4 sistemilineari

Ax = b, ATy = c (1.22)

Ax = 0, ATy = 0. (1.23)

Dall’Algebra sappiamo che vale la seguente alternativa:o entrambi i sistemi (1.22) hanno una soluzione per ogni b, c ∈ Rn oppure entrambi i

sistemi omogenei (1.23) hanno soluzioni non banali.Se detA 6=0 siamo nel primo caso; se detA =0 allora

dimN (A) = dimN (A) = d > 0.

Nel secondo caso, essendo

N(AT)

= R (A)⊥ , N (A) = R(AT)⊥

si vede che, affinche i sistemi Ax = b e Ay = c siano risolubili, b e c devono soddisfare dcondizioni lineari : l’ortogonalita con gli elementi di una base di N (AT ) e di N (A), rispetti-vamente.

Il risultato che generalizza tale alternativa si chiama teorema dell’alternativa di Fredholm,che noi tratteremo nell’ambito degli spazi di Hilbert. Accenneremo alla fine della sezionead una possibile estensione negli spazi di Banach. Un uso particolarmente importante diquesto teorema e quello di stabilire condizioni di risolubilita di certi problemi al contorno perequazioni a derivate parziali. Per esempio, vedremo che per la risolubilita del problema diNeumann

−∆u = f in Ω∂νu = g su ∂Ω

una condizione necessaria e suffuciente e∫Ω

f +∫∂Ω

g = 0

Questa condizione ha un preciso significato fisico ma anche un significato matematico profondo,che ha le sue radici ... nell’Algebra Lineare!

41

Page 44: Libro - Analisi Funzionale - Matematica

1.6.1 Un esempio preliminare

Siano Q = (0, 2π) × (0, 2π) e f ∈ L2 (Q). Proviamo a risolvere il problema (per ora un poaccademico ...)

∆u+ λu = f in Q (1.24)

con u periodica di periodo 2π in entrambe le direzioni: u = (x1 + 2π, x2 + 2π) = u (x1, x2).E’ naturale ambientare il problema nell’ambito dello spazio H2 (Q), introdotto nell’esempio1.8. Sviluppiamo u ed f in serie di Fourier

u(x1, x2) =∑m,n

um,nei(mx1+nx2) f(x1, x2) =

∑m,n

fm,nei(mx1+nx2)

con m,n interi relativi. Inserendo queste espressioni nella (1.24) ed uguagliando i coefficientidi Fourier, si trovano le infinite equazioni

(λ− [m2 + n2])um,n = fm,n m,n interi relativi (1.25)

Se λ 6= m2 + n2 per ogni m,n allora ricaviamo

um,n = (λ− [m2 + n2])−1fm,n (1.26)

Queste relazioni definiscono univocamente la soluzione di (1.24) in H2 (Q) (perche ?) edinoltre e facile dimostrare che

‖u‖H2 ≤ C ‖f‖L2

dove C = inf (λ−[m2+n2]). L’operatore T = ∆+λ realizza in questo caso una corrispondenzabiunivoca e bicontinua (isomorfismo) tra H2 (Q) e L2 (Q).

Supponiamo invece che λ = m2 + n2 per qualche m,n. Osserviamo tre cose: primo, datoλ ≥ 0, l’equazione λ = m2+n2 e risolta da un numero finito di coppie di interi m,n. Secondo,la risolubilita di (1.25) implica che, in corrispondenza di queste coppie, deve essere

fm,n =∫Q

f (x1, x2) e−i(mx1+nx2)dx1dx2 = 0 (1.27)

nel qual caso, i corrispondenti um,n hanno valore arbirario. Terzo, le funzioni e−i(mx1+nx2)

coincidono con le soluzioni non banali dell’equazione omogenea

∆u+ λu = 0 in Q (1.28)

e la (1.27) esprime l’ortogonalita di f con queste funzioni.Se dunque λ = m2 + n2 (questi λ si chiamano autovalori) il problema non e sempre

risolubile e quando lo e vi sono infinite soluzioni. Sintetizziamo nel seguente teorema, doveabbiamo indicato con Λ l’insieme dei valori m2 + n2, m,n interi relativi.

Microteorema 6.1. Vale l’alternativa:

i) Se λ /∈ Λ, la (1.24) ha un’unica soluzione u ∈ H2 per ogni f ∈ L2

ii) Se λ ∈ Λ, la (1.28) ha un numero finito di soluzioni non banali linearmente indipendentiv1, v2, ..., vk e (1.24) e risolubile se e solo se f e ortogonale ad ognuna delle vj , j = 1, 2, ..., k.

Interpretiamo il microteorema in modo piu astratto. Gli ingredienti sono:— un operatore differenziale lineare ∆ : H2 ⊂ L2 (Q) → L2 (Q)— l’equazione (∆ + λI) u = f

42

Page 45: Libro - Analisi Funzionale - Matematica

— l’equazione omogenea associata (∆ + λI) u = 0Sia λ0 /∈ Λ e L = ∆ + λ0. Allora esiste L−1 : L2 (Q) → H2 ⊂ L2 (Q). Possiamo scrivere

∆ + λ = L − (λ− λ0) I e la (1.24) nel modo seguente:

I − (λ− λ0)L−1 = L−1f

Osserviamo ora che, come operatore da L2 (Q) in L2 (Q), L−1 e compatto poiche l’immersionedi H2 in L2 (Q) e compatta. Inoltre L−1 e autoaggiunto. Infatti, come nell’esempio 1.8,usando le (1.26):

< L−1f, g >L2=∫Q

(L−1f) g =∑m,n

(λ− [m2 + n2])−1fm,ng−m,−n

=∑m,n

fm,n(λ− [m2 + n2])−1g−m,−n =∫Q

f (L−1g) =< f,L−1g >L2

Conclusione. Abbiamo un’equazione del tipo:

(I − µK)u = g

con K: H → H, compatto ed autoaggiunto. Dal microteorema,

il nucleo di I − µK, N (I − µK) , ha dimensione finita

ed infinel’immagine di I − µK, R (I − µK) , coincide con N (I − µK)⊥ .

Da qui l’alternativa: o l’equazione (I − µK)u = f ha una soluzione per ogni g oppurel’equazione (I − µK)u = 0 ha soluzioni non banali.

1.6.2 Il teorema dell’alternativa

Introduciamo prima un po di terminologia, il cui significato dovrebbe essere chiaro dopo leultime considerazioni del paragrafo precedente.

Sia Φ : V1 → V2, con V1, V2 spazi di Hilbert. Diciamo che Φ e un operatore di Fredholm seN (Φ) e R (Φ)T hanno dimensione finita.Definiamo l’indice di Φ con la formula

ind (Φ) = dimN (Φ)− dimR (Φ)T = dimN (Φ)− dimN (Φ∗)

L’indice e una misura di quanto l’operatore e distante dall’essere una corrispondenza biunivoca.

Teorema 6.2 (di Fredholm). Siano V uno spazio di Hilbert (reale) e K : V → V unoperatore compatto. Allora

Φ = I −K

e un operatore di Fredholm con indice zero. Inoltre R (Φ) e chiuso, Φ∗ = I −K∗,

R (Φ) = N (Φ∗)⊥ (1.29)

eN (Φ) = 0 ⇐⇒ R (Φ) = V. (1.30)

Note

43

Page 46: Libro - Analisi Funzionale - Matematica

6.1. L’ultima formula indica che Φ e iniettivo se e solo se e suriettivo. Ovvero, perl’equazione x−Kx = f , l’unicita della soluzione implica l’esistenza di una soluzione per ognif ∈ V e viceversa. Basta allora verificare una delle due! La stessa cosa capita per l’aggiuntoΦ∗ = I −K∗ e per la relativa equazione y −K∗y = g.

6.2. Sia d = dimR (Φ)T = dimN (Φ∗) > 0. La (1.29) indica che l’equazione x−Kx = fe risolubile se e solo se f ⊥ N (Φ∗), cioe se e solo se < f, y >= 0 per ogni y soluzione diy −K∗y = 0. Cio si traduce in d relazioni lineari indipendenti per f .

6.3. Il teorema vale naturalmente anche nel caso di operatori della forma

K − λI

con λ 6= 0. Il caso λ = 0 non si puo includere nel teorema. Banalmente, l’operatore K = 0(che e compatto) ha nuleo coincidente con tutto H e quindi, se dimH = ∞, il teorema nonvale. Ma vi sono casi piu significativi. Per esempio, basta prendere l’operatore (con immagineunidimensionale, quindi compatto) dato da

Kx = L (x)x0

dove L e un funzionale lineare continuo su H, che supponiamo a dimensione infinita. Il nucleodi K e costituito dagli elementi x ∈ H tali che

Kx = L (x)x0 = 0.

Dal teorema di Riesz, esiste z ∈ H tale che L (x) =< z, x >. Il nucleo N (K) coincide quindicon il sottospazio ortogonale a z, che ha dimensione infinita.

Dimostrazione14 1. N (Φ) ha dimensione finita. Se non fosse vero possiamo determinare15

una successione infinita di vettori ortonormali xn ∈ N (Φ) : ‖xn‖ = 1 e < xn, xm >= δmn,per ogni m,n, ed inoltre

Kxn = xn. (1.31)

Se m 6= n,‖xm − xn‖2 = ‖xm‖2 − 2 < xm, xn > + ‖xn‖2 = 2

e da (1.31)‖Kxm −Kxn‖ =

√2.

Ma allora la successione Kxn non contiene sottosuccessioni convergenti, contro la compat-tezza di K.

2. Ristretto a N (Φ)⊥, Φ e iniettivo (fatto per lo meno intuitivo ...). Esiste cioe un numeroC > 0 tale che

‖x‖ ≤ C ‖Φx‖ , per ogni x ∈ N (Φ)⊥ . (1.32)

Infatti, se non fosse vero, potremmo determinare una successione infinita di vettori xn ∈N (Φ)⊥ tali che ‖xn‖ = 1 e ‖Φxn‖ → 016. Poiche K e compatto, possiamo estrarre da Kxnuna sottosuccessione che continuiamo a chiamare Kxn, convergente ad un punto x. Essendo

xn = Φxn +Kxn e Φxn → 0,14Un po laboriosa. Si puo saltare in prima lettura.15Con il procedimento di Gram-Schmidt, per esempio.16Se la (1.32) non e vera, dato n ∈ N , esiste yn tale che ‖yn‖ > n ‖Φyn‖. Poniamo xn = yn/ ‖yn‖. Allora

‖xn‖ = 1 e ‖Φxn‖ < 1/n.

44

Page 47: Libro - Analisi Funzionale - Matematica

si vede che xn converge allo stesso x e che

x = Kx.

Abbiamo, dunque che x appartiene a N (Φ) ma anche a N (Φ)⊥ poiche N (Φ)⊥ e chiuso.Essendo N (Φ) ∩N (Φ)⊥ = 0 e deve essere x = 0, che contraddice ‖x‖ = lim ‖xn‖ = 1.

3. R (Φ) e chiuso e quindi17 R (Φ) = N (Φ∗)⊥, che prova la (1.29). Sia infatti yn =Φxn → y. Vogliamo mostrare che esiste w tale che Φw = y. Dal teorema di proiezione,possiamo scrivere

xn = wn + zn con wn ∈ N (Φ)⊥ e zn ∈ N (Φ) .

Dunque, anche Φwn → y. Da (1.32) si ricava che

‖wm − wn‖ ≤ C ‖yn − ym‖ .

Pertanto wn e di Cauchy e wn → w. Per la continuita di Φ, Φwn → Φw da cui Φw = y.

4. R (Φ)T ha dimensione finita. Infatti, R (Φ)T = N (Φ∗) che ha dimensione finita per ilpunto 1 (con Φ∗ al posto di Φ). Dunque, Φ e Φ∗ sono operatori di Fredholm.

5. Mostriamo ora la (1.30). Sia N (Φ) = 0; allora Φ e una corrispondenza biunivoca traV e V1 = R (Φ), che e un sottospazio chiuso per il punto 3. Se V1 ⊂ V , deve allora essereV2 = Φ(V1) ⊂ V1, V3 = Φ(V2) ⊂ V2, ..., Vk = Φ (Vk−1) ⊂ Vk−1, ... .

Abbiamo cosı costruito una successione Vk di sottospazi chiusi, ciascuno strettamentecontenuto nel precedente. Scegliamo18 xk ∈ Vk con ‖xk‖ = 1 e xk ∈ V ⊥k+1. Ora, per n > m siha,, aggiungendo e togliendo xn ed xm:

Kxn −Kxm = −Φxn + Φxm + xn + xm.

Ma, essendo n > m, si haΦxn, Φxm, xn ∈ Vm+1

mentre xm ∈ V ⊥m+1. Allora

‖Kxn −Kxm‖2 = ‖−Φxn + Φxm + xn‖2 + ‖xm‖2 ≥ ‖xm‖2 = 1

e quindi la successione Kxn non puo contenere successioni convergenti, contro la compat-tezza di K. Deve dunque essere V1 = R (Φ) = V .

Sia ora R (Φ) = V . Allora N (Φ∗) = R (Φ)T = 0. Essendo K∗ compatto, dalladiscussione precedente si ha R (Φ∗) = V . Questo implica a sua volta che N (Φ) = R (Φ∗)⊥ =0.

6. Rimane da mostrare che ind(Φ) = 0. Basta far vedere che

dimN (Φ∗) ≤ dimN (Φ) (1.33)

Infatti, applicando la (1.33) a Φ∗ e ricordando che Φ∗∗ = Φ, si ricava la disuguaglianza opposta.Supponiamo per assurdo che dimN (Φ∗) > dimN (Φ). Allora esiste una trasformazione lineare

A : N (Φ) → N (Φ∗)

17Teorema 3.3.18In base al teorema delle proiezioni.

45

Page 48: Libro - Analisi Funzionale - Matematica

iniettiva ma non suriettiva, e continua in quanto opera tra spazi a dimensione finita. Sia Pla proiezione di V su N (Φ) e poniamo

T = K +A P : V → V

Osserviamo che T e compatto come somma di operatori compatti19. Facciamo vedere cheI − T e iniettivo. Sia infatti y ∈ N (I − T ), cioe una soluzione di

y −Ky −A Py = 0.

Essendo y −Ky = Φy ∈ R (Φ) e A Py ∈ N (Φ∗) = R (Φ)T si deduce che

y −Ky = 0 e A Py = 0. (1.34)

Dunque y ∈ N (Φ) ed allora Py = y che implica, per la seconda delle (1.34), Ay = 0. EssendoA iniettivo, deve essere y = 0 e quindi I − T e iniettivo. Applicando il punto 5 a I − T sideduce che R (I − T ) = V . Ma questo e impossibile perche, se w ∈ N (Φ∗) \R (A), l’equazione

v − Tv = w

ossiav −Kv −A Pv = w

non ha soluzione, essendo v −Kv ∈ R (Φ) = N (Φ∗)⊥ e A Pv ∈ R (A).

1.6.3 Alternativa per problemi variazionali astratti

Abbiamo gia visto nella sezione 5.1 un esempio di alternativa. Vediamo ora come si puo usarequesto teorema in riferimento ai problemi variazionali astratti della sezione 3,

a (u, v) = Fv ∀v ∈ V (1.35)

quando non funziona il teorema di Lax-Milgram20. Occorre inquadrare bene il problema perevitare confusioni. In riferimento al problema (1.35) abbiamo due spazi di Hilbert: V , doveandiamo a cercare le soluzioni, e V ′ dove e assegnato il dato F . Introduciamo un terzo spazio,intermedio tra V e V ′, che chiamiamo H. Nei problemi differenziali, di solito H = L2 (Ω),con Ω dominio limitato in Rn, mentre V e un suo sottospazio, i cui elementi sono funzioniche hanno un opportuno numero di derivate e che soddisfano qualche condizione al bordo. Insostanza, abbiamo una terna V , H, V ′, e vogliamo che:

1. V ⊂ H, con immersione compatta. Cio significa che l’operatore identita da V ad H,

I1 : V → H;u 7→ u

e compatto. In particolare e anche continuo, per cui esiste un numero C tale che

‖u‖H ≤ C ‖u‖V ∀u ∈ V (1.36)

2. V e denso in H.19A P ha immagine a dimensione finita, percio, essendo continuo, e automaticamente compatto.20Solitamente a causa della non coercivita della forma bilineare.

46

Page 49: Libro - Analisi Funzionale - Matematica

Usando il teorema di Riesz, identifichiamo H col suo duale H ′. Possiamo ora immergere Hin V ′, considerare cioe ogni elemento di H come elemento di V ′. Questo si puo fare osservandoprima che, fissato u ∈ H, il funzionale

v 7→< u, v >

e continuo in V . Cio segue dalla disuguaglianza di Schwarz e dalla (1.36), infatti

|< u, v >| ≤ ‖u‖ ‖v‖ ≤ (C ‖u‖) ‖v‖V (1.37)

Quindi ad u e associato un unico elemento di V ′. Chiamiamolo I2u. Facciamo vedere chela corrispondenza e iniettiva. Infatti, se I2u = 0, dalla densita di V in H si ricava u = 0(perche?). L’operatore I2 : u ↔ I2u identifica dunque u come elemento di V ′. Cio autorizzaa scrivere u anziche I2u. Possiamo cioe pensare u come elemento di H o H ′, oppure comeelemento di V ′.

Si puo poi dimostrare che V e H sono densi in V ′. Sotto le condizioni 1,2 abbiamo percio

V ⊂ H ⊂ V ′

e chiamiamo (V,H, V ′) terna Hilbertiana. Abbiamo gia osservato che l’identificazione di Hcon H ′ proibisce di identificare V con V ′. Per semplificare le formule, poniamo

‖·‖ = ‖·‖H < ·, · >=< ·, · >H e < ·, · >∗= V ′ < ·, · >V

Notiamo che allora, per ogni u ∈ H, v ∈ V , si ha

< I2u, v >∗=< u, v >∗=< u, v > (1.38)

e la (1.37) indica che l’immersione H in V ′ e continua, essendo ‖I2u‖V ′ ≤ C ‖u‖.Questa e l’ambientazione giusta. Abbiamo ancora bisogno di introdurre la forma bilineare

a∗, aggiunta della a, data daa∗ (u, v) = a (v, u)

Teorema 6.3. Sia (V,H, V ′) terna Hilbertiana tale che l’immersione di V in H sia com-patta. Siano F ∈ V ′ e a una forma bilineare su V tale che:

i) a e continua

ii) a e debolmente coerciva; esistono cioe λ0 ∈ R e α > 0 tali che

a (v, v) + λ0 ‖v‖2 ≥ α ‖v‖2V ∀v ∈ V

Siano poi Na e Na∗ , rispetttivamente, i sottospazi delle soluzioni dei due problemi omogenei(autospazi)

a (u, v) = 0 ∀v ∈ V e a∗ (w, v) = 0 ∀v ∈ V

Allora:a)

dimNa = dimNa∗ = d <∞

b) Il problemaa (u, v) =< F, v >∗ ∀v ∈ V

ha soluzione se e solo se < F,w >∗= 0 per ogni w ∈ Na∗ .

47

Page 50: Libro - Analisi Funzionale - Matematica

La dimostrazione, ancorche istruttiva, e piuttosto delicata21 e si puo saltare senza rischiper la compensione futura. Conviene premettere alcune osservazioni. Se a e quindi anche a∗sono continue, come nella dimostrazione del teorema di Lax-Milgram, ad esse sono associatidue operatori lineari L ed L∗ ∈ L (V, V ′) tali che

< Lu, v >∗= a (u, v) < L∗u, v >∗= a∗(u, v).

Gli asterischi sono messi in basso anziche in alto perche L∗ non e l’aggiunto22 di L, chetra l’altro, opera tra V ′ e V . Per calcolare l’aggiunto L∗ ricorriamo all’operatore di Riesz(isometria canonica di V ′ in V ) J : V ′ → V . Per ogni F ∈ V ′, si ha

Fv =< F, v >∗=< JF, v >V ∀v ∈ V.

L’aggiunto di L e L∗ = JL∗J : V ′ → V . Infatti, per ogni F ∈ V ′ e u ∈ V abbiamo, perdefinizione di aggiunto e di prodotto scalare in V ′,

< L∗F, u >V =< F,Lu >V ′=< JF, JLu >V =< JLu, JF >V .

Per il teorema di rappresentazione e la definizione di L e L∗,

=< Lu, JF >∗= a (u, JF ) = a∗ (JF, u) =< L∗JF, u >∗=< JL∗JF, u >V

e quindi< L∗F, u >V =< JL∗JF, u >V

da cui L∗ = JL∗J .Oltre alle due immersioni I1 : V → H e I2 : H → V ′ conviene introdurre l’immersione

(continua) I3 : V → V ′. Si puo naturalmente scrivere23 I3 = I2I1. indichiamo poi con IVl’identita in V . Siamo ora pronti per la prova.

Dimostrazione. La forma bilineare b (u, v) = a (u, v) + λ0 < u, v > e continua e coercivae quindi, se Z ∈ V ′, per il teorema di Lax-Milgram, esiste un’unica soluzione u ∈ V delproblema

b (u, v) =< Z, v >∗ ∀v ∈ V.

L’operatore L0 ∈ L (V, V ′), associato alla forma bilineare b, tale cioe che

< L0, v >∗= b (u, v) ∀v ∈ V,

e dunque un isomorfismo; essendo I3 = I2I1, in virtu della (1.38), si puo scrivere L0 = L+λ0I3.Scriviamo ora l’equazione a (u, v) =< F, v >∗nella forma

b (u, v) =< λ0I3u+ F, v >∗, ∀v ∈ V

ovveroL0u = λ0I3u+ F

che a sua volta equivale au− λ0L

−10 I3u = L−1

0 F.

Ponendo poi g = L−10 F e

K = λ0L−10 I3 : V → V,

21Consigliata agli spiriti forti.22Si chiama aggiunto formale.23Scriviamo semplicemente FG anziche F G per la composizione di due operatori, quando non sorgano

confusioni.

48

Page 51: Libro - Analisi Funzionale - Matematica

l’equazione diventa(IV −K)u = g.

L’operatore K e compatto. Infatti, indichiamo come sopra l’immersione di V in H con I1 el’immersione di H in V ′ con I2. Allora se u ∈ V , si puo scrivere:

Ku = λ0L−10 I2I1u

secondo lo schema

uI17−→ u

I27−→ uλ0L

−107−→ Ku.

Essendo I2 , λ0L−10 continue ed I1 compatta si deduce che24 K e compatto. Possiamo allora

usare il teorema dell’alternativa per K e dedurre che

dimN (IV −K) = dimN (IV −K∗) = d <∞.

Ma w −Kw = 0 equivale aw − λ0L

−10 I3w = 0

cioeL0w − λ0I3w = 0

cioea (w, v) = 0, ∀v ∈ V

percioN (IV −K) = Na.

Essendo poiIV −K = IV − λ0L

−10 I3 = L−1

0 (L0 − λ0I3) = L−10 L,

si ha, ricordando che L∗ = JL∗J ,

(IV −K∗) = L∗(L−10 )∗ = JL∗J(L−1

0 )∗. (1.39)

Ora, a∗ (w, v) = 0 per ogni v ∈ V equivale ad L∗w = 0. Dalla (1.39)

L∗ = J−1(IV −K∗)L∗0J−1

e quindi, essendo J un isomorfismo tra V ′ e V ,

L∗w = 0 se e solo se (IV −K∗)L∗0J−1w = 0

ovverow ∈ N (L∗) = Na∗ se e solo se L∗0J

−1w ∈ N (IV −K∗) . (1.40)

Essendo anche L∗0 J−1 un isomorfismo da V su V , i due nuclei Na∗ e N (IV −K∗) hanno la

stessa dimensione e cosı a) e provata.Abbiamo poi R (IV −K) = N (IV −K∗)⊥. Cio significa che l’equazione

u−Ku = z

e risolubile se e solo se < z, v >V = 0 per ogni v ∈ N (IV −K∗). Se F ∈ V ′ e z = L−10 F ,

otteniamo< L−1

0 F, v >V = 0 ∀v ∈ N (I −K∗)

24Microteorema 5.7.

49

Page 52: Libro - Analisi Funzionale - Matematica

Dalla (1.40) si puo scrivere

v = L∗0J−1w con w ∈ Na∗

e percio, per definizione di aggiunto,

< L−10 F, v >V =< L−1

0 F,L∗0J−1w >V =< F, J−1w >V ′=< F,w >∗= Fw

che conclude la dimostrazione di b).

1.7 Spettro di un operatore compatto

1.7.1 Spettro di una matrice

Siano A e una matrice quadrata di ordine n e λ un numero complesso. Allora, o l’equazionel’equazione

Ax−λx = b

ha un’unica soluzione per ogni b oppure esiste un vettore u 6= 0 tale che Au =λu. Inquest’ultimo caso si dice allora che λ,u costituiscono una coppia autovalore−autovettore.L’insieme degli autovalori si chiama spettro della matrice A; indichiamolo con σP (A). Seλ /∈ σP (A) e quindi ben definita la matrice risolvente (A−λI)−1. L’insieme ρ (A) = C\σP (A)si chiama risolvente di A. Se λ ∈ σP (A) il nucleo N (A−λI) e il sottospazio generato dagliautovettori di A associati a λ e prende il nome di autospazio di A associato a λ. Si noti cheσP (A) = σP (Aᵀ). Un caso particolarmente importante e quello delle matrici simmetriche:tutti gli autovalori λ1, ...λn sono reali (non necessariamente distinti) ed esiste in Rn una baseortonormale di autovettori u1, ...,un. L’azione di A si scompone nella somma delle proiezionisui suoi autospazi secondo la formula25 (decomposizione spettrale di A):

A = λ1u1u>1 + λ1u2u>2 + ...+ λnunu>n .

Vogliamo generalizzare questi concetti nell’ambito degli spazi di Hilbert. Una motivazione e... il metodo di separazione di variabili, che abbiamo gia avuto modo di usare piu volte inmaniera naıf.

1.7.2 Separazione delle variabili

Abbiamo visto che il metodo di separazione delle variabili porta a costruire soluzioni di prob-lemi al contorno per sovrapposizione di soluzioni particolari. Nel caso dell’equazione di dif-fusione queste ultime sono onde stazionarie. Il loro calcolo esplicito, d’altra parte, si puoeffettuare solo in presenza di geometrie particolari. Che cosa si puo dire in generale? Vedi-amolo su un esempio accademico.

Esempio 7.1. Sia da risolvere in Ω ⊂ R2, dominio limitato, il problema. ut = ∆u (x, y) ∈ Ω, t > 0u (x, y, 0) = g (x, y) (x, y) ∈ Ωu (x, y, t) = 0 (x, y) ∈ ∂Ω, t > 0

Cerchiamo soluzioni della forma

u (x, y, t) = v (x, y)w (t)

25Gli uj sono vettori colonna; uju>j e una matrice n× n.

50

Page 53: Libro - Analisi Funzionale - Matematica

Sostituendo e riarrangiando i termini nel solito modo si trova

w′ (t)w (t)

=∆v (x, y)v (x, y)

= −λ λ > 0

che conduce ai due problemiw′ + λw = 0 t > 0

e −∆v = λv in Ωv = 0 su ∂Ω (1.41)

Un valore λ per cui esiste una soluzione non identicamente nulla v del problema (1.41) sidice autovalore di Dirichlet dell’opertore −∆ in Ω e v e un’autofunzione corrispondente. Ilproblema originale si puo risolvere se:

a) Esiste una successione di autovalori (reali) λn con autofunzioni corrispondenti un. Incorrispondenza ad ogni λn si trova

wn (t) = Ane−λnt An ∈ R

b) Si puo costruire la candidata soluzione come

u (x, y, t) =∑

Ane−λntun (x, y)

con la serie che converge in qualche senso opportuno e con i coefficienti An ancora dascegliere.

c) Il dato iniziale g puo essere ”sviluppato” in serie di autofunzioni: g (x, y) =∑gnun (x, y).

Scegliendo allora An = gn si soddisfa anche la condizione iniziale.L’ultima condizione richiede sostanzialmente che l’insieme delle autofunzioni di −∆ costi-

tuisca una base (meglio se ortonormale) per lo spazio dei possibili dati iniziali. Cio conducein modo naturale ad affrontare il problema dello spettro di un operatore lineare in uno spaziodi Hilbert, esaminando in particolare il caso di operatori compatti.

1.7.3 Risolvente e spettro. Operatori compatti

Definiamo risolvente e spettro di un operatore lineare e continuo. Ci limitiamo a sottoinsiemi diR perche e il caso che ci interessa qui, anche se l’ambientazione naturale (e talvolta necessaria)sarebbe in C.

Definizioni 7.1. Sia L ∈ L (H), H spazio di Hilbert reale e I l’identita in H.

a) L’insieme risolvente di L e l’insieme dei numeri reali λ tali che L − λI e iniettivo esuriettivo:

ρ (L) = λ ∈ R : L− λI e iniettivo e suriettivo

b) Lo spettro (reale) di L eσ (L) = R\ρ (L)

c) Gli autovalori di L costituiscono lo spettro puntuale e sono gli elementi λ di σ (L) taliche L− λI non e iniettivo:

σP (L) = λ ∈ σ (L) : N (L− λI ) 6= ∅ .

N (L− λI ) si chiama autospazio associato a λ.

51

Page 54: Libro - Analisi Funzionale - Matematica

Nota 7.1. Se λ ∈ ρ (L), si puo mostrare26 che il risolvente (L− λI)−1 e limitato. Sela dimensione di H e finita lo spettro di un operatore lineare limitato e solo puntuale. Indimensione infinita possono esserci elementi di σ (L) che non sono autovalori.

Esempi.7.2. Questo esempio mostra che, in generale, σP (L) e contenuto strettamente in σ (L).

Sia H = l2. Sia L l’operatore lineare da l2 in l2 che associa a x = x1, x2, ... ∈ l2 l’elementoy = 0, x1, x2, .... Poniamo 0 = 0, 0, 0, .... Si ha:

(L− λI)x = −λx1, x1 − λx2, x2 − λx3, ...

Se λ 6= 0, allora λ ∈ ρ (L) e infatti, per ogni z = z1, z2, ... ∈ l2

(L− λI)−1 z =−z1λ,−z2

λ+z1λ2, ....

Essendo R(L) costituito dalle successioni con primo elemento nullo, L non e suriettivo e quindi0 ∈ σ (L). D’altra parte, essendo Lx = 0 solo quando x e la successione nulla, N (L) = 0 equindi 0 /∈ σP .

7.3. L’operatore L : L2 (R) → L2 (R) defnito da

Lv (x) = v (−x)

ha σ (L) = σP (L) = 1. Lasciamo la prova come (utile) esercizio.Una prima immediata proprieta degli autovalori e che ad autovalori distinti corrispondono

autovettori linearmente indipendenti. Precisamente:Microteorema 7.1 Sia L ∈ L (H) e siano u1, u2, ..., uk autovettori associati rispettiva-

mente agli autovalori λ1, λ2, ..., λk. Se gli autovalori sono tutti distinti tra loro, gli autovettorisono linearmente indipendenti (generano un sottospazio di dimensione k).

Dimostrazione. Procediamo per induzione, a partire dal caso banale k = 1. Supponiamovero l’enunciato per k e dimostriamolo per k + 1. Sia, per assurdo,

uk+1 =k∑j=1

αjuj

Allora,

Luk+1 =k∑j=1

αjLuj =k∑j=1

αjλjuj

Ma anche

Luk+1 = λk+1uk+1 =k∑j=1

αjλk+1uj

Sottraendo si trovak∑j=1

αj(λj − λk+1)uj = 0

che, per l’ipotesi di ricorrenza, implica αj(λj −λk+1) = 0 e quindi αj = 0 per ogni j = 1, .., k.Contraddizione.

26Conseguenza del Teorema del grafico chiuso: Se il grafico dell’operatore lineare A : H1 → H2 e chiuso inH1 ×H2 allora A e continuo.

52

Page 55: Libro - Analisi Funzionale - Matematica

Il caso che ci interessa maggiormente e quello degli operatori compatti in spazi di Hilberta dimensione infinita.

Teorema 7.2. Spettro di un operatore compatto. Sia L : H → H, compatto, dimH = ∞.Allora

a) 0 ∈ σ (L)b) σ (L) \ 0 = σP (L) \ 0c) σP (L) \ 0 e un insieme con un numero finito di elementi oppure e una successione che

tende a zero.

Nota 7.1. Lo spettro contiene dunque sempre il valore zero, che potrebbe essere o nonessere un autovalore. Gli altri elementi dello spettro sono comunque autovalori che, se infiniti,costituiscono una successione tendente a zero. Se λ e un autovalore non nullo, il teoremadell’alternativa si applica a L − λI, ed in particolare, l’autospazio corrispondente a λ, cioeN (L− λI), ha dimensione finita.

Dimostrazione. a) Sia 0 /∈ σ (L). Allora L e biunivoco da H su H e quindi esiste L−1. Maallora scrivendo I = L L−1, l’operatore identita I risulta compatto come composizione di unlimitato e di un compatto27. In base al teorema 5.1 si ha dimH <∞, contro l’ipotesi.

b) Sia λ ∈ σ (L) \ 0. Se λ /∈ σP (L) allora N (L− λI) = 0 e, per l’alternativa diFredholm, R (L− λI) = H. Ma allora λ ∈ ρ (L); contraddizione.

c) Sia µn una successione di elementi distinti di σ (L) \ 0 tale che µn → µ. Facciamovedere che µ = 0. Sia Hn il sottospazio generato dagli autovettori u1, ..., un, corrispondenti aµ1, ..., µn. Allora Hn Hn+1, poiche i vettori u1, ..., un, ... sono indipendenti (per il microte-orema 7.1). Possiamo cosı scegliere, per ogni n ≥ 1, un elemento vn ∈ Hn tale che ‖vn‖ = 1e vn ⊥ Hn−1. Osserviamo anche che (L − µnI) (Hn) ⊆ Hn−1, essendo (L − µnI)un = 0.Ora, se m < n, si ha Hm−1 Hm ⊆ Hn−1 * Hn e i vettori Lvn − µnvn, Lvm − µmvm, vmappartengono a Hn−1 mentre vn ⊥ Hn−1. Allora:∥∥∥∥Lvnµn − Lvm

µm

∥∥∥∥2

=∥∥∥∥Lvn − µnvn

µn− Lvm − µm

µm− vm + vn

∥∥∥∥2

=∥∥∥∥Lvn − µnvn

µn− Lvm − µm

µm− vm

∥∥∥∥2

+ ‖vn‖2 ≥ 1

Di conseguenza, se µn → µ 6= 0, la successione vn/µn e limitata ma Lvn/µn non puocontenere sottosuccessioni convergenti, contro la compattezza di L.

1.7.4 Operatori compatti autoaggiunti

Nel caso di operatori compatti ed autoaggiunti la teoria si puo ulteriormente raffinare. Com-inciamo col

Microteorema 7.3. Sia K : H → H, compatto ed autoaggiunto. Poniamo

m = inf‖u‖=1

< Ku, u > M = sup‖u‖=1

< Ku, u > .

Allora σ (K) ⊂ [m,M ] e m, M ∈ σ (K).

27Microteorema 5.7.

53

Page 56: Libro - Analisi Funzionale - Matematica

Dimostrazione. Se λ > M , allora < λu−Ku, u >≥ (λ−M) ‖u‖2, percio la forma bilineare

aλ (u, v) =< λu−Ku, v >

e continua e coreciva. Il teorema di Lax-Milgram implica che l’operatore λI −K e un isomor-fismo su H e che quindi λ ∈ ρ (K). Analogamente si prova che, se λ < m, allora λ ∈ ρ (K).Concludiamo che σ (K) ⊂ [m,M ]. Proviamo ora che M ∈ σ (K). Supponiamo per assurdoche M ∈ ρ (K). Sia vn ⊂ H tale che

< Kun, un >→M, ‖un‖ = 1. (1.42)

Si puo scrivereun = (MI −K)−1 (Mun −Kun) . (1.43)

D’altra parte, la forma bilineare aM e anche simmetrica e aM (u, v) ≥ 0, per ogni u, v ∈ H.Possiamo percio definire un nuovo prodotto scalare e una nuova norma in H ponendo

< u, v >M= aM (u, v) =< Mu−Ku, v >, ‖u‖M =√aM (u, u).

La disuguaglianza di Schwarz da allora,

|< Mu−Ku, v >| ≤ |< Mu−Ku, u >|1/2 |< Mv −Kv, v >|1/2 . (1.44)

Poiche M ∈ ρ (K), abbiamo anche che esiste C tale che

|< Mv −Kv, v >| ≤ C ‖v‖2

Dalla (1.44) deduciamo allora28,

‖Mu−Ku‖ ≤ C |< Mu−Ku, u >|1/2

Dalle (1.42) si ha che < Mun − Kun, un >→ 0 e quindi ‖Mun −Kun‖ → 0. Dalla (1.43),si deduce allora che un → 0, n contraddizione con la seconda delle (1.42). Analogamente siprova che m ∈ σ (K).

Nota 7.2. Il microteorema indica che, se K e compatto e autoaggiunto, il minimo e ilmassimo autovalore sono soluzioni del seguente problema di minimo e massimo, rispettiva-mente:

m = infu 6=0

< Ku, u >

‖u‖2M = sup

u 6=0

< Ku, u >

‖u‖2

Il rapporto <Ku,u>‖u‖2 si chiama quoziente di Rayleigh.

Il seguente teorema e di notevole importanza.Teorema 7.4. Siano H uno spazio di Hilbert separabile, K : H → H, compatto ed

autoaggiunto. Allora esiste una base numerabile ortonormale di H (ossia una base Hilbertiana)consistente di autovettori di K.

Dimostrazione. 1. Sia λnn≥1 la successione degli autovalori distinti di K, eccetto 0.Poniamo H0 = N (K), e per n ≥ 1, Hn = N (K − λnI). Dall’alternativa di Fredholm,sappiamo che

0 ≤ dimH0 ≤ ∞ e 0 < dimHn <∞.

28Ricordiamo che‖w‖ = sup

‖v‖=1< w, v >

54

Page 57: Libro - Analisi Funzionale - Matematica

I sottospazi Hn, n ≥ 0, sono a due a due ortogonali. Infatti, siano u ∈ Hn, v ∈ Hm, m 6= n.Allora Ku = µnu, Kv = µmv e

µn < u, v >=< Ku, v >=< u,Kv >= µm < u, v >

che implica < u, v >= 0, essendo µn 6= µm.2. Sia ora V = ∪n≥0Hn, lo spazio generato dall’unione degli Hn, n ≥ 0. Facciamo

vedere che e denso in H (ossia che la sua chiusura topologica e H), mostrando che V ⊥ = 0.Chiaramente si ha K (V ) ⊆ V . Inoltre K

(V ⊥)⊆ V ⊥; infatti, se u ∈ V ⊥ e v ∈ V si ha

< Ku, v >=< u,Kv >= 0.Ora, la restrizione K di K a V ⊥ e un operatore compatto ed autoaggiunto. Deve essere

σ(K) = 0, poiche un autovalore non nullo di K sarebbe automaticamente un autovalore nonnullo di K. Dal microteorema 7.3, si deduce allora che < Ku, u >= 0 per ogni u ∈ V ⊥. Mase u, v ∈ V ⊥, si ha

0 =< K (u+ v) , u+ v > − < Ku, u > − < Kv, v >= 2 < Ku, v >

da cui K = 0. Di conseguenza V ⊥ ⊂ N (K) ⊂ V che implica V ⊥ = 0. Dunque V e densoin H.

3. Da 1 e 2 segue che, se V1 = ⊕n≥1Hn, si ha N (K)⊥V 1 e possiamo scrivere

H = N (K)⊕ V 1.

Di conseguenza, o λ = 0 e un autovalore di K e allora N (K) 6= 0 oppure H = V 1. Aquesto punto scegliamo in ogni autospazio Hn una base ortonormale, osservando che, essendoH separabile29, H0 ha una base ortonormale numerabile. L’unione di queste basi forma unabase ortonormale numerabile di autovettori per H.

Nota 7.3. Una ovvia ma importante conseguenza del teorema 7.4 e la formula di decom-posizione spettrale di K. Se u ∈ H, indichiamo con uλ la sua proiezione sul sottospazio chiusoN (K − λI). Allora valgono le formule

u =∑

λ∈σP (K)

uλ Ku =∑

λ∈σP (K)

λuλ

dove le somme convergono nella norma diH. Piu precisamente, se xkn≥1 e una base ortonor-male di autovettori per V1 = ⊕n≥1Hn, corrispondente percio al complesso degli autovalori nonnulli, si puo descrivere l’azione di K nel seguente modo:

Kx =n≥1 (Kx, xn)xn =n≥1 λk (x, xn)xn, ∀x ∈ H. (1.45)

Inoltre, R (K) coincide con gli elementi y ∈ V1 tali che la somma

n≥1(y, xn)λn

xn

e convergente (dimostrarlo).Non solo; per λ 6= 0 e λ 6= λn per ogni n ≥ 1, si puo descrivere l’azione dell’operatore

inverso (λI −K)−1; infatti, si ha, per ogni y ∈ H,

x = (λI −K)−1y =1λy +n≥1 λn

< y, xn >

λ− λnxn.

29E’ l’unico punto in cui si usa la separabilita di H.

55

Page 58: Libro - Analisi Funzionale - Matematica

Questa formula si ricava come segue; da λx−Kx = y, cioe Kx = λx− y, e dalla (1.45), si ha

λx− y =n≥1 λn < x, xn > xn.

Moltiplicando per xk entrambi i membri, si ottiene

< λx, xk > − < y, xk >= λk < x, xk >

da cui< x, xk >=

< y, xk >

λ− λk

e quindiλx− y =n≥1 λn

< y, xk >

λ− λkxn

che e la formula cercata.

1.7.5 Applicazione ai problemi variazionali astratti

Vediamo qui le conseguenze dei teoremi 7.2 e 7.4 sui problemi variazionali astratti. L’impostazionee quella del teorema 6.3 che prevede una terna Hilbertiana (V,H, V ′), tale che l’immersionedi V in H sia compatta e V sia denso in H, ed una forma bilineare a con la sua simmetricaa∗. Le nozioni di risolvente e spettro si trasportano facilmente. Consideriamo il problema

a (u, v) = λ < u, v > + < F, v >∗ ∀v ∈ V (1.46)

dove F ∈ V ′ e, ricordiamo, < ·, · > e riservato al prodotto scalare in H. L’insieme risolventeρ (a) e l’insieme dei numeri reali λ tali che (1.46) ha una e una sola soluzione uF per ogniF ∈ V ′ e l’applicazione

F 7−→ uF

e un isomorfismo di V ′ su V . Lo spettro e σ (a) = R\ρ (a) e lo spettro puntuale σP (a) e ilsottoinsieme degli autovalori, ossia dei numeri reali λ tali che il problema omogeneo

a (u, v)− λ < u, v >= 0 ∀v ∈ V

ha soluzioni (autosoluzioni) non nulle. Chiamiamo autospazio associato all’autovalore λ lospazio generato dalle corrispondenti autofunzioni e lo indichiamo con Na−λ. Il teoremaseguente e conseguenza dei teoremi dell’alternativa e dei teoremi 7.2, 7.4.

Teorema 7.5 Sia (V,H, V ′) terna Hilbertiana tale che l’immersione di V in H sia com-patta. Siano λ ∈ R, F ∈ V ′ e a una forma bilineare su V ×V continua e debolmente coerciva;esistono cioe λ0 ∈ R e α > 0 tali che

a (v, v) + λ0 ‖v‖2 ≥ α ‖v‖2V ∀v ∈ V

Allora:a) λ ∈ σP (a) se e solo se λ ∈ σP (a∗) e

dimNa−λ = dimNa∗−λ = d <∞

b) Il problema (1.46) ha soluzione se e solo se < F,w >∗= 0 per ogni w ∈ Na∗−λ.c) Lo spettro e puramente puntuale, e contenuto nella semiretta (−λ0,+∞) e, se infinito,

e una successione λn tendente a +∞.

56

Page 59: Libro - Analisi Funzionale - Matematica

d) Se a = a∗ e u, v sono autosoluzioni associate ad autovalori diversi, si ha:

a (u, v) =< u, v >= 0.

Inoltre, in quest’ultimo caso, H ha una base ortonormale numerabile di autosoluzioni un eun/

√λn + λ0

costituisce una base ortonormale in V , rispetto al prodotto scalare definito

da((u, v)) = a (u, v) + λ0 < u, v > .sl (1.47)

Omettiamo la prova, accennando solo alla ragione per la quale gli autovalori costituisconouna successione che tende a +∞. Siano L : V → V ′ associato alla forma bilineare a mediantela formula < Lu, v >∗= a (u, v) e L0 = L + λ0I3, dove I3 e l’immersione di V in V ′. Gliautovalori di a coincidono dunque con gli autovalori di L. La dimostrazione ricalca quella delteorema 6.3 e poi usa il teorema 7.4 per l’operatore K = L−1

0 I3. Se poniamo µ = 1/ (λ+ λ0),si ha l’identita

K − µIV = −µL−10 (L− λI3) (1.48)

la quale indica che gli autospazi di K coincidono con quelli di L. L’operatore K : V → V ecompatto e, nel caso a = a∗ risulta anche autoaggiunto rispetto al prodotto scalare (1.47). Leconclusioni seguono dai teoremi 7.2 e 7.4, osservando che il valore µ = 0 non interviene (ilnucleo di K si riduce al vettore nullo), e che µ > 0 equivale a λ > −λ0 e µ → 0 equivale aλ→∞.

Problema 1. Controllare che l’operatore K = L−10 I3, che nterviene nella dimostrazione

del teorema 7.5 e autoaggiunto in V rispetto al prodotto scalare ((u, v)) = a (u, v) + λ0 <u, v >.

57

Page 60: Libro - Analisi Funzionale - Matematica

Chapter 2

Teoremi di punto fisso eapplicazioni

I teoremi di punto fisso costituiscono uno strumento fondamentale per la soluzione di probleminon lineari, formulati tramite un’equazione del tipo

F (x) = x

In generale F e un operatore definito per esempio, in uno spazio metrico o normato X, a valoriin X. In base alle proprieta di F possiamo suddividere i teoremi di punto fisso in classi. Duefra le piu importanti sono:

1. Punti fissi per operatori di contrazione

2. Punti fissi per operatori compatti

Un operatore non lineareT : X → Y

con X e Y metrici o normati, si dice compatto se e continuo e se l’immagine di un insiemelimitato (nello spazio di partenza) e relativamente compatta (nello spazio d’arrivo).

Tra i teoremi della prima classe esamineremo il teorema delle contrazioni, di Banach-Caccioppoli; tra quelli della seconda, esamineremo i teoremi di Schauder e di Leray-Schauder.

2.1 Teorema delle contrazioni

L’ambientazione naturale del teorema delle contrazioni e quello degli spazi metrici. Sia dunque(X, d) uno spazio metrico e

F : X → X.

F si dice contrazione se, ∀x, y ∈ X esiste α, 0 < α < 1 tale che

d(F (x) , F (y)) ≤ α d(x, y).

Osserviamo che una contrazione e necessariamente continua (e, infatti, lipschitziana). La (??)esprime il fatto che la distanza delle immagini di due punti in X e inferiore di quella tra i duepunti, almeno di una percentuale α. Una funzione

F : Rn → R

58

Page 61: Libro - Analisi Funzionale - Matematica

e una contrazione se, per esempio, F e differenziabile |∇F ′ (x)| ≤ α < 1, (provarlo). Il fattoche F contragga le distanze conferisce alla successione

xm+1 = F (xm) , m ≥ 0,

costruita per ricorrenza a partire da un punto iniziale qualunque x0, una notevole stabilitanel comportamento asintotico, che le rende particolarmente appetibili nei metodi numerici. Ilseguente teorema e molto importante.

Teorema 1.1. Sia (X, d) uno spazio metrico completo e F : X → X una contrazione.Allora esiste in X un unico punto fisso di F.

Dimostrazione. Fissiamo un elemento x0 ∈ X e definiamo la successione ricorsiva

xm+1 = F (xm) m ≥ 0.

Facciamo vedere che xm e di Cauchy. Infatti, si ha, per j ≥ 1.

xj+1 = F (xj), xj = F (xj−1)

e quindid(xj+1, xj) = d (F (xj), F (xj−1)) ≤ αd (xj , xj−1) .

Ripetendo lo stesso discorso per j − 1, j − 2, fino a j = 1 si ha

d(xj+1, xj) ≤ αjd(x1, x0).

Ma allora, per la disuguaglianza triangolare, se m > k,

d(xm, xk) ≤m−1∑j=k

d(xj+1, xj)

≤ d(x1, x0)m−1∑j=k

αj

≤ d(x1, x0)αk

1− α.

Pertanto, se k →∞, d(xm, xk) → 0 e xm e di Cauchy. Esiste allora x ∈ X tale che

xm → x

Passando al limite per m→∞ nella relazione di ricorrenza

xm+1 = F (xm)

ed usando la continuita di F, si trovax = F (x)

e percio x e punto fisso per F . Se y e un altro punto fisso per F, si avrebbe

d(x, y) = d (F (x), F (y)) ≤ αd(x, y)

ossia(1− α) d(x, y) ≤ 0

59

Page 62: Libro - Analisi Funzionale - Matematica

che implica d(x, y) = 0 ovvero x = y. Il punto fisso e dunque unico e la dimostrazione ecompleta.

Si noti che il punto iniziale x0 e scelto arbitrariamente in X. Da un diverso punto di vista,il teorema 1.1 afferma che il sistema dinamico definito dalla successione

xm+1 = F (xm)

ha un unico punto di equilibrio asintoticamente stabile, con bacino di attrazione coincidentecon tutto X.

2.2 Teoremi di Schauder e Leray-Shauder

2.2.1 Il teorema di Schauder

Questo teorema estende agli spazi di Banach il teorema di punto fisso di Brouwer, valido inRn:

Teorema 2.1. (di Brouwer). Sia S ⊂ Rn una sfera chiusa e

T : S → S

continua. Allora T ha almeno un punto fisso x ∈S.In dimensione n = 1, il teorema 2.1 esprime il fatto che il grafico di una funzione continua

f : [0, 1] → [0, 1]

interseca il grafico della retta y = x almeno una volta. Per la dimostrazione, basta osservareche, posto w (x) = g (x) − x, si ha w (0) ≥ 0, w (1) ≤ 0 e quindi w ha almeno uno zerox; ma w (x) = 0 significa g(x) = x, per cui x e punto fisso di g. In dimensione n > 1, ladimostrazione e sorprendentemente complicata, e non e il caso di inserirla qui. Naturalmenteil teorema continua a valere se invece di una sfera ci fosse un qualunque insieme ad essaomeomorfo.1 La difficolta nell’estendere il teorema a infinite dimensioni risiede nel fatto cheuna sfera chiusa in uno spazio di Banach o di Hilbert a dimensione infinita non e compatta.Un modo per superare l’ostacolo e considerare insiemi compatti e convessi. Ricordiamo cheun insieme E e convesso se, data una qualunque coppia di punti x, y ∈ E, il segmento che licongiunge e interamente contenuto in E.

Se X e uno spazio di Banach ed E ⊂ X, si definisce inviluppo convesso di E, denotato conil simbolo co E il piu piccolo insieme convesso che contiene E :

co E = ∩F : F convesso, E ⊂ F .

Col simboloco E

si indica la chiusura di co E, che si chiama inviluppo convesso chiuso di E. Una proprietaimportante degli inviluppi convessi e espressa nella seguente proposizione:

Microteorema 2.2. Se E e compatto anche co E e compatto.

Un esempio di insieme compatto e convesso e l’inviluppo convesso chiuso di un numerofinito di punti: co x1, x2, ..., xN =

∑Ni=1 λixi : 0 ≤ λi ≤ 1,

∑Ni=1 λi = 1

1Ossia topologicamente equivalente.

60

Page 63: Libro - Analisi Funzionale - Matematica

Teorema 2.3. Siano X uno spazio di Banach e

i) A ⊆ X compatto e convesso

ii) T : A→ A un operatore continuo.

Allora T ha un punto fisso x ∈ A.Dimostrazione. L’idea e approssimare T con operatori tra spazi finito-dimensionali per

applicare il teorema di Brouwer. Poiche A e compatto, per ogni ε > 0, possiamo trovare unacopertura di A mediante un numero finito di ε−sfere S1 = Sε (x1),..., SN = Sε (xN ). Sia ora

Aε = co x1, x2, ..., xN .

Essendo A convesso, si ha Aε ⊆ A. Definiamo Pε : A→ Aε mediante la formula

Pε(x) =

N∑i=1

dist(x,A− Si)xi

N∑i=1

dist(x,A− Si)

, x ∈ A.

Si noti che dist(x,A − Si) 6= 0 se x ∈ Si, per cui il denominatore non si annulla se x ∈ A.Inoltre, Pε (x) e combinazione lineare convessa dei punti xi, e quindi Pε (x) ∈ Aε. L’operatorePε e continuo, essendo una combinazione finita di rapporti di distanze, e, per ogni x ∈ A,abbiamo

‖Pε(x)− x‖ ≤

N∑i=1

dist(x,A− Si) ‖xi − x‖

N∑i=1

dist(x,A− Si)

< ε (2.1)

in quantodist(x,A− Si) = 0, se x /∈ Si.

L’operatorePε T : Aε → Aε

e continuo, come composizione di due operatori continui, e, d’altra parte, Aε e omeomorfo allasfera unitaria chiusa di RM per un opportuno M, M ≤ N. Il teorema di Brouwer assicural’esistenza di un punto fisso xε:

(Pε T ) (xε) = xε.

Per la compattezza di A, esistono una successionexεj

e un punto x di A tali che

xεj→ x se εj → 0.

Applichiamo (2.1) con Txεjal posto di x ; si ha:∥∥xεj − T (xεj )

∥∥ =∥∥(Pεj T

)(xεj )− T (xεj )

∥∥ < εj .

Passando al limite, per la continuita della norma si trova

‖x− T (x)‖ = 0

e cioe x = T (x).

61

Page 64: Libro - Analisi Funzionale - Matematica

Applicheremo il teorema di Schauder all’equazione di diffusione e trasporto nei semicon-duttori; proprio in vista di applicazioni di questo tipo, conviene formulare una variante delteorema nella quale la compattezza e richiesta all’immagine T (A), anziche ad A.

Teorema 2.4. Siano X uno spazio di Banach e

i) A ⊆ X chiuso e convesso

ii) T : A→ A un operatore continuo

iii) T (A) e compatto in X.

Allora T ha un punto fisso x ∈ A.Dimostrazione. Sia K l’inviluppo convesso chiuso della chiusura di T (A) :

K = coT (A)

.

Essendo T (A) compatto, anche K e compatto (microteorema 2.2.). Essendo A chiuso econvesso si ha K ⊆ A. Inoltre,

T (K) ⊆ T (A) ⊆ K

La restrizioneT : K → K

e quindi un operatore che soddisfa le ipotesi del teorema 2.1. Esiste percio un punto fissox ∈ K.

Spesso il teorema si usa nella forma seguente:

Teorema 2.4’. Siano X uno spazio di Banach e

i) A ⊆ X chiuso, limitato e convesso

ii) T : A→ A un operatore compatto

Allora T ha un punto fisso x ∈ A.

2.2.2 Il teorema di Leray-Schauder.

Una ulteriore variante del teorema di Schauder si ottiene sostituendo l’ipotesi di compattezzadi A con la compattezza dell’operatore T , mentre la convessita di A e rimpiazzata dall’esistenzadi una famiglia di operatori Ts, 0 ≤ s ≤ 1, dove T1 = T e T0 e un operatore compatto cheha un punto fisso. L’esempio piu semplice e Ts = sT, con T0 = 0, che ha l’ovvio punto fissox = 0. Se l’insieme dei punti fissi della famiglia Ts e limitato, possiamo concludere che T1 haun punto fisso.

Teorema 2.5. (di Leray-Schauder). Sia X uno spazio di Banach e T : X → X tale che:

i) T e compatto

ii) Esiste M tale che, per ogni soluzione (x, s) , 0 ≤ s ≤ 1, dell’equazione

x = sT (x)

si ha‖x‖ < M. (2.2)

Allora T ha un punto fisso in X.

Dimostrazione. SiaBM = x ∈ X : ‖x‖ ≤M

62

Page 65: Libro - Analisi Funzionale - Matematica

Definiamo un operatore P : BM → BM mediante la formula

P (y) =

T (y) se ‖T (y)‖ ≤M

M T (y)‖T (y)‖ se ‖T (y)‖ > M.

BM e chiuso e convesso e T (BM ) e compatto per ipotesi. Di conseguenza anche P (BM ) eun insieme compatto, essendo sottoinsieme chiuso del compatto T (BM ). Per il teorema 2.4esiste x ∈ BM tale che

P (x) = x.

Ma x e anche punto fisso per T . Se non lo fosse, dovrebbe essere ‖T x‖ > M e

x =M

‖T (x)‖T (x), (2.3)

ossiax = sT (x) , con s =

M

‖T (x)‖< 1.

Per la i) si ha ‖x‖ < M, mentre la (2.3) implica ‖x‖ = M. Contraddizione.

Il punto chiave nell’applicazione del teorema di Leray-Schauder e stabilire (2.2). Spesso ciosi ottiene mediante stime dell’energia, dette anche stime a priori. A volte queste si dimostranocon metodi piu diretti, usando per esempio il teorema di immersione di Sobolev.

2.3 Applicazione ad alcune equazioni ellittiche semilin-eari

2.3.1 Un caso semplice

Vediamo su un esempio-modello come si usa il teorema di Leray-Shauder. Consideriamo ilproblema di Dirichlet per l’equazione di Poisson semilineare seguente:

∆u = −f (u) in Ωu = 0 su ∂Ω.

Assumiamo le seguenti ipotesi: Ω e un dominio limitato di Rn;

f : R → R

e una funzione di classe C1 (R), limitata:

|f (u)| ≤ K, ∀u ∈ R,

con f (0) 6= 0 (cosicche u = 0 non e soluzione del problema) e decrescente.Vogliamo dimostrare che esiste una soluzione del problema ed esaminarne l’eventuale

unicita. Un’idea e ricondursi ad un problema di punto fisso nel modo seguente.Ambientazione per la soluzione del problema: scegliamo H1

0 (Ω), che incorpora la con-dizione omogenea di Dirichlet; inoltre, la composizione f (u) e ben definita come funzione diL∞ (Ω) ed in particolare di L2 (Ω). Sappiamo anche che l’immersione di H1

0 (Ω) in L2 (Ω) ecompatta (teorema di Rellich).

Ambientazione per il problema di punto fisso: scegliamo X = L2 (Ω) e “linearizziamo ilproblema” fissando una funzione w ∈ L2 (Ω) e risolvendo, anziche il problema originale,

∆u = −f (w) in Ωu = 0 su ∂Ω. (2.4)

63

Page 66: Libro - Analisi Funzionale - Matematica

Questo problema e lineare con secondo membro in L2 (Ω) e quindi ha un’unica soluzione(teorema di Lax-Milgram) u ∈ H1

0 (Ω) ⊂ L2 (Ω), che dipende in modo univoco da w. Si e cosıdefinito un operatore

T : L2 (Ω) → L2 (Ω)

che associa a w la soluzione u di (2.4):

u = T (w) .

D’altra parte il teorema di Lax-Milgram, da anche la stima

‖u‖H10 (Ω) ≤ ‖f (w)‖L2(Ω) ≤

√|Ω|L ≡ R.

Ma allora l’immagine T(L2 (Ω)

)di L2 (Ω), e un insieme limitato in H1

0 (Ω) e quindi precom-patto (a chiusura compatta) in L2 (Ω). Dal teorema di Shauder deduciamo l’esistenza di unpunto fisso w:

w = T (w) .

Ma questa equazione equivale ad affermare che

∆w = −f (w)

per cui abbiamo trovato una soluzione.Per l’unicita, proviamo a procedere come se il problema fosse lineare, supponendo che vi

siano due soluzioni w1 e w2. Poniamo u = w1 − w2 e vediamo se u e soluzione di qualcheequazione. Si ha

∆u = −f (w1) + f (w2) .

Dal teorema del valor medio, possiamo scrivere

−f (w1) + f (w2) = −f ′ (w) (w1 − w2) = −f ′ (w)u

con w opportuno, tra w1 e w2. Ponendo c (x) = −f ′ (w) ≥ 0, abbiamo che u e soluzione inH1

0 (Ω) dell’equazione∆u− c (x)u = 0, c (x) ≥ 0.

Ma allora deve essere u = 0.In questo caso ... particolarmente fortunato, abbiamo anche unicita. Ma se f non fosse

decrescente, l’unicita potrebbe benissimo non esserci.

2.3.2 Equazioni ellittiche semilineari

Esaminiamo ora alcuni problemi ellittici semilineari, che si incontrano per esempio nella model-lazione dei dispositivi microelettronici e cioe problemi misti (Dirichlet-Neumann) del tiposeguente: −div (a (x)∇w) + f (x, w) = 0 in Ω

w = wD su ΓD∂νw = 0 su ΓN

(SE)

dove Ω e un dominio limitato in Rn, a = a (x) e uno scalare e f : Ω × R → R. InoltreΓD ∪ ΓN = ∂Ω, ΓD ∩ ΓN = ∅. E’ bene precisare la formulazione debole del problema, anchese non avremo bisogno di usarla direttamente. Se poniamo

u = w − wD e f (x,u) = f (x, u+ wD)

64

Page 67: Libro - Analisi Funzionale - Matematica

dove wD e un rilevamento in H1 (Ω) di wD, la formulazione debole del problema (SE) e:trovare una funzione u ∈ H1 (Ω) tale che u ∈ H1

0,ΓD(Ω) e che, ∀v ∈ H1

0,ΓD(Ω),∫

Ω

a (x)∇u · ∇v + f (x, u) v

dx = −

∫Ω

a (x)∇wD · ∇v dx+∫

ΓN

a∂νwD dσ.

Abbiamo bisogno del seguente risultato di regolarita, valido per equazioni uniformementeellittiche generali (del quale omettiamo la dimostrazione):

Microteorema 3.1. Sia u ∈ H1 (Ω) soluzione debole di

−div (A (x)∇w) = F (x) in Ω.

Se A e uniformemente ellittica in Ω e F e limitata, allora u e continua in Ω.Il teorema che ci serve e il seguente.Teorema 3.2. Supponiamo che:

1. a (x) ∈ L∞ (Ω) e a (x) ≥ a > 0.

2. wD e limitata su ΓD.

3. La funzione f (x, w) e regolare e monotona crescente rispetto a w per ogni x ∈ Ω, conderivata ∂wf limitata su ogni insieme del tipo Ω× [w1, w2].

4. Esistono due funzioni g (w) e G (w) tali che

g (w) ≤ f (x, w) ≤ G (w)

per ogni x ∈ Ω e per ogni w ∈ R.

5. Esistono w∗ e w∗ tali che g (w∗) = 0, G (w∗) = 0.

Allora esiste un’unica soluzione w del problema (SE) inH1 (Ω)∩L∞ (Ω) che inoltre verificala disuguaglianza

W∗ ≡ minw∗, inf

ΓD

wD

≤ w (x) ≤ max

w∗, sup

ΓD

wD

≡W ∗. (2.5)

Dimostrazione. 1. Controlliamo subito l’unicita della soluzione. Se w1 e w2 sono soluzionideboli e limitate con gli stessi dati al bordo, la funzione h = w1−w2 e soluzione del problema

−div (a (x)∇h) + c (x)h = 0

con dati nulli e con c (x) = ∂wf (x, ω (x)) ≥ 0, per ω (x) opportuno tra w1 (x) e w2 (x). Ilteorema di Lax-Milgram o ancora il principio di massimo implicano che h = 0 in Ω e cioe chew1 = w2.

2. Per l’esistenza della soluzione usiamo il teorema di Leray-Schauder, ambientato inL2 (Ω). Il primo passo e linearizzare l’equazione nel seguente modo. Per ogni funzione z diL2 (Ω), definiamo la troncata ztr di z mediante la formula:

ztr (x) =

W ∗ z (x) > W ∗

z (x) W∗ ≤ z (x) ≤W ∗

W∗ z (x) < W∗

Osserviamo che:

65

Page 68: Libro - Analisi Funzionale - Matematica

a) se z ∈ H1 (Ω) allora anche ztr ∈ H1 (Ω);b) ztr ∈ L∞ (Ω);c) l’operatore

z → ztr

e continuo da L2 (Ω) a L2 (Ω).2

Per ogni z fissato, consideriamo il problema lineare

−div (a (x)∇w) + f (x, ztr) = 0 (2.6)

∂νw = 0 su ΓN e w = wD su ΓD.

Il problema e risolubile con metodi standard (teorema di Lax-Milgram) ed ha un’unica soluzionew in H1 (Ω) che soddisfa la disuguaglianza

‖w‖H1(Ω) ≤ C‖f (·, ztr)‖L2(Ω) + ‖wD‖H1(Ω)

(2.7)

dove C dipende da dalla costante di ellitticita a, da Ω e dalla dimensione n. Dalle ipotesi 3 e4 abbiamo

‖f (·, ztr)‖L2(Ω) ≤ K ≡ max |g (W ∗)| , |g (W∗)|√|Ω|

e quindi‖w‖H1(Ω) ≤ C

K + ‖wD‖H1(Ω)

.

Poiche l’operatore di troncamento z 7−→ ztr e continuo da L2 (Ω) in L2 (Ω) Indichiamo oracon T = T (z) l’operatore da L2 (Ω) a L2 (Ω), che associa a z la troncata ztr e a questa lasoluzione w del problema (2.6). Poiche l’operatore di troncamento z 7−→ ztr e continuo daL2 (Ω) in L2 (Ω), dalla (2.7) si deduce che T e continuo con immagine limitata in H1 (Ω) .Pertanto, dal teorema di Rellich, l’immagine di T e relativamente compatta in L2 (Ω) e Trisulta\unoperatorecompatto.

Il teorema 2.4 di Schauder implica allora l’esistenza di un punto fisso w per T , che risolvel’equazione

−div (a (x)∇w) + f (x, wtr) = 0. (2.8)

3. Per concludere, occorre dimostrare che W∗ ≤ w ≤ W ∗; infatti, in tal caso w = wtr percui w e la soluzione del problema originale (SE). A tale scopo, osserviamo anzitutto che, peril microteorema 3.2, w e continua in Ω, per cui l’insieme dei punti Ω+ dove w e maggiore diW ∗ e un aperto in Rn. La frontiera di Ω+ e costituita o da punti interni ad Ω in cui w = W ∗

oppure da punti appartenenti alla frontiera di Ω dove assume i dati di Dirichlet o di Neumann.Supponiamo per assurdo che Ω+ non sia vuoto e che vi appartenga il punto x∗. Si abbia

dunque w (x∗) > W ∗. Possiamo sempre supporre che Ω+ sia connesso3. Allora, in Ω+,wtr = W ∗ e soddisfa l’equazione lineare

−div (a (x)∇w) + f (x,W ∗) = 0.

con le condizioni w = wD su ΓD ∩ ∂Ω+, w = W ∗ su ∂Ω+ ∩Ω e ∂νw = 0 su ΓN ∩∂Ω+. D’altraparte, osserviamo che

−div (a (x)∇W ∗) + f (x,W ∗) = f (x,W ∗) ≥ f (x, w∗) ≥ sl g (w∗) = 0

2Problema: dimostrare c).3In ogni caso possiamo limitarci alla componente connessa di Ω+ che contiene x∗.

66

Page 69: Libro - Analisi Funzionale - Matematica

e ricordiamo che wD ≤W ∗. Allora, posto z = W ∗ − w, si ha

−div (a (x)∇z) ≥ 0,

z ≥ 0 su ΓD ∩ ∂Ω+, z = 0 su ∂Ω+ ∩ Ω e ∂νw = 0 su ΓN ∩∂Ω+. Dal principio di massimo sideduce che w ≤ W ∗ in Ω+: contraddizione, in quanto w (x∗) > W ∗. Analogamente si provache w (x) ≥W∗. Cio conclude la dimostrazione del teorema.

2.4 Il Modello drift-diffusion per dispositivi a semicon-duttore

I solidi si possono classificare come isolanti, semiconduttori o conduttori. A temperaturaambiente la conducibilita elettrica di un semiconduttore e significativamente maggiore di quelladi un isolante e significativamente minore di quella di un conduttore. Cio puo essere spiegatoconfrontando la concentrazione intrinseca di elettroni di conduzione nei tre tipi di solido. Nelsilicio e dell’ordine di 1010cm−3, in un metallo di 1022cm−3 mentre in un isolante e dell’ordinedi qualche migliaio.

Quando il livello di energia di un semiconduttore si alza moderatamente, per esempio ap-plicando un campo elettrico o aumentando la temperatura, gli elettroni di valenza, presenti innumero relativamente elevato, diventano elettroni di conduzione. Chiaramente, ogni elettroneche abbandona il suo stato originario lascia una lacuna nel reticolo. E’ ragionevole riguardarequeste lacune come trasportatori di cariche positive. Il movimento di lacune, esattamentecome il movimento di cariche negative, induce una corrente elettrica.

In condizioni di equilibrio termico, il numero di lacune eguaglia il numero di elettroni diconduzione. Indicheremo questa concentrazione intrinseca con ni.

Il passo piu importante nella fabbricazione di un dispositivo a semiconduttore e l’innesto diatomi di impurita nella struttura cristallina del semiconduttore. Questa procedura si chiamadrogaggio. Due sono, principalmente, le possibilita di innesto:

– atomi che producono uno o piu elettroni di conduzione in eccesso, detti donori– atomi che possono accettare elettroni e che pertanto producono lacune, detti accettori.Se si innestano atomi di drogaggio ad una concentrazione superiore a quella intrinseca, la

conduttivita cresce in modo significativo e le proprieta elettriche del cristallo possono esserecontrollate dosando appunto il drogaggio.

Ildispositivo piu elementare e la giunzione pn (diodo): una parte e drogata con accettori(lato ”p”) ed e carica positivamente, mentre la parte adiacente e drogata con donori ed equindi carica negativamente (lato ”n”) .

Il catodo e l’anodo sono costruiti portando il semiconduttore a stretto contatto con unmetallo. Quando una tensione positiva e applicata tra anodo e catodo, una corrente elevatafluisce attraverso il diodo, anche per piccoli voltaggi. Se un voltaggio negativo e applicato,solo una corrente molto piccola fluisce. Pertanto, il diodo pn agisce come una valvola: apre echiude in dipendenza dal segno del voltaggio applicato.

Nella derivazione di un modello matematico per un dispositivo a semiconduttore seguiremola procedura standard, utilizzando

· leggi fisiche generali; in questo caso le equazioni di Maxwell,· leggi costitutive; di origine essenzialmente sperimentale, in questo caso si tratta di modelli

per il flusso di cariche (trattate come un continuo), per il tasso di ricombinazione-generazionedelle coppie lacuna-elettrone e per alcuni parametri rilevanti.

Deriveremo nella prossima sezione un modello, detto di deriva-diffusione e studieremocon qualche dettaglio la versione stazionaria. Questo modello sembra costituire un buon

67

Page 70: Libro - Analisi Funzionale - Matematica

compromesso tra l’efficienza computazionale ed un’accurata descrizione dei meccanismi fisicicoinvolti nel funzionamento di un dispositivo ed e stato il modello base per la tecnologia deglianni ’80 e primi anni ’90. Il maggior difetto risiede nel fatto che l’energia dei portatori noncompare come variabile dinamica, per cui non possono essere descritti fenomeni nei quali essagioca un ruolo importante, come nel caso degli hot electrons. Un modello macroscopico chetenga conto del flusso di energia e il cosiddetto modello idrodinamico, per il quale perorimandiamo a testi specializzati.

Anche la crescente miniaturizzazione dei dispositivi pone qualche limite alla plausibilitadel modello: da un lato, la modellazione del flusso di cariche come un continuo e ai limiti dellavalidita; dall’altro, nel modello, il cammino libero di una particella e praticamente consider-ato nullo, mentre attraverso la miniaturizzazione e l’uso di materiali diversi dal silicio, talecammino libero diventa dell’ordine di grandezza della regione attiva del dispositivo e pertantonon trascurabile.

Infine, gli effetti quantistici giocano un ruolo sempre meno trascurabile per cui si rendenecessario l’uso di equazioni di tipo Boltzmann-Schrodinger.

In ogni caso il modello deriva-diffusione rimane importante, in quanto gli effetti che non e ingrado di descrivere avvengono solo localmente. E’ quindi conveniente usare modelli sofisticatisolo localmente (dato il costo computazionale alto) ed usare il modello deriva-diffusione altrove.

2.4.1 Equazioni di Maxwell. Equazione di Poisson

Deriviamo un modello base per il comportamento elettrodinamico di un dispositivo a semi-conduttore.

Quest’ultimo occupa un dominio limitato e semplicemente connesso in R3 che denotiamocon D. D consiste, in generale, di una parte Ω, occupata dal semiconduttore e, nel caso diun dispositivo MOS (metal-oxide-semiconductor), di uno o piu domini adiacenti la cui unioneindichiamo con Φ.

ftbhFU193.75pt204.0625pt0ptSezione trasversale di un transistor-MOSFigureL’evoluzione del campo elettromagnetico in un mezzo arbitrario e governata dalle equazioni

di Maxwell (in opportune unita di misura, nelle quali la velocita della luce nel vuoto e lapermeabilita magnetica sono uguali a 1):

rot H = J +∂D∂t

(Maxwell-Ampere) (2.9)

rot E = −∂B∂t

, (Maxwell-Faraday) (2.10)

div B = 0, (Gauss)

div D = ρ, (Gauss)

dove :· E e il campo elettrico· D e il vettore spostamento o induzione elettrica· H e il campo magnetico· B e il vettore induzione magnetica· J e la densita di corrente di conduzione· ρ e la densita di carica elettrica.Assumeremo valida la seguente relazione costitutiva

D = εE

68

Page 71: Libro - Analisi Funzionale - Matematica

dove ε si chiama permittivita. In generale ε e una matrice 3×3, ma, nella maggior parte deicasi possiamo considerare il materiale omogeneo e isotropo e trattare ε come scalare (costante).Nel vuoto

εvuoto = 8.854187811× 10−14 [A]× [s]× [V ]−1 × [cm]−1

mentre per il silicioεsil = 11.7εvuoto.

Poiche div B = 0, si puo determinare un potenziale vettore A tale che

rot A = B. (2.11)

Inserendo l’ultima equazione nella seconda di Maxwell, si trova

rot(E +

∂A∂t

)= 0

e percio, essendo il dominio semplicemente connesso, esiste uno scalare ψ tale che

E +∂A∂t

= −∇ψ (2.12)

Osserviamo che i potenziali A e ψ non sono determinati univocamente; infatti, se ϕ = ϕ (x,t)e una funzione scalare (regolare) si ha che anche

A′ = A +∇ϕ e ψ′ = ψ − ∂ϕ

∂t

soddisfano ancora le (2.11) e (2.12), rispettivamente. Di conseguenza avremo

divA′ +∂ψ′

∂t= divA +

∂ψ

∂t+ ∆ϕ− ∂2ϕ

∂t2.

Moltiplichiamo ora per ε e applichiamo la divergenza ad entrambi i membri della (2.12) conA′ al posto di A; si trova (div∇ψ = ∆ψ)

div[D + ε∂A′

∂t] = −ε∆ψ

ossia, essendo divD = %,

ε∂

∂tdivA′ + ε∆ψ = −ρ

A questo punto, fissiamo A e ψ e usiamo il grado di liberta su ϕ scegliendola in modo che

∆ϕ− ∂2ϕ

∂t2+∂ϕ

∂t= −div A− ∂ψ

∂t

Con questa scelta, divA′ = 0 e quindi si ottiene l’equazione (di Poisson) per il potenzialeelettrico ψ :

ε∆ψ = −ρ. (2.13)

Nel semiconduttore possiamo scrivere la densita spaziale di carica ρ come

ρ = q (p− n+ C) , x ∈ Ω

69

Page 72: Libro - Analisi Funzionale - Matematica

dove q e la carica elementare, p la concentrazione di cariche positive (lacune), n la concen-trazione di cariche negative (elettroni di conduzione) e C e il profilo predefinito degli atomi didrogaggio. Se tutte le ”impurita” hanno una carica di ionizzazione unitaria, allora

C = N+D −N−

A

dove a destra compaiono le concentrazioni di donori e accettori, rispettivamente. Assumeremoche il profilo sia costante nel tempo:

∂C

∂t= 0.

Di solito, la parte Φ del dispositivo e neutra:

ρ = 0 x ∈ Φ.

Si puo allora scrivere l’equazione di Poisson nella forma seguente:

ε∆ψ =−ρ = q (n− p− C) x ∈ Ω0 x ∈ Φ (2.14)

2.4.2 Equazioni di continuita.

Ricordando che div rot H = 0, div D = ρ, dalla (2.9) si ricava

0 = div J +∂ρ

∂t(2.15)

il cui significato e: sorgenti o pozzi per la densita di corrente di conduzione sono determinatisolo dalle variazioni temporali della densita di carica. Scriviamo

J = Jp+Jn

evidenziando il contributo dato dalla densita di corrente delle lacune e degli elettroni. Dalla(2.15) si ottiene

−div Jp − q∂p

∂t= div Jn − q

∂n

∂t, x ∈ Ω.

Per ottenere un’equazione per la densita di corrente delle lacune ed una per la densita dicorrente degli elettroni, uguagliamo i due membri dell’ultima equazione ad una quantita chescriviamo nella forma qR :

div Jp + q∂p

∂t= −qR, x ∈ Ω (2.16)

div Jn − q∂n

∂t= qR, x ∈ Ω. (2.17)

Le equazioni (2.16) e (2.17) si chiamano equazioni di continuita per le correnti. Lafunzione R puo essere interpretata fisicamente come differenza tra il tasso al quale le cop-pie lacune-elettroni si ricombinano e il tasso al quale le coppie lacune- elettroni sono gener-ate all’interno del semiconduttore. Chiamiamo R tasso di ricombinazione/generazione.Chiaramente, la ricombinazione (risp. generazione) ha un effetto prevalente se R > 0 (risp.R < 0). Modelli piu o meno appropriati per R si possono ricavare con metodi di fisica statis-tica. La parte Φ del dispositivo si considera un perfetto isolante e quindi

Jn = Jp = 0, in Φ.

70

Page 73: Libro - Analisi Funzionale - Matematica

2.4.3 Relazioni costitutive

Veniamo ora ai modelli per la densita di corrente. Adottiamo un punto di vista puramentefenomenologico ed identifichiamo come principali meccanismi di produzione della corrente inun semiconduttore i seguenti:

a) la diffusione di elettroni e lacune con relative correnti di diffusione Jdiffp e Jdiffn ,

b) la deriva (drift) di elettroni e lacune causate causate dal campo elettrico come forzamotrice, con relative correnti di trasporto Jdriftp e Jdriftn .

Assumiamo che la corrente totale sia determinata dalla sovrapposizione delle due correntidi diffusione e trasporto:

Jp = Jdiffp +Jdriftp e Jn = Jdiffn +Jdriftn

Diffusione. Elettroni e lacune diffondono da regioni ad alta concentrazione verso regionia bassa concentrazione. La direzione di diffusione di un insieme di particelle e la direzione dimassima discesa della corrispondente concentrazione e, usando la legge di Fourier, i flussi didensita di corrente sono proporzionali (e opposti) ai gradienti delle concentrazioni. Le densitadi corrente di diffusione sono ottenute moltiplicando i flussi per la carica elementare: +q perle lacune, −q per gli elettroni. Il risultato e

Jdiffp = −qDp∇p, Jdiffn = qDn∇n

con Dp, Dn positivi.Deriva. Le correnti di trasporto sono definite dal prodotto della carica elementare per la

concentrazione e per la velocita media di deriva, vn per gli elettroni, vp per le lacune:

Jdriftp = qpvp, Jdriftn = −qnvn.

Le velocita sono proporzionali al campo elettrico (se questo non e troppo elevato), con la stessaorientazione per le lacune e l’opposta per gli elettroni:

vp = µpE, vn = −µnE

I coefficienti µp, µn sono positivi e si chiamano coefficienti di mobilita. In generale

µp = µp (x,∇ψ) , µn = µn (x,∇ψ)

I coefficienti di diffusione e quelli di mobilita sono legati tra loro dalle relazioni di Einstein

Dp = UTµp, Dn = UTµn

doveUT =

kBT

q

si chiama potenziale termico (' 0.025 V a T = 300 K), kB e la costante di Boltzmann e T latemperatura del dispositivo.

Arriviamo cosı alle seguenti relazioni per la densita di corrente, per x ∈ Ω:

Jp = −qµp (UT∇p+ pE)Jn = qµn (UT∇n+ nE)

71

Page 74: Libro - Analisi Funzionale - Matematica

Modelli per il tasso di ricombinazione. Vari modelli per il tasso di ricombinazione sonodisponibili. A bassa densita, per campi elettrici di piccola intensita e in vicinanza dell’equilibriotermico, possono essere ritenuti validi i seguenti modelli.

Il modello SRH (Shockley Read Hall) e della forma

R =np− n2

i

τp(n+ ni) + τn(p+ ni)

dove ni e la densita intrinseca e τp, τn sono le vite medie di lacune ed elettroni. Questo modellosi giustifica su una scala temporale piccola.

Il modello di Auger e della forma

R = (Cnn+ Cpp)(np− n2

i

)dove Cp, Cn sono coefficienti legati al meccanismo di ricombinazione/generazione. Per esempio,la ricombinazione, in questo caso, si assume dovuta alla cattura degli elettroni (un elettronesi sposta dalla banda di conduzione alla banda di valenza e si ricombina con una lacuna,trasferendo la sua energia ad un altro elettrone di conduzione) o alla cattura di lacune (comeprima, ma l’energia viene trasferita ad una lacuna nella banda di valenza). Il processo oppostofornisce il meccanismo di generazione.

2.4.4 Il modello stazionario

Le equazioni. Riassumiamo i risultati dei paragrafi precedenti, scrivendo le equazioni delmodello diffusione-trasporto (drift-diffusion) stazionario. Facciamo le seguenti ipotesi.

• Le sole sorgenti di corrente sono la deriva dovuta all’azione del campo elettrico e ladiffusione.

• Valgono le relazioni di Einstein.

• Il campo magnetico B e stazionario: ∂B/∂t = 0 e anche ∂n/∂t = ∂p/∂t = 0.

Abbiamo dunqueE = −∇ψ

e si ottiene il seguente sistema di equazioni a derivate parziali, valide per x ∈ Ω.ε∆ψ = q (p− n+ C) eq. di Poissondiv Jp = −qR eq. di continuita per le lacunediv Jn = qR eq. di continuita per gli elettroniJp = −qµp (UT∇p+ p∇ψ) densita di corrente per le lacuneJn = qµn (UT∇n− n∇ψ) densita di corrente per gli elettroni.

(2.18)

Per i dispositivi MOS, si ha inoltre,

∆ψ = 0 x ∈ Φ.

La temperatura T dovrebbe essere considerata come una variabile interna, dipendente da Jpe Jn, determinata attraverso un’equazione di diffusione del calore. Per brevita, considereremoT come variabile esterna, costante.

Condizioni al bordo. Le equazioni (2.18) devono essere completate da appropriatecondizioni al bordo, che modellizzino l’interazione del dispositivo con l’ambiente circostante.

72

Page 75: Libro - Analisi Funzionale - Matematica

La frontiera ∂D di un dispositivo puo essere in generale suddivisa in due parti disgiunte:

∂D = ∂FD ∪ ∂AD.

∂FD costituisce un bordo fisico reale, consistente di segmenti isolati, coperti da uno stratoprotettivo, e da contatti metallici. ∂AD e costituita da segmenti artificialmente introdotti perseparare il dispositivo da altri dispositivi adiacenti. In figura 2.1, i segmenti HG, EF, AB, CDcostituiscono ∂FD, gli altri ∂AD.

Dal punto di vista matematico, non c’e necessita di distinguere tra segmenti isolati eartificiali, poiche su di essi vale la stessa condizione e precisamente una condizione di Neumannomogenea: il flusso di corrente e il campo elettrico sono nulli nella direzione normale al bordo.Se poniamo

∂NΩ = ∂insΩ ∪ ∂AΩ

abbiamo dunque, indicando con ν il versore normale esterno a ∂Ω :

∂νψ = Jp·ν = Jn·ν = 0 su ∂NΩ.

Stesse condizioni valgono sulla corrispondente parte di Φ.Le altre parti di ∂Ω, la cui unione indichiamo con ∂DΩ, corrispondono a contatti Ohmici

(o di tipo analogo). Qui vengono assegnate condizioni di Dirichlet per il potenziale ψ e per leconcentrazioni n, p. In particolare, in un contatto Ohmico, si ha

n− p− C = 0.

Usando la relazione np = n2i , valida in equilibrio termico, si trovano le seguenti condizioni di

Dirichlet:

n = nD =12

[√C2 + 4n2

i + C

]p = pD =

12

[√C2 + 4n2

i − C

]ψ = ψD = Uest + Uint

dove Uest e il potenziale applicato e

Uint = UT ln(nDni

)e il potenziale intrinseco, scelto in modo tale che il dispositivo sia in equilibrio termico se ipotenziali esterni sono nulli.

Sull’interfaccia BE, ossido-semiconduttore, abbiamo

Jp·ν = Jn·ν = 0

e inoltre[ψ]BE = [ε (x) ∂νψ]BE = 0

dove [f ]BE indica il salto della funzione f attraverso il segmento BE ed

ε (x) =ε in Ωεo in Φ.

Infine, si assegna il valore del potenziale ψ sul contatto metallico in ∂Φ (gate contact).

73

Page 76: Libro - Analisi Funzionale - Matematica

2.4.5 Cambio di variabili e adimensionalizzazione

Per il trattamento matematico del problema, conviene introdurre nuove variabili. Poniamo,ricordando l’espressione di Uint,

ϕn = ψ − UT ln(n

ni

), ϕp = ψ + UT ln

(p

ni

)o, equivalentemente,

n = ni exp(ψ − ϕnUT

), p = ni exp

(ϕp − ψ

UT

).

Le quantita ϕn e ϕp si chiamano livelli o potenziali di Fermi. In termini di queste quantita siha

Jn = qµn (UT∇n− n∇ψ) =

= qµn

[UTni

(∇ψ −∇ϕn

UT

)exp

(ψ − ϕnUT

)− ni exp

(ψ − ϕnUT

)∇ψ]

= −qµnni exp(ψ − ϕnUT

)∇ϕn

e quindiJn = −qµnn∇ϕn.

AnalogamenteJp = −qµpp∇ϕp.

Passiamo ora a variabili adimensionali, introducendo i fattori di scala indicati nella tabellaseguente, per i quali sono indicati alcuni valori tipici di riferimento.

variabile fattore di scala ordine di grandezzax l 5× 10−3cm

t l2

µUT9.7× 10−7s

ψ UT 0.0259V

C, n, p, ni C 1017cm−3

µn, µp µ 103cm2V −1s−1

Jn,JpqUT Cµ

l83 A cm−2

R R = UT Cµl2 1.1× 1023cm−3s−1

dove

• l = O (diam Ω)

• C = O (maxC), µ = O (max µn, µp)

Cominciamo col porre

V =ψ

UT, u = exp(−ϕn

UT), v = exp(

ϕpUT

).

74

Page 77: Libro - Analisi Funzionale - Matematica

Alloran = nie

V u, p = nie−V v

e le relazioni di corrente diventano

Jn = −qµnniUT eV∇u, Jp = −qµnniUT e−V∇v.

Passiamo da µp, µn, C, R, a µp/µ, µn/µ, C/C, indicando le quantita riscalate ancora con glistessi simboli. Poniamo infine

δ2 =ni

C, (tipicamente tra 10−7 e 10−10)

e

λ =λDl, λD =

√εUT

qC.

Il parametro λ si chiama lunghezza caratteristica normalizzata del dispositivo, con valoritipici dell’ordine da 10−1 a 10−5. In variabili adimensionali, il problema di deriva-diffusionestazionario si scrive nel modo seguente:

λ2∆V = δ2eV u− δ2e−V v − C (x) (2.19)

div(µne

V∇u)

= S (2.20)

div(µpe

−V∇v)

= S (2.21)

valide nel dominio Ω che rappresenta il semiconduttore, dove S = R

Rδ2e il tasso di ricombinazione-

generazione modificato. Le condizioni su ∂NΩ sono

∂νV = ∂νu = ∂νv = 0 (2.22)

mentre quelle su ∂DΩ sonoV = VD, u = uD, v = vD (2.23)

con nD = nieV uD, pD = nie

−V vD, VD = ψD

UT. Dato il loro significato, n, p sono positive e

quindi lo sono anche u, v.

2.4.6 Un teorema di esistenza

Dal punto di vista pratico e importante sviluppare metodi numerici per la soluzione del mod-ello. Questi ultimi risultano piu efficaci quando si raggiunge un soddisfacente grado di com-prensione teorica del problema attraverso le proprieta analitiche della soluzione. Le maggioridifficolta nel trattamento del modello di diffusione e trasporto risiedono da un lato nella naturanonlineare del sistema, dall’altro nella grande differenza nell’ordine di grandezza delle quantitacoinvolte. Per esempio, le soluzioni presentano in generale gradienti elevati in corrispondenzadi giunzioni pn e l’efficienza di un metodo numerico aumenta se si adatta a questo fenomeno,cosiddetto di strato limite. Le questioni che si pongono in modo naturale ed occorre analizzaresono in particolare le seguenti.

1. Esistenza della soluzione e sue proprieta di regolarita. Eventuale unicita.

2. Struttura della soluzione.

3. Proprieta di stabilita.

75

Page 78: Libro - Analisi Funzionale - Matematica

Qui ci occuperemo dell’esistenza della soluzione. Il problema e costituito da un sistema diequazioni semilineari, con condizioni miste Dirichlet-Neumann, la cui soluzione debole si ricavacon i metodi illustrati nella sezione 3. E’ interessante osservare che il metodo che useremoper risolverlo e alla base dei metodi numerici di solito usati in questo modello. In ogni caso,le semplificazioni e le ipotesi fatte nella costruzione del modello stesso, oltre al carattere nonlineare menzionato, impongono un’analisi di esistenza, tesa a dimostrare che il sistema diequazioni e risolubile in un ambiente matematico ”naturale”, che rifletta le proprieta fisichecaratteristiche del dispositivo.

In generale, non ci si puo aspettare che la soluzione sia unica, poiche ci sono dispositivi(come i thyristors) il cui funzionamento e basato esplicitamente sull’esistenza di soluzionistazionarie multiple. Si ha unicita quando, per esempio, il potenziale applicato, e quindi ledensita di corrente, sono sufficientemente piccole. Nel caso di equilibrio termico (assenza divoltaggio applicato, Jp= Jn= 0), il sistema si riduce al problema scalare per il solo potenzialeV

λ2∆V = δ2eV u− δ2e−V v − C (x)

con u = uE , v = vE , costanti. Si puo mostrare allora che la soluzione V = VE e anche unica.Un procedimento di linearizzazione permette allora di concludere l’unicita per potenziali vicinia VE e per u, v vicine a uE , v = vE , rispettivamente.

Le questioni 2 e 3 sono tecnicamente piuttosto complicate. La seconda richiede l’uso ditecniche di perturbazione singolare; la terza richiede l’esame dell’equazione non stazionaria.Rimandiamo il lettore a testi specializzati sull’argomento.

Per analizzare l’esistenza di una soluzione, inquadriamo il modello in un ambiente matem-atico appropriato. Ci limiteremo a considerare il caso in cui Φ = ∅. Cominciamo a isolarele ipotesi sul dominio Ω, sui dati e sui parametri del problema che servono nella dimostrazionedel teorema di esistenza.

1. Ω e un dominio limitato in Rk, (k = 1, 2, 3), Lipschitziano e la misura (k − 1) -dimensionaledi ∂NΩ e ∂NΩ sono positive.

2. I dati di Dirichlet sono tracce di funzioni in H1 (Ω) ed in particolare

(VD, uD, vD) ∈(L2 (∂DΩ)

)3.

Esiste inoltre, K > 0 tale che

1K≤ uD (x) , vD (x) ≤ K, ∀x ∈ ∂DΩ.

3. Il profilo di drogaggio e limitato, cioe C ∈ L∞ (Ω). Poniamo

C = inf C (x) , C = supC (x) .

4. Il tasso di ricombinazione-generazione S e della forma:

S = F (x, V, u, v) (uv − 1)

dove F ≥ 0 ed e di classe C1 rispetto a (V, u, v) per ogni x ∈ Ω, mentre e limitata congradiente in x limitato, uniformemente in insiemi limitati rispetto a (V, u, v).

76

Page 79: Libro - Analisi Funzionale - Matematica

5. I coefficienti di mobilita µn, µp soddisfano le seguenti condizioni:

(i) µn = µn (x,∇V ) , µp = µp (x,∇V )

(ii) 0 < µn ≤ µn ≤ µn, 0 < µp ≤ µp ≤ µp

(iii) |µn (x,y1)− µn (x,y2)|+ |µp (x,y1)− µp (x,y2)| ≤ L |y1 − y2|per ogni x ∈ Ω e ogni y1,y2 ∈ Rk.

Nota 5.1. Le ipotesi 1, 2, 3 sono realistiche. Piu problematiche sono le ipotesi 4, 5. Inparticolare, la 5 (ii) esclude il fenomeno di saturazione di velocita in campi elettrici di intensitaelevata.

Teorema 5.1. Sotto le ipotesi indicate, il problema di diffusione-trasporto ha una

soluzione debole (V ∗, u∗, v∗) ∈(H1 (Ω) ∩ L∞ (Ω)

)3, che soddisfa le disuguaglianze:

1K≤ u∗, v∗ ≤ K, q.o. in Ω

V− ≤ V ∗ ≤ V+, q.o. in Ω

dove

V− = min

inf∂D

VD, log

[C +

√C2 + 4δ2

2Kδ2

]

V+ = max

sup∂D

VD, log

KC +√C

2+ 4δ2

2δ2

.

La strategia della dimostrazione consiste nel disaccoppiare le tre equazioni differenzialied usare il teorema di punto fisso di Schauder. Le condizioni al bordo sono gia disaccoppiate.Sottolineiamo che l’analisi numerica, con relativa costruzione di algoritmi risolutivi, e basatasulla stessa filosofia. L’operatore di punto fisso e costruito come segue.

A) Si fissa (u, v) = (u0, v0) con u0 > 0, v0 > 0 e si risolve l’equazione semilineare diPoisson

λ2∆V = δ2eV u0 − δ2e−V v0 − C (x) (2.24)

con le condizioniV = VD su ∂DΩ e ∂νV = 0 su ∂NΩ.

Sia V1 la soluzione.B) Disaccoppiamo le equazioni di continuita (2.20) e (2.21) dall’equazione di Poisson sos-

tituendo V1 al posto di V in quelle equazioni. A loro volta, queste si disaccoppiano scegliendoopportunamente gli argomenti di S. Precisamente, si risolvono separatamente i due problemiellittici lineari seguenti:

div(µn (x,∇V1) eV1∇u

)= F (x, V1, u0, v0) (uv0 − 1) (2.25)

con le condizioniu = uD su ∂DΩ e ∂νu = 0 su ∂NΩ

ediv(µp (x,∇V1) e−V1∇v

)= F (x, V1, u0, v0) (u0v − 1) (2.26)

77

Page 80: Libro - Analisi Funzionale - Matematica

con le condizioniv = vD su ∂DΩ e ∂νv = 0 su ∂NΩ.

Siano u1 e v1 le soluzioni rispettive.C) Se si indica con B il sottoinsieme chiuso e convesso di (L2 (Ω))2, definito da

B =

(u, v) ∈ (L2 (Ω))2 :1K≤ u, v ≤ K, q.o. in Ω

,

allora la corrispondenza che associa alla coppia di partenza (u0, v0) la coppia di soluzioni(u1, v1) definisce una trasformazione G (mappa di Gummel) tale che

G : B → B

Si dimostra che G e compatta e percio, in base al teorema di Schauder, ha un punto fisso(u∗, v∗). Se V ∗ e la soluzione dell’equazione di Poisson corrispondente a (u∗, v∗), allora laterna (V ∗, u∗, v∗) e soluzione debole del problema di diffusione trasporto.

2.4.7 Analisi della mappa di Gummel.

Implementiamo ora la strategia A), B), C) delineata sopra. II primo problema che occorrerisolvere nei passi indicati e un problema misto (Dirichlet-Neumann) per un’equazione ellitticasemilineare della forma

div (a (x)∇w) = f (x, w) in Ω∂νw = 0 su ∂NΩ w = wD su ∂DΩ (SE)

con Ω dominio limitato lipschitziano in Rn e f : Ω×R → R. Il teorema che serve e quindi ilteorema 3.2. Consideriamo una coppia (u0, v0) appartenente all’insieme B definito nel puntoC),

B =

(u, v) ∈ (L (Ω))2 :1K≤ u, v ≤ K q.o. in Ω

e risolviamo l’equazione semilineare (2.24) usando il teorema citato con

• w = V, wD = VD, a (x) = λ2

• f (x,w) = δ2ewu0 − δ2e−wv0 − C (x)

• g∗ (w) = 1K δ

2ew −Kδ2e−w − C, g∗ (w) = Kδ2ew − 1K δ

2e−w − C

e quindi

w∗ = log

KC +√C

2+ 4δ2

2δ2

, W ∗ = max w∗,K ≡ V+

w∗ = log

[C +

√C2 + 4δ2

2Kδ2

],W∗ = min

w∗,

1K

≡ V−.

Otteniamo cosı una soluzione V1 che soddisfa la disuguaglianza

V− ≤ V1 ≤ V+

Inseriamo ora V1 al posto di V nelle equazioni lineari (2.20) e (2.21). Poiche

µneV1 > µne

V− , µpeV1 > µpe

−V+

78

Page 81: Libro - Analisi Funzionale - Matematica

il problema e uniformemente ellittico. Inoltre, dalla positivita di F e u0, v0, si deduce checiascuna equazione ha una ed una sola soluzione in H1 (Ω) , u1 e v1, rispettivamente.

Osserviamo che, essendo F ≥ 0 e

0 <1K≤ u0, v0 ≤ K,

la funzione costante z (x) = K e soprasoluzione del problema misto, in quanto

−div(µn (x,∇V1) eV1∇K

)+ F (x, V1, u0, v0) (Kv0 − 1) = F (x, V1, u0, v0) (Kv0 − 1) ≥ 0

e K ≥ wD, ∂νK = 0. Analogamente, la funzione costante z (x) = 1/K e sottosoluzione delproblema misto, in quanto

−div(µn (x,∇V1) eV1∇K

)+ F (x, V1, u0, v0) (

1Kv0 − 1) ≤ 0

e K ≥ wD, ∂νK = 0. Dal principio di massimo, segue che

1K≤ u1 ≤ K.

Analogamente si dimostra che1K≤ v1 ≤ K.

Si e in tal modo definita la mappa di Gummel

G : B → B

che associa alla coppia (u0, v0) ∈ B la coppia (u1, v1), pure appartenente a B, come abbiamoappena visto. L’ultimo passo che rimane da fare e mostrare che G e compatta. Questo seguedalle stime per le soluzioni delle equazioni ellittiche e dal teorema di Rellich. Infatti, per lesoluzioni di (2.20) e (2.21) abbiamo

‖u1‖H1(Ω) ≤ L1

‖F (·, V1, u0, v0)‖L∞(Ω) + ‖uD‖H1(Ω)

‖v1‖H1(Ω) ≤ L2

‖F (·, V1, u0, v0)‖L∞(Ω) + ‖vD‖H1(Ω)

dove L1, L2 dipendono, in ultima analisi, solo dalle costanti λ, µn, µp, V+, V−,K.

Queste due disuguaglianze implicano che G (B) e un insieme limitato di(H1 (Ω)

)2 e per-tanto, in base al teorema di Rellich, relativamente compatto in

(L2 (Ω)

)2. La dimostrazionee cosı conclusa.

79