66
1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si ` e soliti introdurre i numeri complessi, partendo dal problema della risoluzione dell’equazione x 2 = -1; (1) ma questo non ` e il motivo storico della nascita dei numeri complessi. In effetti la risoluzione dell’equazione (1) non poteva essere considerato un problema ma- tematico aperto, nel senso che, fin dalla nascita dei numeri reali negativi, era ovvio che l’equazione (1) non aveva soluzioni. La questione che ha dato l’avvio allo studio dei numeri complessi ` e in- vece collegata al problema della risoluzione dell’equazione di terzo grado. Car- dano e Tartaglia avevano scoperto una formula per determinare una soluzione dell’equazione x 3 + px + q =0, alla quale si pu` o ricondurre ogni equazione di terzo grado mediante un cambia- mento lineare di variabile. La formula di Cardano ` e la seguente x = 3 -q 2 + q 2 4 + p 3 27 + 3 -q 2 - q 2 4 + p 3 27 . (2) La formula non pu` o essere utilizzata quando il discriminante, q 2 4 + p 3 27 ,` e minore di 0, eppure ogni equazione di terzo grado ha almeno una radice reale. Ecco il problema matematico aperto: risolvere l’equazione cubica nel casus ir- riducibilis, cio` e quando il discriminante ` e minore di 0. Bombelli esamin` o l’equazione x 3 - 15x - 4=0 (3) che appartiene al casus irriducibilis e ha la radice 4. Dalla formula di Cardano si otterrebbe x = 3 2+ -121 + 3 2 - -121. Bombelli dimostr` o, che, attribuendo un significato matematico alla radice qua- drata di -1 (la chiama pi` u di meno), se si pone 3 2+ -121 = a + b -1 allora 3 2 - -121 = a - b -1; per cui applicando la formula di Cardano si ottiene x =(a + b -1) + (a - b -1) = 2a. 1

1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

1 Numeri e spazi vettoriali complessi

1.1 Breve introduzione storica

Si e soliti introdurre i numeri complessi, partendo dal problema della risoluzionedell’equazione

x2 = −1; (1)

ma questo non e il motivo storico della nascita dei numeri complessi. In effettila risoluzione dell’equazione (1) non poteva essere considerato un problema ma-tematico aperto, nel senso che, fin dalla nascita dei numeri reali negativi, eraovvio che l’equazione (1) non aveva soluzioni.

La questione che ha dato l’avvio allo studio dei numeri complessi e in-vece collegata al problema della risoluzione dell’equazione di terzo grado. Car-dano e Tartaglia avevano scoperto una formula per determinare una soluzionedell’equazione

x3 + px + q = 0,

alla quale si puo ricondurre ogni equazione di terzo grado mediante un cambia-mento lineare di variabile. La formula di Cardano e la seguente

x =3

√−q

2+

√q2

4+

p3

27+

3

√−q

2−

√q2

4+

p3

27. (2)

La formula non puo essere utilizzata quando il discriminante, q2

4 + p3

27 , eminore di 0, eppure ogni equazione di terzo grado ha almeno una radice reale.Ecco il problema matematico aperto: risolvere l’equazione cubica nel casus ir-riducibilis, cioe quando il discriminante e minore di 0.

Bombelli esamino l’equazione

x3 − 15x− 4 = 0 (3)

che appartiene al casus irriducibilis e ha la radice 4. Dalla formula di Cardanosi otterrebbe

x =3√

2 +√−121 +

3√

2−√−121.

Bombelli dimostro, che, attribuendo un significato matematico alla radice qua-drata di −1 (la chiama piu di meno), se si pone

3√

2 +√−121 = a + b

√−1

allora3√

2−√−121 = a− b

√−1;

per cui applicando la formula di Cardano si ottiene

x = (a + b√−1) + (a− b

√−1) = 2a.

1

Page 2: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Bombelli non conosceva un algoritmo per l’estrazione della radice cubica di2 +

√−121, ma verifico che, estendendo le usuali regole del calcolo algebrico a

espressioni che contenevano√−1,

(2 +√−1)3 = 2 + 11

√−1 = 2 +

√−121,

per cui a = 2, b = 1 e x = 4.Dunque l’introduzione dell’ entita piu di meno rendeva compatibile la radice

4 dell’equazione (3) con la formula di Cardano (2). Non si poteva ancora af-fermare di aver risolto il casus irriducibilis, perche non era noto un algoritmoper determinare la radice cubica dell’espressione a + b

√−1, ma la utilita di

considerare, nella trattazione di problemi algebrici, l’entita√−1, chiamata suc-

cessivamente unita immaginaria, era pienamente dimostrata.Soltanto due secoli piu tardi, grazie a Gauss, verra attribuita la natura di

numero all’espressione a + b√−1, detta numero complesso.

Per quanto in senso storico la nascita dei numeri complessi sia da ricondurrea problemi algebrici, in queste note i numeri complessi verranno introdotti se-guendo una problematica geometrica.

1.2 Le coordinate polari

Nel piano fissiamo un punto O, una semiretta r uscente da O e un verso per lamisura degli angoli orientati che hanno r come primo lato.

A ogni punto P del piano diverso da O possiamo associare due numeri: ilprimo ρ rappresenta la distanza di P da O, il secondo θ la misura in radiantidell’angolo orientato che la semiretta uscente da O e passante per P forma conr. La coppia (ρ, θ) da una rappresentazione del punto P in coordinate polari.

Una precisazione e necessaria sulla misura dell’angolo orientato. Senza en-trare in sottili disquisizioni su cosa sia la misura di un angolo, segnaliamo chele coppie (ρ, θ) e (ρ, θ1) corrispondono allo stesso punto se θ − θ1 = 2kπ, conk ∈ Z.

Diversi approcci si trovano in letteratura, per trattare le difficolta provenientidalla mancanza di corrispondenza biunivoca fra i punti del piano e l’insieme dellecoppie di numeri reali (ρ, θ). Segnalo i due principali. Il primo, quello dellageometria differenziale, prevede che vi siano infiniti sistemi di coordinate localidi tipo polare e quindi che un punto possa essere rappresentato da infinite coppiedi numeri. Il secondo di tipo piu algebrico, prevede che la misura dell’angoloorientato sia un insieme infinito di valori, per cui le coordinate polari di unpunto sono una coppia di cui il primo elemento e un numero reale positivo e ilsecondo un insieme di numeri reali che differiscono fra loro per multipli interidi 2π. Seguendo questo secondo approccio scriveremo

Pp≡ (ρ,Θ).

doveΘ = {θ + 2kπ}k∈Z.

2

Page 3: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

ρ si chiama il modulo1 di P ; Θ si chiama l’argomento2 di P .Quando scriviamo Θ1 + Θ2, intendiamo l’insieme ottenuto sommando ogni

numero del primo insieme con ogni numero del secondo e cioe l’insieme3

Θ1 + Θ2 := {θ1 + θ2 + 2kπ}k∈Z.

Quando applichiamo a Θ una funzione trigronometrica si intende che la appli-chiamo a uno qualunque dei suoi valori, senza pericolo di confusione, percheogni funzione trigonometrica ha 2π come periodo.

Osserviamo infine che non vengono assegnate le coordinate polari del puntoO.

Per determinare le relazioni che esistono fra coordinate polari e coordinatecartesiane, mettiamo sul piano un sistema di riferimento cartesiano ortogonale,dove l’origine coincide con O, l’asse positivo delle ascisse x coincide con lasemiretta r e l’asse positivo delle ordinate y, ortogonale all’asse delle ascissein O, sia scelto, fra i due possibili, in modo tale che l’angolo orientato xy misuri{π

2 + 2kπ}k∈Z.Se P ha coordinate cartesiane

P ≡ (x, y)

e coordinate polariP

p≡ (ρ,Θ).

allora, da un verso {x = ρ cos(Θ)y = ρ sin(Θ) (4)

e dall’altro4 ρ =

√x2 + y2

cos(Θ) = x√x2+y2

sin(Θ) = y√x2+y2

.

1.3 Definizione dei numeri complessi

L’introduzione delle coordinate cartesiane nel piano permette di definire unacorrispondenza biunivoca fra i punti del piano e R2 e questa corrispondenzapermette di trasportare sul piano l’operazione di somma propria dello spaziovettoriale R2. Per cui, se P1 ≡ (x1, y1) e P2 ≡ (x2, y2), poniamo5

P1 + P2 :≡ (x1 + x2, y1 + y2)1nella terminologia antica raggio vettore.2nella terminologia antica anomalia3in questo modo si garantisce che la misura dell’angolo che si ottiene dalla giustapposizione

del secondo spigolo di un angolo orientato con il primo spigolo di un secondo angolo orientatoe uguale alla somma delle misure dei due angoli orientati.

4evitiamo di dare un’espressione espilicita per Θ, perche bisognerebbe prima convenire sulledefinizioni delle funzioni arcoseno e arcocoseno.

5la somma dei punti nel piano con origine fissata, puo essere introdotta in modo puramente

geometrico, con la regola del parallelogramma applicata ai vettori geometrici→

OP1 e→

OP2 .

3

Page 4: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Quale operazione suggeriscono le coordinate polari fra i punti del piano pri-vato dell’origine? I moduli, essendo numeri reali positivi, hanno una strutturanaturale di gruppo se considero la moltiplicazione; mentre, per quanto riguardagli argomenti, ho una struttura di gruppo se considero la somma.

Combiniamo le due operazioni precedenti, il prodotto dei moduli e la sommadegli argomenti, in una nuova operazione per i punti del piano privato dell’origine,che denotiamo provvisoriamente con ∗: posto che sia P1

p≡ (ρ1,Θ1) e P2

p≡

(ρ2,Θ2), definiamoP1 ∗ P2 :

p≡ (ρ1ρ2,Θ1 + Θ2).

Questa stessa operazione, in coordinate cartesiane assume l’espressione

P1 ∗ P2≡(√

x21 + y2

1

√x2

2 + y22(cos Θ1 cos Θ2 − sinΘ1 sinΘ2),√

x21 + y2

1

√x2

2 + y22(cos Θ1 sinΘ2 + cos Θ2 sinΘ1) =

(x1x2 − y1y2, x1y2 + x2y1)

Trasferiamo le operazioni cosı introdotte in R2,

(x1, y1) + (x2, y2) := (x1 + x2, y1 + y2)

(x1, y1) ∗ (x2, y2) := (x1x2 − y1y2, x1y2 + x2y1).

Si prova che (R2,+, ∗) e campo, cioe

• e un gruppo commutativo rispetto la somma (+) con elemento neutro(0, 0)

• gli elementi diversi da (0, 0) formano un gruppo rispetto al prodotto (∗),con elemento neutro (1, 0)

• vale la proprieta distributiva

((x1, y1) + (x2, y2)) ∗ (x3, y3) = (x1, y1) ∗ (x3, y3) + (x2, y2) ∗ (x3, y3)

Le verifiche delle proprieta sono tutte elementari; segnaliamo solo la provadell’esistenza dell’inversa rispetto al prodotto6:sia (a, b) 6= (0, 0), dobbiamo cercare (x, y) tale che

(a, b) ∗ (x, y) = (1, 0)

cioe {ax− by = 1bx + ay = 0

poiche il sistema ha una e una sola soluzione, essendo a2 + b2 6= 0, l’inverso di(a, b) esiste.

6che peraltro e ovvia se si pensa al prodotto in termini di coordinate polari

4

Page 5: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Chiameremo (R2,+, ∗) il campo dei numeri complessi e verra semplicementeindicato con C; come d’uso, eviteremo di scrivere il simbolo dell’operazioneprodotto, e converremo anche che in un’espressione algebrica, in mancanza diparentesi, l’operazione prodotto abbia priorita sull’operazione di somma.

La funzionef : R → C

x 7→ (x, 0)

e iniettiva e tale chef(x + y) = f(x) + f(y)

f(xy) = f(x)f(y)

pertanto, se identifichiamo x ∈ R con (x, 0) ∈ C, possiamo considerare il campoC come un’estensione del campo R.

C eredita da R2 anche la struttura di spazio vettoriale su R , quindi ho dueoperazioni di prodotto di un numero complesso per un numero reale, quella chec’e in ogni spazio vettoriale di moltiplicazione di un vettore per uno scalare,e quella che deriva dal considerare ogni numero reale un particolare numerocomplesso. Per fortuna le due operazioni coincidono, per cui non vi e ambiguitanel prodotto di un numero reale per un numero complesso. La base standard di Ccome spazio vettoriale su R e formata dai numeri7 (1, 0) e (0, 1), il numero (1,0)possiamo chiamarlo 1, corrispondendo al numero reale 1 e all’unita del prodotto;chiamiamo unita immaginaria il numero (0, 1) e indichiamola sinteticamente con”i”.

Formando 1 e i una base di C come R-spazio vettoriale, possiamo rappre-sentare il numero (x, y) ∈ C nel seguente modo

(x, y) = x1 + yi = x + iy.

Abbiamo che i2 = −1; pertanto i e soluzione dell’equazione x2 = −1, maanche −i e soluzione, quindi la scrittura

i =√−1,

che si trova in molto libri, e fonte di confusione, essendo equivoco il significatodel simbolo √ .

Indicheremo il generico numero complesso con la lettera z e volendo metterein luce la decomposizione di cui sopra scriveremo

z = x + iy. (5)

x si chiama la parte reale di z (si indica Re(z)) e y la parte immaginaria (siindica Im(z)). La scrittura data dalla (5) e particolarmente comoda perche ilprodotto fra due numeri complessi puo essere eseguito con le usuali regole delcalcolo algebrico, sostituendo −1 ogni volta che troviamo i2.

7gli elementi di C vengono chiamati numeri e non vettori

5

Page 6: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

1.4 Alcune funzioni elementari su CLa seguente funzione si chiama coniugio ed e particolarmente importante

C → Cz = x + iy 7→ z := x− iy

La sua importanza deriva dal fatto che il coniugio e un isomorfismo di campi,cioe e biunivoca e gode delle seguenti proprieta

z1 + z2 = z1 + z2

z1z2 = z1z2

La parte reale e la parte immaginaria di un numero complesso possono esseredefinite tramite il coniugio da

Re : C → R ⊂ Cz 7→ z+z

2

Im : C → R ⊂ Cz 7→ z−z

2i

Per il coniugio valgono le seguenti proprieta di facile verifica

• ¯z = z

• z + z = 2Re(z)

• z − z = 2iRe(z)

• z−1 = (z)−1, per z 6= 0

• z = z ⇔ z ∈ R

• z = −z ⇔ z ∈ iR, in tal caso diremo che z e un immaginario puro.

Definiamo la funzione modulo di un numero complesso z = z+iy nel seguentemodo

|z| =√

x2 + y2,

risulta |z| =√

Re(z)2 + Im(z)2 =√

zz. Trattandosi di numeri reali positivi onulli, non c’e equivoco col simbolo di radice, intendendosi con

√x il numero reale

non negativo il cui quadrato e x. Inoltre se z e un numero reale il suo modulocoincide col valore assoluto, per cui non c’e confusione nel simbolo usato.

Per la funzione modulo valgono le seguenti proprieta

• |z| ≥ 0 e |z| = 0 ⇔ z = 0

• |z| = |z|

• |Re(z)| ≤ |z|, |Im(z)| ≤ |z|, |z| ≤ |Im(z)|+ |Re(z)|

6

Page 7: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

• |z1z2| = |z1||z2|

• |z−1| = |z|−1, per z 6= 0

• |z1 + z2| ≤ |z1|+ |z2|

• |z1 + z2| ≥ ||z1| − |z2||.

Segnaliamo la dimostrazione delle ultime due relazioni, essendo le altre imme-diate:

|z1 + z2|2 = (z1 + z2)(z1 + z2) = |z1|2 + z1z2 + z1z2 + |z2|2 =|z1|2 + z1z2 + z1z2 + |z2|2 =|z1|2 + 2Re(z1z2) + |z2|2 ≤

|z1|2 + 2|z1z2|+ |z2|2 =|z1|2 + 2|z1||z2|+ |z2|2 =|z1|2 + 2|z1||z2|+ |z2|2 =

(|z1|+ |z2|)2,

similmente (passaggi abbreviati)

|z1 − z2|2 = |z1|2 − 2Re(z1z2) + |z2|2 ≥|z1|2 − 2|(z1z2)|+ |z2|2 =

(|z1| − |z2|)2.

1.5 La rappresentazione trigoniometrica di un numero com-plesso

Scriviamo un numero complesso z = x + iy diverso da 0 nella forma

z = |z|(Re(z)|z|

+ iIm(z)|z|

).

Poiche(

Re(z)|z|

)2

+(

Im(z)|z|

)2

= 1, possiamo anche scrivere

z = |z|(cos Θ + i sinΘ). (6)

dove Θ = {θ + 2kπ}k∈Z rappresenta la misura8 dell’angolo orientato che lasemiretta uscente da 0 e passante per 1 forma con la semiretta uscente da 0e passante per z; esso e tale che cos Θ = Re(z)

|z| e sinΘ = Im(z)|z| . Θ si dice

l’argomento di z. La funzione argomento e definita per tutti numeri complessidiversi da 0 ed e un esempio di funzione a piu valori.

8e doveroso segnalare che la definizione di misura di un angolo, specie se orientato, e que-stione assai delicata e autorevoli matematici ritengono che questa non possa essere data inmamiera corretta se non in un corso di analisi complessa o in un corso di teoria della misura;purtroppo ragioni didattiche impongono anticipare le definizioni delle funzioni trigonometri-che, ed anche la rappresentazione trigonometrica di un numero complesso.

7

Page 8: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Sianoz1 = ρ1(cos θ1 + i sin θ1)

z2 = ρ2(cos θ2 + i sin θ2),

due numeri complessi, con θ1, θ2 ∈ R e ρ1, ρ2 ∈ R+; se z1 = z2, allora, essendo| cos θ + i sin θ| = 1, abbiamo

ρ1 = |ρ1|| cos θ1 + i sin θ1| = |ρ1(cos θ1 + i sin θ1)| = z1 =z2 = |ρ2(cos θ2 + i sin θ2)| = |ρ2|| cos θ2 + i sin θ2| = ρ2,

quindi cos θ1 = cos θ2 e sin θ1 = sin θ2. Poiche l’implicazione nell’altro verso eovvia, possiamo concludere che

z1 = z2 ⇐⇒{

ρ1 = ρ2

∃k ∈ Z : θ1 = θ2 + 2kπ(7)

Pertanto, se rapprensentiamo la misura di un angolo orientato con un insieme dinumeri reali Θ = {θ+2kπ}k∈Z, un numero complesso non nullo e univocamentedeterminato dalla sua rappresentazione (6). Per ogni θ ∈ Θ

z = |z|(cos θ + i sin θ)

si chiama una rappresentazione trigonometrica di z. Tornando alla (6) Θ sichiama l’argomento di z e ogni θ ∈ Θ si chiama una determinazione dell’argomentodi z.

Sianoz1 = |z1|(cos Θ1 + i sinΘ1)

z2 = |z2|(cos Θ2 + i sinΘ2),

si haz1z2 = |z1||z2|(cos(Θ1 + Θ2) + i sin(Θ1 + Θ2)), (8)

che e ovvia se si considera la ”genesi” che abbiamo presentato del prodotto dinumeri complessi, e che comunque si prova facilmente usando le formule delcoseno e del seno dell’angolo somma.

Come caso particolare dalla (8) otteniamo la formula di De Moivre

zn = |z|n(cos(nΘ) + i sin(nΘ)). (9)

OSSERVAZIONE. Nella formula di De Moivre col simoblo nΘ intendiamoΘ + . . . + Θ, n volte, e qunindi

nΘ = {nθ + 2kπ}k∈Z

e non nΘ = {nθ + 2knπ}k∈Z.La formula di De Moivre permette di risolvere in C l’equazione

zn = w (10)

8

Page 9: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Per w 6= 0, siaw = |w|(cos Φ + i sin Φ),

con Φ = {φ + 2kπ}k∈Z, e sia

z = |z|(cos Θ + i sinΘ),

con Θ = {θ + 2kπ}k∈Z una soluzione di (10). Abbiamo |w| = |z|n, Φ = nΘ.Da cui segue subito che |z| = |w| 1n , ma non possiamo scrivere Θ = Φ

n , perl’osservazione precedente. In effetti da (10) segue{

|z| = |w| 1n∀φ ∈ Φ,∀θ ∈ Θ,∃k ∈ Z : φ = nθ + 2kπ

ovvero {|z| = |w| 1n∀φ ∈ Φ,∀θ ∈ Θ,∃k ∈ Z : θ = φ

n + 2kπn

Pertanto ∀k ∈ Z , in numeri

|w| 1n(

cos(

φ

n+

2kπ

n

)+ i sin

n+

2kπ

n

))sono soluzioni della (10) ma non ho infinite soluzione diverse, potendo i numeriφn + 2kπ

n rappresentare diverse determinazioni dello stesso angolo. Sia φ ∈ Φ,poniamo

θ0 = φn

θ1 = φn + 2π

n

θ2 = φn + 2 2π

n...

...θn−1 = φ

n + (n− 1) 2πn

a cui corrispondono gli angoli le cui misure sono

Θ0 = {φn + 2kπ}k∈Z

Θ1 = {φn + 2π

n + 2kπ}k∈ZΘ2 = {φ

n + 2 2πn + 2kπ}k∈Z

......

Θn−1 = {φn + (n− 1) 2π

n + 2kπ}k∈Z;

il numero φn + n 2π

n = φn + 2π appartiene a Θ0 e non da luogo a una diversa

soluzione dell’equazione (10). Pertanto, se w 6= 0, l’equazione (10) ha n distintesoluzioni ed esse sono date da 9

9nella formula che segue al posto di Θ0, Θ1 . . . potremmo scrivere anche θ0, θ1 . . .

9

Page 10: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

z0 = |w| 1n (cos(Θ0) + i sin(Θ0))z1 = |w| 1n (cos(Θ1) + i sin(Θ1))z2 = |w| 1n (cos(Θ2) + i sin(Θ2))...

...zn−1 = |w| 1n (cos(Θn−1) + i sin(Θn−1))

Infine, se w = 0, la (10) ha la sola soluzione nulla.Esempio Per trovare le soluzioni dell’equazione z3 = 2, dobbiamo rappre-

sentare in modo trigonometrico il numero complesso 2:

2 = 2(cos(0) + i sin(0))

pertanto le tre radici cubiche di 2 sono

z0 = 213 (cos(0) + i sin(0)) = 2

13

z1 = 213 (cos( 2π

3 ) + i sin( 2π3 )) = 2

13 (− 1

2 + i√

32 )

z2 = 213 (cos( 4π

3 ) + i sin( 4π3 )) = 2

13 (− 1

2 − i√

32 )

Esempio Per trovare le soluzioni dell’equazione z4 = −4, dobbiamo rappre-sentare in modo trigonometrico il numero complesso -4:

−4 = 4(cos(π) + i sin(π))

pertanto le quattro radici quarte di -4 sono

z0 = 212 (cos(π

4 ) + i sin(π4 )) = 2

12 ( 2

12

2 + i 212

2 ) = 1 + i

z1 = 212 (cos(π

4 + π2 ) + i sin(π

4 + π2 )) = 2

12 (− 2

12

2 + i 212

2 ) = −1 + i

z2 = 212 (cos(π

4 + π) + i sin(π4 + π)) = 2

12 (− 2

12

2 − i 212

2 ) = −1− i

z3 = 212 (cos(π

4 + 3π2 ) + i sin(π

4 + 3π2 )) = 2

12 ( 2

12

2 − i 212

2 ) = 1− i

Esempio Per trovare le soluzioni dell’equazione z2 = −i, dobbiamo rappre-sentare in modo trigonometrico il numero complesso i:

−i = (cos(3π

2) + i sin(

2))

pertanto le due radici quadrate di -i sono

z0 = (cos( 3π4 ) + i sin( 3π

4 )) = (− 212

2 + i 212

2 ) =√

22 (−1 + i)

z1 = (cos( 3π4 + π) + i sin( 3π

4 + π)) = ( 212

2 − i 212

2 ) =√

22 (1− i)

La formula di De Moivre (9) ci ha permesso di trovare le soluzioni di alcunesemplici equazioni polinomiali, ma non esiste una formula che utilizzi solo lequattro operazioni e le estrazioni di radici, tipo quella di Cardano (2) che diale soluzioni della generica equazione polinomiale, quando il grado e maggiore

10

Page 11: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

di 4. Ciononostante, il seguente teorema, cosı importante da essere chiamatoteorema fondamentale dell’algebra, assicura che almeno una soluzione esiste.

Teorema (fondamentale dell’algebra)Ogni polinomio in una variabile, a coefficienti complessi, non costante, ha

almeno una radice10 in C .Le dimostrazioni puramente algebriche di questa teorema sono molto complesse;altre piu abbordabili fanno uso di strumenti di analisi matematica.

Un polinomio in una variabile si dice monico se il coefficiente del termine digrado massimo e 1. Se un polinomio p(z) ha una radice z0, allora e divisibileper (z − z0) e, ripetendo la divisione n volte, otteniamo il seguente

Corollario Ogni polinomio, in C, non costante, di grado n, si fattorizza nelprodotto di una costante e di n fattori di primo grado monici.

Ogni polinomio a coefficienti reali e anche un polinomio a coefficienti com-plessi, e come tale ammette radici complesse.

Proposizione 1.1 Sia p(x) un polinomio a coefficienti reali. Se w e una radicedi p(x) anche w lo e.

Dim. Sia p(x) = anxn + an−1xn−1 + . . . + a1x + a0. Se w e radice abbiamo

anwn + an−1wn−1 + . . . + a1w + a0 = 0,

coniugando ambo i membri, abbiamo

anwn + an−1wn−1 + . . . + a1w + a0 = 0 = 0,

da cui, considerate le proprieta della funzione coniugio e tenendo presente che icoefficienti sono reali,

anwn + an−1wn−1 + . . . + a1w + a0 = 0,

cioe p(w) = 0.

Corollario Ogni polinomio a coefficienti reali di grado dispari ha almenouna radice reale.

1.6 Spazi vettoriali reali e spazi vettoriali complessi

Abbiamo gia osservato che C e uno spazio vettoriale sul campo R di dimensione2, essendo {1, i} una base. C e anche uno spazio vettoriale sul campo C, e inquesto caso la sua dimensione e 1, essendo ogni numero complesso non nullouna sua base.

Uno spazio vettoriale V su C e anche uno spazio vettoriale su R , in quanto,essendo definito il prodotto di un vettore per un numero complesso, e definitoanche il prodotto di un vettore per un numero reale poiche questo e un par-ticolare numero complesso. Indichiamo con VR l’insieme V munito della solastruttura di spazio vettoriale reale.

10cioe un numero complesso dove il polinomio vale 0, per questo la radice di un polinomiosi dice anche uno zero del polinomio

11

Page 12: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Proposizione 1.2 Sia V uno spazio vettoriale su C. Se dim(V ) = n, alloradim(VR) = 2n.

Dim. Sia V = {v1, . . . ,vn} una base su C di V . Allora VR = {v1, . . . ,vn, iv1, . . . , ivn}e una base di V su R. Infatti, essendo V una base su C, abbiamo che ogni vettorew si scrive

w = z1v1 + . . . + znvn = (x1 + iy1)v1 + . . . (xn + iyn)vn =x1v1 + . . . + xnvn + y1iv1 + . . . + ynivn.

e quindi VR e un sistema di generatori su R di V . D’altra parte, se

a1v1 + . . . + anvn + b1iv1 + . . . + bnivn = 0

e una combinazione lineare nulla degli elementi di VR, allora

(a1 + ib1)v1 + . . . + (an + ibn)vn = 0,

e una combinazione lineare a coefficienti complessi nulla dei vettori della baseV; pertanto

(a1 + ib1) = . . . = (an + ibn) = 0

da cui a1 = . . . = an = b1 = . . . = bn = 0.

Sia ora V uno spazio vettoriale reale di dimensione n, possiamo dare a V ×V una struttura di spazio vettoriale complesso11. Questo spazio si chiama ilcomplessificato di V e lo indichiamo con VC. Le operazioni di somma e prodottoper uno scalare in VC sono definnite da

(v1,v2) + (w1,w2) := (v1 + w1,v2 + w2)

(x + iy)(v1,v2) := (xv1 − yv2, yv1 + xv2)

Le verifiche delle proprieta sono di routine. Per quanto gia visto all’inizio delparagrafo, VC ha anche una struttura di spazio vettoriale reale, che coincidecon quella di V × V . Possiamo definire un’applicazione iniettiva da V in VC,che e lineare come applicazione fra spazi vettoriali reali (verifiche banali), nelseguente modo

J : V −→ VCv 7−→ (v, 0)

Abbiamo(v1,v2) = (v1, 0) + i(v2, 0),

per cui, se identifichiamo v con (v, 0), (operazione legittimata dal fatto che J elineare e iniettiva) possiamo scrivere

(v1,v2) = v1 + iv2.

11V × V ha in maniera naturale una struttura di spazio vettoriale reale di dimensione 2n.

12

Page 13: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Proposizione 1.3 Se dim(V ) = n, allora dim VC = n.

Dim. Basta provare che, sotto l’identificazione J , una base di V e ancheuna base di VC. Sia dunque V = {v1, . . . ,vn} una base di V ; sia (v,w) ∈ C;abbiamo

v = a1v1 + . . . + anvn

w = b1v1 + . . . + bnvn

da cui

(v,w) = v + iw = a1v1 + . . . + anvn + i(b1v1 + . . . + bnvn) =(a1 + ib1)v1 + . . . + (an + ibn)vn,

pertanto V = {v1, . . . ,vn} e un sistema di generatori di VC.Sia ora

(a1 + ib1)v1 + . . . + (an + ibn)vn = 0

una combinazione lineare nulla dei vettori di V, abbiamo

(a1v1 + . . . + anvn, b1v1 + . . . + bnvn) =a1v1 + . . . + anvn + i(b1v1 + . . . + bnvn) =

(a1 + ib1)v1 + . . . + (an + ibn)vn = 0 = (0, 0)

da cuia1v1 + . . . + anvn = b1v1 + . . . + bnvn = 0

e, essendo {v1, . . . ,vn} linearmente indipendenti in V , concludiamo che

a1 = . . . = an = b1 = . . . = bn = 0

e che {v1, . . . ,vn} sono linearmente indipendenti in VC.

1.7 Applicazioni lineari e matrici

1.7.1

Sia F : V → W un’applicazione C-lineare fra spazi vettoriali complessi di di-mensione n e m. Siano V = {v1, . . . ,vn}, W = {w1, . . . ,wm}, basi di V eW rispettivamente. Come e noto a F possiamo associare una matrice m × n,MW,V(F ), sinteticamente definita dalla relazione

F (V) = WMW,V(F ).

MW,V(F ) = (αij) e una matrice a elementi complessi. Essa puo essere scrittacome A+iB, dove gli elementi di A = (aij) e B = (bij) sono, rispettivamente, leparti reali e le parti immaginarie degli elementi di MW,V(F ), cioe αij = aij+ibij .

13

Page 14: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Nel paragrafo precedente abbiamo visto che V e W , sono anche spazi vetto-riali reali di dimensione 2n e 2m; per distinguerli li abbiamo chiamati VR e WR.F e anche un’applicazione R-lineare da VR a WR.

Siano VR e WR le basi di VR e WR precedentemente definite. Vogliamocalcolare MWR,VR(F ).

Le colonne di MWR,VR(F ), sono rappresentate dalle componenti dei vettoriF (v1), . . . , F (vn), F (iv1), . . . , iF (vn), rispetto a WR = {w1, . . . ,wm, iw1, . . . , iwm}.Abbiamo

F (vj) =m∑

i=1

αijwi =m∑

i=1

aijwi + im∑

i=1

bijwi =m∑

i=1

aijwi +m∑

i=1

bij iwi

e

F (ivj) = iF (vj) = im∑

i=1

αijwi =m∑

i=1

iaijwi−m∑

i=1

bijwi =m∑

i=1

aij iwi−m∑

i=1

bijwi,

da cui la matrice cercata, e rappresentata a blocchi da

MWR,VR(F ) =(

A −BB A

).

1.7.2

Sia ora F : V → W un’applicazione lineare fra spazi vettoriali reali di dimen-sione n e m e siano V = {v1, . . . ,vn}, W = {w1, . . . ,wm}, basi di V e W ,rispettivamente. Possiamo estendere F a un’applicazione FC : VC → WC, perlinearita, utilizzando il fatto che le basi V e W di di V e W sono anche basi diVC e WC, e dunque la FC e definita sui vettori di una base di V . FC si chiamala complessificata dell’applicazione F . Essendo FC(vj) = F (vj), abbiamo che

MW,V(FC) = MW,V(F ).

Osservazione Capitera, qualche volta, di considerare le radici complesse ( enon reali) del polinomio caratteristico di un operatore T su uno spazio vettorialereale; questi numeri sono autovalori dell’operatore complessificato TC; i rispettiviautovettori saranno combinazioni lineari a coefficienti complessi dei vettori dellabase di V e come tali elementi di VC.

14

Page 15: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

2 Complementi di teoria degli operatori

Richiamiamo le proprieta sulla diagonalizzazione degli operatori. Sia V unospazio vettoriale12 su K di dimensione finita, V = {v1, . . . ,vn} una base di V eT : V → V un operatore lineare. Indichiamo con MVV(T ), la matrice associataa T rispetto alla base V. Ricordo che le sue colonne rappresentano, nell’ordine,le componenti dei trasformati dei vettori della base V rispetto alla stessa baseV. Tale proprieta puo essere scritta, in notazione matriciale

T (V) = VMVV(T ).

Se v = x1v1 + . . . + xnvn = Vx, con x =

x1

...xn

abbiamo

T (v) = T (Vx) = T (V)x = VMVV(T )x,

da cui se poniamo T (v) =: Vy, ne segue che

y = MVV(T )x

che possiamo considerare la rappresentazione in coordinate dell’operatore T .L’operatore T si dice diagonalizzabile se esiste una base W per cui MWW(T )

e diagonale, questo accade se e soltanto se esiste una base di autovettori13.Ricordiamo che due matrici A,B ∈ Mnn(K) si dicono simili se esiste G ∈

GLn(K) tale cheB = G−1AG.

EssendoMVV(T ) = M−1

WV(Id)MWW(T )MWV(Id),

dove MWV(Id) e la matrice cambiamento di base, abbiamo che T e diagonaliz-zabile se e solo se MVV(T ) e simile a una matrice diagonale.

La procedura per determinare se T e diagonalizzabile prevede di calcolare, inprimo luogo gli autovalori di T (che coincidono, qualunque sia la base V, con gliautovalori di MVV(T )), tramite la ricerca delle radici del polinomio caratteristico

PT (λ) = det(MVV(T )− λI).

λ e un autovalore se e solo se e radice del polinomio caratteristico. Per ogni au-tovalore λ, si definisce l’autospazio Vλ, come l’insieme degli autovettori associatia λ con l’aggiunto del vettore nullo; si definisce poi la molteplicita geometricadi λ come la dimensione di Vλ. Il criterio di diagonalizzabilita stabilisce cheT e diagonalizzabile se e solo se la somma delle molteplicita geometriche de-gli autovalori di T e uguale alla dimensione di V . Infine e da segnalare chela molteplicita geometrica di un autovalore λ e sempre minore o uguale dellamolteplicita algebrica di λ, cioe dell’esponente con cui si trova il fattore λ − λnella decomposizione in fattori irriducibili del polinomio caratteristico PT (λ).

12indichiamo genericamente con K un campo, nel nostro corso K e sempre R o C13ricordo che un vettore x non nullo si dice un autovettore relativo all’autovalore λ ∈ K, se

T (x) = λx.

15

Page 16: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

2.1 Classificazione di matrici, operatori, applicazioni li-neari

La relazione di similitudine fra matrici quadrate e di equivalenza. I matematicisi pongono, dunque, il problema di classificare le matrici modulo la relazione disimilitudine, cioe classificare le classi di equivalenza.

Se T e un operatore e A = MWW(T ) e la matrice associata a T rispetto labase W, allora la classe di equivalenza di A rappresenta l’insieme delle matricicon cui possiamo vedere rappresentato T rispetto basi diverse. Infatti, sia Bsimile a A, esiste quindi G ∈ GLn(K) tale che

B = G−1AG.

PoniamoV = WG,

abbiamo che V e una base di V e G = MWV(Id), per cui

B = M−1WV(Id)MWW(T )MWV(Id) = MVV(T ).

Questo non e il solo motivo per cui e importante classificare le matrici modulosimilitudine. La classificazione delle matrici modulo similitudine permette anchedi classificare gli operatori modulo automorfismi. Vediamo cosa si intende conquesta affermazione.

Siano T e F due operatori sullo spazio vettoriale V . Supponiamo che esistaun automorfismo14 su V , φ, tale che

φ ◦ F = T ◦ φ. (11)

E facile vedere che questa e una relazione di equivalenza fra operatori: sisuole dire che F e T sono equivalenti modulo automorfismi. Quando F e T sonoequivalenti modulo automorfismi, allora hanno le stesse proprieta algebriche, peresempio hanno lo stesso rango, stessi autovalori, stesse molteplicita algebriche egeometriche; inoltre se W = ker(F ) allora φ(W ) = ker(T ) e in generale tramite φo φ−1 e possibile passare da sottospazi significativi per T agli analoghi sottospaziper F .

Da (11) segueF = φ−1 ◦ T ◦ φ

che in coordinate, rispetto a una base a una base V, di V , si rappresenta

MVV(F ) = M−1VV(φ)MVV(T )MVV(φ),

per cui matrici associate, rispetto la stessa base, a operatori equivalenti sonosimili.

Viceversa, sia la matrice A simile a MVV(T ), esiste quindi G ∈ GL(K) taleche A = G−1MVV(T )G. Sia φ : V → V definita15 da

φ(V) = VG,

14un operatore su V invertibile15un’applicazione lineare e definita quando siano dati i suoi valori sui vettori di una base

16

Page 17: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

abbiamo che φ e invertibile e MVV(φ) = G, per cui, posto

F := φ−1 ◦ T ◦ φ,

abbiamo che F e equivalente a T modulo automorfismi e

MVV(F ) = M−1VV(φ)MVV(T )MVV(φ) = G−1MVV(T )G = A.

Concludendo possiamo affermare che la classe di equivalenza di matrici qua-drate rispetto la relazione di similitudine rappresenta l’insieme delle matrici as-sociate,rispetto a una stessa base, a una classe di operatori equivalenti moduloautomorfismi.

Pertanto la classificazione delle matrici modulo similitudine permette anchedi classificare gli operatori modulo automorfismi.

Il modo piu semplice per classificare un insieme di classi di equivalenza equello di individuare all’interno di ogni classe un suo elemento16 con caratteri-stiche specifiche che verra chiamata forma canonica.

La teoria della diagonalizzazione degli operatori (o delle matrici) permettedi classificare gli operatori diagonalizzabili. Abbiamo infatti che

Proposizione 2.1 Due matrici diagonali sono simili se e solo se sulla diago-nale troviamo gli stessi elementi e con la stessa molteplicita, disposti eventual-mente in ordine diverso.

Dim. Se le matrici diagonali A e B sono simili, allora hanno lo stessopolinomio caratteristico, quindi gli stessi autovalori con le stesse molteplicitaalgebriche. Poiche gli elementi della diagonale di una matrice diagonale sonogli autovalori della matrice ripetuti tante volte quanto e la loro molteplicitaalgebrica, e gli autovalori con le loro molteplicita sono invarianti per similitudine,A e B hanno sulla diagonale gli stessi numeri (e, se ripetuti, li incontriamo lostesso numero di volte, salvo in un diverso ordine).

Viceversa proviamo che due matrici diagonali con diagonali uguali, salvol’ordine degli elementi, sono simili. Poiche ogni permutazione dell’ordine deglielementi della diagonale puo essere ottenuta con una sequenza di scambi, pos-siamo limitarci a considerare a due matrici diagonali A e B che differiscono soloper lo scambio di due elementi sulla diagonale. Siano

A =

a1 0 0 . . . 00 a2 0 . . . 00 0 a3 . . . 0...

......

. . ....

0 0 0 . . . an

B =

a2 0 0 . . . 00 a1 0 . . . 00 0 a3 . . . 0...

......

. . ....

0 0 0 . . . an

Sia inoltre C ottenta dalla matrice unita cambiando le prime due colonne,

16o un limitato gruppo di elementi

17

Page 18: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

cioe

C =

0 1 0 . . . 01 0 0 . . . 00 0 1 . . . 0...

......

. . ....

0 0 0 . . . 1

Abbiamo che C e ortogonale e quindi C−1 = Ct = C e facilmente si verifica che

A = C−1BC.

Prima di progredire nello studio che ci portera a classificare tutte le matricimodulo similitudine, osserviamo come l’analogo problema di classificazione delleapplicazioni lineari fra due spazi vettoriali diversi, modulo automorfismi dei duespazi vettoriali, sia semplice. Questa classificazione e conseguenza del seguente,importante teorema

Proposizione 2.2 (teorema nullita + rango17)Sia F : V → W un’applicazione lineare. Abbiamo che

dim(kerF ) + dim(F (V )) = dim V

Dim. Sia {v1, . . . ,vs} una base di ker(F ) e completiamola a una base di V ,

V = {v1, . . . ,vs,vs+1, . . . ,vn}.

Se proviamo che {F (vs+1), . . . , F (vn)} e una base di F (V ) abbbiamo provatoil teorema.

• span{F (vs+1), . . . , F (vn)} = F (V ).

Sia w ∈ F (V ), esiste v ∈ V tale che F (v) = w.

v = a1v1 + . . . + asvs + as+1vs+1 + . . . + anvn,

quindi, per la linearita di F , e poiche i primi s vettori di V stanno inker(F ),

w = F (v) =a1F (v1) + . . . + asF (vs) + as+1F (vs+1) + . . . + anF (vn) =

as+1F (vs+1) + . . . + anF (vn).

• {F (vs+1), . . . , F (vn)} sono linearmente indipendenti.

17si dice nullita la dimensione del nucleo di un’applicazione lineare, si dice rango la dimen-sione dell’immagine

18

Page 19: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Sia as+1F (vs+1) + . . . + anF (vn) = 0, una combinazione lineare nulla.Abbiamo

0 = as+1F (vs+1) + . . . + anF (vn) =F (as+1vs+1 + . . . + anvn).

Per cui as+1vs+1 + . . . + anvn ∈ ker(F );questo vettore e quindi combi-nazione lineare dei vettori della base di ker(F ). Esistono a1, . . . , as taliche

as+1vs+1 + . . . + anvn = a1v1 + . . . + asvs,

e pertanto

−a1v1 − . . .− asvs + as+1vs+1 + . . . + anvn = 0

rappresenta una combinazione lineare nulla dei vettori della base di V . Nesegue che tutti i coefficenti e in particolare as+1 . . . + an sono nulli.

Vediamo come utilizzare la dimostrazione del teorema per classificare le appli-cazioni lineari fra due spazi vettoriali diversi modulo automorfismi.

Completiamo la base {F (vs+1), . . . , F (vn)} di F(V) in una base W di W ,aggiundendo opportunamente k vettori, w1, . . . ,wk, con k = m− (n− s).

W = {F (vs+1), . . . , F (vn),w1, . . . ,wk}.

La matrice associata a F rispetto le basi V e W e

MWV(F ) =

0 . . . 0 1 0 . . . 00 . . . 0 0 1 . . . 0...

......

......

. . ....

0 . . . 0 0 0 . . . 10 . . . 0 0 0 . . . 0...

......

......

......

0 . . . 0 0 0 . . . 0

=

(0 Ir

0 0

)

dove Ir e la matrice unita di dimensione uguale al rango di F .Poiche due matrici che rappresentano la stessa applicazione lineare rispetto a

basi diverse hanno lo stesso rango, possiamo concludere che troviamo nella classedi equivalenza di un applicazione lineare F fra spazi diversi modulo automorfismi(dello spazio di partenza e di arrivo), tutte e sole le applicazioni che hanno lostesso rango di F . Quindi il rango classifica le applicazioni lineari.

19

Page 20: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

2.2 Triangolarizzazione degli operatori

Il fatto fondamentale che distingue la teoria degli operatori in campo comlesso daquella in campo reale e che in C un operatore ha sempre almeno un autovalore,perche il polinomio caratteristico ha almeno una radice.

Definizione 2.1 Una matrice quadrata A = (aij) si dice triagolare superiorese aij = 0 per i > j.

Proposizione 2.3 Ogni operatore T su uno spazio vettoriale complesso V etriangolarizzabile, cioe esiste una base V per cui la matrice associata MVV(T )e triangolare superiore.

Dim. La dimostrazione e per induzione sulla dimensione di V . Per gli spazi didimensione 1 la proposizione e banale. Assumiamo che ogni operatore su unospazio vettoriale complesso di dimensione n− 1 sia triangolarizzabile.

Sia λ1 un autovalore di T (esiste perche siamo su uno spazio vettoriale com-plesso) e sia v1 un suo autovettore. Completiamo v1 fino a una base di V . Siaquesta V = {v1,v2, . . . ,vn}. La matrice associata a T , rispetto alla base V, hala forma

MVV(T ) =

λ1 a12 . . . a1n

0 a22 . . . a2n

......

......

0 an2 . . . ann

=(

λ1 B0 A

).

Sia W = span{v2, . . . ,vn}. Sia P la proiezione da V in W definita da

P : V −→ Wv = a1v1 + a2v2 + . . . + anvn 7−→ a2v2 + . . . + anvn

L’applicazione18 P ◦ T|W : W → W e un operatore su uno spazio vettorialedi dimensione n− 1, che rispetto alla base {v2, . . . ,vn} di W ha, come matriceassociata, la matrice A. Per ipotesi induttiva esiste una base W = {w2, . . . ,wn}di W , rispetto la quale la matrice associata a T , MWW(P ◦ T|W ), e triangolaresuperiore.

U = {v1,w2, . . . ,wn} e una base di V e la matrice assocata a T rispetto Ue

MUU (T ) =(

λ1 D0 MWW(P ◦ T|W )

)dove D e un non precisato vettore riga, infatti tutte le componenti, esclusa laprima, dei vettori T (w2), . . . , T (wn), rispetto alla base U , sono uguali allecomponenti dei vettori P ◦ T|W (w2), . . . , P ◦ T|W (wn), rispetto alla base W.

MUU (T ) e triangolare superiore.

�18conT|W intendiamo la restrizione di T al sottospazio W

20

Page 21: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Definizione 2.2 Sia T un operatore su uno spazio vettoriale reale o complesso,definiamo spettro di T l’insieme delle radici complesse del polinomio caratteri-stico.

Per un operatore T su uno spazio vettoriale reale V , lo spettro19 coincide conl’insieme degli degli autovalori dell’estensione TC di T al complessificato VC.

Si osservi che la proposizione (2.3) non e vera in campo reale, in quanto ognioperatore triangolarizzabile ha almeno un autovettore (il primo vettore di unabase che lo triangolarizza), mentre esistono operatori privi di autovettori, quali,ad esempio, le rotazioni nello spazio vettoriale V2

O, di angolo diverso da 0 e π.Comunque vale la seguente

Proposizione 2.4 Un operatore T su uno spazio vettoriale reale V , con lospettro tutto reale, e triangolarizzabile.

la cui dimostrazione e simile alla precedente, poiche nella prova e intervenutal’ipotesi che il campo sia complesso, solo per provare l’esistenza di un autovet-tore. Bisogna osservare anche che, se T ha lo spettro tutto reale, pure P ◦ T|Wha lo spettro tutto reale.

2.3 Somma e somma diretta di sottospazi

Definizione 2.3 Siano U e W due sottospazi dello spazio vettoriale V , l’insieme

U + W := {v ∈ V |v = u + w, u ∈ U w ∈ W}

si dice la somma di U e W .E facile provare che U+W e un sottospazio vettoriale di V . Anche l’intersezione

dei due sottospazi, U ∩W , e un sossospazio vettoriale di V . Il seguente teoremalega la dimensione della somma di sue sottospazi con la dimensione della lorointersezione.

Proposizione 2.5 (teorema di Grassmann)Siano U e W due sottospazi vettoriali di V , abbiamo

dim U + dim W = dim(U ∩W ) + dim(U + W ).

Dim. Siano {v1, . . . ,vr} una base di U ∩W . U ∩W e, sia un sottospaziodi U , sia un sottospazio di W . Completiamo la base di U ∩W fino a ottenerebasi di U e di W . Siano rispettivamente{v1, . . . ,vr,u1, . . . ,us} una base di U ,{v1, . . . ,vr,w1, . . . ,wt} una base di W . Abbiamo che dim U = r + s, dim W =

19alcuni autori intendono con spettro di un operatore reale l’insieme delle radici reali delpolinomio caratteristico

21

Page 22: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

r + t. Ci basta provare che dim(U + W ) = r + s + t, per poter concludere diaver dimostrato il teorema. Proviamo quindi che

{v1, . . . ,vr,u1, . . . ,us,w1, . . . ,wt}

e una base di U + W .

• span{v1, . . . ,vr,u1, . . . ,us,w1, . . . ,wt} = U + W.

Sia u + w un generico vettore di U + W .

u = a1v1 + . . . + arvr + b1u1 + . . . + bsus

w = c1v1 + . . . + crvr + d1w1 + . . . + dtwt.

segue

u+w = (a1+c1)v1+. . .+(ar+cr)vr+b1u1+. . .+bsus+d1w1+. . .+dtwt.

• v1, . . . ,vr,u1, . . . ,us,w1, . . . ,wt sono linearmente indipendenti.

Sia

a1v1 + . . . + arvr + b1u1 + . . . + bsus + c1w1 + . . . + ctwt = 0 (12)

una loro combinazione lineare nulla. Il vettore w := c1w1 + . . . + ctwt

appartiene a W , ma appartiene anche a U , perche

w = −(a1v1 + . . . + arvr + b1u1 + . . . + bsus) ∈ U,

quindi w ∈ U ∩W. Pertanto w ∈ U ∩W e quindi w = d1v1 + . . . + drvr

e sostituendo in (12) otteniamo

(a1 + d1)v1 + . . . + (ar + dr)vr + b1u1 + . . . + bsus = 0,

che, essendo una combinazione lineare dei vettori della base di U , puoessere nulla solo se

(a1 + d1) = . . . = (ar + dr) = b1 = . . . = bs = 0.

Utilizziamo il fatto che b1 = . . . = bs = 0 nella (12); otteniamo

a1v1 + . . . + arvr + c1w1 + . . . + cswt = 0,

che, essendo una combinazione lineare dei vettori di una base di W , puoessere nulla solo se

a1 = . . . = ar = c1 = . . . = cr = 0.

Dunque i coefficienti della (12) sono necessariamente tutti nulli.

22

Page 23: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Definizione 2.4 La somma di due sottospazi U e W dello spazio vettoriale Vsi dice diretta se U ∩W = {0}; in tal caso la somma si scrive U ⊕W

Per il teorema di Grassmann dim(U ⊕W ) = dim U + dim W .Vale la seguente

Proposizione 2.6 Ogni vettore v ∈ U ⊕ W si scrive in uno e un sol modocome somma, v = u + w, di un vettore u ∈ U e di un vettore w ∈ W .

Dim. Supponiamo che il vettore v ∈ U ⊕W si possa scrivere in due modicome somma di un vettore che sta in U e un vettore che sta in W .

v = u1 + w1 = u2 + w2, u1,u2 ∈ U, w1,w2 ∈ W ;

abbiamo che il vettore u1−u2 = w2−w1 appartiene sia a U che a W . Dunqueu1 − u2 = w2 −w1 = 0, perche U ∩W = {0}. Da qui u1 = u2 e w1 = w2.

La definizione di somma diretta si estende al caso della sommna di un numerofinito di sottospazi nel modo seguente

Definizione 2.5 La somma dei sottospazi W1, . . . ,Wr si dice diretta (e si scriveW1 ⊕ . . . ⊕ Wr) se ogni vettore v ∈ W1 + . . . + Wr e somma in uno e un solmodo di r vettori, v1, . . . ,vr, con v1 ∈ W1, . . . ,vr ∈ Wr.

Proposizione 2.7

dim(W1 ⊕ . . .⊕Wr) = dimW1 + . . . + dim Wr

Dim. Siano W1 . . .Wr r basi, rispettivamente di W1, . . . ,Wr. La lorounione, W, e una base di W1 ⊕ . . .⊕Wr, infatti

• W genera W1 ⊕ . . .⊕Wr perche ogni vettore di W1 ⊕ . . .⊕Wr e sommadi r vettori, w1 ∈ W1, . . . ,wr ∈ Wr, ciascuno dei quali e combinazionelineare dei vettori delle basi dei rispettivi spazi.

• W e un insieme di vettori linearmente indipendenti, perche , se vi fosseuna combinazione lineare non banale dei vettori di W, avremmo che ilvettore nullo, oltre a scriversi come 0 + . . . + 0 si scrive anche in un mododiverso come somma di r vettori, w1 ∈ W1, . . . ,wr ∈ Wr.

2.4 I teorema di riduzione

Definizione 2.6 Sia T un operatore sullo spazio vettoriale V . Un sottospazioW , di V , si dice T -invariante (o invariante per T o anche T-stabile) se T (W ) ⊆W .

23

Page 24: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Se T e diagonalizzabile e V = {v1, . . . ,vn} e una base che diagonalizza Tallora span{v1}, . . . , span{vn} sono spazi T -invarianti e

V = span{v1} ⊕ . . .⊕ span{vn},

anzi e facile vedere che T e diagonalizzabile se e solo se V e somma diretta din sottospazi T -invarianti di dimensione 1. E pertanto naturale ricercare per glioperatori non diagonalizzabili la decomposizione di V in una somma diretta conil maggior numero di sottospazi T -invarianti.

Con questo obiettivo in mente, introciamo la seguente:

Definizione 2.7 Sia λ un autovalore di T , v ∈ V si dice una radice per T diordine m relativa all’autovalore λ, se

(T − λId)m(v) = 0

e m e il piu piccolo numero naturale per cui vale tale proprieta.Gli autovalori sono radici di ordine 1.

Proposizione 2.8 L’insieme delle radici di T relative all’autovalore λ e unsottospazio vettoriale che indichiamo con R(T, λ).

Dim. Sia v ∈ R(T, λ); esiste m ∈ N tale che (T − λId)m(v) = 0; ne segue che(T − λId)m(kv) = k(T − λId)m(v) = 0, dunque kv ∈ R(T, λ).

Siano v1,v2 ∈ R(T, λ); esistono m1,m2 ∈ N tali che (T − λId)m1(v1) = 0 e(T − λId)m2(v2) = 0; ne segue

(T − λId)max(m1,m2)(v1 + v2) =(T − λId)max(m1,m2)(v1) + (T − λId)max(m1,m2)(v2) = 0

Proposizione 2.9 R(T, λ) e T -invariante.

Dim. Sia v ∈ R(T, λ). Esiste m ∈ N tale che (T − λId)m(v) = 0. Anche(T − λId)m+1(v) = 0. Quindi

0 = (T − λId)m+1(v) = (T − λId)m((T − λId)(v)) =(T − λId)m(T (v)− λv) =

(T − λId)m(T (v))− λ(T − λId)m(v) =(T − λId)m(T (v)).

Quindi anche T (v) e una radice relativa a λ.

Teorema (I Teorema di riduzione)

24

Page 25: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Sia T : V → V un operatore sullo spazio vettoriale complesso di dimensionefinita V . Siano λ1, . . . , λk i suoi autovalori. Allora

V = R(T, λ1)⊕ . . .⊕ R(T, λk)

Omettiamo la dimostrazione del teorema20, ma cerchiamo di saperne di piusul sottospazio delle radici.

T|R(T,λ) ha il solo autovalore λ, perche se avesse anche un diverso autovaloreµ, un autovettore di T|R(T,λ) relativo a µ, sarebbe anche autovettore di T equindi apparterrebbe a R(T, µ) contro al fatto che R(T, λ) ∩ R(T, µ) = 0.

Ne segue che la dimensione di R(T, λ) e uguale alla molteplicita algebrica diλ.

Consideriamo una base Vλ di R(T, λ) che triangolarizza T|R(T,λ); sulla dia-gonale di MVλVλ

(T|R(T,λ)) troviamo gli autovalori, pertanto

MVλVλ(T|R(T,λ)) =

λ a12 . . . a1n

0 λ . . . a2n

......

. . ....

0 0 . . . λ

.

Poiche ogni sottospazio e Id-invariante, abbiamo

Proposizione 2.10 R(T, λ) e (T − µId)-invariante, qualunque sia µ, in parti-colare e (T − λId)-invariante.

Rispetto la base Vλ indicata sopra abbiamo

MVλVλ((T − µId)|R(T,λ)) =

λ− µ a12 . . . a1n

0 λ− µ . . . a2n

......

. . ....

0 0 . . . λ− µ

.

Definizione 2.8 Un operatore T su V si dice nilpotente se esiste m ∈ N taleche Tm = 0 ( cioe Tm(v) = 0 per ogni v ∈ V ); si dice nilpotente di ordine mse m e il piu piccolo indice tale che Tm = 0.

Proposizione 2.11 Sia λ un autovalore dell’operatore T sullo spazio di dimen-sione finita V . (T − λId)|R(T,λ) : R(T, λ) → R(T, λ) e nilpotente.

Dim. Rispetto alla base Vλ di R(T, λ) , che triangolarizza (T − λId),

MVλVλ((T − λId)|R(T,λ)) =

0 a12 . . . . . . a1n

0 0 a23 . . . a2n

......

. . . . . ....

0 0 . . . 0 an−1 n

0 0 . . . 0 0

20puo essere trovata sul libro di Ciliberto Algebra lineare, oppure sulle vecchie note del

Corso di Complementi di Algebra lineare

25

Page 26: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

e una matrice triangolare superiore con diagonale principale nulla. Il quadratodi questa matrice ha nulla anche la diagonale immediatamente a destra delladiagonale principale:

(MVλVλ((T − λId)|R(T,λ)))2 =

0 0 ∗ . . . ∗ ∗0 0 0 . . . ∗ ∗...

.... . . . . .

......

0 0 0. . . 0 ∗

0 0 0 . . . 0 00 0 0 . . . 0 0

,

dove al posto degli ∗ vi sono numeri non meglio precisati. Ogni successivapotenza determina un’ulteriore diagonale nulla, per cui (T − λId)|R(T,λ) e nil-potente e l’ordine di nilpotenza e, al piu, uguale alla molteplicita algebrica diλ.

Osserviamo che l’ordine di nilpotenza di (T − λId)|R(T,λ) e uguale al piupiccolo m tale che ker(T − λId)m+1 = ker(T − λId)m. Cio deriva dal fatto che,se

ker(T − λId)m+1 = ker(T − λId)m

allora per ogni k ∈ N

ker(T − λId)m+k = ker(T − λId)m;

infatti sia v ∈ ker(T − λId)m+k, abbiamo

0 = (T − λId)m+k(v) = (T − λId)m+1((T − λId)k−1(v)) =(T − λId)m((T − λId)k−1(v)) =

(T − λId)m+k−1(v)

Iterando il procedimento k volte, otteniamo (T−λId)m(v) = 0, cioe v ∈ ker(T−λId)m.

2.5 Il II teorema di riduzione

Il primo teorema di riduzione mostra una prima decomposizione di V in sommadiretta di sottospazi T -invarianti. Dobbiamo chiederci se un sottospazio delleradici possa essere, a sua volta, somma diretta di sottospazi T -invarianti.

Un sottospazio W di R(T, λ) e T -invariante se e solo se e (T−λId)-invariante.Possiamo quindi limitarci a cercare sottospazi di R(T, λ), (T − λId)-invarianti.Il vantaggio sta nel fatto che (T − λId)|R(T,λ) e un operatore nilpotente.

Introduciamo la seguente

26

Page 27: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Definizione 2.9 Sia G un operatore sullo spazio vettoriale V di dimensione n,G si dice ciclico se esiste una base, V = {v1, . . . ,vn}, detta base ciclica, taleche

G(v1) = 0G(v2) = v1

...G(vn) = vn−1

E immediato verificare che ogni operatore ciclico e nilpotente. La matriceassociata all’operatore ciclico G rispetto una base ciclica ha la forma

Jn :=

0 1 0 . . . 00 0 1 . . . 0...

.... . .

...0 0 0 . . . 10 0 0 . . . 0

.

0 e il solo autovalore di un operatore ciclico G, con molteplicita algebrican e molteplicita geometrica 1. Pertanto l’autospazio relativo all’autovalore 0 espan(v1).

Per gli operatori nilpotenti vale il II teorema di riduzione, di cui omettiamola dimostrazione.Teorema (II Teorema di riduzione)Sia G un operatore nilpotente sullo spazio vettoriale V . Esistono sottospaziG-invarianti W1, . . . ,Wk tali che

V = W1 ⊕ . . .⊕Wk

e la restrizione, G|Wi, di G a ogni sottospazio Wi, e un operatore ciclico.

Applicando il II teorema di riduzione all’operatore

(T − λId)|R(T,λ) : R(T, λ) → R(T, λ)

e, ricordando che un sottospazio (T − λId)-invariante e anche T -invariante, ab-biamo che

R(T, λ) = W1 ⊕ . . .⊕Wk, (13)

dove i sottospazi Wi sono T -invarianti e gli operatori (T − λId)|Wisono ciclici.

Chiamiamo sottospazio di Jordan relativo all’autovalore λ dell’operatore T,un sottospazio W ⊆ V per cui (T − λId)|W e ciclico, e base di Jordan una basedi W ciclica per (T − λId)|W .

Sia V = {v1, . . . ,vr} una base di Jordan di W . Poiche la matrice associataa (T − λId)|W e

Jr =

0 1 0 0 . . . 00 0 1 0 . . . 00 0 0 1 . . . 0...

......

. . ....

0 0 0 0 . . . 10 0 0 0 . . . 0

, (14)

27

Page 28: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

la matrice associata a T |W rispetto a V e

Jr(λ) =

λ 1 0 . . . 0 00 λ 1 . . . 0 0...

.... . . . . .

......

.... . . . . .

...0 0 0 . . . λ 10 0 0 . . . 0 λ

. (15)

La matrice Jr(λ) si chiama blocco di Jordan di ordine r relativo a λ o λ-bloccodi Jordan di ordine r.

Sia Vi = {vi1 , . . . ,vir(i)} una base di Jordan di Wi; dalla (13) segue che∪k

i=1Vi e una base di R(T, λ) e rispetto a questa base l’operatore T |R(T,λ) erappresentato da una matrice avente sulla diagonale k blocchi di Jordan. Essaha la forma

r(1)︷ ︸︸ ︷ r(2)︷ ︸︸ ︷ r(k)︷ ︸︸ ︷

λ 1 0 0

0 λ. . . 0 0

.... . . . . .

...0 0 . . . λ 10 0 . . . 0 λ 0

λ 1 0 0

0 λ. . . 0 0

.... . . . . .

...0 0 . . . λ 10 0 . . . 0 λ 0

. . . . . .. . . 0

λ 1 0 0

0 λ. . . 0 0

.... . . . . .

...0 0 . . . λ 10 0 . . . 0 λ

;

dove i singoli blocchi di Jordan hanno ordine uguale alla dimensione dei Wi;nel caso che un blocco abbia dimesione 1 allora e formato dal solo autovalore.Come si vede, si tratta di una matrice con tutti zeri eccetto che sulla diagonaledove troviamo l’autovalore λ e sulla prima parallela destra della diagonale dovetroviamo una sequenza di 1 e 0, che servono a individuare i blocchi di Jordan.

28

Page 29: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

2.6 Forma canonica di Jordan

Combiniamo il I e il II teorema di riduzione.Per ognuno dei sottospazi delle radici esiste una decomposizione in sottospazi

di Jordan, quindi V e somma diretta di sottospazi di Jordan, che ricordo sono T -invarianti. Prendendo una base di Jordan per ciascuno dei sottospazi di Jordane facendone l’unione, ottengo una base W di V, rispetto la quale la matriceassociata a T ha lungo la diagonale blocchi di Jordan relativi ai vari autovaloridi T . Supponiamo che sia si il numero dei (λi)-blocchi di Jordan che trovo sulladiagonale; la matrice associata a T rispetto W puo essere schematizzata nellaseguente nella matrice a bloccchi, dove i blocchi non rappresentati sono tuttinulli e dove l’indice che numera i blocchi di Jordan e indicato fra parentesi pernon confonderlo con l’indice che mostra (quando e scritto) l’ordine del bloccodi Jordan.

MWW(T ) =

J(1)(λ1). . .

J(s1)(λ1). . .

. . .J(1)(λk)

. . .J(sk)(λk)

. (16)

Definizione 2.10 Una matrice che e nulla, salvo avere lungo la diagonale bloc-chi di Jordan si dice una forma canonica di Jordan.

Da quanto sopra detto abbiamo

Proposizione 2.12 Per ogni operatore T su uno spazio vettoriale complessodi dimensione finita esiste una base rispetto la quale la matrice associata e unaforma canonica di Jordan

Poiche ogni matrice complessa definisce un operatore su Cn, vi e un equiva-lente della proposizione precedente in termini di matrici.

Proposizione 2.13 Ogni matrice quadrata complessa e simile in C a una formacanonica di Jordan.

Si osservi che i sottospazi delle radici sono univocamente determinati dall’operatoreT ; non cosı i sottospazi di Jordan. Se consideriamo ad esempio l’operatore nullosu V , questo ha un solo autovalore, lo zero, a cui corrisponde come sottospaziodelle radici lo stesso spazio V . Ogni sottospazio di dimensione 1 e un sotto-spazio di Jordan, ed esistono infinite decomposizioni di V in somma diretta disottospazi di Jordan.

29

Page 30: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Sono invece univocamente determinati da T , sia il loro numero sia le lorodimensioni21, e la prova di questa affermazione seguira dall’algoritmo che servea calcolare la forma canonica di Jordan dell’operatore T .

Cominciamo col calcolare il rango delle potenze di (Jr(λ)− λIr). Da (14) e(15) abbiamo che Jr(λ)− λIr = Jr e quindi

rk(Jr(λ)− λIr) = r − 1.

J2r =

0 0 1 0 . . . 00 0 0 1 . . . 0...

......

. . ....

0 0 0 0 . . . 10 0 0 0 . . . 00 0 0 0 . . . 0

dunque

rk(Jr(λ)− λIr)2 = r − 2.

Ogni volta che si alza di uno l’esponente di Jr, la diagonale degli uni si spostadi un posto verso destra e verso l’alto cosicche il rango scende di uno. Pertanto

rk(Jr(λ)− λIr)h ={

r − h se h ≤ r0 se h ≥ r

(17)

a cui diamo un senso anche per h = 0, convenendo che, per ogni matrice qua-drata non nulla A, A0 = I.

Se µ 6= λ, indipendentemente dal valore di h,

rk(Jr(µ)− λIr)h = r.

Valutiamo ora come varia il rango di (T −λId)h al crescere di h. Sia W unabase rispetto la quale la matrice associata a T sia in forma canonica di Jordan;con le notazioni della (16) abbiamo

rk(T − λId)h = rk((MWW(T )− λIn)h =k∑

i=1

si∑j=1

rk(J(j)(λi)− λIr(i,j))h,

dove r(i, j) e l’ordine di J(j)(λi).Se λi 6= λ, il rango di (J(j)(λi)− λI)h non varia al crescere di h, mentre, per

la (17), se λi = λ, al crescere di 1 dell’esponente h, il rango di (J(j)(λi) − λI)h

diminuisce di 1, purche (J(j)(λi) − λI)h non sia gia diventata la matrice nulla,nel qual caso il rango non puo ulteriormente diminuire al crescere di h. Pertanto

rk(T − λId)h−1 − rk(T − λId)h (18)

21questo giustifica la parola canonica che si da alla forma di Jordan

30

Page 31: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

rappresenta il numero dei λ-blocchi di Jordan con ordine maggiore o uguale ah.

Ne segue la seguente

Proposizione 2.14 Sia ρ(T, λ, h) il numero del λ-blocchi di Jordan di ordineh, che si trovano in una forma canonica di Jordan associata all’operatore T .Vale

ρ(T, λ, h) = rk(T − λId)h−1 − 2rk(T − λId)h + rk(T − λId)h+1 (19)

Dim. Dalla (18) segue subito

ρ(T, λ, h) = (rk(T − λId)h−1 − rk(T − λId)h) −(rk(T − λId)h − rk(T − λId)h+1)

da cui la tesi.

La formula (19) permette di calcolare ρ(T, λ, h) direttamente da T , senzadover determinare una base rispetto la quale la matrice associata a T sia unaforma canonica di Jordan, quindi i numeri ρ(T, λ, h) non dipendono dalla baseusata per rappresentare T in forma canonica di Jordan. Da cio ne derivaTeorema(della riduzione a forma canonica di Jordan)Sia T un operatore sullo spazio vettoriale complesso di dimensione finita V .Esiste una base W rispetto la quale la matrice associata a T e una forma ca-nonica di Jordan, la quale e univocamente determinata da T , salvo l’ordine concui compaiono i blocchi di Jordan sulla diagonale di MWW(T ).

Gli invarianti ρ(T, λ, h) servono anche a classificare le matrici quadrate com-plesse rispetto la relazione di similitudine. Sia A ∈ Mnn(C) e sia TA : Cn → Cn

l’operatore che definito da T (x) = Ax. Indichiamo con ρ(A, λ, h) := ρ(TA, λ, h).Abbiamo che

Proposizione 2.15 Due matrici A,B ∈ Mnn(C) sono simili se e solo se

1. hanno gli stessi autovalori

2. ρ(A, λ, h) = ρ(B, λ, h), per ogni autovalore λ e per ogni naturale h minoreo uguale della moltepliciya algebrica di λ.

Dim. Due matrici simili rappresentano lo stesso operatore rispetto basi diversequindi hanno gli stessi autovalori e gli stessi ρ(−, λ, h); viceversa se, A e B hannogli stessi autovalori e ρ(A, λ, h) = ρ(B, λ, h), per ogni λ e per ogni h, allora sonosimili alla stessa forma canonica di Jordan, quindi simili fra loro.

31

Page 32: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Similmente, gli invarianti ρ(T, λ, h) sono sufficienti a classificare anche glioperatori modulo automorfismi nel senso che

due operatori T e T ′ sono equivalenti modulo automorfismi e hanno quindile stesse proprieta algebriche22, se e solo se hanno gli stessi autovalori e hannouguali gli invarianti ρ(T, λ, h), ρ(T ′, λ, h).

Un’ulteriore osservazione e che la decomposizione di V in somma diretta disottospazi T -invarianti, data dalla riduzione a forma canonica di Jordan, non eulteriormente migliorabile nel senso che non esiste un’altra decomposizoione di Vin un maggior numero di sottospazi T -invarianti, perche altrimenti la restrizionedi T a ciascuno di questi sottospazi sarebbe, a sua volta, riducibile a formacanonica di Jordan e complessivamente ritroverei due decomposizioni di T aforma canonica di Jordan con diversi valori per ρ(T, λ, h), contro l’unicita.

Che dire infine della classificazione delle matrici quadrate reali a meno disimilitudine? La teoria della riduzione a forma canonica di Jordan risolve anchequesto problema. Vale infatti

Proposizione 2.16 Due matrici quadrate reali A,B ∈ Mnn(R) sono simili see solo se sono simili come matrici complesse. Cioe

∃M ∈ GLn(R), A = M−1BM ⇐⇒ ∃C ∈ GLn(C), A = C−1BC.

Dim. L’implicazione =⇒ e banale. Viceversa. Sia C ∈ Mnn(C) tale

A = C−1BC.

SegueCA = BC

da cui, coniugando e tenendo presente che che A e B sono reali

CA = BC,

e quindi

Re(C)A =CA + CA

2=

BC + BC

2= BRe(C)

Im(C)A =CA + CA

2i=

BC + BC

2i= BIm(C).

Non possiamo concludere che A e B sono simili come matrici reali perche, puressendo Re(C) e Im(C) matrici reali, non sappiamo se sono invertibili. Poicheanche ogni combinazione lineare aReC + bImC e tale che

(aReC + bImC)A = B(aReC + bImC),

dobbiamo chiederci se esistono a, b ∈ R tali che (aReC + bImC) e invertibile.Scegliamo a = 1 e osserviamo che

det(ReC + bImC)22vedi paragrafo (2.1)

32

Page 33: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

e un polinomio in b, a coefficienti reali, non identicamente nullo, in quantocalcolato sul numero complesso i assume il valore det C 6= 0. Esiste dunquealmeno un numero reale b (ne esistono infiniti) tale che

det(ReC + bImC) 6= 0.

Sia M = (ReC + bImC), ho M ∈ GLn(R) e A = M−1BM .

Interpretando il risultato precedente in termini di operatori, abbiamo che lospettro e gli invarianti ρ(TC, λ, h) sono sufficienti a classificare anche gli operatorisu uno spazio vettoriale reale a meno di automorfismi:

due operatori T e T ′ sullo spazio vettoriale reale V sonno equivalenti a menodi automorfismi, e hanno quindi le stesse ”proprieta algebriche”23 se e solo sehanno lo stesso spettro e i loro complessificati hanno gli invarianti ρ(TC, λ, h) eρ(T ′C, λ, h) uguali.

2.7 Un esempio di calcolo della forma canonica di Jordan

Sia T l’operatore cheT : C4 −→ C4

x 7−→ Ax

dove

A =

1 0 0 10 0 1 00 1 0 10 0 0 1

PT (λ) = det

1− λ 0 0 1

0 −λ 1 00 1 −λ 10 0 0 1− λ

= (1− λ)3(1 + λ).

Ho due autovalori λ1 = 1 di molteplicita algebrica 3 e λ2 = −1 di molteplicitaalgebrica 1. Da cio segue che necessariamente ρ(T, λ2, 1) = 1 e non serve calco-lare altro per l’autovalore λ2. Calcoliamo ora ρ(T, λ1, 1), ρ(T, λ1, 2) e ρ(T, λ1, 3).Determiniamo

rk(T − λ1I4) = rk

0 0 0 10 −1 1 00 1 −1 10 0 0 0

= 2

rk(T − λ1I4)2 = rk

0 0 0 00 2 −2 00 −2 2 00 0 0 0

= 1

23vedi paragrafo (2.1)

33

Page 34: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

rk(T − λ1I4)3 = 1.

Per l’ultimo rango non e necessario fare calcoli, perche la molteplicita algebricadi λ1 e 3 e dunque rk(T − λ1I4)3 = dim(C4)− 3 = 1. E’ anche inutile calcolarerk(T−λ1I4)4, perche all’aumentare dell’esponente oltre la molteplicita algebricail rango non scende piu.

Dalla (19) abbiamoρ(T, λ1, 1) = 4− 2 · 2 + 1 = 1ρ(T, λ1, 2) = 2− 2 · 1 + 1 = 1ρ(T, λ1, 3) = 1− 2 · 1 + 1 = 0

Esiste una base W per cui la matrice associata a T rispetto a W e

MWW(T ) =

1 1 0 00 1 0 00 0 1 00 0 0 −1

.

34

Page 35: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

3 Forme bilineari e forme sesquilineari

3.1 Definizioni

Sia V uno spazio vettoriale su K .

Definizione 3.1 Un’applicazione B : V × V → K si dice bilineare se

1. B(v + w, z) = B(v, z) + B(w, z)

2. B(kv,w) = kB(v,w)

3. B(v,w + z) = B(v,w) + B(v, z)

4. B(v, kw) = kB(v,w)

La forma si dice inoltre simmetrica se B(v,w) = B(w,v) e antisimmetrica ( oalternante) se B(v,w) = −B(w,v).

Sia V uno spazio vettoriale su C .

Definizione 3.2 Un’applicazione H : V × V → C si dice sesquilineare se

1. H(v + w, z) = H(v, z) + H(w, z)

2. H(kv,w) = kH(v,w)

3. H(v,w + z) = H(v,w) + H(v, z)

4. H(v, kw) = kH(v,w)

La forma si dice inoltre hermitiana se H(v,w) = H(w,v) e antihermitiana seH(v,w) = −H(w,v)

Le proprieta 1 e 2 segnalano che B (H) e lineare nella prima variabile, leproprieta 3 e 4 segnalano che B e lineare (H antilineare) nella seconda variabile.

Proposizione 3.1 Ogni forma bilineare (sesquilineare) e somma di una formasimmetrica e una antisimmetrica (hermitiana e antihermitiana).

Dim.

B(v,w) =B(v,w) + B(w,v)

2+

B(v,w)−B(w,v)2

(20)

Il primo addendo e una forma bilineare simmetrica, S(B), il secondo e una formabilineare antisimmtrica, A(B).

H(v,w) =H(v,w) + H(w,v)

2+

H(v,w)−H(w,v)2

(21)

Il primo addendo e una forma hermitiana il secondo e una forma antihermitiana.

35

Page 36: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

A ogni forma bilineare B(v,w) si puo associare una forma quadratica Q :V → K, definita da

Q(v) = B(v,v).

Per ogni forma quadratica vale

Q(kv) = k2Q(v)

Q(v + w) = Q(v) + Q(w) + B(v,w) + B(w,v).

Se la forma e simmetrica allora

B(v,w) =Q(v + w)−Q(v)−Q(w)

2. (22)

Molte forme bilineari definiscono la stessa forma quadratica ma fra di loro vene e una sola simmetrica; infatti B e S(B) generano la stessa forma quadratica,il che garantisce che nell’insieme delle forme bilineari che generano la stessaforma quadratica ve ne e una simmetrica, e d’altra parte per la (22) questa eunivocamente determinata da Q.

In modo analogo a quanto visto sopra, a una forma sesquilineare H(v,w) siassocia la forma H-quadratica QH : V → C, definita da

QH(v) = H(v,v).

Per ogni forma H-quadratica vale

QH(kv) = |k|2QH(v)

QH(v + w) = QH(v) + QH(w) + H(v,w) + H(w,v),

da cui se la forma H e hermitiana si ha

H(v,w) = ReH(v,w) + iImH(v,w) =

QH(v + w)−QH(v)−QH(w)2

+ iQH(v + iw)−QH(v)−QH(w)

2. (23)

Osserviamo che la forma H-quadratica associata a una forma hermitianae reale, nel senso che assume solo valori reali, infatti h(v,v) = h(v,v) ∈ R.(Analogamente la forma H-quadratica associata a una forma antihermitiana eimmaginaria pura.)

Vi e corrispondenza biunivoca fra le forme hermitiane e le forme H-quadratichereali, infatti dalla (21) segue che fra tutte le forme sesquilineari che definisconouna forma H-quadratica reale ve ne e una hermitiana e d’altra parte una formahermitiana che definisce una forma H-quadratica reale QH puo essere ricostruitaa partire da QH , per la (23), ed e quindi univocamente determinata.

Esempio 3.1 Sia A ∈ Mnn(K) l’applicazione

B : Kn ×Kn → K(x,y) 7→ xtAy

e una forma bilineare in Kn. La forma B e simmetrica se e solo se A e simme-trica.

36

Page 37: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Definizione 3.3 Una matrice A ∈ Mnn(C) si dice hermitiana se A = At.

Esempio 3.2 Sia A ∈ Mnn(C), l’applicazione

H : Cn × Cn → C(x,y) 7→ xtAy

e una forma sesquilineare in Cn. La forma H e hermitiana se e solo se A ehermitiana.

3.2 Matrici associate a forme bilineari e sesquilineari

Sia B : V × V → K una forma bilineare e sia H : V × V → C una formasesquilineare; (si intende che nel primo caso V e uno spazio vettoriale su K , nelsecondo uno spazio vettoriale su C .) Sia V = {v1, . . . ,vn} una base di V .

Definiamo

MV(B) := (B(vi,vj))1 ≤ i ≤ n1 ≤ j ≤ n

MV(H) := (H(vi,vj))1 ≤ i ≤ n1 ≤ j ≤ n

.

Siamo in grado, adesso, di rappresentare in coordinate la forma bilineare(sesquilineare). Siano v =

∑ni=1 xivi e w =

∑nj=1 yjvj ,

B(v,w) = B

n∑i=1

xivi,n∑

j=1

yjvj

=

n∑i,j=1

xiyjB(vi,vj) =n∑

i,j=1

xiyjMV(B)ij = xtMV(B)y.

dove xt = (x1, . . . , xn) e y = (y1, . . . , yn)t. Similmente

H(v,w) = H

n∑i=1

xivi,n∑

j=1

yjvj

=

n∑i,j=1

xiyjH(vi,vj) =n∑

i,j=1

xiyjMV(H)ij = xtMV(H)y.

La rappresentazione in coordinate rispetto alla base V della forma quadraticaQ associata alla forma bilineare B e il seguente polinomio omogeneo di secondogrado, nelle coordinate x1, . . . , xn del vettore v:

Q(v) = B(v,v) = xtMV(B)x =n∑

i=1

n∑j=1

xixjB(vi,vj),

e nel caso in cui la forma bilineare B sia la forma bilineare simmetrica associataalla forma quadratica Q, posso scrivere

37

Page 38: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Q(v) =n∑

i=1

Q(vi)x2i + 2

n∑i=1

n∑j=i+1

B(vi,vj)xixj .

Per cui, se il polinomio omogeneo di secondo grado

n∑i=1

aiix2i +

n∑i=1

n∑j=i+1

aijxixj

rappresenta la forma quadratica Q, rispetto la base V, la matrice che rappresentala forma bilineare simmetrica24 B associata alla forma quadratica Q, rispettola stessa base, e

MV(B) =

a11

a122 . . . a1n

2a122 a22 . . . a2n

2

. . . . . .. . . . . .

a1n

2a2n

2 . . . ann

.

Nel caso di una forma hermitiana H la rappresentazione in coordinate dellaforma H-quadratica associata e data da

QH(v) =n∑

i=1

n∑j=1

xixjH(vi,vj) =n∑

i=1

QH(vi)|xi|2+2n∑

i=1

n∑j=i+1

Re(H(vi,vj)xixj).

La matrice associata a una forma bilineare (sesquilineare) dipende dalla base.Vediamo le relazioni che sussistono fra due matrici associate alla stessa formarispetto due basi diverse. Sia V ′ = {v′1, . . . ,v′n} un’altra base di V . Nella nuovabase i vettori v,w si rappresentano v =

∑ni=1 x′iv

′i e w =

∑nj=1 y′jv

′j . Dalle

formule di cambiamento di coordinate abbiamo

x = MVV′(id)x′ y = MVV′(id)y′

Da cui

B(v,w) = xtMV(B)y =(MVV′(id)x′)tMV(B)MVV′(id)y′ =

x′tM tVV′(id)MV(B)MVV′(id)y′

d’altra parteB(v,w) = x′tMV′(B)y′

pertantox′tMV′(B)y′ = x′tM t

VV′(id)MV(B)MVV′(id)y′

che, valendo per ogni x′ e y′, implica

MV′(B) = M tVV′(id)MV(B)MVV′(id).

24in qualche libro tale forma si chiama forma polare associata alla forma quadratica

38

Page 39: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Analogamente, nel caso sesquilineare, otteniamo

MV′(H) = M tVV′(id)MV(H)MVV′(id).

Definizione 3.4 Due matrici A,B ∈ Mnn(K) si dicono congruenti se esisteuna matrice M ∈ GLn(K) tale che

A = M tBM.

Definizione 3.5 Due matrici A,B ∈ Mnn(C) si dicono H-congruenti se esisteuna matrice M ∈ GLn(C) tale che

A = M tBM.

Le relazioni di congruenza e H-congruenza sono di equivalenza. Verifica peresercizio.

Abbiamo dunque provato che

Proposizione 3.2 Le matrici associate alla stessa forma bilineare (sesquili-neare) rispetto a due basi diverse sono congruenti (H-congruenti).

La definizione di H-congruenza (3.5) e spesso presentata con la condizioneA = M tBM , che e del tutto equivalente, perche se M soddisfa la condizionedella (3.5), allora M soddisfa la variante su esposta.

Proposizione 3.3 Il rango della matrice associata a una forma bilineare (se-squilineare) non dipende dalla base scelta.

Dim. Moltiplicando una matrice per una matrice invertibile non si altera ilrango e del resto il rango non viene alterato dalle operazioni di trasposizione edi coniugio di una matrice.

Proposizione 3.4 Il determinante di una matrice associata a una forma her-mitiana e reale.

Dim. La matrice associata a una forma hermitiana e una matrice hermitiana,cioe A = At. Da cui

det(A) = det(At) = det(At) = det(A).

Definizione 3.6 Se il rango di una forma bilineare (o sesquilineare) e minoredella dimesione di V allora la forma si dice degenere.

Proposizione 3.5 Una forma bilineare B e non degenere se e solo se

∀v 6= 0 ∃w B(v,w) 6= 0 (24)

(o, equivalentemente, ∀w 6= 0 ∃v B(v,w) 6= 0.Stessa cosa per una forma sesquilineare H.

39

Page 40: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Dim. La forma B in coordinate, rispetto a una base V, si rappresenta xtAy,dove x e y sono vettori colonna che rappresentano le coordinate di v e w edA = MV(B). B e non degenere se e solo se det(A) 6= 0.

• B non degenere ⇒ (24)

Da v 6= 0 segue x 6= 0 e questo implica rk(xt) = 1; poiche il prodotto peruna matrice invertibile non altera il rango, abbiamo rk(xtA) = 1; quindi(xtA) non e il vettore riga nullo e avra una sua componente diversa dazero. Sia per semplicita la prima componente diversa da zero, allora ilvettore y che ha la prima componente uguale a 1 e tutte le altre nulle etale che xtAy 6= 0. Posto w = Vy, abbiamo B(v,w) 6= 0.

• (24) ⇒ B non degenere

Se vale la (24), allora per ogni x 6= 0, esiste y tale che xtAy 6= 0; pertanto,per ogni x 6= 0, xtA 6= 0 ed trasponendo per ogni x 6= 0, Atx 6= 0 . Ilche significa che il sistema Atx = 0 ha solo la soluzione banale e questo epossibile se e solo se det(A) 6= 0. Dunque B e non degenere.

3.3 Forme bilineari simmetriche e forme hermitiane

Le definizione che seguono vengono enunciate per una forma bilineare simme-trica, ma valgono, sostituendo H a B, anche per una forma hermitiana.

La scelta di una forma bilineare simmetrica B (hermitiana H) permette diintrodurre la nozione di perpendicolarita nello spazio vettoriale V .

Definizione 3.7 Siano v,w ∈ V . v si dice ortogonale a w (si scrive v ⊥ w),se B(v,w) = 0.

Definizione 3.8 Sia S ⊂ V un sottoinsieme. Si definisce

S⊥ := {v ∈ V |B(v,w) = 0, ∀w ∈ S}.

E facile verificare che S⊥ e un sottospazio vettoriale.

Definizione 3.9 Siano U,W,⊂ V sottospazi. Si dice che U e perpendicolare aW ( U ⊥ W ) se U ⊂ W⊥.

E immediato verificare che U ⊥ W ⇔ W ⊥ U . Il vettore nullo e ortogonalea ogni vettore dello spazio e se la forma e non degenere esso e l’unico vettoreortogonale a tutti i vettori di V .

Definizione 3.10 Un vettore v ∈ V si dice isotropo se B(v,v) = Q(v) = 0(H(v,v) = QH(v) = 0).

40

Page 41: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Il vettore nullo e un vettore isotropo e se la forma e degenere ci sono molti vettoriisotropi, ma anche nel caso di forme bilineari non degeneri possono esisterevettori isotropi. Per esempio, per

B : C× C → C(x,y) 7→ xty

il vettore(

1i

)e isotropo. Ed anche per

B : R× R → R

(x,y) 7→ xt

(0 11 0

)y

il vettore(

10

)e isotropo.

Definizione 3.11 Sia v non isotropo. Si definisce il coefficiente di Fourier diw rispetto v, lo scalare

av(w) :=B(w,v)B(v,v)

,

analoga definizione per una forma hermitiana H

av(w) :=H(w,v)H(v,v)

.

Si ha

B(v,w − av(w)v) = B(v,w)− B(w,v)B(v,v)

B(v,v) = 0.

Analogamente per una forma hermitiana

H(v,w − av(w)v) = H(v,w)− H(w,v)H(v,v)

H(v,v) = 0.

Da cui, sia nel caso bilineare simmetrico sia nel caso hermitiano, w− av(w)v ∈{v}⊥. Poiche , w = av(w)v + (w − av(w)v), e i soli vettori che appartengonoal proprio ortogonale sono i vettori isotropi, possiamo concludere che, se v e unvettore non isotropo,

V = span{v} ⊕ v⊥. (25)

Definizione 3.12 Una base {v1, . . . ,vn} si dice ortogonale se B(vi,vj) = 0,(H(vi,vj) = 0) ogni qual volta i 6= j.

Ne segue che la matrice associata a una forma bilineare (hermitiana) rispettouna base ortogonale e diagonale.

Prima di provare che esistono basi ortogonali, dimostriamo il seguenteLemma Ogni forma bilineare B (hermitiana H) non nulla ha almeno un vettorenon isotropo.

41

Page 42: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Dim. Poiche B (H) e non nulla, esistono v,w ∈ V , tali che B(v,w) 6= 0(H(v,w) 6= 0). Nel caso bilineare simmetrico per la (22) possiamo concludereche almeno uno fra i tre vettori v, w, v+w, e non isotropo. Nel caso hermitianoper la (23) possiamo concludere che almeno uno fra i quattro vettori v, w, v+w,v + iw e non isotropo.

Proposizione 3.6 Sia B (H) una forma bilineare simmetrica (hermitiana).Esiste una base ortogonale.

Dim. La dimostrazione per induzione non presenta differenze fra il caso sim-metrico da quello hermitiano.

Se B e la forma nulla allora ogni base e ortogonale. Se B non e identica-mente nulla, procediamo per induzione sulla dimensione di V . Se dim V = 1 laproposizione e banale.

Assumiamo l’esistenza di una base ortogonale per ogni spazio vettoriale Vdi dimensione n − 1. Sia v1 un vettore non isotropo(esiste per il lemma). Perla (25)

V = span{v1} ⊕ v⊥1 .

ovviamente B|v⊥1 e ancora bilineare simmetrica. Sia {v2, . . . ,vn} una base or-togonale di v⊥1 ; essa esiste perche dim(v⊥1 ) = n − 1. E facile verificare che{v1,v2, . . . ,vn} e una base ortogonnale di V .

Il teorema precedente mostra che per una forma bilineare o hermitiana,esiste sempre una base rispetto la quale la matrice associata e diagonale. Cidomandiamo se non sia possibile migliorare ulteriormente il risultato.

Trattiamo prima il caso di una forma B bilineare simmetrica sul campo C.

Proposizione 3.7 Sia B una forma bilineare simmetrica su uno spazio vetto-riale complesso V di rango r. Esiste una base V, tale che

MV(B) =(

Ir 00 0

)Dim. Per la proposizione (3.6) sia V ′ = {v′1, . . . ,v′n} una base tale che la

matrice associata MV(B) sia diagonale. Poiche il rango e r, salvo un cambia-mento dell’ordine dei vettori della base, posso supporre che i primi r elementidella diagonale a11, . . . , arr siano non nulli, mentre tutti gli altri sono 0. Ab-biamo dunque che

B(v′1,v′1) = a11, . . . , B(v′r,v

′r) = arr,

B(v′r+1,v′r+1) = 0, . . . , B(v′n,v′n) = 0,

B(v′i,v′j) = 0 per i 6= j

42

Page 43: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Se poniamo

vi ={ 1√

aiiv′i 1 ≤ i ≤ r

v′i r + 1 ≤ i ≤ n

dove√

aii e una delle due radici quadrate di aii, abbiamo che V = {v1, . . . ,vn}e una base, perche ottenuta da V ′ tramite una matrice invertibile, e che MV(B)e diagonale con

B(v1,v1) = 1, . . . , B(vr,vr) = 1, B(vr+1,vr+1) = 0, . . . , B(vn,vn) = 0.

Poiche sappiamo che il rango e un invariante delle forme bilineari simmetri-che, seguendo gli stessi ragionamenti fatti per gli operatori, possiamo concludereche due forme bilineari simmetriche complesse sono equivalenti, a meno di auto-morfismi di V, se e solo se hanno lo stesso rango e che quindi il rango classificale forme bilineari simmetriche complesse25.

Poiche due matrici simmetriche complesse, rappresentano la stessa formabilineare rispetto basi diverse se e solo se sono congruenti, possimao concludereche due matrici simmetriche complesse sono congruenti, se e solo se hanno lostesso rango.

Nel caso di una forma bilineare simmetrica reale, non possiamo arrivare allostesso risultato perche non sempre esiste la radice quadrata di un numero reale.Abbiamo comunque l’importante

Proposizione 3.8 (Teorema di Sylvester)Sia B una forma bilineare simmetrica su uno spazio vettoriale reale V di rangor. Esistono numeri interi p, q, con p + q = r, e una base V, tale che

MV(B) =

Ip 0 00 −Iq 00 0 0

Inoltre i numeri p, q, non dipendono dalla base, ma solo dalla forma.

Dim. Anche questa volta dalla proposizione (3.6), e salvo un riordinamentodell’ordine dei vettori, sappiamo che esiste una base V ′ = {v′1, . . . ,v′n} tale chela matrice associata MV(B) e diagonale, con i primi p termini della diagonale,a11, . . . , app, positivi, i secondi q termini, ap+1 p+1, . . . , arr, negativi e i restantinulli. Abbiamo dunque che

B(v′1,v′1) = a11, . . . , B(v′r,v

′r) = arr,

B(v′r+1,v′r+1) = 0, . . . , B(v′n,v′n) = 0,

B(v′i,v′j) = 0 per i 6= j.

25ed anche le forme quadratiche complesse

43

Page 44: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Se poniamo

vi =

1√aii

v′i 1 ≤ i ≤ p1√−aii

v′i p + 1 ≤ i ≤ r

v′i r + 1 ≤ i ≤ n

abbiamo che V = {v1, . . . ,vn} e una base, perche ottenuta da V ′ tramite unamatrice invertibile, e che MV(B) e diagonale con

B(v1,v1) = 1, . . . , B(vp,vp) = 1B(vp+1,vp+1) = −1, . . . , B(vr,vr) = −1

B(vr+1,vr+1) = 0, . . . , B(vn,vn) = 0.

Resta da provare che la coppia p, q non dipende dalla base. Sia pertanto V ′′ ={v′′1 , . . . ,v′′n} un’altra base tale che

B(v′′1 ,v′′1 ) = 1, . . . , B(v′′t ,v′′t ) = 1B(v′′t+1,v

′′t+1) = −1, . . . , B(v′′r ,v′′r ) = −1

B(v′′r+1,v′′r+1) = 0, . . . , B(v′′n,v′′n) = 0

con p 6= t e supponiamo che t < p. Sia U = span{v1, . . .vp} e W = span{v′′t+1, . . .v′′n}.

Dal teorema di Grassmann abbiamo

dim U + dim W = dim(U ∩W ) + dim(U + W )

p + (n− t) = dim(U ∩W ) + dim(U + W ) ≤ dim(U ∩W ) + n

1 ≤ p− t ≤ dim(U ∩W ).

Per cui esiste un vettore non nullo v ∈ U ∩W . Poiche v ∈ U ,

v = a1v1 + . . . + apvp,

con a1, . . . , ap non tutti nulli; e poiche v ∈ W ,

v = bt+1v′′t+1 + . . . + bnv′′n.

Dalla prima abbiamo

B(v,v) = a21B(v1,v1) + . . . + a2

pB(vp,vp) = a21 + . . . + a2

p > 0

Mentre dalla seconda

B(v,v) = b2t+1B(vt+1,vt+1) + . . . + b2

nB(vn,vn) = −b2t+1 − . . .− b2

t+r ≤ 0.

questo e assurdo e l’assurdo nasce dall’aver supposto t ≤ p.

44

Page 45: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Nel caso hermitiano abbiamo un teorema perfettamente analogo al teoremadi Sylvester. Anche la dimostrazione e identica, perche gli elementi della diago-nale di una matrice hermitiana sono tutti reali.

Definizione 3.13 Si dice segnatura della forma bilineare simmetrica B (o dellaforma hermitiana H) la coppia (p, q), corrispondente al numero dei terminipositivi e negativi che si trovano sulla diagonale di una matrice associata a B(H), rispetto una base ortogonale.

La segnatura e dunque un invariante della forma bilineare simmetrica (her-mitiana) e da una parte classifica le forme simmetriche reali (hermitiane) a menodi automorfismi di V, e dall’altra classifica le matrici simmetriche reali (hermi-tiane) rispetto la relazione di congruenza (H-congruenza), nel senso che duematrici sono congruenti (H-congruenti) se e solo se hanno la stessa segnatura.

Piu spesso si parla di segnatura di una forma quadratica, riferendosi allasegnatura della forma bilineare simmetrica associata.

Definizione 3.14 Una forma quadratica (hermitiana) di rango r su uno spaziovettoriale V di dimensione n prende il seguente nome a seconda della segnatura

(n, 0) definita positiva(0, n) definita negativa(r, 0) con r < n semidefinita positiva(0, r) con r < n semidefinita negativa(p, q) con p > 0 e q > 0 indefinita

La ragione dei nomi delle forme quadratiche e dovuta al fatto che una formaQ e definita positiva se e solo se Q(v) ≥ 0 e Q(v) = 0 ⇔ v = 0.

3.4 Prodotti scalari e prodotti hermitiani

Definizione 3.15 Una forma bilineare simmetrica con forma quadratica asso-ciata definita positiva su uno spazio vettoriale reale V si dice un prodotto scalare.

Definizione 3.16 Una forma hermitiana definita positiva su uno spazio vetto-riale complesso V si dice un prodotto hermitano.

Supporremo nel seguito sempre definito un prodotto scalare o un prodotto her-mitiano, che indicheremo, per ricordarci che e definito positivo, con

< v,w > .

Definizione 3.17 Si dice modulo (o norma) di un vettore v il numero

‖v‖ :=√

< v,v >

Proposizione 3.9 (Disuguaglianza di Schwartz)

| < v,w > | ≤ ‖v‖‖w‖

e vale l’uguaglianza se e solo se v e w sono linearmente dipendenti.

45

Page 46: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Dim. Diamo la dimostrazione nel caso del prodotto hermitiano che presentaqualche maggiore difficolta. Se w = 0 il teorema e banale. Per ogni a, b ∈ C,abbiamo

0 ≤ < av + bw, av + bw >= aa‖v‖2 + bb‖w‖2 + 2Re(ab < v,w >), (26)

se poniamo a = ‖w‖2 e b = − < v,w >, otteniamo

0 ≤ ‖w‖4‖v‖2 + | < v,w > |2‖w‖2 + 2Re(−‖w‖2| < v,w > |2) =‖w‖4‖v‖2 − | < v,w > |2‖w‖2

da cui, dividendo per ‖w‖2 e passando alla radice quadrata, otteniamo la disu-guaglianza.

Infine se vale l’uguale ho che

0 =< ‖w‖2v− < v,w > w, ‖w‖2v− < v,w > w >

da cui, essendo il prodotto definito positivo, segue che ‖w‖2v− < v,w > we una combinazione lineare nulla non banale di v e w, quindi v e w sonolinearmente dipendenti. Viceversa, se v e w sono uno un multiplo dell’altro,l’uguaglianza e di immediata verifica.

Dalla disuguaglianza di Schwartz, tanto nel caso reale quanto in quello her-mitiano, seguono le seguenti proprieta

1. ‖v‖ ≥ 0, ‖v‖ = 0 ⇐⇒ v = 0

2. ‖kv‖ = |k|‖v‖

3. ‖v + w‖ ≤ ‖v‖+ ‖w‖

La dimostrazione delle prime due e banale, la terza nel caso hermitiano segueda

‖v + w‖2 = ‖v‖2 + 2Re < v,w > +‖w‖2 ≤‖v‖2 + 2| < v,w > |+ ‖w‖2 ≤

‖v‖2 + 2‖v‖‖w‖+ ‖w‖2 =(‖v‖+ ‖w‖)2,

e in maniera simile nel caso reale.Uno spazio vettoriale dove vi sia una funzione norma, ‖v‖, che soddisfi le tre

proprieta di cui sopra, si dice spazio normato. In uno spazio normato e possibiledefinire una funzione distanza d, tramite

d(v,w) := ‖v −w‖;

in effetti d soddisfa le proprieta

46

Page 47: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

1. d(v,w) ≥ 0 e d(v,w) = 0 ⇐⇒ v = w

2. d(v,w) = d(w,v)

3. d(v,w) ≤ d(v, z) + d(z,w).

Pertanto, l’introduzione di un prodotto scalare o hermitiano in uno spa-zio vettoriale arricchisce la sua struttura facendolo diventare anche uno spaziometrico.

3.5 Operatori ortogonali e unitari

Sia V uno spazio vettoriale di dimensione finita su C (su R) dove sia definitaun prodotto hermitiano (un prodotto scalare) .

Definizione 3.18 Un operatore T : V → V si dice unitario (ortogonale) se

< T (v), T (w) >=< v,w > .

Nelle proposizioni che seguono si faranno le dimostrazioni per il caso unitario,ottenedosi le dimostrazioni del caso ortogonale in maniera del tutto simile, ilpiu delle volte , semplicemente omettendo il simbolo del coniugio.

Definizione 3.19 Una matrice A ∈ Mnn(C) si dice unitaria se AtA = I ( oequivalentemente AAt = I)

Proposizione 3.10 Un operatore unitario (ortogonale) gode delle seguenti pro-prieta

1. conserva il modulo di un vettore

2. conserva la distanza di due vettori

3. trasforma basi ortonormali in basi ortonormali

4. e invertibile

5. la matrice associata all’operatore, rispetto a una base ortonormale, e or-togonale se l’operatore e ortogonale e unitaria se l’operatore e unitario.

Dim. Le proprieta 1), 2) e 3) sono immediata conseguenza della definizione. Te invertibile perche e iniettivo, infatti T (v) = 0 implica

0 =< T (v), T (v) >=< v,v >

e questo implica v = 0. Infine proviamo l’ultima proprieta. Sia V = {v1, . . . ,vn}una base ortonormale di V . Sia T (vi) =

∑nk=1 aki vk, per cui la matrice asso-

ciata a T , rispetto la base V, e

MV(T ) = (aki)1 ≤ k ≤ n1 ≤ i ≤ n

.

47

Page 48: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Abbiamo

δij =< vi,vj >=< T (vi), T (vj) >=

<n∑

k=1

aki vk,n∑

h=1

ahj vh >=

n∑k=1

aki

n∑h=1

ahj < vk,vh >=

n∑k=1

aki

n∑h=1

ahjδkh =

n∑k=1

akiakj =n∑

k=1

atikakj

dove atik sono gli elementi della matrice trasposta (MV(T ))t; pertanto

(MV(T ))t(MV(T )) = I,

cioe MV(T ) e una matrice unitaria.

Proposizione 3.11 Se λ e autovalore di un operatore unitario T (ortogonale),allora |λ| = 1 (λ = ±1).

Dim. Sia v un autovettore relativo all’autovalore λ, abbiamo

< v,v >=< T (v), T (v) >=< λv, λv >= λλ < v,v >,

da cui, essendo v 6= 0, segue la tesi.

Proposizione 3.12 Autovettori relativi a autovalori distinti di un operatoreunitario T (ortogonale) sono ortogonali fra loro

Dim. Siano v e w due autovettori relativi agli autovalori λ e µ, con λ 6= µ.Abbiamo

< v,w >=< T (v), T (w) >=< λv, µw >= λµ < v,w > .

Da cui, o λµ = 1 o < v,w >= 0. Poiche, per la proposizione precedente,µµ = 1, non puo essere anche λµ = 1, altrimenti λ = µ. Dunque < v,w >= 0.

La seguente proposizione e vera per gli operatori unitari, ma non per glioperatori ortogonali.

48

Page 49: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Proposizione 3.13 Sia T un operatore unitario. Esiste una base ortonormaleche diagonalizza T .

Dim. Dobbiamo determinare l’esistenza di una base ortonormale di autovettori.La dimostrazione e per induzione sulla dimensione di V . Se dim V = 1 , il fattoe banale. Supponiamo di averlo provato per gli spazi vettoriali di dimensionen − 1 e apprestiamoci a dimostrarlo per gli spazi vettoriali di dimensione n.Sia λ un autovalore di T ; esso esiste perche siamo sul campo C. Sia v1 unautovettore unitario, relativo a λ.

Sia w ∈ v⊥1 , abbiamo

0 =< v1,w >=< T (v1), T (w) >=< λv1, T (w) >= λ < v1, T (w) >= 0,

da cui, essendo λ 6= 0, segue che < v1, T (w) >= 0. Dunque T (v⊥1 ) ⊆ v⊥1 .Naturalmente

T|v⊥1 : v⊥1 → v⊥1e ancora unitario e opera su uno spazio di dimensione n − 1: Per l’ipotesiinduttiva, esiste una base ortonormale di autovettori per T|v⊥1 , {v2, . . . ,vn}.Risulta dunque che {v1,v2, . . . ,vn} e una base ortonormale di autovettori di T .

3.6 Operatori simmetrici, teorema spettrale

Sia V uno spazio vettoriale di dimensione finita su R (su C) dove sia definitoun prodotto scalare (prodotto hermitiano) .

Definizione 3.20 Un operatore T : V → V si dice simmetrico (hermitiano)26

se< T (v),w >=< v, T (w) >

Proposizione 3.14 La matrice associata a un operatore simmetrico (hermi-tiano), rispetto a una base ortogonale, e simmetrica (hermitiana).

Dim. Dimostrazione per un operatore hermitiano. Sia V = {v1, . . . ,vn} unabase ortonormale di V . Sia T (vi) =

∑nk=1 aki vk, per cui la matrice associata a

T , rispetto la base V eMV(T ) = (aki)1 ≤ k ≤ n

1 ≤ i ≤ n

.

Abbiamo

< T (vi),vj >=<n∑

k=1

aki vk,vj >=n∑

k=1

aki < vk,vj >=n∑

k=1

akiδkj = aji,

26tali operatori vengono anche chiamati autoaggiunti, infatti si definisce aggiunto di unoperatore T un operatore G tale che

< T (v),w >=< v, G(w) >;

la teoria mostra che per ogni operatore T esiste uno e un solo aggiunto G.

49

Page 50: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

similmente

< vi, T (vj) >=< vi,n∑

k=1

akj vk >=n∑

k=1

akj < vi,vk >=n∑

k=1

akjδik = aij .

Poiche < T (vi),vj >=< vi, T (vj) >, abbiamo che aji = aij , da cui MV(T ) =MV(T )t. Per un operatore simmetrico stessa prova senza il coniugio.

Premettiamo il seguente lemma alla dimostrazione del teorema spettrale.

Lemma Lo spettro di un operatore simmetrico (hermitiano) e totalmente reale;ovvero il polinomio caratteristico dell’operatore si decompone nel prodotto di nfattori lineari reali.

Dim. Esprimiamo l’operatore in termini di coordinate rispetto una base or-tonormale. Sia V = {v1, . . . ,vn} una base ortonormale di V e sia MV(T ) lamatrice associata. Sia λ un autovalore complesso di MV(T ) e x un corrispon-dente autovettore27 di Cn. Abbiamo

MV(T )x = λx, (27)

e, coniugando ambo i membri,

MV(T )x = λx.

Utilizzando ora la condizione che, MV(T ) e reale simmetrica nel caso dell’operatoresimmetrico, ovvero che MV(T ) e hermitiana nel caso di un operatore hermitiano,otteniamo in ogni caso

MV(T )tx = λx,

quindi, moltiplicando a sinistra per xt

xtMV(T )tx = xtλx,

da cui,posto x = (x1, . . . ,xn), utilizzando la (27), otteniamo

λn∑

i=1

xixi = λxtx = xtMV(T )tx = (MV(T )x)tx = (λx)tx = λn∑

i=1

xixi.

Essendo x 6= 0, abbiamo∑n

i=1 xixi 6= 0 e quindi λ = λ, cioe λ ∈ R. Pertantoogni autovalore di MV(T ) complesso e reale e dunque il polinomio caratteri-stico di MV(T ), che e uguale al polinomio caratteristico di T , si decompone nelprodotto di fattori lineari reali.

Si osservi che di conseguenza il polinomio caratteristico di un operatorehermitiano e reale.

27nel caso T sia un operatore simmetrico, x rappresenta le componenti rispetto la base V,di un autovettore relativo a λ dell’operatore complessificato TC.

50

Page 51: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Siamo ora in grado di dimostrare il teorema piu importante di questo capi-tolo.

Proposizione 3.15 (Teorema spettrale — versione per gli operatori) Sia T unoperatore simmetrico (o hermitiano). Esiste una base ortonormale che diago-nalizza T .

Dim. Dobbiamo determinare l’esistenza di una base ortonormale di autovettori.La dimostrazione e per induzione sulla dimensione di V . Se dim V = 1 , il fattoe banale. Supponiamo di aver provato il teorema per gli spazi di dimensionen − 1 e apprestiamoci a dimostrarlo per gli spazi di dimensione n. Sia λ unautovalore di T ; esso esiste per il lemma. Sia v1 un suo autovettore unitario.

Sia w ∈ v⊥1 , abbiamo

< v1, T (w) >=< T (v1),w >=< λv1,w >= λ < v1,w >= 0.

Pertanto T (v⊥1 ) ⊆ v⊥1 . Naturalmente T|v⊥1 : v⊥1 → v⊥1 e ancora simmetrico(hermitiano) e opera su uno spazio di dimensione n − 1. Per l’ipotesi indut-tiva, esiste una base ortonormale di autovettori per T|v⊥1 , {v2, . . . ,vn}. Risultadunque che {v1,v2, . . . ,vn} e una base ortonormale di autovettori di T .

Il teorema spettrale ammette anche diverse letture se lo si esprime in terminidi matrici o in termini di forme bilineari. La versione per le matrici si ottieneconsiderando che ogni matrice simmetrica A (hermitiana) definisce un’operatoresimmetrico (hermitiano) T : Rn → Rn (T : Cn → Cn): l’operatore che mappax in Ax.

Proposizione 3.16 (Teorema spettrale — versione per le matrici) Sia A unamatrice simmetrica ( hermitiana). Esiste una matrice M ortogonale (unitaria)che diagonalizza A, cioe tale che M−1AM e diagonale.

Se M e ortogonale e M−1AM e diagonale, allora anche M tAM e diagonale,quindi la matrice simmetrica A non solo e simile ma e anche congruente auna matrice diagonale. Se M e hermitiana e M−1AM e diagonale, abbiamoche M tAM e diagonale, e ponendo N = M , abbiamo che N tAN e diagonale;quindi la matrice hermitiana A non solo e simile ma e anche H-congruente auna matrice diagonale.

Come conseguenza della osservazione precedente otteniamo che se (p, q) ela segnatura di una matrice simmetrica (hermitiana), allora p rappresenta ilnumero degli autovalori positivi e q rappresenta il numero degli autovalori ne-gativi, contati entrambi con la dovuta molteplicita. Dalla stessa osservazionesegue anche la versione del teorema spettrale per le forme bilineari.

Proposizione 3.17 (Teorema spettrale — versione per le forme bilineari) SiaB una forma bilinerare simmetrica (H una forma hermitiana). Esiste una baseortonormale che diagonalizza B (H).

51

Page 52: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Quest’ultimo enuciato puo essre cosı riletto: se su uno spazio vettoriale Vsono date due forme bilinerai simmetriche (hermitiane) di cui una sia definitapositiva, allora esiste una base che diagonalizza entrambe.

52

Page 53: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

4 Tensori

In tutto il capitolo supponiamo che V sia uno spazio vettoriale di dimensione nsullo R , per quanto le considerazioni che si faranno valgono in genere anche suC .

4.1 Spazio duale

Definizione 4.1 Un’applicazione lineare da σ : V → R si chiama funzionale(lineare) o covettore.

La somma di due funzionali e il prodotto di un funzionale per una costante sonodefinite da

(σ1 + σ2)(v) := σ1(v) + σ2(v)

(kσ)(v) := k(σ(v))

Sono verifiche di routine controllare che la somma di due funzionali e un funzio-nale e che il prodotto di un funzionale per una costante e ancora un funzionale.

L’insieme di tutti i funzionali e uno spazio vettoriale rispetto le operazioni disomma e prodotto per una costante, definite sopra (anche queste sono verifichedi routine).

Come ogni applicazione lineare, un funzionale resta univocamente definitoquando si assegnino i valori che assume sui vettori di una base.

Definizione 4.2 Lo spazio vettoriale dei funzionali lineari su V si chiama spa-zio duale e si indica con V ∗.

Proposizione 4.1 Se V ha dimensione finita, allora dim V ∗ = dim V .

Dim. Sia {e1, . . . , en} una base di V , sia ηi per 1 ≤ i ≤ n il funzionale su Vdefinito da

ηi(ej) = δij .

dove δij e la funzione ”delta di Kronecker”, che vale 1 se i = j e vale 0 se i 6= j.

{η1, . . . , ηn} e una base di V ∗. Infatti

1. sono linearmente indipendenti, perche dan∑

i=1

aiηi = 0

segue che, applicando il funzionale a un qualunque vettore ej della basedi V , da un lato

n∑i=1

aiηi(ej) = 0(ej) = 0

e dall’altron∑

i=1

aiηi(ej) =

n∑i=1

aiδij = aj .

Da cui necessariamente aj = 0 per ogni j;

53

Page 54: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

2. generano tutto V ∗, perche , per ogni funzionale σ ∈ V ∗, si ha

σ =n∑

i=1

(σ(ei))ηi,

infatti per dimostrare l’uguaglianza dei due funzionali basta verificarla suivettori di una base; cosı facendo abbiamo per ogni ej

n∑i=1

(σ(ei)ηi)(ej) =n∑

i=1

σ(ei)ηi(ej) =n∑

i=1

σ(ei)δij = σ(ej).

Definizione 4.3 La base {η1, . . . , ηn} di V ∗ si dice base duale della base {e1, . . . , en}di V .

Avendo V e V ∗ la stessa dimensione sono spazi vettoriali isomorfi, ma non vi eun modo canonico di associare un funzionale a un vettore 28, con cio intendo direche bisogna ricorrere a un arbitraria scelta delle basi per definire un isomorfismo.

Notiamo invece che e possibile definire un isomorfismo canonico fra V e lospazio biduale (V ∗)∗. Definiamo

Φ : V → (V ∗)∗

v 7→ Φ(v)

dove

Φ(v) : V ∗ → Rσ 7→ σ(v).

Lasciamo al lettore la verifica che Φ(v) e effettivamente un funzionale lineare suV ∗ e che la Φ cosı definita e lineare (basta applicare le definizioni); dimostriamoinvece che Φ e iniettiva. Se Φ(v) = 0, allora per ogni σ ∈ V ∗, Φ(v)(σ) = 0;cioe, per ogni σ ∈ V ∗, σ(v) = 0 e questo e possibile solo se v = 0, infatti perogni v 6= 0 posso completare v in una base e considerare il funzionale che su vassume il valore 1 e su tutti gli altri vettori della base il valore 0. Concludiamoche Φ e un isomorfismo, perche V e (V ∗)∗ hanno la stessa dimensione.

Come si vede per definire Φ non si e fatto uso di scelte di basi. Poiche ognivettore si comporta come un funzionale sullo spazio dei funzionali, identificandov con Φ(v), possiamo concludere che non solo i covettori sono funzionali sullospazio dei vettori, ma anche i vettori sono funzionali sullo spazio dei covettori.

28a meno che non si aumenti la struttura di V , introducendo un prodotto scalare, madiscuteremo di considerazioni di questo tipo piu avanti.

54

Page 55: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

4.2 Convenzione di Einstein

La convenzione di Einstein e una convenzione che semplifica la notazione. Essaprevede che:

1. i vettori di una base dello spazio vettoriale V , {e1, . . . , en} si indicianocon indici in basso,

2. i vettori della base duale {η1, . . . , ηn} si indiciano con indici in alto,

3. le coordinate di un vettore si indiciano con indici in alto,

4. le coordinate di un covettore si indiciano con indici in basso,

5. si ometta il simbolo di sommatoria, se questa si riferisce a un indice chesi trova una volta un basso e una volta in alto,

6. ogni qualvolta si incontri uno stesso indice in alto e in basso in un prodottosi intende che si deve effettuare una somma al variare di quell’indice fra 1e la dimensione di V ,

7. si dispongono gli indici in alto o in basso in modo di evitare se possibiledi dover fare una sommatoria, rispetto a un indice ripetuto due volte inbasso (o in alto); se questa situazione dovesse essere inevitabile si mostraesplicitamente il simbolo e l’indice di sommatoria,

8. usualmente in una formula che contiene un’uguaglianza un indice non ri-petuto in basso (in alto) a sinistra dell’uguale deve comparire non ripetutoin basso (in alto) anche a destra dell’uguale

Per quanto alcuni ritengano che dietro questa notazione non ci siano fattiparticolarmente rilevanti da un punto di vista scientifico29, noi ne faremo usonelle pagine che seguono.

Pertanto la decomposizione di un vettore v rispetto alla base E = {e1, . . . , en}si scrivera

v = xjej (28)

piuttosto che

v =n∑

j=1

xjej o v =n∑

j=1

xjej

Se E ′ = {e′1, . . . , e′n} e un’altra base avremo

v = x′ie′i (29)

e le relazioni che danno il cambiamento di base nella forma

e′i = αjiej o ej = βi

je′i (30)

29ma molti fisici matematici non sono d’accordo con questa opinione

55

Page 56: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

mentre quelle che danno il cambiamento di coordinate (che si ricavano sosti-tuendo le (30) nelle (28) e (29)) sono

xj = αji x′i o x′i = βi

jxj . (31)

Per ricollegare queste formule al nostro modo di rappresentare le matricicambiamento di base, osserviamo che

ME′E(id) =(βi

j

)1 ≤ i ≤ n1 ≤ j ≤ n

eMEE′(id) =

(αj

i

)1 ≤ j ≤ n1 ≤ i ≤ n

.

Infine il fatto che le due matrici sono una l’inversa dell’altra si rappresenta

αijβ

jk = δi

k

αijβ

ki = δk

j .

4.3 Definizione di tensore

La nozione di tensore puo essere introdotta in modi diversi. Possiamo qui fare unparallelo con la nozione di vettore (di cui comunque il tensore rappresenta unageneralizzazione). Il vettore puo essere introdotto come terna (n-pla) di numeri,come segmento orientato, come elemento di uno spazio vettoriale. Similmente untensore puo essere introdotto come un pacchetto di numeri variamente indiciati,come un’applicazione multilineare, o come un elemento del prodotto tensorialedi spazi vettorali.

Utilizzeremo qui l’approccio che descrivere il tensore come un’applicazionemultilineare.

Definizione 4.4 Siano V1, . . . , Vr spazi vettoriali su R. Un’applicazione F :V1 × . . . × Vr → R si dice multilineare se e lineare in ciascuna delle variabili.Formalmente per ogni indice i, per ogni a, b ∈ R e per ogni v,w ∈ Vi

F (v1, . . . ,vi−1, av + bw,vi+1, . . . ,vr) =aF (v1, . . . ,vi−1,v,vi+1, . . . ,vr) + bF (v1, . . . ,vi−1,w,vi+1, . . . ,vr)

Definizione 4.5 Si dice tensore sullo spazio vettoriale V di ordine covarianter e ordine controvariante s (o di tipo (r, s)) un’applicazione multilineare

T : V×, . . . ,×V︸ ︷︷ ︸r

×V ∗×, . . . ,×V ∗︸ ︷︷ ︸s

→ R

Esempio 4.1 Ogni covettore σ ∈ V ∗ e un tensore covariante di ordine 1, es-sendo un funzionale lineare su V .

56

Page 57: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Esempio 4.2 Avendo indentificato V con il suo biduale (V ∗)∗, anche ogni vet-tore v ∈ V e un tensore controvariante di ordine 1, essendo un funzionale suV ∗.

Esempio 4.3 Ogni forma bilineare su V e un tensore covariante di ordine 2.

Esempio 4.4 Il determinante, inteso come funzione delle colonne di una ma-trice n× n e un tensore covariante di ordine n sullo spazio vettoriale Rn.

La somma di due tensori di tipo (r, s) e il prodotto di un tensore per unoscalare sono definiti in modo analogo a quanto fatto per i covettori:

Definizione 4.6 Siano T,R tensori di tipo (r, s) e k scalare. Definiamo

(T+R)(v1, . . . ,vr, σ1, . . . , σs) := T (v1, . . . ,vr, σ1, . . . , σs)+R(v1, . . . ,vr, σ1, . . . , σs)

(kT )(v1, . . . ,vr, σ1, . . . , σs) := kT (v1, . . . ,vr, σ1, . . . , σs).

E verifica di routine che T + R e kT sono ancora tensori. E altrettanto verificadi routine che l’insieme dei tensori di tipo (r, s) forma uno spazio vettorialerispetto le operazioni sopra definite. Lo indichiamo con T r

s (V ).

4.4 Il prodotto tensoriale

Definiamo un prodotto fra tensori, che a un tensore T di tipo (r, s) e uno T ′ ditipo (r′, s′), associa un tensore T ⊗ T ′ di tipo (r + r′, s + s′).

Definizione 4.7

T ⊗ T ′ : V×, . . . ,×V︸ ︷︷ ︸r+r′

×V ∗×, . . . ,×V ∗︸ ︷︷ ︸s+s′

→ K

T ⊗ T ′(v1, . . . ,vr,vr+1, . . . ,vr+r′ , σ1, . . . , σs, σs+1, . . . , σs+s′) :=T (v1, . . . ,vr, σ1, . . . , σs)T ′(vr+1, . . . ,vr+r′ , σs+1, . . . , σs+s′)

Sono verifiche di routine controllare che T +T ′ e un tensore, cioe un’applicazionemultilineare.

Il prodotto tensoriale gode delle proprieta

(T + T ′)⊗ T ′′ = T ⊗ T” + T ′ ⊗ T”

T ⊗ (T ′ + T ′′) = T ⊗ T ′ + T ⊗ T”

k(T ⊗ T ′) = (kT )⊗ T ′ = T ⊗ (kT”)

pertanto⊗ : T r

s × T r′

s′ → T r+r′

s+s′

e bilineare.

57

Page 58: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

Il prodotto tensoriale e anche associativo, cioe

(T ⊗ T ′)⊗ T” = T ⊗ (T ′ ⊗ T”)

e pertanto possiamo omettere le parentesi in un prodotto di tre tensori e, periterazione, definire anche il prodotto tensoriale di un numero maggiore di tensori;in tal caso ⊗ si comporta come un’applicazione multilineare.

Sia {e1, . . . , en} una base di V , e {η1, . . . , ηn} la base duale di V ∗.Calcoliamo il tensore ηi1 ⊗ ηi2 ⊗ . . .⊗ ηir su una qualunque r-pla di vettori

della base di V, ej1 , ej2 , . . . , ejr. Abbiamo

ηi1 ⊗ ηi2 ⊗ . . .⊗ ηir (ej1 , ej2 , . . . , ejr ) = δi1j1

δi2j2

. . . δirjr,

questo numero vale sempre 0, eccetto il caso in cui gli indici i1, . . . , ir sianorispettivamente uguali a j1, . . . , jr, nel qual caso assume il valore 1.

Proposizione 4.2 L’insieme dei tensori {ηi1⊗. . .⊗ηir}, al variare di i1, . . . , irfra 1 e n forma una base dello spazio dei vettori covarianti di ordine r, T r

0 .

Dim. La dimostrazione della lineare indipendenza si fa testando la gene-rica combinazione lineare dei tensori del nostro insieme sulla generica r-pla deivettori della base di V :

ai1,...,ir{ηi1 ⊗ . . .⊗ ηir} = 0

implica che per ogni r-pla (ej1 , . . . , ejr)

ai1,...,ir{ηi1 ⊗ . . .⊗ ηir}(ej1 , . . . , ejr ) = 0(ej1 , . . . , ejr ) = 0,

ma d’altra parte

ai1,...,ir{ηi1 ⊗ . . .⊗ ηir}(ej1 , . . . , ejr

) = ai1,...,irδi1j1

. . . δirjr

= aj1,...,jr,

quindi per ogni r-pla (j1, . . . , jr), aj1,...,jr= 0.

Il fatto che {ηi1 ⊗ . . .⊗ ηir}, al variare di i1, . . . , ir, generino tutto T r0 segue

dal fatto che per ogni un tensore covariante di ordine r, T , vale la seguente

T = T (ei1 , . . . , eir)ηi1 ⊗ . . .⊗ ηir , (32)

la quale pure si dimostra testandola sulla generica r-pla dei vettori della basedi V , (ej1 , . . . , ejr

). Infatti

T (ei1 , . . . , eir)ηi1 ⊗ . . .⊗ ηir (ej1 , . . . , ejr

) =T (ei1 , . . . , eir

)δi1j1

δi2j2

. . . δirjr, =

T (ej1 , . . . , ejr)

58

Page 59: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

In modo del tutto analogo, ricordando che i vettori della base di V , si com-portano come funzionali sui vettori della base di V ∗, si perviene a dimostrareche

Proposizione 4.3 L’insieme dei tensori {ej1⊗. . .⊗ejs}, al variare di j1, . . . , js

fra 1 e n forma una base dello spazio dei vettori controvarianti di ordine s, T 0s .

e piu in generale

Proposizione 4.4 L’insieme dei tensori {ηi1 ⊗ . . . ⊗ ηir ⊗ ei1 ⊗ . . . ⊗ eis}, al

variare di i1, . . . , ir e j1, . . . , js fra 1 e n forma una base dello spazio dei vettoricon ordine di coovarianza r e e ordine di controvarianza s, T r

s .

Ne segue chedim T r

s = nr+s.

4.5 Gli operatori come tensori di tipo (1, 1)

Denotiamo con End(V ) lo spazio vettoriale degli operatori su V . Esso ha di-mensione n2. Definiamo

Φ : End(V ) → T 11 (V )

F 7→ Φ(F )

doveΦ(F ) : V × V ∗ → K

(v, σ) 7→ σ(F (v))

La bilinearita di Φ(F ) e conseguenza banale della linearita di F e di σ, il che ciassicura che Φ(F ) e un tensore.

Proposizione 4.5 Φ e un isomorfismo canonico di spazi vettoriali

Dim. La linearita di Φ e conseguenza diretta delle definizioni.Φ e iniettiva, infatti se Φ(F ) = 0, allora per ogni v ∈ V e per ogni σ ∈ V ∗,

σ(F (v)) = 0. Dal fatto che per ogni σ ∈ V , σ(F (v)) = 0, segue che F (v) = 0,e poiche questo vale per ogni v ∈ V , allora F e l’operatore nullo.

Infine, avendo End(V ) e T 11 (V ) la stessa dimensione, si conclude che Φ e

un isomorfismo, che si dice canonico, perche la sua definizione non dipende dascelte arbitrarie, quali potrebbe essere la scelta di una base.

In matematica, quando vi e un isomorfismo canonico, si e soliti identificarei due spazi vettoriali. Ne segue che ogni operatore lineare T : V → V vieneinterpretato come un tensore con ordine di covarianza 1 e controvarianza 1 eviceversa un tensore di tipo 1-1 puo essere interpretato come operatore lineare.

59

Page 60: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

4.6 Tensori e cambiamenti di base

Siano {e1, . . . , en}, {e′1, . . . , e′n} due basi di V e {η1, . . . , ηn}, {η′1, . . . , η′n} lerispettive basi duali.

Abbiamo gia scritto le relazioni relative ai cambiamenti di base (30)

e′i = αjiej ej = βi

je′i (33)

conαj

i βkj = δk

i . (34)

Consideriamo il covettore βijη

j e applichiamolo al vettore e′k. Applicando le(33) e (34) e la definizione di base duale, per cui ηj(eh) = δj

h, abbiamo

βijη

j(e′k) = βijη

j(αhkeh) = αh

kβijη

j(eh) = αhkβi

jδjh = αh

kβih = δi

k.

Poiche, d’altra parte, η′i(e′k) = δik ne segue che η′i e βi

jηj assumono gli stessi

valori sui vettori di una base di V , pertanto

η′i = βijη

j . (35)

La (35) rappresenta la formula di cambiamento di base per la base duale30.Si osservi che la matrice che permette di passare dalla base {η1, . . . , ηn} allabase {η′1, . . . , η′n} e l’inversa31 di quella che occorre per passare dalla base{e1, . . . , en} alla base {e′1, . . . , e′n}.

Dalla (35) seguono poi le relazioni per il cabiamento di base nell’ordineinverso

ηj = αji η′i. (36)

Si calcolano, poi, le relazioni per i cambiamenti di coordinate; se un covettore erappresentato in due basi diverse da σ = siη

i = s′jη′j abbiamo

si = βji s′j s′j = αi

jsi (37)

I covettori si dicono covarianti, perche le loro coordinate variano, al cambiaredella base di V , e conseguentemente al cambiare della base duale, con la matricedi cambiamento di base di V ; mentre i vettori si dicono controvarianti, perchele loro coordinate variano, al cambiare di base, con la matrice inversa rispettoa quella del cambiamento di base, come mostrato in (31).

Si scriva un tensore T covariante di ordine r come combinazione lineare deivettori della base {ηj1 ⊗ . . .⊗ ηjr} di T r

0

T = tj1...jrηj1 ⊗ . . .⊗ ηjr (38)

30Si noti come nelle sostituzioni effettuate per dimostrare la formula (35), talvolta, abbiamodovuto cambiare il nome degli indici al fine di evitare ripetizioni indesiderate.

31esattamente l’inversa se si conviene di rappresentare la base duale come un vettore colonna,e leggere la (35) come un prodotto fra matrici (che e la scelta preferibile), e la traspostadell’inversa se si conviene di rappresentare la base duale come un vettore riga.

60

Page 61: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

e come combinazione de vettori della base {η′i1 ⊗ . . .⊗ η′ir}

T = t′i1...irη′i1 ⊗ . . .⊗ η′ir . (39)

Sostituendo la (35) nella (39) abbiamo

T = t′i1...ir(βi1

j1ηj1)⊗ . . .⊗ (βir

jr)ηjr = t′i1...ir

βi1j1

. . . βirjr

ηj1 ⊗ . . .⊗ ηjr (40)

e confrontando questa con la (38) otteniamo che le coordinate dei tensori co-varianti di ordine r variano al cambiare della base di V (e conseguentemete alcambiare della base di V ∗) in un verso secondo la formula

tj1...jr= βi1

j1. . . βir

jrt′i1...ir

(41)

e nell’altro secondo la formula

t′i1...ir= αj1

i1. . . αjr

irtj1...jr

(42)

In modo analogo se si scrive un tensore controvariante T di ordine s comecombinazione lineare dei vettori delle basi {ej1 ⊗ . . . ⊗ ejs

} e {e′i1 ⊗ . . . ⊗ e′is}

di T 0s :

T = tj1...jsej1 ⊗ . . .⊗ ejs= t′i1...ise′i1 ⊗ . . .⊗ e′is

,

otteniamo le formule di cambiamento delle coordinate di un tensore controva-riante

tj1...js = αj1i1

. . . αjs

ist′i1...is t′i1...is = βi1

j1. . . βis

jstj1...js (43)

Infine un tensore T r-volte covariante e s-volte controvariante si rappresentarispetto la base {ηj1 ⊗ . . .⊗ ηjr ⊗ ek1 ⊗ . . .⊗ eks

} di T rs

T = tk1...ksj1...jr

ηj1 ⊗ . . .⊗ ηjr ⊗ ek1 ⊗ . . .⊗ eks

e rispetto la base {η′i1 ⊗ . . .⊗ η′ir ⊗ e′h1⊗ . . .⊗ e′hs

} di T rs

T = t′h1...hsi1...ir

η′i1 ⊗ . . .⊗ η′ir ⊗ e′h1⊗ . . .⊗ e′hs

da cui le formule di cambiamento di coordinate di un tensore misto di tipo (r, s),

tk1...ksj1...jr

= αk1i1

. . . αksis

βh1j1

. . . βhrjr

t′i1...is

h1...hr(44)

t′i1...is

h1...hr= βi1

k1. . . βis

ksαj1

h1. . . αjr

hrtk1...ksj1...jr

(45)

Si osservi come nelle coordinate (o componenti) di un tensore gli indici dicovarianza siano quelli in basso e gli indici di controvarianza siano quelli in alto.

61

Page 62: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

4.7 Collegamenti con il calcolo differenziale

In molte applicazioni le matrici che intervengono nel calcolo tensoriale sono lamatrice jacobiana e la sua inversa. Vediamo il perche.

La prima e immediata osservazione e che se

y = Ax

e un’applicazione lineare da Rn in se , allora A coincide con la matrice jacobianadi questa applicazione,

A =(

∂yi

∂xj

)1 ≤ i ≤ n1 ≤ j ≤ n

Possiamo applicare lo stesso concetto alla matrice cambiamento di coordinate(31), per cui, posto che v si scriva v = xiei nella base {e1, . . . , en} e v = x′je′jnella base {e′1, . . . , e′n}, abbiamo

x′j =∂x′j

∂xixi xi =

∂xi

∂x′jx′j (46)

Pertanto le matrici di cambiamento di coordinate utilizzate in tutte le for-mule sui tensori possono essere sostituite dalla matrice jacobiana e la sua inversa:

(αi

j

)1 ≤ i ≤ n1 ≤ j ≤ n

=(

∂xi

∂x′j

)1 ≤ i ≤ n1 ≤ j ≤ n(

βij

)1 ≤ i ≤ n1 ≤ j ≤ n

=(

∂x′i

∂xj

)1 ≤ i ≤ n1 ≤ j ≤ n

.

Le (46) hanno il vantaggio, rispetto alle (31), di evitare ogni possibile confu-sione fra la matrice cambiamento di coordinate e la sua inversa. Cosı la formulagenerale di cambiamento di base per i tensori si scrive senza possibilita di equi-voci

tk1...ksj1...jr

=∂xk1

∂x′i1. . .

∂xks

∂x′is

∂x′h1

∂xj1. . .

∂x′hr

∂xjrt′i1...is

h1...hr(47)

t′i1...is

h1...hr=

∂x′i1

∂xk1. . .

∂x′is

∂xks

∂xj1

∂x′h1. . .

∂xjr

∂x′hrtk1...ksj1...jr

(48)

Ma vi e una ragione piu profonda nel rappresentare con la jacobiana lamatrice cambiamento di coordinate.

Ad ogni vettore v = aiei dello spazio dei vettori applicati in un puntox0 ∈ Rn, si puo associare l’operatore differenziale ai ∂

∂xi , che ad ogni applicazionef ∈ C∞(U), dove U e un intorno di x0, associa la derivata direzionale32 (nella

32dovremmo scrivere ∂∂xi |x0

, ma in tutti gli operatori differenziali che seguiranno eviteremo

di mettere il simbolo di |x0 che significa calcolato in x0 perche non avremo ragione di cambiareil punto di applicazione dei vettori.

62

Page 63: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

direzione di v) di f in x0,n∑

i=1

ai ∂f

∂xi.

Adottata questa identificazione fra operatori e vettori applicati, i vettoridella base di V , {e1, . . . , en}, sono rappresentati dagli operatori differenziali{ ∂

∂x1 , . . . , ∂∂xn }.

Conveniamo che, nelle espressioni del tipo ∂∂xi o ∂xj

∂xi , gli indici delle variabiliche si trovano sotto la linea di frazione siano da considerarsi indici in basso. Laformula di cambiamento di base e data ora da

∂x′i=

∂xj

∂x′i∂

∂xj.

Anche i covettori hanno un’interessante lettura in termini di calcolo diffe-renziale.

Il differenziale di una funzione f ∈ C∞(U), nel punto x0 ∈ Rn, si indicacon df|x0 (ma noi scriveremo semplicemente df) ed e definito come il funzionalelineare che a ogni vettore v applicato in x0 ∈ Rn associa la derivata direzionaledi f rispetto a v in x0. Cioe se v = aiei = ai ∂

∂xi

(df)(v) = df(ai ∂

∂xi) = ai ∂f

∂xi

I differenziali delle funzioni coordinate, dxi, . . . , dxn, risultano essere i vettoridella base duale, perche

dxi(∂

∂xj) =

∂xi

∂xj= δi

j .

Le formula di cambiamento di base per la base duale risulta coincidere conla formula di differenziazione di funzione composta.

dx′j =∂x′j

∂xidxi.

4.8 Una definizione alternativa di tensore

Le formule di cambiamento di coordinate per i tensori (47), (48) sono spessoutilizzate per definire i tensori. In questo approccio la definizione di tensore eseguente33

Definizione 4.8 Si dice tensore (o campo tensoriale) di tipo (r,s) un oggettodefinito da un insieme di numeri tk1...ks

j1...jrin un sistema di coordinate arbitrarie

(x1, . . . , xn), la cui espressione numerica dipende dal sistema di coordinate se-condo la seguente relazione: se e xk = xk(x′1, . . . , x′n), x′j = x′j(x1, . . . , xn),con x′(x(x′)) = x′, vale la formula di trasformazione

33la definizione esposta e tratta da Novikov, Dubronik, Fomenko,Geometria contemporanea1, con qualche adattamento alle notazioni da noi usate.

63

Page 64: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

tk1...ksj1...jr

=∂xk1

∂x′i1. . .

∂xks

∂x′is

∂x′h1

∂xj1. . .

∂x′hr

∂xjrt′i1...is

h1...hr

in cui t′i1...is

h1...hre l’espressione numerica del tensore nelle coordinate (x′) e tk1...ks

j1...jr

l’espressione numerica del tensore nelle coordinate (x); tutti gli indici varianoda 1 a n , essendo n la dimensione dello spazio considerato.

4.8.1

La definizione di tensore data in funzione delle coordinate varia, nel suo signi-ficato, in funzione dei sistemi di coordinate ammessi. Se ad esempio siamo inuno spazio euclideo, (spazio vettoriale di dimensione finita dotato di prodottoscalare), e logico assumere solo riferimenti ortonormali. In questo caso le matricicambiamento di coordinate sono ortogonali e pertanto 34

∂xi

∂x′j=

∂x′j

∂xi(49)

Non vi e dunque modo di distinguere un vettore da un covettore basandosi sulcomportamento delle sue componenti al variare della base fra un insieme di basiortonormali. E per questo motivo che, talvolta, nell’algebra tensoriale in spazieuclidei non si fa differenza fra vettori e covettori, fra ordine di covarianza eordine di controvarianza.

Chiariamo questi concetti con un esempio. Supponete che abbiate descrittoun fenomeno fisico per mezzo di tre numeri (t(1), t(2), t(3)) che dipendono dalsistema di coordinate usato nello spazio, dove di proposito ho messo gli indici inlinea. Questa terna rappresenta un vettore, un covettore o altro? Metto l’indicein alto o in basso? Si ha la risposta guardando come cambiano questi numerial cambiare del riferimento. Se, in un altro riferimento, con la stessa origine, ilfenomeno e descritto da (t′(1), t′(2)′, t′(3)) e avete

t(i) =3∑

j=1

∂xi

∂x′jt′(j) (50)

e questo vale qualunque sia il secondo riferimento scelto, allora stabilite chesi tratta di un vettore controvariante e scrivete gli indici in alto. Se, in-vece, in un altro riferimento, con la stessa origine, il fenomeno e descritto da(t′(1), t′(2)′, t′(3)) e avete

t(i) =3∑

j=1

∂x′j

∂xit′(j) (51)

e questo vale qualunque sia il secondo riferimento scelto, allora stabilite che sitratta di un vettore covariante (o covettore) e scrivete gli indici in basso. Se,

34si noti come nella formula l’indice in alto a sinistra e uguale all’indice in basso a destra el’indice in basso a sinistra e uguale all’indice in alto a destra!

64

Page 65: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

infine, esiste un riferimento, per cui non vale (50) e un riferimento per cui nonvale (51) allora stabilite che si tratta di altro.

Ma e probabile che gli unici sistemi di riferimento rispetto ai quali possiate(o siate interessati) a descrivere il fenomeno, siano sistemi ortogonali, in tal caso,per la (49), non vi e differenza fra la (50) e la (51). In questo caso parlerete solodi vettore (ovvero tensore del primo ordine) senza distinguere tra covarianza econtrovarianza.

4.8.2

Notiamo come la definizione di tensore data tramite le coordinate, che utilizzala matrice jacobiana, si presta a essere estesa anche a cambiamenti di coordinatenon lineari, purche abbiano siano di classe almeno C1 e con matrice jacobiananon nulla. E il caso delle coordinate polari: se vogliamo esprimere in coordinatepolari un tensore sullo spazio vettoriale dei vettori applicati in un punto P delpiano diverso dall’origine, dovremo utilizzare, per passare dalla rappresentazionein coordinate cartesiane a quella in coodinate polari, la matrice jacobiana delleformule di cambiamento di coordinate (4).

La cosa assume particolare importanza quando si voglia fare del calcolo ten-soriale su superficie curve (e piu in genererale su varieta differenziali). In questocaso le funzioni di cambiamento di coordinate fra diversi sistemi di coordinatelocali sono generalmente non lineari.

Un approccio indipendente dalle coordinate per definire tensori su oggettigeometrici diversi da Rn, le varieta differenziali, comporta, in primo luogo lanecessita di definire lo spazio dei vettori tangenti in modo intrinseco, cioe senzaricorrere a un’immersione dell’oggetto in uno spazio euclideo. In tale contesto siutilizzano come definizione dei vettori applicati in un punto (i cosiddetti vettoritangenti) gli operatori differenziali, che soddisfano la regola di Leibnitz quandosono applicati a un prodotto di funzioni. La geometria differenziale si occupadello sviluppo di questi concetti.

4.8.3

Osserviamo come la definizione di differenziale di una funzione df = ∂f∂x1 dx1 +

. . . + ∂f∂xn dxn e la definizione di gradiente di una funzione, che comunemente

si trova sui testi di analisi, ∇f =(

∂f∂x1 , . . . , ∂f

∂xn

), corrispondano allo stesso

tensore letto nei due diversi approcci: applicazione lineare o insieme indiciatodi numeri. Del differenziale abbiamo gia detto; il gradiente, invece, e una n-pladi numeri che varia al cambiare delle coordinate secondo la regola

∂f

∂xi=

∂f

∂x′j∂x′j

∂xi

e che e dunque un covettore ai sensi dell’ultima definizione.Nel differenziale abbiamo l’espressione della decomposizione del covettore

nella base duale, mentre nel gradiente si rappresentano solo le componenti.

65

Page 66: 1 Numeri e spazi vettoriali complessi1 Numeri e spazi vettoriali complessi 1.1 Breve introduzione storica Si `e soliti introdurre i numeri complessi, partendo dal problema della risoluzione

In genere si richiede che il gradiente risulti un vettore controvariante e nonun vettore covariante; la cosa non presenta inconvenienti se si utilizzano esclu-sivamente riferimenti ortonormali, ma dobbiamo apportare una correzione alladefinizione di gradiente se vogliamo esprimerlo anche in altre ccordinate.

Indichiamo i titoli di quelli che potrebbero essere i successivi argomenti dialgebra tensoriale

4.9 L’isomorfismo canonico indotto dal prodotto scalarefra V e V ∗

4.10 La contrazione degli indici

4.11 Il prodotto esterno

4.12 Pullback dei tensori covarianti

66