108
Lezioni di Meccanica Analitica Nell’Intendimento e nella Speranza dell’Autore Brevemente ( 1 ) Illustrate Nella Imperitura Tradizione del Lagrange Ma non Dimenticando Alcuni Aspetti pi` u Moderni Della Disciplina Forse pi` u Geometrizzabile Della Matematica Tutta Alfredo Marzocchi ( 2 ) Versione 2.1, febbraio 2012 ( 1 ) Sempre a Parte le Note a Pi` e di Pagina ( 2 ) Universit` a Cattolica del S. Cuore, Dipartimento di Matematica e Fisica, Via dei Musei, 41 - 25121 Brescia (Italia)

Lezioni di Meccanica Analitica - dmf.unicatt.itdmf.unicatt.it/~musesti/MA/MA2011-2012.pdf · Lezioni di Meccanica Analitica Nell’Intendimento e nella Speranza dell’Autore Brevemente

Embed Size (px)

Citation preview

Lezionidi

Meccanica AnaliticaNell’Intendimento e nella Speranza dell’Autore

Brevemente (1) IllustrateNella Imperitura Tradizione del Lagrange

Ma non Dimenticando Alcuni Aspetti piu ModerniDella Disciplina Forse piu Geometrizzabile

Della Matematica Tutta

Alfredo Marzocchi (2)

Versione 2.1, febbraio 2012

(1) Sempre a Parte le Note a Pie di Pagina(2) Universita Cattolica del S. Cuore, Dipartimento di Matematica e Fisica, Via dei Musei, 41 - 25121

Brescia (Italia)

2

Indice

1. Meccanica lagrangiana 31.1. Sistemi meccanici olonomi 31.2. Sistemi meccanici olonomi, versione geometrica 81.3. Velocita e vettori tangenti 151.4. Vincoli di velocita e sistemi integrabili 201.5. Forze e accelerazioni 261.6. Equazioni di Lagrange, seconda forma 291.7. Fibrato tangente 321.8. Energia cinetica di un sistema olonomo 371.9. Equazioni di Lagrange, forma finale 441.10. Integrali primi 491.11. Il principio di minima azione 521.12. Covettori e spazio cotangente 591.13. Varieta riemanniane ed energia cinetica 622. Meccanica hamiltoniana 682.1. La funzione e le equazioni di Hamilton 682.2. Trasformazione di Legendre e spazio degli stati 702.3. Intermezzo: sistemi dinamici 722.4. Stabilita dell’equilibrio 782.5. I teoremi di Ljapunov sulla stabilita 872.6. Stabilita nei sistemi olonomi 892.7. Conservazione dell’energia 902.8. Il principio dell’azione hamiltoniana 912.9. Trasformazioni canoniche, prima parte 932.10. Metodo di Hamilton-Jacobi 982.11. Parentesi di Poisson 1002.12. Invariante integrale di Poincare 1022.13. Sistemi simplettici e parentesi di Lagrange 105

3

1. Meccanica lagrangiana

1.1. Sistemi meccanici olonomi

Lo studio di tutti i sistemi meccanici vincolati e un’impresa pressoche ciclopica. Nonavete idea di quali e quante insidie si possano annidare dietro l’apparente innocua defini-zione, che abbiamo comunque visto non essere proprio banale, di sistema meccanico di Npunti vincolati fra loro in vario modo.

D’altro canto, limitarsi ai soli punti liberi e ai sistemi rigidi sarebbe deludente, dato checi siamo dati tanto da fare per enunciare nel modo piu completo le leggi della Meccanicadei Sistemi, e del resto chi abbia mai aperto (o visto l’interno di) un orologio meccanico sache legare assieme punti e corpi rigidi e una delle cose piu affascinanti dell’agire umano.

Occorre quindi cercare una classe di sistemi che siano al tempo stesso sufficientementegenerali da coprire le piu normali esigenze delle applicazioni e che permettano uno studiomatematico fecondo.

Fortunatamente una simile classe esiste, ed e quella dei cosiddetti sistemi olonomi. Par-lando in modo approssimativo ma (spero) efficace, si tratta di sistemi che possono es-sere esaurientemente descritti da un numero finito di “coordinate” (dette coordinate la-grangiane), che pero sono in generale diverse dalle coordinate cartesiane dei punti delsistema.

Definizione 1.1 (Vaga). Un sistema meccanico di N punti si dice olonomo se i vettoriposizione di ogni punto del sistema dipendono da n coordinate indipendenti q1, . . . , qn e daltempo.

Perche questa definizione e un po’ vaga lo vedremo fra poco. Si intuisce per esempioche, specie dal versante matematico, quell’“indipendenti” non e chiaro cosa voglia dire(o meglio, come si possa realizzare). Ma su questo torneremo. Vediamo prima qualcheesempio, che aiuta a chiarire quello che vogliamo dire.

Se abbiamo N punti liberi nello spazio, potremmo scegliere di descrivere la loro posizionecon le coordinate cartesiane (xs, ys, zs) di ciascuno di essi, per cui

xs = xse1 + yse2 + zse3 (s = 1, . . . , N)

oppure con le coordinate sferiche, oppure un po’ delle une (per alcuni punti) e un po’ dellealtre, e cosı via. L’unico fatto chiaro e che ogni punto, potendosene andare per conto suo,ha bisogno di tre coordinate. Dunque in tutto servono 3N coordinate, non importa se sianocartesiane, cilindriche, o sferiche.

Se i punti sono vincolati con un vincolo di posizione, sappiamo che non possono assu-mere tutte le reciproche posizioni. Per esempio, due punti su una superficie non possonomuoversi ovunque nello spazio. Se la superficie e una sfera, tanto per immaginare qualcosadi semplice, avremo che potremo descrivere la posizione dei due punti con le rispettivecolatitudini e longitudini ϑ1, ϕ1, ϑ2, ϕ2.

Per il resto, i due punti sono liberi di muoversi, per cui non possiamo dare altre restrizioniai parametri ϑ1, ϕ1, ϑ2, ϕ2. Potremmo in questo caso dire che i punti hanno le coordinatecartesiane (x1, y1, z1) e (x2, y2, z2) ma che, se l’origine delle coordinate e messo come alsolito, esse soggiaciono alle condizioni

x21 + y2

1 + z21 = R2 e x2

2 + y22 + z2

2 = R2.

4

Figura 1. Due punti su una sfera.

Vediamo allora che un certo conto torna: le coordinate sono 6, pero ci sono due relazioni,dunque quattro coordinate “indipendenti”. Poi sappiamo che possiamo usare anche lecoordinate cilindriche ϑ1, z1, ϑ2, z2. Pero sempre quattro coordinate.

Quali che siano pero le coordinate scelte, troveremo sempre un modo, piu o menocomplicato, di esprimere le posizioni dei due punti in termini di quelle coordinate: peresempio

x1 = R senϑ1 senϕ1e1 +R senϑ1 cosϕ1e2 +R cosϑ1e3

x2 = R senϑ2 senϕ2e1 +R senϑ2 cosϕ2e2 +R cosϑ2e3

oppure

x1 =√R2 − z2

1 cosϑ1e1 +√R2 − z2

1 senϑ1e2 + z1e3

x2 =√R2 − z2

2 cosϑ2e1 +√R2 − z2

2 senϑ2e2 + z2e3,

e cosı via.Se invece prescriviamo ulteriori vincoli, la situazione puo cambiare, anche dal punto di

vista della convenienza di queste o quelle coordinate. Se, per esempio, richiediamo che idue punti sulla sfera stiano a distanza fissa 2l (l < R), allora ci accorgiamo che il puntomedio del segmento congiungente i due punti si trova su una sfera di raggio

√R2 − l2, per

cui conviene individuare con due coordinate tipo colatitudine e longitudine questo puntomedio e con un ulteriore angolo la posizione di questo segmento rispetto a una direzionefissata nel piano della congiungente, come mostra la fig. 2.

In ogni caso, stavolta le coordinate sono tre, e guarda caso abbiamo aggiunto la relazione

(x1 − x2)2 + (y1 − y2)2 + (z1 − z2)2 = 4l2.

Capitera poi che se vincoliamo uno dei due punti, per esempio all’equatore della sfera, al-lora basteranno solo due parametri, (avremo aggiunto la condizione z1 = 0—se vincoliamoil primo punto), che saranno, per esempio, la longitudine di questo punto e l’angolo di rota-zione del segmento congiungente. Se poi fissiamo l’altro punto al meridiano di Greenwich,

5

Figura 2. Due punti su una sfera a distanza fissata.

per far contenti gli Inglesi, allora bastera un solo angolo per individuare i due punti (1),e infatti avremo aggiunto la condizione y2 = 0, e cosı via. Appare anche chiaro che lesuccessive restrizioni devono essere efficaci, altrimenti non restringono nulla (o troppo): seper esempio avessi richiesto che il punto medio dell’asta stia a distanza

√R2 − l2 dal centro

della sfera nona avrei aggiunto nulla a quello che gia sappiamo (e se la distanza di questopunto dal centro fosse stata diversa, allora sarebbe stato impossibile collocare il sistema).

Figura 3. Due punti che scorrono su un meridiano e sull’equatore di una sfera.

In tutti i casi, ci par vero che se a un sistema meccanico di N punti aggiungiamo mvincoli di posizione indipendenti, allora le posizioni dei punti si possono descrivere con3N −m coordinate indipendenti.

Vediamo ora di specificare meglio quanto abbiamo detto negli esempi. Richiamiamoprima una definizione di Analisi.

(1) In questo caso il punto medio del segmento congiungente i due punti dovra stare su una curva chesi potra individuare con un angolo, vedi fig. 3.

6

Definizione 1.2. Una sottovarieta (senza bordo) di classe Ck in uno spazio normato Xdi dimensione e un sottoinsieme di X tale che per ogni x ∈M esistono un intorno apertoU di x in X, un m > 0 e un’applicazione g : U → Rm di classe Ck tali che

(a) M ∩ U = {ξ ∈ U : g(ξ) = 0};(b) per ogni x ∈M ∩ U l’applicazione lineare dg : X → Rm sia suriettiva.

Cominciamo a capire dove vogliamo arrivare: X e destinato a diventare (E3)N , e la (a)non dice altro che le posizioni dei punti che ci interessano saranno ristrette da m condizioniche si scrivono nella forma g(ξ) = 0.

Non e forse chiaro il motivo della condizione (b), che evidentemente deve essere legatoall’indipendenza. Vediamo perche.

Supponiamo di avere assegnato m − 1 condizioni del tipo gj(ξ) = gj(x1, . . . , x3N) = 0con m 6 3N e che la m-esima sia una funzione delle precedenti, scelta in modo che siaautomaticamente verificata. Avremo quindi

gm(ξ) = f(g1(ξ), . . . , gm−1(ξ))

con f : Rm → R di classe Ck tale che f(0) = 0 (cosı e automaticamente verificata).Derivando la relazione appena scritta, troviamo per ogni k = 1, . . . , 3N ,

∂gm∂ξk

(ξ) =m−1∑j=1

∂f

∂ξj(g1(ξ), . . . , gm−1(ξ))

∂gj∂ξk

(ξ)

e quindi nello jacobiano

∂g1

∂ξ1

. . .∂g1

∂ξ3N

. . .∂gm−1

∂ξ1

. . .∂gm−1

∂ξ3N∂gm∂ξ1

. . .∂gm∂ξ3N

si ha che, punto per punto, i termini della m-esima riga sono combinazioni lineari deitermini delle prime m− 1 righe, e quindi la matrice non ha rango pieno, il che equivale adire che il differenziale dg non e suriettivo.

Chiedere la suriettivita del differenziale, quindi, implica l’indipendenza funzionale dellerelazioni (vincoli di posizione) imposte.

Richiamiamo ora, sempre dal Corso di Analisi, il seguente

Teorema 1.3. Un sottoinsieme M di uno spazio metrico X di dimensione finita e unasottovarieta di classe Ck se e solo se per ogni x ∈ M esistono un intorno aperto U dix in X, n > 0, un aperto Q in Rn e un’applicazione ϕ : Q → X di classe Ck tale cheϕ(Q) = M ∩U , ϕ : Q→M ∩U e un omeomorfismo e per ogni q = (q1, . . . , qn) ∈ Q, dϕ(q)e iniettivo.

Il significato del teorema e che per ogni punto della sottovarieta esiste un intorno del pun-to che e descrivibile con “coordinate locali” in numero di n, e che queste sono indipendenti(cio e sancito dall’iniettivita di dϕ).

I sistemi olonomi sono proprio questi. Le posizioni di tutti gli N punti del sistemasi possono descrivere mediante un numero finito n 6 3N di coordinate indipendenti che

7

e assolutamente tradizionale indicare con q1, . . . , qn, ed eventualmente dal tempo (2). Ilnumero n, inoltre, sembra lo stesso per tutte le possibili scelte delle coordinate. In simboli,

(1.1) xs = cs(q1, . . . , qn, t) (s = 1, . . . , N).

(Con la simbologia di prima, nel caso di indipendenza dal tempo,

ϕ(q) = (c1(q1, . . . , qn), . . . , cN(q1, . . . , qn)).)

Non ci vuole molto a complicare questo quadro: se, nei nostri esempi, si fosse volutoimpedire ai punti di oltrepassare l’equatore della sfera, confinandoli cosı alla semisferainferiore, si sarebbero aggiunti dei vincoli di posizione diversi dalla forma gj(ξ) = 0, ma,per esempio, della forma gj(ξ) 6 0 (ossia dei vincoli unilateri, come si diceva in MeccanicaRazionale). In questo caso l’“oggetto” matematico uscente sarebbe stato una “sottovarietacon bordo” ed avrebbe comportato numerosi problemi, che preferiamo evitarci: bastasapere che esistono.

Dalla definizione di sottovarieta, inoltre, non discende che n sia lo stesso per tutti ipunti, e difatti in generale non e cosı. Non ci vuol molto a trovare un sistema meccanicoche abbia degli n diversi da punto a punto, ma, sempre per non complicare troppo la vita,ci limiteremo a considerare sottovarieta per le quali n e indipendente dal punto. Questonumero e allora detto dimensione della sottovarieta, o, nel nostro caso, numero dei gradidi liberta del sistema.

Definizione 1.4. Diremo sistema meccanico olonomo (o piu brevemente, sistema olonomo)un sistema che ammette una descrizione come una sottovarieta in E3N di classe C∞ (3)

E facile immaginarsi un sistema meccanico che non si puo descrivere con un numerofinito di gradi di liberta: un esempio e una corda. Anche nel suo movimento piu sempli-ce, illustrato nella fig. 4, ogni punto della corda si puo spostare perpendicolarmente allacongiungente i suoi estremi con un’ordinata diversa per ogni ascissa, purche la funzionex 7→ u(t, x) sia continua.

Figura 4. Una corda vibrante.

(L’immagine della funzione x 7→ u(t, x) e la “forma” della corda all’istante t.) L’idea quie abbastanza banale: trattandosi di un sistema continuo, formato pertanto da un numeroinfinito di punti, si puo intuire che questo tipo di comportamento sia la norma, anche se

(2) Questo caso corrisponde ai vincoli esterni mobili, per esempio quello visto con i due punti vincolatialla sfera quando, per esempio, il raggio della sfera vari nel tempo in modo conosciuto. Basta in questoesempio sostituire R(t) ad R. Su questi sistemi torneremo in seguito

(3) Questo requisito e talora sovrabbondante: in pratica basta Ck con k > 2, ma ho richiesto C∞ persottolineare che la regolarita non interessa, dato che i casi che abbiamo in mente sono sempre C∞. Qualoracio dovesse cadere, sappiate che tutti i risultati che andremo ad enunciare si estendono anche a Ck, k > 2.

8

esistono sistemi continui—non solo quelli rigidi—descritti da un numero finito di gradi diliberta.

Dunque nessun sistema continuo ammette un numero finito di gradi di liberta? None vero: una importante eccezione e quella dei corpi rigidi. Benche essi siano formatida infiniti punti, questi punti sono tutti individuabili a partire da una rotazione e da unatraslazione, che portano il riferimento fisso in uno solidale con il corpo rigido. Sappiamo chepoi, in qualche modo dipendente dalla forma del corpo, tutti i punti sono “rintracciabili”.Siccome una rotazione e una traslazione sono individuate da sei (3 + 3) parametri, ilcorpo rigido libero ha sei gradi di liberta. Siccome poi sappiamo che, dal punto di vistadella dinamica, tutta l’informazione e contenuta nella trasformazione d’inerzia, potremmoaddirittura pensare di sostituire ad ogni corpo rigido un sistema finito di punti che abbiala stessa trasformazione d’inerzia e lavorare solo con quelli (4).

Esistono pero anche dei sistemi finiti di punti che non si possono descrivere con dellecoordinate lagrangiane: avremo modo di vederne alcuni fra poco.

Se poi abbiamo una funzione t 7→ (q1(t), . . . , qn(t)), di classe C2, essa si dira motopossibile del sistema. Chiaramente, la legge

t 7→ (x1(q1(t), . . . , qn(t), t), . . . ,xN(q1(t), . . . , qn(t), t))

dara la legge oraria di tutti i punti del sistema.Cosa succede se siamo in presenza di vincoli mobili? Possiamo ricondurci al caso prece-

dente supponendo che anche il tempo sia un grado di liberta. In altre parole, immaginiamoche lo “stato” del sistema sia dato da una n+ 1-upla (q1, . . . , qn, t) e che la legge oraria siaespressa nella forma

s 7→ (x1(q1(s), . . . , qn(s), t(s)), . . . ,xN(q1(s), . . . , qn(s), t(s)))

richiedendo che s 7→ t(s) sia invertibile, cosicche si puo sempre, se lo si desidera, esprimeres in funzione di t e le posizioni dei punti in funzione di t. In questo modo ci si riconducead una sottovarieta di E3N di dimensione n+ 1.

1.2. Sistemi meccanici olonomi, versione geometrica

Prima di procedere con la definizione formale, un piccolo avvertimento: sembra com-plicata. E un po’ lo e. Il guaio nasce da questo: dato un sistema olonomo, non c’e ingenerale un sistema di coordinate che lo descrive. Cercheremo di spiegare con calma tuttoquanto dopo la definizione. Per semplificarci la vita, non considereremo il caso in cui leposizioni dei punti materiali dipendano esplicitamente dal tempo, ossia ci liberiamo deivincoli esterni mobili.

Premettiamo alcune semplici notazioni. Se abbiamo un sistema meccanico di N punti, leloro posizioni si troveranno nello spazio E3. Dunque il complesso degli N vettori posizione

(4) Un modo carino di farlo e considerare sei masse disposte ai vertici di un ottaedro regolare di lato 1,uguali se stanno su vertici opposti. Sapreste trovare il numero minimo di punti necessari?

9

(x1, . . . ,xN) apparterra allo spazio E3 × . . .× E3︸ ︷︷ ︸N volte

, che indicheremo con (E3)N . Indichere-

mo anche con c una configurazione del sistema, ossia un complesso di vettori posizione(x1, . . . ,xN) ∈ (E3)N .

Definizione 1.5. Un sistema meccanico di N punti, vincolato con vincoli esterni fissi, sidice olonomo a n gradi di liberta se esiste n ∈ N, n > 1 tale che per ogni configurazione cdel sistema esistano un aperto V di Rn e un’applicazione C : V → (E3)N con le seguentiproprieta:

(1) c ∈ C(V );(2) se c appartiene a C1(V1)∩C2(V2), allora la funzione C−1

2 ◦C1 : Rn → Rn e di classeC∞ e invertibile con inversa di classe C∞.

L’idea e semplice, a prima vista: ogni configurazione si puo “individuare” con n “coor-dinate”, e questo numero non cambia da un punto ad un altro: la funzione C e quella chepermette di calcolare le posizioni dei punti una volta note le “coordinate”.

Ad un esame piu attento, pero, si nota qualche cosa in piu. Primo, che c debba starenell’immagine di C e ovvio; ma cosa significa la condizione (2)? Significa questo: se unadata configurazione e descrivibile in due modi diversi con delle “coordinate”, allora lafunzione che fa passare dalle une alle altre (che e C−1

2 ◦ C1), deve essere di classe C∞ einvertibile con inversa pure di classe C∞ (5).

Vediamo di capirci qualcosa di piu con un esempio semplice: il pendolo semplice (dunqueN = 1).

Noi sappiamo individuare il posizionamento del punto del pendolo semplice in vari modi:usando le coordinate cartesiane abbiamo

x = xe1 + (R−√R2 − x2)e2 (6).

Naturalmente vediamo subito che con questa formula non possiamo coprire il semicerchiosuperiore, per il quale dobbiamo invece usare quest’altra:

x = xe1 + (R +√R2 − x2)e2.

La posizione del punto nel piano e data ovviamente da x1e1 +x2e2, e dunque, perlomenoper il semicerchio inferiore, abbiamo le due funzioni

C1 :

{x1 = C11(x) = x

x2 = C12(x) = R−√R2 − x2

Questa e un esempio di funzione C della definizione. Se vogliamo legarla ad un aperto,possiamo scegliere l’intorno ] − R,R[: in questo modo lasceremo fuori le posizioni A e B,ma vedremo di recuperarle dopo.

Supponiamo ora di prendere come coordinata la y, e di limitarci al semicerchio di destra.Allora avremo

x =√R2 − (R− y)2e1 + ye2 =

√2Ry − y2e1 + ye2

(5) E quello che altre volte, in Meccanica Razionale, abbiamo chiamato un diffeomorfismo di classe C∞.

(6) Dovete naturalmente vedere questo punto in E3 con x3 = 0. Nel seguito non scriveremo nemmenoC13, ecc., per non appesantire il tutto.

10

x

yy

R

-R R

R-y #

A B

O

C

Figura 5. Il pendolo semplice e un sistema olonomo.

oppure

C2 :

{x1 = C21(y) =

√2Ry − y2

x2 = C22(y) = y

che e pure definita in ] − R,R[. Vogliamo ora verificare che l’applicazione C−12 ◦ C1 e un

diffeomorfismo di classe C∞ (o, piu brevemente, C∞). Essa associa x a y, e vediamo dovee definita. Siccome C1 copre il semicerchio aperto inferiore e C2 quello aperto di destra,la composizione e definita sul quarto di cerchio OB, ossia da ]0, R[ in se ed e data dallafunzione

C−12 ◦ C1 : x 7→ R−

√R2 − x2.(7)

Questa funzione, essendo definita su ]0, R[ (aperto), e di classe C∞ e invertibile e quinditutto fila liscio.

Si capisce che, a furia di prendere termini col segno piu o col segno meno e di passaredalle ascisse alle ordinate si riesce a ricoprire tutto il cerchio. E una noia, ma non va fattoogni volta: basta sapere che si puo. Per esempio, i punti A e B non si riescono a descriverecon la coordinata x cosı come l’abbiamo messa noi, pero con la y sı, e anche, ovviamente,con una proiezione su una qualsiasi retta non orizzontale.

Qualcuno potrebbe domandarsi: ma non era piu semplice usare l’angolo ϑ? In fin deiconti esso copre tutta la circonferenza ed e un unico parametro. Perche non l’abbiamousato? L’angolo e certamente una scelta molto suggestiva, pero non e esente da difetti. Il

(7) Come ho fatto? Metodo noioso: C1 associa ad x la coppia (x,R−√R2 − x2). Per trovare C−12 devo

allora invertire il sistema {C21(y) = x

C22(y) = R−√R2 − x2

e, siccome C22(y) = y, la seconda equazione mi da la funzione composta. Naturalmente anche la prima

lo faceva, perche se inverto√

2Ry − y2 = x trovo la stessa espressione (nell’intervallo in esame). Metodosemplice: osservare che tra x e y sussiste la relazione x2 + (R − y)2 = R2, che e poi l’equazione dellacirconferenza di centro (0, R) e raggio R. A questo punto C−12 ◦C1 non e altro che la y ricavata in funzionedi x.

11

x

y

R

Figura 6. La relazione x 7→ R−√R2 − x2.

primo e che se ricordiamo la definizione “pignola” di ϑ(x, y) delle dispense di MeccanicaRazionale, ci verra in mente che essa ha dei guai quando ϑ = π/2, per via dell’arcotangente,ecc.. Il secondo e che per coprire tutta la circonferenza serve un intervallo non aperto, qualeper esempio [0, 2π[. Se si vuole coprire tutta la circonferenza con degli aperti, servonoalmeno due angoli, quali ad esempio ϑ e η = π − ϑ, entrambi definiti, per esempio, su]− π, π[. In questo modo alla prima rappresentazione manca il polo nord N e alla secondail polo sud O. Laddove invece entrambe le rappresentazioni sono possibili, il cambio dicoordinate e appunto ϑ = π − η, che e certamente di classe C∞.

Qualcuno ancora piu testardo potrebbe insistere: ma perche questi V devono essereproprio aperti? Perche in seguito avremo bisogno di definire un moto su V . E evidente chese le coordinate lagrangiane qi variano nel tempo, avremo in corrispondenza un movimentodel sistema e viceversa. Se il moto e definito su un insieme chiuso, potremmo aver problemicon le derivate. All’estremo, pensiamo al caso in cui V1 ∩ V2 sia ridotto ad un punto:potremmo parlare di cambio di coordinate C∞ definito su un punto?

La morale e dunque questa, un po’ ipocrita, se volete: ci basta sapere che le carte sianoin regola (8), poi possiamo descrivere un moto come vogliamo: quando una coordinata e“prossima alla fine”, saltiamo su un’altra tramite il cambio di coordinate e proseguiamo conla coordinata nuova. La definizione con gli aperti ci dice appunto che possiamo farlo (9).

Un’ultima osservazione sul pendolo semplice. Avremmo potuto anche dire cosı: le coor-dinate del punto P sono x e y, ma non sono indipendenti: fra esse sussiste la relazionex2 + y2 − 2Ry = 0, e le varie “carte” non sono altro che modi di raffigurare dei pezzidella circonferenza. Si vede cosı che l’ambientazione in E2 viene “ridotta” a un insieme piupiccolo, la circonferenza, che e piu identificabile ma meno rappresentabile (globalmente).

(8) Nel vero senso della parola, visto che le applicazioni CU si chiamano “carte” o “carte locali”...(9) Tra l’altro, ci accorgiamo che quando abbiamo considerato il pendolo semplice, abbiamo barato

perche abbiamo permesso che nel caso del moto rivolutivo l’angolo ϑ andasse oltre 2π. In realta, nonappena ϑ fosse stato diverso da zero, avremmo dovuto scrivere anche l’equazione per η, fargli magariil suo bravo problema di Weierstrass, passare a η al momento giusto, oppure, peggio ancora, inventareuna qualche relazione di equivalenza e passare al quoziente: improponibile. In certi casi conviene essereimprecisi.

12

##

O

C

P

QM

Figura 7. Un pendolo olonomo.

Torniamo alla definizione. A rigore non era necessario supporre che n fosse uguale pertutti i punti: infatti se si avessero due n diversi su due aperti V1, V2 con V1 ∩ V2 6= ∅, peril fatto che il cambio di coordinate e biunivoco e differenziabile, il teorema di inversionelocale (che, detto per inciso, e un risultato importantissimo per i nostri problemi) ci diceche i due n devono coincidere.

Ma che dire se i punti sono due (cioe N = 2)? Per esempio, se il punto fosse sostituitoda due punti sulla circonferenza situati a distanza 2l < 2R uno dall’altro, un po’ comeabbiamo fatto per la sfera, avremmo avuto bisogno di un’altra coordinata, di un altroangolo? No, perche noto l’angolo ϑ, i vettori posizione di P e Q sono facilmente ricavabilida quello di M , il punto medio del segmento PQ, come mostra la figura 7:

Infatti, laddove ϑ funziona (10),

x(M) =√R2 − l2 senϑe1 +

√R2 − l2(1− cosϑ)e2

e quindi

x(P ) = (√R2 − l2 senϑ− l cosϑ)e1 + [

√R2 − l2(1− cosϑ)− l senϑ]e2

x(Q) = (√R2 − l2 senϑ+ l cosϑ)e1 + [

√R2 − l2(1− cosϑ) + l senϑ]e2.

In ogni caso, quindi, come vedete, con una sola coordinata si riesce a definire la posizionedei due punti, e anche di tutti quelli del segmento PQ, volendo. Quindi questo resta unsistema olonomo a un grado di liberta.

Vediamo un po’ piu da vicino l’insieme di tutte le configurazioni di un sistema olonomo.Poniamo

M = {c ∈ (E3)N : c e una configurazione del sistema}.Vediamo cosa possiamo dire sull’insieme M . Innanzitutto, che e uno spazio topologico:

infatti, le varie configurazioni appartengono alle controimmagini delle varie funzioni C, e

(10) Naturalmente potevamo usare la x di M , visto che M sta sulla circonferenza di raggio√R2 − l2,

oppure quella di P , col solo risultato di complicare le formule, ma la sostanza non sarebbe cambiata:sempre un parametro.

13

quindi sono degli aperti perche controimmagini di aperti di Rn tramite funzioni continue;questi aperti sono semplici aperti di R3N (11).

Consideriamo ora l’insieme di tutti gli intorni V della definizione e di tutte le funzioniC ad essi associati. Poniamo anche Uα = Cα(Vα), dove α e un indice. Questi Uα sonodegli intorni dei corrispondenti c. Per ragioni che appariranno chiare fra poco, al postodelle funzioni Cα, che associano ai V gli U , conviene considerare le loro inverse ϕα = C−1

α .Poniamo quindi

A = {(Uα, ϕα)}α∈I (

12).

L’insieme A e un insieme importante perche “descrive” M in questo senso: dato unc ∈M , c’e un Uα contenente c. Infatti, per la (1) della definizione 1.5, abbiamo che esisteα ∈ I tale che c ∈ Cα(Vα) = Uα, quindi

M ⊆⋃α∈I

Uα =⋃α∈I

Cα(Vα) =⋃α∈I

ϕ−1α (Vα).

Resta solo da “tradurre” la condizione (2) della definizione fondamentale 1.5. Se ci pensateun momento, essa si scrive

(2’) Se c ∈ Uα ∩ Uβ, allora ϕα ◦ ϕ−1β : Rn → Rn e un diffeomorfismo C∞.

Infine, essendo il nostro A l’insieme di tutte le coppie (Uα, ϕα), esso e sicuramente mas-simale, nel senso che se (Uα, ϕα) sono coppie intorno-funzione come si e detto, allora(Uα, ϕα) ∈ A.

Le proprieta che ci siamo sforzati di ricavare per il nostro insieme M non sono puroesercizio mentale: esse corrispondono ad una fondamentale definizione della Geometriamoderna, la definizione di varieta differenziabile. Eccola:

Definizione 1.6. Uno spazio topologico di Hausdorff M si dice varieta differenziabile, seesiste una famiglia A = {Uα, ϕα}α∈I con le seguenti proprieta:

(1) Per ogni α ∈ I, ϕα : M → Vα ⊆ Rn e una applicazione biunivoca;(2) Per ogni α, β ∈ I, allora ϕα◦ϕ−1

β : Rn → Rn e un’applicazione di classe C∞ laddovee definita;

(3) M =⋃α∈I Uα.

(4) Se (Uα, ϕα) verifica la (2), allora (Uα, ϕα) ∈ A.

Come vedete, se confrontate questa definizione con la nostra originale di M, le ϕα sono lenostre carte ma viaggiano “al contrario”, ossia dalla varieta a Rn, e non da Rn alla varieta,perche a noi fanno piu comodo delle funzioni che ci danno le configurazioni. Dunqueconcludiamo che l’insieme delle configurazioni di un sistema olonomo ha una struttura divarieta differenziabile. Sul numero n valgono le considerazioni dette sopra, ed essendo

(11) Questo spazio topologico e anche di Hausdorff, il che significa che configurazioni diverse ammettonointorni disgiunti. Siano infatti c1, c2 due diverse configurazioni. Siccome sono elementi di (E3)N , essiammettono senz’altro due sfere aperte disgiunte, che sono gli intorni cercati. Fra un attimo sara chiaro ilperche di questa curiosa digressione.

(12) Che vuol dire {. . .}α∈I? Niente: solo una funzione da I a valori in {. . .}, che invece di U(α) siscrive Uα. Praticamente serve a questo: a dare una notazione simile a quella con l’indice naturale xn, ecc.quando non e detto che n stia in un insieme numerabile.

14

'

'

' '

®

®

®

®

¯

¯

¯

¯

V

U

V

U

-1

M

R

R

n

n

Figura 8. Definizione di varieta.

“proprio” della varieta si chiama dimensione della varieta. La famiglia A = {Uα, ϕα}α∈I sichiama atlante sulla varieta (13).

Esempi di varieta ce ne sono molti. Di semplici, purtroppo pochi. Facciamo bastarequelli che abbiamo.

Prima di tutto, una linea regolare nello spazio e una varieta di dimensione uno. Sonocarte le sue parametrizzazioni (grazie alla biunivocita non stiamo a sottilizzare se vanno inun senso o in un altro). Una superficie regolare nello spazio e una varieta di dimensionedue. Le coordinate curvilinee definite sulla superficie sono carte locali. Pensate che laterrificante “superficie regolare” della figura 22 della prima parte e una varieta, e purepiuttosto semplice. Esempi “umani” di superfici sono la sfera, il toro, il cilindro (14).

Per trovare una varieta di dimensione tre, possiamo pensare allo spazio E3, o a un suo

(13) Questo nome deriva, ovviamente, da quello che riguarda il mappamondo: la sua funzione e infattidi “spianare” le parti della Terra in modo da poter effettuare analisi e misure (approssimate). Questomostra anche la genesi del concetto di varieta, che era semplicemente una generalizzazione del concettodi superficie (o ipersuperficie), vista sia dal punto di vista “implicito” (con funzioni del tipo fk = 0 comeabbiamo visto sopra), che “esplicito” (con la rappresentazione parametrica). L’atlante viene poi in soccorsoal problema che abbiamo segnalato nel pendolo semplice circa gli insiemi aperti o meno). Il concetto divarieta e da un secolo un boccone duro da digerire, ma estremamente versatile, e, nel nostro caso, un po’meno generale perche immersa (v. piu avanti). Chi non si vuole spaventare puo pensare semplicemente aduna superficie.

(14) Esempi meno umani sono il piano proiettivo (le carte sono le coordinate omogenee) e la bottiglia diKlein, una curiosa superficie che in E3 si autointerseca,

15

sottoinsieme aperto (15). Se pero non vogliamo pensare allo spazio, cominciamo ad andarein crisi, perche non potremo visualizzare questa varieta (servirebbe poter vedere le cose inalmeno quattro dimensioni). Una varieta di dimensione tre, diversa dallo spazio euclideo,e l’insieme delle rotazioni. Infatti ogni rotazione e rappresentabile, per esempio, con i treangoli di Eulero, il che vi fa capire che si trattera di una varieta molto curva.

Se vogliamo salire di dimensione, le cose non possono che complicarsi, e quindi non ciavventureremo in quel campo minato.

La varieta di un sistema olonomo ha pero una grande semplificazione (che per alcuni e unacomplicazione): e, come si dice, immersa in uno spazio euclideo, lo spazio (E3)N . Questovuol dire che ogni elemento della varieta e “interpretabile” come un elemento di (E3)N , e lavarieta tutta come un suo sottoinsieme. Questo e il significato della formula (1.1): essa dai vettori posizione dei punti (che stanno in (E3)N) a partire dalle coordinate lagrangiane.Un purista avrebbe detto: no, le coordinate lagrangiane sono le coordinate della varietaM , i cui elementi sono “le configurazioni”, e poi c’e un’immersione ι : M → (E3)N chefornisce le xs.

Comunque la vogliamo vedere, l’immergibilita ci garantisce che possiamo scrivere “leequazioni della varieta” semplicemente scrivendo le restrizioni che i vincoli impongono alle3N coordinate x1, . . . , zN . Per esempio, i nostri due punti che scorrono sul meridiano esull’equatore della sfera individuano una varieta di equazioni

x21 + y2

1 + z21 = R2

x22 + y2

2 + z22 = R2

(x1 − x2)2 + (y1 − y2)2 + (z1 − z2)2 = 4l2

y1 = 0

z2 = 0;

che poi si veda che questo sistema si parametrizza con un angolo, e (purtroppo o perfortuna) tutto un altro paio di maniche...

1.3. Velocita e vettori tangenti

Figura 9. La bottiglia di Klein.ma si tratta di un’apparenza (un po’ come una superficie curva pare che si autointersechi quando siproietta su un piano), in quanto in dimensione quattro cio non accade. Per fortuna, non incontreremosistemi meccanici che si rappresentano con questa varieta.

(15) Ora, forse, capiamo per intero la differenza fra E3 e R3: E3 e una varieta, e R3 e lo spazio Rn nelquale vivono le varie carte. Le coordinate curvilinee sono alcune di queste.

16

Fin qui le questioni sulla configurazione del nostro sistema. Se vogliamo calcolare lavelocita dei punti rispetto alle coordinate lagrangiane, l’intuizione e l’abitudine ai calcolici suggeriscono di derivare rispetto al tempo la (1.1), ottenendo

(1.2) vs =n∑i=1

∂cs∂qi

qi +∂cs∂t

(s = 1, . . . , N).

Sebbene questa conclusione sia giusta, dobbiamo rifletterci un attimo sopra. Innanzitutto,a partire dal nostro sistema, ne consideriamo un moto regolare t 7→ xs(t) (s = 1, . . . , N),e dunque la supposta biunivocita tra le posizioni xs e le qi ci fornisce, per composizione

xs(t) = cs(q1(t), . . . , qn(t), t),

dopodiche potremo derivare ed ottenere la (1.2). Pertanto il moto regolare del sistemarisulta rappresentato anche dalle n funzioni t 7→ (q1(t), . . . , qn(t)).

Successivamente, dato che la dipendenza esplicita dal tempo delle posizioni rappresentavincoli dipendenti dal tempo, se vogliamo trovare le velocita virtuali, dovremo soffermarcial primo dei due addendi della (1.2):

(1.3) ws =n∑i=1

∂cs∂qi

qi (s = 1, . . . , N).

Fin qui il discorso in una determinata carta, ossia avendo fissato le cs (s = 1, . . . , N).Un po’ diversa e la situazione se vogliamo capire la struttura geometrica che sta sotto.

Per fortuna nostra, abbiamo a disposizione un’esperienza che ci fa comodo. Innanzitutto,e chiaro cosa si intenda per una curva in Rn. Siccome siamo in Rn, sappiamo tutto(attenzione! Rn, non RN). Questa curva si trasforma, mediante la carta cs (o c perbrevita), o ancora ϕ−1

α se preferite, in una “curva” sulla varieta M . Sempre dal momentoche siamo in Rn, sappiamo cos’e una curva differenziabile (16) e quando due curve hannolo stesso vettore derivato in un punto di Rn (che, al solito, possiamo individuare col valorenullo del parametro): qualcosa tipo ~γ(0) = ~η(0), solo che sono vettori in Rn e non in R3,e quindi scriveremo γ(0) = η(0). Ebbene, possiamo considerare la classe di equivalenzadelle curve mutuamente tangenti in un punto (q1, . . . , qn) e aventi lo stesso vettore derivato:queste classi si possono sommare, moltiplicare per uno scalare in modo da renderle unospazio vettoriale (17).

(16) Noi l’abbiamo fatto in R3, ma, dato che non dobbiamo parlare di binormali, ecc., la definizione divettore derivato e la stessa.

(17) Se p e la configurazione data, prese due classi [γ]p e [η]p e λ ∈ R, definiamo

[γ]p + [η]p = [γ + η]p e λ[γ]p = [λγ]p.

Cosa vuol dire? Vuol dire che ho preso la classe fatta dalla curva somma delle due assegnate e quellafatta dalla moltiplicazione della curva per lo scalare (qui aiuta il fatto che il dominio delle curve e R pertutte; in caso contrario sarebbe piu complicato.). Pero, e qui paghiamo lo scotto di aver usato le classi diequivalenza, questa definizione non e ancora detto che sia giusta: dobbiamo verificare che la definizionedella classe “somma di due” non dipende dalle curve scelte (gia, perche io ho scritto [γ + η]p, ma chi sonoγ ed η? Il simbolo [γ]p non dice nulla su γ, per cui non e nemmeno chiaro, a rigore, cosa sia [γ + η]p:e solo un’abbreviazione per dire “prendo una curva di [γ]p, una di [η]p, le sommo, e prendo la classe diequivalenza della somma”. Ma siamo sicuri che se avessi preso un’altra γ e un’altra η avrei trovato allafine la stessa classe? No, appunto...).

17

Pertanto possiamo dare la seguente

Definizione 1.7. Un vettore tangente a una varieta M in un suo punto p e una classe diequivalenza [µ] di curve su M tali che µ(0) = ν(0) = p e tali che per ogni per µ, ν ∈ [µ] eper ogni carta locale ϕα, posto

γ(t) = ϕα(µ(t)), η(t) = ϕα(ν(t))),

si abbia γ′(0) = η′(0).

Figura 10. Un vettore tangente.

Questa e una bella definizione, ma come facciamo ad usarla? Be’, dobbiamo scegliereuna carta e rappresentare il nostro vettore con delle coordinate, anzi, con le coordinatedella carta, che sono le q1, . . . , qn. Una curva sulla varieta sara dunque rappresentatain una carta da una funzione t 7→ (q1(t), . . . , qn(t)), e se vogliamo individuare il vettoretangente facendo le derivate in zero della curva, troveremo che esso sara individuato daq1(0)eq1 + . . .+ qn(0)eqn (18). Siccome il fatto che t = 0 e irrilevante, e usuale indicare con(q1, . . . , qn) le coordinate di un vettore tangente in p alla varieta M (19).

Ma questo e facile: se γ1 e equivalente a γ2 e η1 e equivalente a η2, allora γ′1(0) = γ′2(0), e idem perη1 ed η2, dunque

(γ1 + η1)′(0) = γ′1(0) + η′1(0) = γ′2(0) + η′2(0) = (γ2 + η2)′(0)

e quindi γ1 + η1 e equivalente a γ2 + η2. In modo analogo si vede che λγ1 e equivalente a λγ2.Queste operazioni fra classi hanno tutte le proprieta delle operazioni fra vettori. Verificarne anche

solo una sarebbe una bella barba, perche alla fine si ricadrebbe sulla somma delle operazioni fra i vettoriderivati. Chi ha dubbi o si sente insicuro (un modo aulico per indicare di solito l’insieme vuoto) puoprovare a verificare.

(18) Non immaginatevi nulla di strano: eq1 e (1, 0, . . . , 0), il primo vettore base in Rn. Con questanotazione un po’ pesante (che peraltro useremo pochissimo) vogliamo distinguerci da e1, e2, e3 che sono ivettori base dello spazio in cui immergiamo i punti.

(19) Correndo vari gravi rischi: il primo e che (q1, . . . , qn) non recano piu traccia del punto p; il secondoe che si rischia di confondere la funzione t→ qk(t) con il suo valore in zero, dato che lo zero non si mette.Ma tant’e: dobbiamo vivere pericolosamente, dato che (q1p(0), . . . , qnp (0)) e talmente pesante che nessuno

saprebbe digerirlo.

18

Vediamo un paio di esempi. Nel caso del pendolo semplice, se la coordinata usata e la ϑ, ilnumero ϑ individua la velocita angolare del punto, e dunque un vettore tangente. Ma allorache fine fa il raggio della circonferenza? Quello serve per individuare la velocita del puntoin E3, e dunque entra in gioco con l’immersione. Vedremo fra un attimo di che si tratta.Pensiamo invece a una superficie immersa, come un toro ad esempio: questa superficie siparametrizza bene con due angoli ϑ e ϕ, come mostra la fig. 11. In questo caso si vedonobene le linee coordinate ϑ = cost., che sono delle circonferenze in un piano verticale nellafigura, e ϕ = cost., che sono invece delle circonferenze in un piano orizzontale. Per ciascunpunto del toro passano due linee coordinate, e le corrispondenti “velocita” ϑ e ϕ danno, inquesto punto, due vettori tangenti, la cui somma vettoriale e il vettore tangente nel punto.In questo caso il vettore tangente “si vede” perche la superficie e immersa, ed e il consuetovettore tangente a una superficie.

Cosa succede se si vuole “trasformare” un vettore tangente ad una varieta ad uno tan-gente ad un’altra? Per esempio, se abbiamo il vettore tangente ad M , come facciamo atrovare il vettore tangente “visto in (E3)N?

La cosa e relativamente semplice, per fortuna. Se abbiamo una trasformazione f :M → N , dove M e N sono due varieta, la f trasformera curve su M in curve su N , ele rispettive carte poi le rappresenteranno. Quindi verra determinata una relazione fra lecoordinate dei punti, quelli di M e quelli di N , tramite le rispettive carte. Analogamente,le curve della classe di equivalenza del vettore tangente ad M si trasformeranno in quelledel corrispondente in N , e per trovare le coordinate del vettore tangente nella nuova cartabastera derivare rispetto a t: compariranno “magicamente” le relazioni fra le varie qk e lenuove coordinate (20).

Per esempio, supponiamo di voler trasformare la circonferenza del pendolo semplicenell’insieme in E2 dei punti {(x, y) : x2 + y2 = R2}. Le relazioni tra ϑ e (x, y) sonolocalmente date da

x = R cosϑ, y = R senϑ

cosicchex = −R senϑϑ, y = R cosϑϑ

che rappresenta un vettore in E2, tangente nel punto (x, y) alla circonferenza, di modulo

Rϑ (ed ecco che l’R ricompare).Ci rendiamo quindi conto che la formula (1.2), nel caso di carte non dipendenti dal

tempo,

vs =n∑i=1

∂cs∂qi

qi

non sono altro che le velocita reali (e anche virtuali perche i vincoli sono fissi) degli elementidella varieta “visti in (E3)N” (21).

(20) Se le dimensioni delle due varieta sono uguali, altrimenti non funziona, perche non sara possibileavere biunivocita e bicontinuita tra le carte di M e quelle di N . In questo caso la stesse dimensioni saranno,per esempio, quelle della varieta M e di una sottovarieta di N—l’immagine di M tramite f .

(21) Che dire dei vincoli mobili? Non ammettono una descrizione geometrica, poverini? In effetti sı;pero bisogna che anche il tempo sia “parametrizzato”. In questo caso (e anche nel caso normale, se volete,ma lı non e necessario) si introduce un parametro reale α e si descrivono q1, . . . , qn e t in funzione di α(garantendo invertibilita). Se si e interessati alla legge oraria, questa sara t 7→ q(α−1(t)), ottenuta percomposizione invertendo α 7→ t(α). Dunque, non accade altro che la varieta ha una coordinata in piu. La

19

Figura 11. Un vettore tangente al toro.

L’insieme di tutti i vettori tangenti in un dato punto p alla varieta e quindi uno spaziovettoriale di dimensione n e si chiama spazio tangente in p ad M . Si indica con TpM .Chiaramente, nel caso di curve o superfici immerse, esso coincide con la retta o il pianotangente alla curva o alla superficie, rispettivamente.

Penultima osservazione interessante: siccome anche E3, poverino, e una varieta, e siccomei vettori applicati in un punto di E3 si fanno con le classi di equivalenza di vettori tangentie risultano essere “come i vettori di E3”, ne concludiamo che TxE3 e isomorfo a E3. Quindiun vettore applicato, in realta, non “vive” in E3, ma in uno spazio diverso, appiccicatoal punto di applicazione. Questo e il motivo per cui la punta della freccia con la qualerappresentiamo il vettore non ha significato fisico: potremmo usare dei bastoncini orientaticolorati con diverse tonalita di colore, per esempio, e rappresentare i vettori applicati inquesto modo. E3, pero, ha una proprieta particolare che molte varieta non hanno. Abbiamovisto che in E3 e possibile traslare un vettore applicato da un punto ad un altro. Vistocon gli occhiali dei vettori applicati, questo vuol dire che e possibile mettere in relazionevettori tangenti alla varieta in punti diversi. Basta immaginarsi questa operazione su unasfera per rendersi conto che non e evidente come si debba fare, e infatti in generale non c’eun modo canonico di farlo (22).

Ultima osservazione (spero interessante). Non sospettereste mai che c’e una relazionefra vettori tangenti ad una varieta e le derivate. Be’, da un lato sı, perche per fare ivettori tangenti bisogna derivare. Ma la relazione piu profonda e fra i vettori tangenti ele derivate direzionali. In effetti una derivata direzionale individua una direzione, no? E

formula (1.2) diventa allora (indicando con l’apice anziche il punto la derivata rispetto ad α)

vs =

n∑i=1

∂cs∂qi

q′i +∂cs∂t

t′,

la quale, posto q0 = t, si riscrive in tutta la sua bellezza

vs =

n∑i=0

∂cs∂qi

q′i.

(22) Cosa vorra mai dire esattamente “canonico” me lo chiedo da molti anni. Non c’e una definizioneprecisa, cosı come non c’e una definizione precisa di “sedia”, ma quando si vede una cosa canonica si capisceche lo e, cosı come quando si vede una sedia. In ogni caso, cio che serve su una varieta per confrontarevettori tangenti in punti diversi—operazione indispensabile se si vuole derivare un campo vettoriale—e unoggetto matematico chiamato connessione, sul quale pero non vogliamo approfondire il discorso.

20

dunque un “operatore derivata direzionale” individuera una direzione, e dunque un vettoretangente. Funziona piu o meno cosı: prendete una funzione M → R, rappresentate M

con una carta e trovate una funzione di q1, . . . , qn. Definite “vettore tangente base”∂

∂q1

la

derivata rispetto a q1 di una qualunque funzione di q1, . . . , qn, e analogamente per gli altri.Poi definite “vettore tangente” una combinazione lineare di vettori tangenti base:

D = q1∂

∂q1

+ . . .+ qn∂

∂qn(23)

E chiaro che questo operatore e in corrispondenza biunivoca con la n-upla (q1, . . . , qn),dunque col vettore tangente. Esso e la derivata direzionale di una qualunque funzione avalori reali sulla varieta (derivata, si intende sempre, valutata nel punto). In molti testi,per questo motivo, si indicano con ∂/∂qk i vettori base di TpM e non, come abbiamo fattonoi, con eqk .

1.4. Vincoli di velocita e sistemi integrabili

Non avremo certo dimenticato dalla prima parte che il tipo di vincoli che abbiamoimmaginato sui sistemi meccanici sia sulle velocita, e non sulle posizioni. Sorge alloraspontanea la domanda: se vincolo un sistema con dei vincoli di velocita, esso resta olonomo?La risposta non e evidente, perche se ho un sistema olonomo, e evidente che le velocitanon saranno qualunque. Ma se si restringono le velocita, siamo sicuri che potremo trovaredelle restrizioni anche sulle posizioni, anzi, solo sulle posizioni? La risposta e, come poteteimmaginare, no.

Facciamo un primo esempio banalissimo. Un punto libero nello spazio con velocita aventedirezione costante, fissata. Ci rendiamo conto subito che il moto di questo punto avvienesu una retta. Quale? Non si sa, ma se si conosce la posizione iniziale del punto, allora essae determinata: e la retta passante per il punto con direzione uguale a quella assegnata. Suquesta retta possiamo porre un’ascissa q1 = x e siamo a posto.

Altro esempio: un punto deve avere velocita sempre ortogonale alla sua posizione (ri-spetto a un riferimento). Qui cosa succede? Vediamo: se x e la posizione, allora v ·x = 0,ossia, in altri termini

v(P ) · (P −O) = 0

da cui segue immediatamente1

2

d

dt||P −O||2 = 0

e quindi||x|| = ||P −O|| = cost.

Abbiamo dedotto quindi che il punto deve stare a distanza costante dall’origine del riferi-mento, e quindi su una sfera. Quale? Non lo sappiamo, ma lo sapremo qualora conosces-simo una posizione del punto (per esempio, quella iniziale). Ora possiamo assegnare sulla

(23) I numeri q1, . . . , qn sono numeri, li ho chiamati cosı per suggestione, ma potevano essere indicaticon i piu prosaici λ1, . . . , λn.

21

sfera, magari localmente, due coordinate, per esempio q1 = ϑ e q2 = ϕ, ed avere il nostrobel sistema olonomo.

Figura 12. Due sistemi meccanici con la stessa varieta delle configurazioni.

Ci accorgiamo quindi che anche quando un vincolo sulle velocita implica un vincolo diposizione, c’e una costante da determinare per conoscere con precisione il vincolo (24).

Ma, a parte la costante da determinare, esistono vincoli di velocita che non provengonoda vincoli di posizione? La risposta e sı. Vediamo perche. Innanzitutto osserviamo che

(24) Se si lavora con le varieta, la distinzione, invece, si fa piu flebile. Infatti, per esempio, tutte le sfere

si comportano allo stesso modo dal punto di vista della geometria differenziale. E proprio per questo cheil raggio della sfera non entra nelle coordinate locali, mentre e l’immersione in E3 che introduce questoelemento non determinato. Questo fatto ha piacevoli e spiacevoli conseguenze: quella piacevole e chepossono esistere sistemi meccanici in apparenza molto diversi che hanno la stessa varieta, e che quindi,dal punto di vista della geometria, sono lo stesso sistema. Quindi, una volta scoperte delle proprieta perquelle varieta, esse si estendono a tutti i sistemi meccanici che la condividono. Quella spiacevole e che inquesto modo la varieta diventa ancora piu astratta e (apparentemente) slegata dalla fisica del problema.Un esempio carino e dato dal toro. Un pendolo doppio (o bipendolo, costituito da un pendolo semplicecon appeso all’estremita un altro pendolo semplice) ha la stessa varieta delle configurazioni di un sistemacostituito da un’asta che ha un estremo fisso nel piano e attaccata alla quale ruota un’altra asta fissatanel suo punto medio, un po’ come una ruota che sterza, come e illustrato nella fig. 12. In ogni caso,la meccanica del sistema entra poi in gioco, ma come ulteriore struttura imposta sulla varieta (l’energiacinetica).

22

nell’espressione delle velocita virtuali (1.3) le qi compaiono linearmente, a causa del fattoche si e derivata una relazione del tipo (1.1). Possiamo quindi limitarci ad assegnare deivincoli di tipo lineare sulla velocita, del tipo

n∑i=1

f i(q1, . . . , qn)qi = 0 (25)

dove fi sono delle funzioni regolari, e chiederci se questi vincoli possono essere scritti nellaforma

d

dtΓ(q1, . . . , qn) = 0.

Se questo e vero, allora cio significa che le qi non sono indipendenti, e, dalla relazione

Γ(q1, . . . , qn) = C,

una volta determinata, grazie ad una posizione del sistema, la costante C, possiamo, almenolocalmente, ricavare una coordinata in funzione delle altre e abbassare il numero di gradidi liberta del sistema.

In pratica, quindi, si tratta di trovare un vincolo lineare di velocita ad hoc. Prendiamoallora questo esempio, che dovrebbe essere, a mia conoscenza, il piu semplice di tutti: duepunti che si muovono nel piano a distanza fissa (che indichiamo con 2l) e tali che il loropunto medio abbia una velocita parallela alla congiungente i due punti (si tratta dellatraccia del moto di un pattino da ghiaccio sul piano, oppure dell’intersezione del piano diuna ruota di biciletta, non inclinata, col piano parallelo al terreno passante per il centro).

Vediamo un po’. Servono al massimo tre coordinate per individuare la posizione delpattino: una scelta semplice e data dalle coordinate (x, y) del punto medio e dall’angolo ϑche la congiungente forma con l’asse x.

Figura 13. La traccia di un pattino da ghiaccio sul piano...

Se non ci fosse il vincolo di velocita, questo sistema sarebbe olonomo con tre gradidi liberta. Invece non possiamo muoverlo come vogliamo, in quanto se, per esempio, lotrasliamo, la velocita del punto medio sara uguale alla velocita dei due punti, e dunqueessa sara parallela alla congiungente solo se lo trasliamo lungo la congiungente. Peroosserviamo che non possiamo solo traslarlo: possiamo fare in modo che il punto mediopercorra una curva regolare qualunque. Infatti, fissata questa curva, basta tracciarne letangenti e prendere i punti a distanza l dal punto di tangenza, simmetricamente.

(25) C’e il segno di uguaglianza perche vogliamo vincoli bilateri.

23

Figura 14. ... e la corrispondente generata da una ruota.

Ci chiediamo allora se, in virtu di questo fatto, i gradi di liberta non siano due (menodi due e impossibile perche il punto medio possiamo farlo andare dove vogliamo, comeabbiamo appena visto). Ma questo vuol dire che ϑ sarebbe fissato una volta nota laposizione del punto medio: e questo e falso, perche se facciamo compiere al pattino unpercorso chiuso che riporta il punto medio alla posizione iniziale, l’angolo ϑ potrebbe esserestato cambiato e (x, y) rimasti gli stessi.

Figura 15. L’angolo ϑ e ottenibile liberamente.

Dal punto di vista della matematica, la situazione e semplice: siccome la velocita delpunto medio ha componenti x, y, la condizione di parallelismo si enuncia semplicementey = (tg ϑ)x, oppure, per non fare comparire denominatori,

(1.4) senϑx− cosϑy = 0.

Si tratta proprio di una relazione lineare in x, y, ϑ (il coefficiente di ϑ e nullo), pero nonesiste una relazione del tipo U(x, y, ϑ) = C che derivata da quella (26).

(26) Tirata di orecchie a chi pensa a x senϑ − y cosϑ = C: non va bene perche ϑ puo dipendere daltempo. Non parliamo di −x cosϑ− y senϑ = C o altri abomini del genere...

24

Perche? Immagino che vi siate accorti che si tratta del vecchio problema di trovare unpotenziale di una forma differenziale: infatti, se avessimo

ω = senϑ dx− cosϑ dy = dU(x, y, ϑ)

potremmo dire che dalla relazione (1.4) segue U(x, y, ϑ) = C (27) . Ma questo non epossibile perche, come si verifica subito,

∂ω1

∂x3

=∂ω1

∂ϑ= cosϑ 6= ∂ω3

∂x1

=∂ω3

∂x= 0

e dunque il numero dei gradi di liberta non si puo abbassare.Un sistema come questo si dice anolonomo, mentre un sistema con vincoli di velocita

riconducibili a un sistema olonomo (a meno di un po’ di costanti (28)) si chiama integrabile.Se un sistema si puo descrivere con un grado di liberta, allora non si possono prescrivere

vincoli di velocita diversi da quello deducibile dal singolo grado di liberta. Viceversa, sipuo dimostrare che se un sistema meccanico si puo descrivere con due gradi di liberta, ese viene in piu prescritto un vincolo di velocita lineare nelle q1, q2, allora esso e sempreintegrabile, e quindi ammette in realta un solo grado di liberta.

Per esempio, supponiamo che il nostro pattino sia ora vincolato in modo che uno dei duepunti, diciamo P , scorra su una retta. Conviene ovviamente prendere questa retta comeun asse, per esempio l’asse x, e scrivere la posizione del punto medio M usando l’ascissadel punto vincolato e l’angolo ϕ formato dalla congiungente i due punti con l’asse x.Chiaramente le coordinate del punto medio saranno (x+ l cosϕ,−l senϕ) e la sua velocita(x−l senϕ ϕ,−l cosϕ ϕ). Invece il vettore M−P ha componenti (l cosϕ,−l senϕ) e quindila condizione di parallelismo tra v(M) e M − P si scrive

x− l senϕ ϕ

l cosϕ=−l cosϕ ϕ

−l senϕ

Figura 16. Un vincolo di velocita in un sistema descrivibile con due parametri.

ossia, dopo alcuni semplici passaggi,

x senϕ− lϕ = 0.

Questa relazione e integrabile. Se ϕ = 0 in una data configurazione, allora dalla relazionesegue che ϕ = 0 per ogni t, e dunque M deve giacere sulla retta dove sta anche P .

(27) In effetti si tratta della relazione 〈ω, u〉 = 0, dove u = (x, y, ϑ).

(28) Gia, perche naturalmente nessuno dice che si debba assegnare un solo vincolo di velocita.

25

Altrimenti, dividendo per senϕ, troviamo

x− 1

senϕϕ = 0

che fornisce (ricordarsi un po’ di integrali non banali)

x− l log∣∣∣tg ϕ

2

∣∣∣ = C

che e la famiglia di curve sulla quale deve stare il punto medio. Nota una sua posizione, sidetermina C e si trova la curva (29).

Figura 17. Una traiettoria di un pattino vincolato a un binario.

Dal punto di vista della geometria, la cosa e abbastanza semplice, almeno a prima vista.Un vincolo lineare sulle qi, calcolato in un punto (q1, . . . , qn) non e altro che un sottospaziovettoriale dello spazio tangente in quel punto alla varieta individuata localmente con lecoordinate q1, . . . , qn. Se questo sottospazio varia con regolarita, ossia se le funzioni fisono per esempio derivabili con continuita, ci si chiede se esista una sottovarieta (che none altro che un sottoinsieme di M che e a sua volta una varieta differenziabile) tale che isuoi vettori tangenti appartengano, punto per punto, al sottospazio. Fisicamente significaquesto: in ogni punto le coordinate q1, . . . , qn “permetterebbero” una velocita nello spaziotangente, ma il vincolo lo limita a un sottospazio (30).

La figura 18 illustra quanto detto con quello che riusciamo a visualizzare: gli spazitangenti bidimensionali e i sottospazi unidimensionali. La sottovarieta e la linea rossa sul“canotto”.

Una assegnazione di sottospazi degli spazi tangenti si chiama distribuzione (31). Se talevarieta esiste, la distribuzione si dira integrabile, altrimenti no. Se essa e integrabile,succede un fatto simpatico: per ogni punto della varieta passa una e una sola sottovarieta,

(29) Forse il povero pattinatore che ha il pattino vincolato a un binario non sa che il punto medio delsuo pattino sta percorrendo una trattrice, che e la curva tale che, preso un segmento di lunghezza costantesulla tangente, simmetrico rispetto alla tangente, abbia un estremo che appartiene a una retta (nel nostrocaso il punto e ovviamente P e la lunghezza l).

(30) Per il fatto che la relazione tra le qi e lineare.(31) Pessimo nome, in quanto lo stesso si usa in Analisi con un significati del tutto diverso, e molto piu

diffuso.

26

e due di esse non si intersecano mai. Cio e dovuto al fatto che la loro equazione e unlegame tra le coordinate Γ(q1, . . . , qn) = C, e dunque per ogni punto (q1, . . . , qn) si trova lacorrispondente C, e se due sottovarieta si intersecano, devono condividere la stessa C (32).

Figura 18. Una distribuzione.

1.5. Forze e accelerazioni

Veniamo ora finalmente all’applicazione dei nostri princıpi fondamentali ai sistemi olo-nomi. Nel seguito ci occuperemo solo di vincoli lisci (e negli aspetti geometrici, anche fissi)e bilateri. Pertanto il principio di d’Alembert si scrivera

(1.5)n∑s=1

〈fs − ps,ws〉 = 0

per ogni sistema di velocita virtuali {ws}s=1,...,N . Se introduciamo la (1.3) nella (1.5)troviamo

N∑s=1

⟨fs − ps,

n∑i=1

∂cs∂qi

qi

⟩= 0

per cui, riordinando e scambiando le sommatorie troviamon∑i=1

(N∑s=1

⟨fs,∂cs∂qi

⟩−

N∑s=1

⟨ps,

∂cs∂qi

⟩)qi = 0

(1.6) Qi =N∑s=1

⟨fs,∂cs∂qi

⟩, τi =

N∑s=1

⟨d

dtps,

∂cs∂qi

⟩, (33)

(32) La stessa situazione si ritrova in E3 quando si ha in esso definita una 1-forma differenziale esattaidenticamente nulla. Le superfici equipotenziali sono le sottovarieta U(x, y, z) = C, che “fogliettano” (sidice, ahime, proprio cosı) tutto lo spazio.

27

n∑i=1

(Qi − τi)qi = 0.

Occorre ora fare uso dell’informazione sull’arbitrarieta delle velocita virtuali. Dalla (1.3),fissato un punto (q1, . . . , qn) (e dunque una configurazione del sistema) in un istante t, ab-biamo che per ogni scelta dei numeri q1, . . . , qn avremo una velocita virtuale. Pertanto pren-dendo le velocita corrispondenti a (1, 0, . . . , 0), . . . , (0, . . . , 0, 1) (cioe qik = δik) troviamo laprima forma delle equazioni di Lagrange:

(1.7) τi = Qi (i = 1, . . . , n)

o, se preferite la forma compatta, τ = Q.Le Qi prendono il nome di componenti lagrangiane delle forze, mentre chiameremo le τi

componenti lagrangiane delle forze d’inerzia o componenti lagrangiane delle accelerazionise le masse sono costanti.

Sembra una presa in giro: non e un gioco di definizioni? Perche non abbiamo postoU = τ −Q e scritto le “equazioni di Marzocchi” nella stupenda forma U = 0? Lo sarebbese la natura delle Qi e delle τi non fosse un po’ diversa (in effetti non e molto diversa, maquesta forma delle equazioni di Lagrange e ancora un po’ grezza).

In effetti, se si ragiona in un istante fissato, e quindi per una certa configurazione fissatae per una certa velocita fissata, i covettori fs e ps sono fissati e il tutto e un modo “incoordinate lagrangiane” per scrivere che la potenza virtuale totale e nulla in quell’istante.

La situazione pero cambia se si considerano le (1.7) come identita di campi.Il fatto importante a questo punto e che mentre le Qi dipendono al piu dalle qk, dalle qk e

dal tempo, le τi dipendono anche dalle qk. Vediamo perche. Innanzitutto le ∂cs/∂qi possonodipendere solo dalle qk e dal tempo, dunque non aggiungono alcuna nuova dipendenza chenon sia gia nel primo covettore. Ora, mentre fs dipende in genere dalle posizioni e dallevelocita, il covettore ps e derivato rispetto al tempo, e dunque, lungo una possibile leggeoraria del sistema, esso dipendera anche dalle derivate seconde delle qk.

Quindi una forma lievemente piu significativa della prima forma delle equazioni diLagrange e

τ (q, q,q, t) = Q(q,q, t).

Soffermiamoci prima sul secondo membro e supponiamo che i covettori forza sianorappresentabili con delle forze, cosicche

Qi =N∑s=1

F s ·∂cs∂qi

.

Qual e il significato fisico di questi scalari (perche di scalari si tratta)? Questo dipendedalla natura delle coordinate q. Se ad esempio la qi e una distanza, allora ∂cs/∂qi avra

(33) Abbiamo scritto questa formula un po’ male perche perlomeno si capisse. In effetti le fs dipendonodalle posizioni, dalle velocita e dal tempo, mentre le ps, dipendono dalle velocita (pero sono derivate).Avremmo dovuto scrivere qualcosa come f ◦ c, ma risultava estremamente pesante. In ogni caso e chiaro:sostituire a xs le loro espressioni in termini delle qk e t, a vs quelle in termini delle qk, delle qk e t, e, doveserve, fare anche la derivata rispetto al tempo.

28

le dimensioni di un numero puro (una direzione) e quindi Qi sara la proiezione della forzalungo quella direzione. Un semplice esempio e quello di un punto (dunque N = 1) vincolatoa una superficie liscia.

Figura 19. Componenti lagrangiane di una forza applicata a un punto suuna superficie.

Cosa sono le quantita ∂cs/∂qi? Sono le derivate parziali della posizione del punto rispettoalle qi, e dunque tenendo le altre qk (in questo caso ce n’e solo una altra) costanti: si trattadunque di vettori derivati delle curve coordinate sulla superficie, e quindi tangenti allecurve stesse, e dunque anche alla superficie (non si tratta in generale di versori, perche none detto che le qi siano ascisse curvilinee sulle curve). Pertanto le Qi sono proporzionali allecomponenti tangenziali delle forze.

Se al posto della superficie c’e una curva regolare e q1 = σ e l’ascissa curvilinea, sappiamogia che ∂cs/∂σ = t, e quindi

Qσ = F · t = Ft.

La cosa cambia un po’ se le coordinate non sono distanze ma angoli: in questo caso∂cs/∂qi ha le dimensioni di una distanza, e dunque Qi quelle di un momento. Se il puntosi muove su un arco di circonferenza, allora, misurata con q = ϑ la sua posizione, dove ϑ el’angolo al centro con una direzione fissa, avremo

∂cs∂ϑ

=∂

∂ϑ(P −O) =

∂ϑReρ = Reϑ.

Di conseguenza,

Qϑ = F · ∂cs∂ϑ

= F ·Reϑ = ‖F ‖R cosϑ = (P −O) ∧ F · e3,

ossia Qϑ e il momento statico di F rispetto ad O.Che dire delle τi? Poco, e solo nel caso in cui le masse siano costanti, cosicche

(1.8) τi =N∑s=1

msas ·∂cs∂qi

.

29

Viste cosı, esse non sono altro che le componenti lagrangiane dell’accelerazione moltiplicateper la massa. Non e tutta l’accelerazione, ma solo la sua componente “tangenziale” (se qie una ascissa curvilinea). Infatti, per un solo punto su una curva regolare, ∂cs/∂qi = t edunque

τσ = ma · t = mat = mσ.

Se invece di una coordinata curvilinea prendiamo un angolo ϑ, allora τϑ sara il momento sta-tico di ma rispetto all’asse degli angoli (34), che non e altro che la massa per l’accelerazionetrasversale.

1.6. Equazioni di Lagrange, seconda forma

Veniamo ora a un “piatto forte”. Supponiamo di rappresentare tutte le forze d’inerziacon dei vettori e andiamo a dare un’espressione alternativa delle τi.

Teorema 1.8. Sia t 7→ q(t) una funzione di classe C2(I;Rn) e sia

K(q(t), q(t), t) =N∑s=1

1

2ps(q(t), q(t), t) · vs(q(t), q(t), t)

l’energia cinetica totale del sistema. Allora si ha

τ (t) =d

dt

∂K

∂q(t)− ∂K

∂q(t),

oppure, in componenti,

τi(t) =d

dt

∂K

∂qi(t)− ∂K

∂qi(t),

dove ∂K/∂q e ∂K/∂q indicano i vettori delle derivate parziali della funzione R2n+1 →[0,+∞[ data da (q, q, t) 7→ K(q, q, t)).

Dimostrazione. Partiamo dalla (1.2), che riscriviamo,

vs =n∑i=1

∂cs∂qi

qi +∂cs∂t

(s = 1, . . . , N),

osservando che, se essa e vista come una funzione di qi, qi e t, essa e lineare nelle qi. Dunque

(1.9)∂vs∂qi

=∂cs∂qi

.

Siccome questa e un’identita, essa sara vera anche quando al posto di qi si sostituiscono leimmagini della funzione t 7→ qi(t) e le rispettive derivate.

Dall’espressione di τi scritta per vettori,

τi =N∑s=1

ps ·∂cs∂qi

(34) Avete capito che intendo: la perpendicolare al piano nel quale e contenuto l’angolo passante perl’origine dello stesso. Noioso.

30

abbiamo inoltre, lungo la funzione t 7→ q(t) (che non indichiamo per brevita),

(1.10) τi =N∑s=1

d

dtps ·

∂cs∂qi

=N∑s=1

d

dt

(ps ·

∂cs∂qi

)−

N∑s=1

ps ·d

dt

∂cs∂qi

.

Osserviamo adesso che, in virtu della (1.9), possiamo scrivere, identicamente in qi, qi e t,ricordando anche che ps = msvs,

(1.11) ps ·∂cs∂qi

= msvs ·∂vs∂qi

=∂

∂qi

(1

2msvs · vs

)=

∂qi

(1

2ps · vs

),

e quindi anche lungo t 7→ q(t). Vediamo ora l’altro termine. Siccome cs dipende dalle qke dal tempo abbiamo

d

dt

∂cs∂qi

=n∑k=1

∂2cs∂qk∂qi

qk +∂2cs∂t∂qi

=∂

∂qi

(n∑k=1

∂cs∂qk

qk +∂cs∂t

)=∂vs∂qi

per la (1.2) un’altra volta, sempre lungo t 7→ q(t). Pertanto

(1.12) ps ·d

dt

∂cs∂qi

= ps ·∂vs∂qi

=∂

∂qi

(1

2ps · vs

).

Sostituendo la (1.11) e la (1.12) nella (1.10), abbiamo

τi =N∑s=1

d

dt

∂qi

(1

2ps · vs

)−

N∑s=1

∂qi

(1

2ps · vs

)e dunque, portando dentro le sommatorie e fuori le derivate rispetto alle qi e qi, abbiamo,sempre lungo t 7→ q(t),

τi =∂

∂qi

N∑s=1

1

2ps · vs −

∂qi

N∑s=1

1

2ps · vs =

d

dt

∂K

∂qi− ∂K

∂qi

che e la tesi.�Questo teorema vale anche se le masse sono variabili nel tempo, ma non devono dipendere

dalla qi. E chiaro che se esse sono costanti l’energia cinetica assume la consueta forma

K =N∑s=1

1

2ms||vs||2.

Collegando questo risultato alla prima forma delle equazioni di Lagrange, abbiamo il

Teorema 1.9 (Seconda forma delle equazioni di Lagrange). Condizioni necessarie e suf-ficienti affinche una funzione t 7→ q(t) rappresenti il movimento di un sistema olonomosoggetto a vincoli lisci sono le equazioni

d

dt

∂K

∂q− ∂K

∂q= Q,

o, in componenti,

(1.13)d

dt

∂K

∂qi− ∂K

∂qi= Qi (i = 1, . . . , n)

dove K e l’espressione dell’energia cinetica del sistema rispetto alle variabili (q, q, t).

31

Potreste pensare a qualche diavoleria, vista l’espressione tutt’altro che semplice delleequazioni di Lagrange. E invece sono una furbata. Innanzitutto, perche non contengono lereazioni vincolari (cosa gia presente nella prima forma delle equazioni). Secondariamente,perche in generale non e difficile trovare l’energia cinetica di un sistema olonomo: bastaderivare le posizioni (che spesso sono la cosa piu difficile da trovare in coordinate “ragione-voli”), poi calcolare l’energia cinetica quadrando le velocita, e infine e solo una macchinettadi derivate. State a vedere cosa capita con il “pattino vincolato al binario” dello scorsoparagrafo, riprodotto nella fig. 20.

Il nostro sistema e costituito da due punti, P e Q, che supponiamo entrambi di massam per semplicita. Le loro

Figura 20. Come si usano le equazioni di Lagrange?

coordinate cartesiane sono

P (x, 0) = xe1, Q(x+ 2l cosϕ,−2l senϕ) = (x+ 2l cosϕ)e1 − 2l senϕe2.

Ne segue che le velocita sono date da

v(P ) = x e1, v(Q) = x− 2l senϕ ϕ e1 − 2l cosϕ ϕ e2.

Pertanto l’energia cinetica del sistema e data da (dopo qualche conticino)

(1.14) K =1

2mx2 +

1

2m[(x− 2l senϕ ϕ)2 + (2l cosϕ ϕ)2] = mx2− 2mlxϕ senϕ+ 2ml2ϕ2.

Da ora in avanti e una macchinetta. Guardate:

∂K

∂x= 2mx− 2mlϕ senϕ,

∂K

∂ϕ= −2mlx senϕ+ 4ml2ϕ,

∂K

∂x= 0,

∂K

∂ϕ= −2mlxϕ cosϕ.

per cui ci restano da calcolare le derivate rispetto al tempo delle prime due espressioni eavremo il primo membro delle equazioni di Lagrange:

d

dt

∂K

∂x− ∂K

∂x= 2mx− 2mlϕ senϕ− 2ml cosϕϕ2 (35)

d

dt

∂K

∂ϕ− ∂K

∂ϕ= −2mlx senϕ− 2mlxϕ cosϕ+ 4ml2ϕ+ 2mlxϕ cosϕ = −2mlx senϕ+ 4ml2ϕ

32

Ora mancano solo le Qi, cioe le forze. Se supponiamo che ci sia solo la forza peso, agenteperpendicolarmente alla retta di P , avremo

∂P

∂x= e1

∂Q

∂x= e1

∂P

∂ϕ= 0

∂Q

∂ϕ= −2l senϕe1 − 2l cosϕe2

cosicche

Qx = −mge2 ·∂P

∂x−mge2 ·

∂Q

∂x= 0, Qϕ = 2mgl cosϕ

e quindi in definitiva le equazioni del moto saranno

(1.15)

{2mx− 2mlϕ senϕ− 2ml cosϕϕ2 = 0

− 2mlx senϕ+ 4ml2ϕ = 2mgl cosϕ.

1.7. Fibrato tangente

Se vogliamo interpretare geometricamente le equazioni di Lagrange, dobbiamo dare unosguardo piu critico alla dimostrazione della seconda forma delle equazioni del matematicotorinese.

Forse i piu timorosi tra voi avranno notato che, accanto alla consueta derivata rispettoal tempo, dall’inizio di tutta la storia della meccanica analitica sono entrate in gioco dellederivate parziali. Le prime a far capolino sono state le derivate delle carte cs rispetto allerispettive coordinate, nell’espressione (1.2) della velocita. Fin qui nulla di strano, perchele carte sono per loro natura delle funzioni di n+ 1 variabili.

La cosa si fa un po’ strana, pero, quando si comincia a considerare la (1.9), perchecompaiono le derivate parziali rispetto alle qi:

∂vs∂qi

=∂cs∂qi

.

Qual e il significato del simbolo qi? E chiaro: e la derivata rispetto al tempo della funzionet 7→ qi(t), che e una funzione del tempo. E allora? ∂/∂qi significa che deriviamo rispettoa una funzione? Ma cosa vuol dire, per esempio, il rapporto incrementale rispetto a unafunzione? Non e cosı: noi deriviamo rispetto a qi come se fosse una variabile scalareindipendente. Questo significa che, quando facciamo questa operazione, ci dimentichiamoche qi e la derivata temporale di qualcosa (36)

(35) Non dobbiamo dimenticare che anche senϕ dipende dal tempo attraverso ϕ...

(36) E commettiamo anche un pericolosissimo abuso di linguaggio. Infatti una cosa sono le funzioniR→ En

t 7→ vs(t) =

n∑i=1

∂cs∂qi

(q(t), t)qi(t)

e un’altra e la funzione Rn → En

(q1, . . . , qn) 7→n∑i=1

∂cs∂qi

qi +∂cs∂t

.

33

Tutta la questione sta in questo passaggio. Prima della seconda forma delle equazioni diLagrange avevamo le variabili qi, e ora spuntano anche le variabili qi. Poco male, direte:abbiamo una “carta” pure per le velocita, che contiene anche le “variabili” qi. Pero levariabili qi sono, potremmo dire, delle variabili “a sovranita limitata”, e precisamente peril motivo che segue.

Supponiamo di assegnare una “curva” a valori nelle variabili “estese” (q, q), cioe unaapplicazione I → R2n (al solito, I e un intervallo di R) del tipo t 7→ (q(t), q(t)). Se levariabili qi fossero delle variabili qualunque, non ci sarebbe nessun legame fra le q(t) e leq(t), e invece c’e: lungo una curva su M , le qi(t) devono essere le derivate delle qi(t).

Questo ci avvicina piano piano all’oggetto di questa discussione. Ma prima limitiamociun po’ agli aspetti essenziali: nel seguito, e in tutti i discorsi “geometrici”, non conside-reremo mai il caso di vincoli mobili, ossia di carte dipendenti esplicitamente dal tempo.Pertanto, il nostro punto di partenza sara la (1.2) con ∂cs/∂t = 0, e quindi

vs = ws =n∑i=1

∂cs∂qi

qi.

D’altro canto, per questa situazione, come per quella generale, la (1.9) e vera, solo che lamancanza della dipendenza da t ci semplifica molte cose.

Noi sappiamo gia che per ogni punto c della nostra varieta “meccanica” delle configu-razioni M esiste uno spazio tangente TcM costituito da tutti i vettori tangenti ad M inc. Se ci fissiamo in c, le coordinate “naturali” (37) sono proprio le componenti del vettorederivato di una curva in c (tradotto in una carta, ma questo poco conta). Dunque in TcMc’e un insieme di “coordinate” (q, q), solo che q e fisso (fissata una carta), mentre q puovariare. Bene, allora si tratta di far variare anche q, cioe di considerare l’insieme di tutti ipunti e i vettori tangenti nei vari punti c ∈M . Dunque ci serve una cosa tipo

TM = {(c, v) : c ∈M, v ∈ TcM} .

Figura 21. Il fibrato tangente.

La prima e una funzione del tempo, che da la velocita dei punti all’istante t. La seconda e una forma affine(perche c’e il termine senza qk), che dice come la velocita dipende dalle qi. Chiaramente quando si derivarispetto alle qi si usa la seconda, ma quando si parla di un moto (possibile o reale) si usa la prima.

(37) Altro termine di impossibile definizione (i numeri naturali non c’entrano nulla). Comunque, se unacosa e fatta in modo naturale, si sente anche in Matematica e non solo a tavola.

34

Ho scritto una cosa “tipo” l’insieme delle coppie perche in realta la definizione e piucomplicata. E complicata dal fatto che vogliamo dire in qualche modo che spazi tangentia punti vicini sono vicini, ossia che se si ha una curva differenziabile con continuita su M ,allora le coordinate q dei vettori negli spazi tangenti variano con continuita, e soprattuttoperche vogliamo poter lavorare con funzioni dipendenti da entrambe le coordinate, comeappunto l’energia cinetica nelle equazioni di Lagrange.

La struttura che abbiamo introdotto si chiama fibrato tangente alla varieta M e si indicacon TM . (38)

Non e difficile vedere che TM e una varieta immersa in (E3 × E3)N . Infatti, data unacarta Cα come nella definizione di M , vogliamo definire una carta Γα che ci “rappresenti”la coppia (c, v) (39). Ma questa e facile: basta prendere n coordinate q1, . . . , qn (attenzioneche non sono delle derivate!) e costruire

Γα : Vα × Rn → TM

Γα : (q1, . . . , qn, q1, . . . , qn) 7→ (C(q), (∇C)q) =

(C(q1, . . . , qn),

n∑i=1

∂C

∂qi(q1, . . . , qn)qi

).

Che (c, v) ∈ Γα(Vα×Rn) e chiaro, perche se C(q) da c, allora ∇C(q)q da v, e la topologiasi ottiene prendendo questi come aperti in TM . Resta da vedere che le carte formano unatlante e che il cambio di coordinate e di classe C∞. La prima cosa l’abbiamo appenavista esibendo una carta nell’intorno del generico (c, v). La seconda viene cosı: il cambio dicoordinate della qi e gia C∞; come sara quello delle qi? Be’, ragioniamo su un solo puntoPs. Da un lato

vs =n∑i=1

∂cs∂qi

qi.

Se chiamiamo ψ : Rn → Rn il cambio di coordinate qi → qj, (ψ sara una certa C−1α ◦ Cβ

ma non ci interessa ora), avremo anche

vs =n∑

i,j=1

∂cs∂ψi

∂ψi∂qj

˙qj.

(38) Il nome ‘tangente’ e chiaro: e fatto con gli spazi tangenti. Il nome ‘fibrato’ viene dal fatto che perogni punto c’e qualcosa “di dritto” che passa per quel punto (uno spazio vettoriale, appunto). In inglesesi dice tangent bundle (bundle vuol dire “fascina”—per esempio, di legna, e lo si capira dalla figura 23).L’idea di fibrato si puo generalizzare al caso di punti ai quali sono associati altri spazi (in genere spazivettoriali), ed ha riscosso molto successo in Matematica.

(39) Ho indicato con v la quantita

v = (v1, . . . ,vN ) ∈ (E3)N

che e il generico “vettore tangente” a M “visto” in (E3)N . La formula (1.2), nel caso di vincoli fissi, puoessere scritta anche cosı:

v = (∇C)q

anche se non e altro che

v = (v1, . . . ,vN ) =

(N∑i=1

∂c1∂qi

qi, . . . ,

N∑i=1

∂cN∂qi

qi

).

35

Ora, siccome ∂cs/∂qi e ∂cs/∂ψi sono la stessa cosa, avremo, confrontando le due espres-sioni, che

qi =n∑j=1

∂ψi∂qj

˙qj

e il cambio di coordinate q che viene determinato, e che e C∞ anche lui perche ψ lo e. Sicco-me le coordinate di (c, v) sono 2n, abbiamo mostrato che TM e una varieta differenziabiledi dimensione 2n, che nel caso della Meccanica Analitica e immerso in (E3 × E3)N (40).

Sia come sia, quello che ne emerge sono due cose: primo, e possibile derivare una fun-zione rispetto sia alle qi che alle qi lungo una curva (41), e secondo che il fibrato tangen-te e l’ambiente naturale per impostare il problema dinamico collegato alle equazioni diLagrange.

Figura 22. Il fibrato tangente allo spazio E1.

Se la varieta M ha dimensione n, purtroppo il fibrato tangente ha dimensione 2n. Dicopurtroppo perche gia per sistemi a due gradi di liberta il fibrato tangente ha dimensionequattro, e quindi non e visualizzabile in E3. Se vogliamo fare degli esempi “visibili”,abbiamo poche scelte per M : lo spazio E1, o uno dei suoi aperti, oppure una curva regolare.Il caso di E1 e cosı semplice che rischia di essere fuorviante: il suo fibrato non e altro chequello che si chiama talvolta “spazio delle fasi” (42), ed e lo spazio coordinatizzato dalle(x, x), dunque, dal punto di vista geometrico, e E2. Quindi, un punto di coordinate (x, u)in E2 rappresenta un punto in E1 con velocita (scalare) u, come illustra la fig. 22. Se poial posto di E3 c’e una curva regolare aperta, la cosa non cambiera molto, salvo il fatto che

(40) Il secondo fattore e E3 e non R3, come potrebbe sembrare dalla definizione di Γα data sopra, percheserve l’R3 “centrato in c”, che e uno spazio vettoriale “applicato in c”.

(41) Il nocciolo del problema e sempre quello, gia segnalato quando parlammo delle curve in E3, diconfrontare un vettore tangente in c con un vettore tangente in un punto vicino. Siccome su una superficiecurva, e quindi a maggior ragione su una varieta, questa operazione e problematica per il fatto che non esisteuna definizione univoca di “trasporto parallelo”, serve dell’informazione aggiuntiva, detta connessione, percalcolare le derivate di un campo vettoriale. La struttura di fibrato permette di fare le derivate che sivogliono, pero lungo una curva. Inoltre, siccome la lagrangiana e uno scalare, con essa il problema deltrasporto parallelo non si pone.

(42) Io preferisco dare questo nome ad un altro fibrato, che incontreremo in meccanica Hamiltoniana.

36

la “base” del fibrato (la curva) non sara rettilinea: in coordinate, per esempio (σ, σ), nonse ne accorge nessuno.

L’altro caso “facile” e quello della circonferenza (che i Geometri chiamano affettuosa-mente S1), che e una curva chiusa. In S1, in particolare, il fibrato tangente e un cilindro(che e il prodotto cartesiano fra una retta e una circonferenza) (43).

Vediamo di analizzare un pochino piu in dettaglio il caso del fibrato TS1, nella speranzadi fare capire come si procede in generale. Un modo “sconveniente”, come gia sappiamo,e quello di utilizzare le coordinate cartesiane per S1. In questo caso, pero, e utile: state aguardare. La circonferenza e data da

(1.16) S1 = {(x, y) : x2 + y2 = R2}.In un punto (x, y) di S1 avremo allora che l’equazione della retta tangente alla circonferenza(intersecare per credere) e

(1.17) xx+ yy = 0

Figura 23. Il fibrato tangente alla circonferenza.

Siccome la velocita del punto e ovviamente xe1 + ye2, le coordinate del vettore tangentedevono essere (x, y). Quindi il fibrato TS1 si puo vedere definito dalle seguenti equazioni:{

x2 + y2 = R2

xx+ yy = 0,

oppure, se preferite non vedere “punti” attorno,{x2 + y2 = R2

xu+ yv = 0.

C’e poco da fare: questa e una sottovarieta di R4 (con coordinate x, y, u, v) di dimensionedue. C’e un modo di trovare una carta nella quale essa e globalmente definita su unprodotto cartesiano (44)? Si tratta di trovare dei nuovi “parametri” rispetto ai quali le

(43) Un caso in cui cio non accade e la sfera S2, il cui fibrato e quadridimensionale, e sul quale quindinon ci avventuriamo.

(44) I Geometri hanno inventato la parola ‘trivializzazione’ per questa operazione. Povero Manzoni...

37

relazioni (1.16) e (1.17) siano identicamente verificate. C’e? Sı, c’e, ed e abbastanzasemplice, se ci pensate:

x = R cosϑ, y = R senϑ, x = −Rϑ senϑ, y = Rϑ cosϑ,

oppure, se preferite non vedere “derivate rispetto al tempo”,

x = R cos a, y = R sen a, u = −Rb sen a, v = Rb cos a.

Che x2 + y2 = R2 ci crediamo; poi evidentemente

xu+ yv = −R2b sen a cos a+R2b cos a sen a = 0 (45).

Quindi, con questa scelta dei parametri (ϑ, ϑ) le relazioni sono identicamente verificate,

percio per ogni ϑ si puo scegliere il ϑ che si vuole, e un ϑ puo aversi in corrispondenza diogni ϑ. C’e pero un problema di carte quando ci avviciniamo a 2π, ma questo non ci fa necaldo ne freddo: sappiamo anzi che ci possono essere varie carte per la stessa varieta, e chequello che conta e che si sovrappongano bene (46). Infine, sappiamo anche che dobbiamoidentificare angoli che differiscano di 2π perche questo e nella definizione di angolo, e quinditroviamo la struttura (globale) di cilindro per TS1.

Il fibrato tangente (e un fibrato in generale) gode di un’altra proprieta molto importante:in una qualsiasi carta locale lo si puo rappresentare come un prodotto cartesiano (non euna cosa gratis, visto che gli spazi tangenti sono centrati su punti diversi). Questo e unaltro modo di dire che si possono usare le coordinate (q, q): non serve una carta appostaper le velocita dopo che si e scelta quella per le configurazioni.

Torniamo quindi al nostro problema. L’energia cinetica, l’abbiamo capito, e definita suTM ed e rappresentata, nelle coordinate locali (q, q), da una funzione scalare K(q, q).L’espressione delle τi, data dal teorema (1.8), si puo ora giustificare rigorosamente sosti-tuendo all’espressione della funzione t 7→ vs(t) la corrispondente funzione in Tc(t)M data daq 7→ (grad cs)q (47), oppure la dipendenza della stessa tramite le q, quando serve derivarerispetto alle qi.

1.8. Energia cinetica di un sistema olonomo

Fibrato o non fibrato, l’energia cinetica e importante. E allora vediamo se possiamodire qualcosa di piu su questa quantita, vista come funzione delle qi, delle qi e del tempo.In effetti la dipendenza delle velocita dalle qi, che discende dall’espressione (1.1), e quindi

(45) Bella forza, direte voi: hai scritto le equazioni parametriche della circonferenza e poi nei hai fattole derivate rispetto al tempo! Ecco, e proprio qui il punto: la struttura di fibrato tangente “nasce” condelle derivate temporali, ma poi esse diventano delle variabili qualunque.

(46) Potremmo usare delle coordinate ben diverse: per esempio r, s con le posizioni

x = R cos e3s, y = R sen e3s, u = −3Rre3s sen e3s, v = 3Rre3s cos e3s.

Controllate che le (1.16) e (1.17) sono identicamente verificate. Riuscite a vedere come le ho “inventate”?

(47) E la solita espressionen∑i=1

∂cs∂qi

qi

scritta in forma compatta.

38

dalle cs, non lascia molto spazio: la forma delle funzioni cs puo essere complicatissima, enon ci aspettiamo certo che derivando migliori.

Invece, la dipendenza della velocita dalle qi e speciale: e lineare, come abbiamo vistofino alla nausea nello scorso paragrafo. Siccome ci immaginiamo che, anche su un fibrato,il quadrato di una cosa lineare sia quadratica, siamo portati a pensare che la dipendenzadella funzione energia cinetica K sia quadratica nelle qi.

Allora vediamo. Il punto di partenza e sempre la (1.2)

vs =n∑i=1

∂cs∂qi

qi +∂cs∂t

.

Dobbiamo calcolare

K =N∑s=1

1

2msvs · vs =

N∑s=1

1

2ms

(n∑i=1

∂cs∂qi

qi +∂cs∂t

(n∑j=1

∂cs∂qj

qj +∂cs∂t

).

Sviluppando le sommatorie e ricordando che gli indici sono muti troviamo

K =N∑s=1

1

2ms

[n∑

i,j=1

∂cs∂qi· ∂cs∂qj

qiqj + 2n∑i=1

∂cs∂qi· ∂cs∂t

+∂cs∂t· ∂cs∂t

]e portando gli ms dentro le sommatorie in i, j e infine scambiandole troviamo

(1.18) K =1

2

n∑i,j=1

Kij qiqj +n∑i=1

K0iqi +1

2K00 =

1

2q · Kq + k · q +

1

2K00

dove abbiamo posto

Kij = (K)ij =N∑s=1

ms∂cs∂qi·∂cs∂qj

, K0i = (k)i =N∑s=1

∂cs∂qi·∂cs∂t

, K00 =N∑s=1

∂cs∂t·∂cs∂t

(48).

(48) Facciamo un piacere anche a chi detesta gli indici: invece di avere le N velocita in E3, indichiamocon v il vettore di E3N di 3N componenti v11, v12, v13, v21, . . . , vN1, vN2, vN3 (in pratica sono le coordinatecartesiane degli N vettori in fila) e indichiamo con c la stessa cosa per le posizioni. Allora la precedenterelazione si scrive

v = (∇c)q +∂c

∂tdove il prodotto tra ∇c e q e il prodotto righe per colonne. Date poi le N masse ms dei punti P1, . . . , PN ,inventiamo un prodotto scalare

a� b =

N∑s=1

√msas ·

√msbs

Ne segue che l’energia cinetica e data da

K =1

2v� v =

1

2

[(∇c)q +

∂c

∂t

]�[(∇c)q +

∂c

∂t

]=

=1

2(∇c)q� (∇c)q + (∇c)q� ∂c

∂t+

1

2

∂c

∂t� ∂c

∂t=

=1

2q ·[(∇c)

T � (∇c)]q +

[(∇c)

T � ∂c

∂t

]· q +

1

2

∂c

∂t� ∂c

∂t

=1

2q · Kq + k · q +

1

2K00

39

Abbiamo cosı (quasi) dimostrato il

Teorema 1.10. L’energia cinetica di un sistema olonomo si esprime come la somma di unaforma quadratica definita positiva nelle q, di una forma lineare nelle q e di una funzioneche non dipende dalle q. In caso di vincoli esterni non dipendenti dal tempo, gli ultimi dueaddendi sono nulli.

Dimostrazione. La (1.18) dice gia quasi tutto. Bisogna osservare che la matrice della formaquadratica K e simmetrica, ma evidentemente

Kij =N∑s=1

ms∂cs∂qi· ∂cs∂qj

= Kji.

Che inoltre gli ultimi due addendi siano nulli in caso di vincoli fissi e ovvio perche solo essicontengono le ∂cs/∂t. Resta da vedere che la forma K e definita positiva. Esaminiamoprima il caso in cui i vincoli sono fissi. Allora intanto

0 6 K =1

2q · Kq

perche l’energia cinetica non puo essere negativa. Se poi K = 0, dalla definizione di K siha vs = 0 per ogni s, e quindi, per l’indipendenza delle coordinate qi, si deve avere qi = 0per ogni i = 1, . . . , n (49).

dove abbiamo posto

K = (∇c)T � (∇c), cioe Kij = Kij =

N∑s=1

ms∂cs∂qi· ∂cs∂qj

,

k = (∇c)T � ∂c

∂t, cioe ki =

N∑s=1

ms∂cs∂qi· ∂cs∂t

,

K00 =∂c

∂t� ∂c

∂t=

N∑s=1

ms∂cs∂t· ∂cs∂t

e dove abbiamo inteso che il � tra matrici significa la moltiplicazione per√ms e la somma su s. Non e il

massimo della bellezza, ma ritroviamo la (1.18) senza sommatorie.Volendo la bellezza bisogna essere ancora piu compatti, ponendo q0 = t e convenire che t = 1. Allora la

(1.2) si scrive, ponendo q = (q0, q1, . . . , qn),

v = ∇c (il ∇ comprende anche la derivazione rispetto a t)

e quindi

K =1

2˙q · K ˙q =

1

2˙q · (∇c

T� ∇c) ˙q =

n∑i,j=0

ms∂cs∂qi· ∂cs∂qj

qiqj (attenzione che i, j partono da zero).

(49) Ci sono, a dire il vero, pochi casi estremamente degeneri, da un punto di vista matematico e nonfisico, nei quali K e semidefinita positiva. Il piu complicato, se cosı si puo dire, e quello dei punti di un’astache ruota attorno alla retta che la contiene (i fisici si turino le orecchie). In questo caso le velocita dei punti

sono nulle, anche se la velocita angolare ϑ e non nulla (ammesso che questo possa avere un senso). Il piudegenere e quello di un punto che ruota su se stesso, per il quale la velocita e nulla senza che si annullino(vedi sopra) ϑ e ϕ. Il trucco sta nel fatto che la massa c’e ma non contribuisce all’inerzia: la sola piccoladignita di questi esempi sta nel fatto che essi sono limiti dell’energia cinetica di qualche corpo continuo altendere a zero del raggio. Nel seguito ignoreremo questi casi e diremo che K e ‘sempre’ definita positiva.

40

Osserviamo ora che se K non dipende da una qk, allora la corrispondente qk non e unacoordinata lagrangiana. Infatti, essendo

K =s∑s=1

1

2msvs · vs

bisogna che per ogni s si abbia∂vs∂qk

= 0.

Ma, dalla (1.9) segue allora che cs non dipende da qk per ogni s, e quindi qk non e coordinatalagrangiana.

Vediamo ora il caso di vincoli esterni mobili, e supponiamo che K non sia definita positiva.Per quanto detto, e per il fatto che K e simmetrica, possiamo diagonalizzarla, per cui, perdelle nuove coordinate φi si ridurra a

K =n∑i=1

λi(φ, t)φ2i +

n∑i=1

H0i(φ, t)φi +1

2H00(φ, t)

dove H0k, (k = 0, . . . , n) sono delle funzioni regolari delle nuove coordinate φi e del tempo.Ora, se, fissato q (e quindi fissato φ) e in un dato istante, uno degli autovalori λk e

strettamente negativo, prendendo la corrispondente φk abbastanza grande si troverebbeK < 0 in quell’istante, il che e assurdo.

Se invece, sempre per un fissato φ e in un dato istante si ha λk = 0, prendiamo intantotutti i φj = 0 con j 6= k. Ne segue che

K = H0k(φ, t)φk +H00(φ, t).

A questo punto, se H0k(φ, t) 6= 0, e sempre possibile trovare φ in modo che K < 0, dato

che H00(φ, t) non dipende dalle φ, mentre se H0k(φ, t) = 0 si ha che K non dipende da

φk, e dunque φk non e una coordinata lagrangiana. Del resto la trasformazione q 7→ φe invertibile, quindi anche le φj sono coordinate lagrangiane, ma esse devono essere nellostesso numero delle q. Questo e assurdo e quindi λj > 0 per ogni j, dunque K e definitapositiva.�

Ancora piu importante del teorema appena visto e il fatto che il determinante dellaforma quadratica K e strettamente positivo:

detK > 0.

Ma ancora piu importante di questo e che quindi

Teorema 1.11. La trasformazione associata alla forma quadratica dell’energia cinetica diun sistema olonomo e invertibile.

Nell’esempio dell’asta con un estremo vincolato a una retta, l’energia cinetica e ridottaalla sola forma quadratica (1.14)

K = mx2 − 2mlxϕ senϕ+ 2ml2ϕ2.

Pertanto

K11 = 2m, K12 = −2ml senϕ, K22 = 4ml2

41

cosicche la matrice della trasformazione K e data da[2m −2ml senϕ

−2ml senϕ 4ml2

].

Questa matrice e invertibile e si ha detK = 4m2l2(2 − sen2 ϕ) > 0. Infine, il polinomiocaratteristico della trasformazione K e

λ2 − 2m(1 + 2l2)λ+ 4m2l2(2− sen2 ϕ) = 0,

che ammette per soluzioni i valori (reali positivi)

λ1,2 = m(1 + 2l2)±m√

4l4 − 4l2 cos2 ϕ+ 1 (50).

Teorema 1.12. Lungo il moto t 7→ q(t) di un sistema olonomo, le componenti lagrangianedell’accelerazione sono date da

τi(t) =n∑j=1

Kij(t)qj(t) +Hi(t)

oppure, in notazione compatta,

τ (t) = K(t)q(t) + H(t)

dove Hj (o H) dipendono dal tempo attraverso solo esplicitamente o attraverso le q, q.

Dimostrazione. Abbiamo, omettendo (dove serve) la dipendenza dal tempo),

(1.19)∂K

∂qi=

n∑j=1

Kij qj +K0i,

oppure, in forma compatta,∂K

∂q= Kq + k

in quanto, derivando l’espressione

1

2

n∑i,j=1

Kij qiqj

rispetto a qh, vi sono due monomi nei quali compare il qh: una volta se i = h e l’altravolta se j = h. I rispettivi coefficienti nella somma sono simmetrici rispetto allo scambiodi indici, per cui ne escono due uguali, che si mangiano pertanto l’1/2 (51)

(50) Siccome − cos2 ϕ > −1, si ha

|m√

4l4 − 4l2 cos2 ϕ+ 1| > m√

4l4 − 4l2 + 1 = m(2l2 − 1)

e quindi λ1 > 4ml2 > 0. L’altro autovalore e ovviamente positivo.

(51) Con la notazione compatta e piu semplice. Dobbiamo calcolare il gradiente (rispetto a q) dellaparte quadratica dell’energia cinetica. Siccome K e simmetrica, essa coincide con la sua trasposta, e quindi

K (x + h) · (x + h)− Kx · x = Kh · x + Kx · h = (Kx + KT x) · h = 2Kx · hper cui per definizione di gradiente

1

2∇q(Kq · q) = Kq.

42

Pertantod

dt

∂K

∂qi=

n∑j=1

Kij qj +n∑j=1

Kij qj + K0i = Kq + Kq + k

e quindi

τi =n∑j=1

Kij qj +n∑j=1

Kij qj + K0i −∂K

∂qi.

Poi abbiamo che ∂K/∂qi e K0i non contengono derivate seconde delle q, e dunque la tesisegue ponendo

Hi =n∑j=1

Kij qj + K0i −∂K

∂qi

oppure

H = Kq + k− ∂K

∂q.�

Corollario 1.13. Il sistema di equazioni differenziali del moto di un sistema olonomosi puo sempre porre in forma normale, ossia ricavare le derivate seconde delle funzioniincognite rispetto alle derivate di ordine inferiore.

Dimostrazione. Grazie al precedente teorema e alla seconda forma delle equazioni di La-grange, il moto del sistema deve verificare il sistema

K(q)q + H(q,q) = Q(q,q).

Dunque, siccome K e invertibile, il sistema diviene

q = K−1(q)(Q−H)(q,q).�

Nell’esempio precedente, la matrice K era invertibile, e quindi il sistema (1.15) si puoricavare rispetto alle x, ϕ, ottenendo

x =2l cosϕϕ2 + g cosϕ senϕ

2− sen2 ϕ

ϕ =cosϕ senϕ

(2− sen2 ϕ)ϕ2 − g

l

cosϕ

2 sen2 ϕ.

A proposito dell’energia cinetica, qualcuno di voi forse ricordera che c’e un teorema cheporta questo nome. Esiste un equivalente del teorema dell’energia cinetica in MeccanicaAnalitica? Deve esserci, perche siamo tutto sommato in un sottocaso della Meccanica.Infatti vediamo nelle prossime formule che succede.

Dapprima prendiamo una qualunque funzione regolare t 7→ q(t) e calcoliamo la derivatadell’energia cinetica lungo il moto:

dK

dt=

n∑i=1

(∂K

∂qiqi +

∂K

∂qiqi

)+∂K

∂t;

Per chi ama le sommatorie, invece, suona cosı:

∂qh(Kij qiqj) = Kij

∂qi∂qh

qj +Kij qi∂qj∂qh

= Kijδihqj +Kij qiδjh = Khj qj +Kihqi = Khiqi +Khiqi = 2Khiqi.

(Nel primo addendo dell’ultimo passaggio abbiamo usato il fatto che l’indice j e muto e l’abbiamotrasformato in i).

43

poi applichiamo la solita regola della derivata del prodotto e troviamo

(1.20)

dK

dt=

n∑i=1

[∂K

∂qiqi −

d

dt

∂K

∂qiqi +

d

dt

(∂K

∂qiqi

)]+∂K

∂t=

=n∑i=1

[(∂K

∂qi− d

dt

∂K

∂qi

)qi +

d

dt

(∂K

∂qiqi

)]+∂K

∂t.

Usando ora la (1.19), osserviamo che

n∑i=1

∂K

∂qiqi =

n∑i,j=1

Kij qiqj +n∑i=1

K0iqi.

Se ci mettiamo ora nel caso in cui i vincoli siano fissi, abbiamo che ∂K/∂t = 0 e chel’ultimo termine a secondo membro e nullo e che l’energia cinetica consiste della sola formaquadratica. Quindi

n∑i=1

∂K

∂qiqi =

n∑i,j=1

Kij qiqj = 2K.

Risostituendo nella (1.20) e accorpando i termini troviamo

(1.21)dK

dt=

n∑i=1

(d

dt

∂K

∂qi− ∂K

∂qi

)qi =

n∑i=1

τiqi = τ · q.

Se ora t 7→ q(t) e un moto possibile del sistema, allora, per la prima forma delle equazionidi Lagrange, abbiamo

dK

dt=

n∑i=1

Qi(t)qi(t) = Q(t) · q(t).

e abbiamo (ri)dimostrato il

Teorema 1.14 (dell’energia cinetica, versione analitica). In un sistema olonomo soggetto

44

a vincoli fissi (52), (53) lungo una soluzione del problema del moto si ha

(1.23)dK

dt(t) =

n∑i=1

Qi(t)qi(t) = Q(t) · q(t).

Grande novita? Stavolta no: guardiamo piu da vicino il secondo membro. Se sostituiamoalle Qi le loro espressioni (1.6), troviamo

n∑i=1

Qi(t)qi(t) =n∑i=1

N∑s=1

F s ·∂cs∂qi

qi

e se ricordiamo la definizione di velocita virtuale (1.3) e che, siccome i vincoli sono fissi,essa coincide in questo caso con la velocita reale, abbiamo

n∑i=1

Qi(t)qi(t) =N∑s=1

F s ·N∑s=1

∂cs∂qi

qi =N∑s=1

F s · vs = P{F }(v)

cioe la potenza reale spesa dalle forze lungo il moto, come recita il teorema generaledell’energia cinetica.

1.9. Equazioni di Lagrange, forma finale

Sebbene la seconda forma delle equazioni di Lagrange sia per certi versi la piu generale,nella maggior parte dei casi questo nome e riservato ad un loro sottocaso, comunque ab-bastanza importante. In pratica, si tratta delle forze conservative: in realta, c’e qualcosadi piu ma poco di piu.

Definizione 1.15. Un campo di forze Q si dice ammettere un potenziale generalizzato seesiste una funzione (q, q) 7→ U(q, q, t) tale che lungo ogni possibile moto t 7→ q(t) si abbia

(1.24) Qi(t) = − d

dt

∂U

∂qi(t) +

∂U

∂qi(t)

(52) I vincoli sono gia lisci per ipotesi.

(53) Si potrebbe anche rinunciare a questa ipotesi. Ponendo

K = K2 +K1 +K0

(intendendo cioe che K2 e la parte quadratica in q, K1 quella lineare e K0 quella indipendente da q),ripercorrendo il calcolo che abbiamo fatto avremmo trovato

n∑i=1

∂K

∂qiqi =

n∑i,j=1

Kij qiqj +

n∑i=0

K0iqi = 2K2 +K1.

Allora risulterad

dt(K2 +K1 +K0) = −τ · q +

d

dt(2K2 +K1)

e quindi in definitiva lungo una soluzione

(1.22)d

dt(K2 −K0)(t) = Q(t) · q(t).

45

(Oppure, in forma compatta,

Q(t) = − d

dt

∂L

∂q(t) +

∂L

∂q(t).

Nel caso in cui U non dipenda dalle qi, U si dice semplicemente potenziale.

Sembra una cosa fatta apposta per qualcos’altro, no? E infatti

Teorema 1.16 (Terza forma delle equazioni di Lagrange). Se un campo di forze ammetteun potenziale generalizzato U , allora, posto L = K +U , si ha che la condizione necessariae sufficiente perche t 7→ q(t) sia un moto e

(1.25)d

dt

∂L

∂qi− ∂L

∂qi= 0 (i = 1, . . . , n),

oppure, in forma compatta,d

dt

∂L

∂q− ∂L

∂q= 0.

Dimostrazione. Se il campo di forze ammette un potenziale generalizzato, allora, se t 7→ q(t)e una funzione regolare del tempo, si ha

Qi(t) = − d

dt

∂U

∂qi+∂U

∂qi

e dunque, lungo questo moto, la seconda forma delle equazioni di Lagrange si riduce alle(1.25). Viceversa, se un moto verifica le (1.25), allora, essendo L = K + U , esso verifica leequazioni (1.13), con Q(t) dato dalla (1.24).�

La funzione(q, q, t) 7→ L(q, q, t) = K(q, q, t) + U(q, q, t)

si dice funzione di Lagrange o Lagrangiana del sistema olonomo.Perche abbiamo chiamato “potenziale” il potenziale generalizzato quando questo non

dipende dalle q? Chiaramente ci deve essere un legame con il potenziale della MeccanicaRazionale, e infatti e cosı: se l’s-esima forza F s ammette potenziale Us, funzione delleposizioni x1, . . . ,xN , (e non del tempo) allora dalla (1.6)

Qi =N∑s=1

F s ·∂cs∂qi

=N∑s=1

gradUs ·∂cs∂qi

=N∑s=1

∂qiUs(x1(q), . . . ,xN(q)) =

∂qi

N∑s=1

Us.

Pertanto, se tutte le forze attive sono conservative, il potenziale e dato dalla somma deipotenziali delle forze attive, espressi in termini delle coordinate lagrangiane (54).

Che dire del potenziale generalizzato? Questo sembra una novita: anche se avevamolasciato la possibilita, nella prima parte, che U dipendesse da x, ecc, avevamo solo richiestoche Fi = ∂U/∂xi, mentre qui l’espressione e piu complicata.

(54) Anche qui c’e un piccolo abuso di notazione: la funzione Us e funzione delle xs (s = 1, . . . , N),mentre le Us che vanno sommate sono quelle nelle quali le xs sono espresse in termini delle qi, quindi,secondo le nostre notazioni, sarebbe

U =

n∑s=1

Us ◦ c.

46

La cosa interessante e che la dipendenza di U dalle qi non puo essere arbitraria. Infattinon dimentichiamo che le Qi possono contenere solo le derivate al piu di primo ordinedelle qi. Siccome nella definizione (1.24) c’e la derivata rispetto al tempo, dobbiamo stareattenti. Vediamo.

Supponiamo che la U sia una funzione arbitraria delle q e cerchiamo di calcolare le Qi.Allora ∂U/∂qj sara funzione di q, q e t, e quindi

Qi = − d

dt

∂U

∂qi+∂U

∂qi= −

n∑j=1

(∂2U

∂qj∂qiqj +

∂2U

∂qj∂qiqj

)− ∂2U

∂t∂qi+∂U

∂qi

e siccome non si deve avere la dipendenza dalle derivate seconde qj, si deve avere

∂2U

∂qj∂qi= 0 (i, j = 1, . . . , n).

Ma allora c’e poco da fare: U deve essere una funzione lineare delle q. Pertanto devonoesistere due funzioni, una vettoriale U e una scalare U0, di q e t, tali che

U(q, q, t) =n∑j=1

Uj(q, t)qj + U0(q, t) = U(q, t) · q + U0(q, t).

Torniamo allora alle Qi. Dalla relazione appena scritta abbiamo, omettendo le dipendenze,

∂U

∂qi= Ui,

∂2U

∂qj∂qi=∂Ui∂qj

,∂2U

∂t∂qi=∂Ui∂t

∂U

∂qi=

n∑j=1

∂Uj∂qi

qj +∂U0

∂qi,

per cui in definitiva

Qi = −n∑j=1

∂2U

∂qj∂qiqj −

∂2U

∂t∂qi+∂U

∂qi= −

n∑j=1

∂Ui∂qj

qj +n∑j=1

∂Uj∂qi

qj −∂Ui∂t

+∂U0

∂qi

e ponendo finalmente

Uij =∂Uj∂qi− ∂Ui∂qj

= −Uji

possiamo scrivere

Qi =n∑i,j

Uij qj −∂Ui∂t

+∂U0

∂qi

oppure, in forma compatta,

(1.26) Q = Uq +∂U0

∂q− ∂U

∂t(55).

(55) Volendo le formule belle, posto q0 = t e t = 1, la precedente formula si scrive

Q = U ˙q

con U antisimmetrica (naturalmente abbiamo posto

U0i =∂U0

∂qi, Ui0 =

∂Ui∂q0

=∂Ui∂t

, U00 =∂U0

∂q0=∂U0

∂t

).

47

Quale puo essere una forza che ammette potenziale generalizzato? La forza di Lorentz euna di queste: essa e data da, in coordinate cartesiane, da

F = ev×B

doveB e un campo vettoriale costante dato ed e e una costante (non 2.718..., i Fisici hannocapito). Mostriamo che in questo caso, riferendoci a coordinate cartesiane come coordinatelagrangiane, cioe x1, x2, x3, x1, x2, x3, il potenziale generalizzato e dato da

U(x, x) =1

2e x×B · x =

1

2e x ·B×x =

1

2eB×x · x.

Siccome le coordinate sono cartesiane, le Qi non sono altro che le Fi, ossia Q = F , e poidall’ultima delle relazioni scritte segue

∂U

∂x=

1

2eB×x,

mentre dalla prima∂U

∂x=

1

2e x×B.

Quindi, dato che B e costante,d

dt

∂U

∂x=

1

2eB× x

e infine

− d

dt

∂U

∂x+∂U

∂x=

1

2e x×B +

1

2e x×B = F .

E facile constatare che la matrice U non e altro che la parte antisimmetrica di B ⊗ x (56).

Se le forze ammettono potenziale generalizzato, la potenza che abbiamo calcolato pocosopra diventa molto semplice. Infatti, dalla (1.26) troviamo facilmente

Q · q = Uq · q +∂U0

∂q· q− ∂U

∂t· q

e, ricordando che la matrice e antisimmetrica, abbiamo

Uq · q = q · UTq = −q · Uq

e quindi Uq · q = 0. Quindi giungiamo a

Q · q =

(∂U0

∂q− ∂U

∂t

)· q.

(56) Dati due vettori ~a,~b ∈ R3, si definisce prodotto tensoriale o diadico o diade dei due la trasformazionelineare tale che

(~a⊗~b)~c = (~b · ~c)~a.Questa definizione si estende, ovviamente, ai vettori applicati, e si verifica in componenti senza difficolta

che (a⊗ b)T = b⊗ a e che

(a⊗ b− b⊗ a)c = a× b · c.

48

Pertanto, combinando questo risultato col teorema dell’energia cinetica (1.14), troviamoche lungo un moto possibile si ha

dK

dt=∂U0

∂q· q− ∂U

∂t· q.

Ora, poichedU0

dt=∂U0

∂q· q +

∂U0

∂t,

abbiamo anche

(1.27)dK

dt=dU0

dt− ∂U0

∂t− ∂U

∂t· q.(57)

Se ora U0 e U non dipendono esplicitamente dal tempo (e quindi dipendono solo dalleq), troviamo

dK

dt=dU0

dte ritroviamo il

Teorema 1.17 (dell’energia meccanica totale, versione analitica). In un sistema olonomosoggetto a vincoli fissi (58) e forze dipendenti da un potenziale generalizzato indipendentidal tempo (59) , lungo una soluzione del problema del moto si ha, posto E = K − U0,

dE

dt(t) = 0. (60)

(57) Con le notazioni “belle” la (1.27) si scrive

d

dt(K − U0) = −∂U

∂t· ˙q

avendo posto U = (U0,U).

(58) I vincoli sono gia lisci per ipotesi.

(59) Volendo invece “tirare” anche sulle forze dipendenti dal tempo, potremmo scrivere

∂U

∂t· q =

d

dt

(∂U

∂t· q)− d

dt

(∂U

∂t

)· q.

Siccome poi

d

dt

(∂U

∂t

)· q =

n∑i,j=1

∂2Ui∂qj∂t

qiqj +∂2U

∂t2· q

avremmo

d

dt

(E +

∂U

∂t· q)

=

n∑i,j=1

∂2Ui∂qj∂t

qiqj +∂2U

∂t2· q− ∂U0

∂t.

A questo punto, pero, i casi non molto particolari (nei quali il secondo membro e zero) non sono molti: se

∂2Ui∂qj∂t

= 0,∂2U

∂t2= 0

allora U = Cq + ct, e a questo punto ∂U/∂t = c = cost., e quindi l’energia aggiunge un semplice terminelineare in q.

49

Questo teorema e un po’ piu forte del suo omologo meccanico in quanto ammette ancheforze che possiedono un potenziale generalizzato (61). Fate comunque attenzione che quelloche si conserva non e l’energia corrispondente al potenziale generalizzato, ma quella checontiene il potenziale ordinario U0. Soltanto, il teorema dice che questo e vero anche seci sono altre forze. In compenso, sappiamo adesso, per esempio, che le forze viscose nonammettono nemmeno un potenziale generalizzato, perche se cosı fosse, la loro potenzaspesa sarebbe nulla, e noi sappiamo che per definizione non e cosı.

1.10. Integrali primi

Definizione 1.18. Una funzione G : Rn×Rn×R→ R (rispettivamente G : Rn×Rn×R→E3) si dice un integrale primo di un moto t 7→ q(t) di un sistema olonomo se la funzione

t 7→ G(q(t), q(t), t) (risp. t 7→ G(q(t), q(t), t))

e costante.

d

d

dx

dt

2

2

2

2

Figura 24. Integrali primi, derivate seconde.

(60) Volendo continuare a tenere l’ipotesi di vincoli mobili (pero escludendo forze dipendenti dal tempo,cosicche ∂U/∂t = 0 e ∂U0/∂t = 0), la (1.22) e la (1.26) forniscono

d

dt(K2 −K0) =

dU0

dt,

ossiad

dt(K2 −K0 − U0) = 0.

(61) Non e un gran risultato in piu, comunque: l’esempio della forza di Lorentz e banale perche essa spen-de potenza nulla sul moto reale, in quanto qv×B ·v = 0, e quindi la sua potenza si poteva tranquillamentelasciare a secondo membro perche e zero. E proprio il caso di dire “bella forza!”.

50

Dunque un integrale primo e una quantita che si conserva durante il moto. Il suo valore,in generale, e noto a partire dalle condizioni iniziali. Un esempio appena visto e l’energiatotale, nel caso valga il teorema che porta questo nome. Esempi vettoriali sono la quantitadi moto e il momento della quantita di moto, naturalmente quando si conservano (62).

Se la funzione G e derivabile, come accade sempre nelle nostre applicazioni, allora G eun integrale primo se e solo se

dG

dt= 0.

La ricerca di integrali primi e uno degli sport piu diffusi fra i Meccanici Analitici. Essiaiutano a risolvere le equazioni del moto e illuminano molte caratteristiche del sistemafisico soggiacente. Unico difetto: non c’e un metodo sicuro per determinarli.

Vediamo comunque cosa si puo trarre dalle equazioni di Lagrange, cominciando con unadefinizione.

Definizione 1.19. Si dice momento cinetico associato alla variabile qk la quantita

pk =∂L

∂qk.

Teorema 1.20. Supponiamo che la lagrangiana di un sistema olonomo non dipenda dauna coordinata qk. Allora il corrispondente momento cinetico e un integrale primo.

Dimostrazione. Basta osservare che la k-esima equazione di Lagrange si scrive

dpkdt

=∂L

∂qk= 0.�

Per esempio, nel nostro pendolo che scorre sulla retta orizzontale, l’energia cinetica, datadalla (1.14)

K = mx2 − 2mlxϕ senϕ+ 2ml2ϕ2

e il potenziale della forza peso e dato da

U = −mgyQ = 2mgl senϕ

per cui la lagrangiana del sistema e

L = mx2 − 2mlxϕ senϕ+ 2ml2ϕ2 + 2mgl senϕ

che e, come potete constatare, indipendente da x. Ne segue che la quantita

px =∂L

∂x= 2mx− 2mlϕ senϕ

e costante lungo il moto.Cosa significa questo integrale primo? Semplice: il sistema e soggetto alla sola forza

peso, che e verticale, e alla reazione vincolare della retta, che e pure verticale. Ne segueche si conserva la componente orizzontale della quantita di moto totale del sistema, cheper il teorema della quantita di moto e pari a

MvG · e1 = 2md

dt(xG) = 2m

d

dt(x+ l cosϕ) = 2m(x− lϕ senϕ),

ossia proprio l’integrale primo che abbiamo ottenuto.

(62) Il caso tuttavia piu frequente e che si conservino solo alcune componenti di questi vettori.

51

La presenza di integrali primi permette di semplificare, in generale, le equazioni del moto.Vediamo nel nostro esempio come cio avvenga. Scriviamo la conservazione che abbiamotrovato nella forma

(1.28) 2mx− 2mlϕ senϕ = px.

Ora, siccome il vincolo esterno e fisso e la forza conservativa, c’e un altro integrale primo:l’energia totale. Essa e data da

K − U = mx2 − 2mlxϕ senϕ+ 2ml2ϕ2 −mgl senϕ = E

Ricavando ora x dalla (1.28) e sostituendo nella relazione qui sopra, con qualche piccolopassaggio si trova

(1.29) ml2(2− sen2 ϕ)ϕ2 −mgl senϕ = E − p2x

4m.

A questo punto tutto e in discesa: ragionando come abbiamo fatto per il pendolo semplice,trasformiamo questa relazione in

(2− sen2 ϕ)ϕ2 =g

l

(E

mgl− p2

x

4m2gl+ senϕ

)e quindi analizzare il problema finale

ϕ2 =g

l

(E

mgl− p2

x

4m2gl+ senϕ

)/(2− sen2 ϕ)

col metodo di Weierstrass (63).Qual e il significato fisico di questi “momenti”. In alcuni casi essi sono quantita di moto,

mentre in altri casi sono momenti della quantita di moto. Nel nostro esempio, abbiamovisto che px era la componente lungo e1 della quantita di moto totale del sistema.

(63) Siccome 2− sen2 ϕ > 0, e comunque abbastanza facile: fissati dei valori ammissibili di E e px (quici vorrebbe una nota nella nota—vedi alla fine) e simile a quello di un punto con potenziale

U =g

l

1

(2− sen2 ϕ)

(senϕ+

E

mgl− p2x

4m2gl

).

Ora, siccome il denominatore e positivo, il moto sara confinato se il numeratore si annulla nell’intervallo]− π, π[ e progressivo altrimenti, col solito caso asintotico se

E

mgl− p2x

4m2gl= 1.

Osserviamo infine che, perche il moto abbia senso, il potenziale deve essere positivo per almeno qualcheϕ, e questo implica

E >p2x4m−mgl.

52

1.11. Il principio di minima azione

Se per un verso le equazioni di Lagrange nella seconda forma sono le piu utili e generali,quelle nella terza forma sono le piu belle, in virtu di un risultato veramente affascinante.Esso dice che, con opportune ipotesi che analizzeremo fra un attimo, la traiettoria “vera”del moto rende minima una certa quantita scalare, definita in modo molto semplice. Manon anticipiamo.

Definizione 1.21. Dati una funzione regolare t 7→ q(t) e un intervallo [t0, t1] ⊆ R, sidefinisce azione lagrangiana nell’intervallo la quantita scalare

SL[q] =

∫ t1

t0

L(q(t), q(t), t) dt.

Con lo stesso nome si chiama l’applicazione SL : q 7→ SL[q], che assegna ad ogni funzioneregolare t 7→ q(t) il valore SL[q].

Siccome di solito in Matematica un’applicazione che associa ad ogni funzione uno scalaresi chiama funzionale, diremo che SL e il funzionale di azione lagrangiana.

Un primo risultato interessante e il seguente.

Teorema 1.22 (Principio dell’azione stazionaria). Siano dati q0,q1 ∈ Rn. Una funzionedi classe C2 t 7→ q(t) tale che q(t0) = q0 e q(t1) = q1 e una soluzione delle equazioni diLagrange se e solo se

d

dsSL[q + sη]|s=0 = 0

per ogni funzione η : [t0, t1]→ Rn di classe C2 tale che η(t0) = η(t1) = 0.

Cosa significa? Questo: siccome η fa zero negli istanti t0 e t1, la funzione t 7→ q + sηvale q0 in t0 e q1 in t1 esattamente come la funzione t 7→ q(t). Quindi il teorema affermache l’azione e “quasi costante” (questo e il senso dell’avere derivata nulla) quando il motoe quello vero, rispetto a tutte le variazioni del moto che mantengano fissi i valori all’istanteiniziale e finale.Dimostrazione. Intanto abbiamo, su qualunque moto regolare,

d

dsSL[q + sη] =

∫ t1

t0

n∑i=1

(∂L

∂qiηi +

∂L

∂qiηi

)dt,

dove L(q, q, t,η, s) = L(q + sη, q + sη, t). Adesso, per il solito trucco,

∂L

∂qiηi =

d

dt

(∂L

∂qiηi

)− d

dt

∂L

∂qiηi

per cui

d

dsSL[q + sη] =

∫ t1

t0

n∑i=1

(∂L

∂qiηi −

d

dt

∂L

∂qiηi

)dt+

∂L

∂qiηi

∣∣∣∣∣t1

t0

53

e quindi, usando stavolta il fatto che q(t0) = q0 e q(t1) = q1 implica che η(t0) = 0 eη(t1) = 0 per ogni i = 1, . . . n, troviamo

d

dsSL[q + sη] =

∫ t1

t0

n∑i=1

(∂L

∂qiηi −

d

dt

∂L

∂qiηi

)dt =

∫ t1

t0

n∑i=1

(∂L

∂qi− d

dt

∂L

∂qi

)ηi dt.

Ponendo ora s = 0 troviamo che ∂L(q, q, t,η, 0)/∂ξ = ∂L/∂ξ, per cui infine

d

dsSL[q + sη]|s=0 =

∫ t1

t0

n∑i=1

(∂L

∂qi− d

dt

∂L

∂qi

)ηi dt.

A questo punto, se t 7→ q(t) verifica le equazioni di Lagrange, e ovvio che il secondo membroe nullo per ogni scelta delle funzioni ηi.

Viceversa, supponiamo che

(1.30)d

dsSL[q + sη]|s=0 = 0

per ogni ηi come nella tesi e per assurdo supponiamo che esistano τ ∈]t0, t1[ e k ∈ N(1 6 k 6 n) tali che, per esempio,

∂L

∂qk(τ)− d

dt

∂L

∂qk(τ) > 0.

Siccome t 7→ qk(t) e di classe C2, l’espressione appena scritta e continua e quindi, per ilteorema di permanenza del segno, esiste δ > 0 tale che per ogni t ∈]τ − δ, τ + δ[

∂L

∂qk(t)− d

dt

∂L

∂qk(t) > 0.

Figura 25. Grafico della funzione ηk.

Consideriamo a questo punto la funzione

(1.31) ηk(t) =

{(|t− τ |2 − δ2)4 |t− τ | 6 δ

0 altrimenti.

54

Questa funzione e di classe C2, strettamente positiva per |t − τ | < δ e nulla fuori da]τ − δ, τ + δ[ ed e raffigurata nella figura 25. Ne segue che, posto ηi(t) = 0 per i 6= k (64)

d

dsSL[q + sη]|s=0 =

∫ τ+δ

τ−δ

(∂L

∂qk− d

dt

∂L

∂qk

)(t)ηk(t) dt > 0

che e contro la (1.30).�La cosa, pero, piu interessante, e che l’azione lagrangiana e in generale minima sulla

traiettoria reale, sempre rispetto alle variazioni della stessa che mantengono inalterate leconfigurazioni iniziale e finale. Pero la definizione di cosa sia “minimo” e un po’ diversa,perche si deve tener conto che le funzioni η “non devono fare scherzi” in t0 e in t1. Ladefinizione e quindi la seguente.

Definizione 1.23. Il funzionale di azione lagrangiana si dice localmente minimo in t 7→q(t) se per ogni τ ∈]t0, t1[ esiste δ > 0 tale che ]τ − δ, τ + δ[⊆ ]t0, t1[ e tale che per ognifunzione η ∈ C1(]t0, t1[;Rn) (65) tale che

η(t) = 0 per ogni t 6∈]τ − δ, τ + δ[ e |η(t)| < δ (66) per ogni t ∈]τ − δ, τ + δ[

si abbia

SL[q] 6 SL[q + η].

L’idea, nonostante l’apparente complessita, e semplice: per ogni funzione del tipo dellaηk della precedente dimostrazione, il funzionale di azione lagrangiana su q + η deve esseremaggiore di quello calcolato per la sola q. Le ηi, pero, devono essere abbastanza “smussate”se lavorano vicino agli estremi dell’intervallo, quando δ e piccolo.

Teorema 1.24 (Principio di minima azione). Siano dati q0,q1 ∈ Rn. Una funzione diclasse C2 t 7→ q(t) tale che q(t0) = q0 e q(t1) = q1 e una soluzione delle equazioni diLagrange per un sistema olonomo se e solo se SL e localmente minimo in t 7→ q(t).

Prima della dimostrazione di questo teorema serve un risultato di Analisi. Se η : [a, b]→Rn e una funzione di classe C1, poniamo

(1.32) ||η||2 =

(∫ b

a

||η||2 dt)1/2

, ||η||∞ = supt∈[a,b]

||η(t)||.

Lemma 1.25. Sia η : [a, b]→ Rn una curva di classe C1 con η(a) = 0. Allora valgono leseguenti disuguaglianze:

||η||2 6 (b− a)||η||2, ||η||∞ 6√b− a||η||2, ||η||∞ 6 (b− a)||η||∞.

Dimostrazione. Consideriamo prima il caso [a, b] = [0, 1]. Allora

(1.33) ||η(t)|| =∥∥∥∥∫ 1

0

η(τ) dτ

∥∥∥∥ 6 ∫ 1

0

||η(τ)|| dτ.

(64) In questo modo tutte le ηi (anche ηk) sono nulle per t = t0 e t = t1.

(65) Vuol dire semplicemente una funzione da ]t0, t1[ a valori in Rn di classe C1.

(66) Significa che |ηi(t)| < δ per ogni i = 1, . . . , n e per ogni t nell’intervallo specificato.

55

Prendendo il sup a primo membro, segue

||η||∞ 6∫ 1

0

||η(τ)|| dτ.

Ne segue intanto prendendo il sup nell’integrale che

||η||2 =

(∫ 1

0

||η||2 dt)1/2

6 ||η||∞ 6∫ 1

0

||η(τ)|| dτ.

Dalla disuguaglianza di Holder (67) e dal ragionamento appena fatto segue che

(1.34)

∫ 1

0

||η(τ)|| dτ 6 ||η||2 6 ||η||∞.

Se invece l’intervallo e [0, c], allora, ponendo φ(τ) = η(bτ), avremo φ(τ) = cη(cτ).Possiamo usare uno dei risultati appena ottenuti e scrivere∫ 1

0

||η(cτ)||2 dτ =

∫ 1

0

||φ(τ)||2 dτ 6∫ 1

0

||φ(τ)||2 dτ = c2

∫ 1

0

||η(cτ)||2 dτ.

Se moltiplichiamo membro a membro per c e poniamo cτ = t, troviamo senza difficolta

||η||22 6 c2||η||22e questo dimostra la prima disuguaglianza nel caso [0, c]. Riscrivendo la (1.33) per ||φ||2abbiamo

supτ∈[0,1]

||η(τ)||2 = ||η||2∞ = ||φ||2∞ 6∫ 1

0

||φ(τ)||2 dτ = c

∫ 1

0

||η(cτ)||2c dτ = c||η||22

e questo mostra la seconda disuguaglianza per il caso [0, c]. Infine, dalle (1.34), segue

||η||∞ = ||φ||∞ 6 ||φ||∞ = c||η||∞.Tutto e stato quindi dimostrato se [a, b] = [0, c]. Siccome queste affermazioni riguardanodelle norme ed esse sono invarianti per traslazioni, ponendo c = b− a si ha la tesi.�

Dimostrazione del teorema (68). Supponiamo che la lagrangiana L del nostro sistema siadefinita su un aperto Λ dello spazio R × Rn × Rn, ossia lo spazio delle (t,q, q). Fissiamouna soluzione di classe C2 t 7→ q(t) delle equazioni di Lagrange e, per ogni ρ > 0, l’insieme

Kρ = {(t,x,v) : t ∈ [t0, t1], ||x− q(t)|| 6 ρ, ||v − q(t)|| 6 ρ}.Questo insieme non e altro che un compatto “vicino” alla traiettoria di q nello spazio(t,q, q). Siccome K0 (quello per ρ = 0) e contenuto in Λ per ipotesi (e una soluzione

(67) Essa dice che ∣∣∣∣∣∫ b

a

f(t)g(t) dt

∣∣∣∣∣ 6(∫ b

a

|f(t)|p dt

) 1p(∫ b

a

|g(t)|q dt

) 1q

dove1

p+

1

q= 1.

Noi l’abbiamo usata con f(t) = ||η(t)||, g(t) = 1, p = q = 2 e, naturalmente, [a, b] = [0, 1].

(68) Questa dimostrazione e dovuta a M. Degiovanni (io l’ho semplificata per il nostro caso), che ringraziomolto. Immagino lo conosciate...

56

ammissibile e dunque L deve avere senso su di essa), allora per ρ abbastanza piccolo,Kρ ⊆ Λ. Ne segue che esiste c > 0 tale che

∀t,q, q ∈ Kρ :

∣∣∣∣∂2L(t,q, q)

∂qi∂qj

∣∣∣∣ 6 c

∣∣∣∣∂2L(t,q, q)

∂qi∂qj

∣∣∣∣ 6 c

su Kρ. In aggiunta a cio, dato che la lagrangiana dipende quadraticamente dalle qattraverso l’energia cinetica, avremo

∂L

∂q= Kq + k

e dunque

∂2L

∂qi∂qj= Kij.

Siccome K e simmetrica e definita positiva e siamo in Rn, per ogni (q, t) esiste ν(q, t) > 0tale che

n∑i,j=1

∂2L(t,q, q)

∂qi∂qjξiξj =

[∂2L

∂q∂q

]ξ · ξ > ν(q, t)||ξ||2 (69).

Siccome gli autovalori dipendono con continuita dai parametri (q, t) (70), ν e continua edal momento che e definita su un compatto, ammette ivi massimo e minimo e quindi esisteν∗ > 0 tale che

n∑i,j=1

∂2L(t,q, q)

∂qi∂qjξiξj > ν∗||ξ||2.

Supponiamo allora che t 7→ q(t) sia una soluzione di classe C2 delle equazioni di Lagran-ge. Prendiamo allora δ > 0 e una funzione η come nella definizione di locale minimalitae facciamo anche in modo che δ 6 ρ e (t1 − t0)δ 6 ρ. Grazie a questo e al lemma 1.25abbiamo che se ||η||∞ 6 δ, allora ||η||∞ 6 ρ e ||η||∞ 6 ρ, e dunque L(t,q + sη, q + sη) edefinita perche il suo argomento appartiene a Kρ.

Se poniamo g(s) = SL[q + sη], sappiamo gia che

g′(0) =

∫ t1

t0

n∑i=1

(∂L

∂qi− d

dt

∂L

∂qi

)ηi dt.

La locale minimalita equivale ad affermare che g(0) 6 g(1). In effetti, vediamo che si hag′′(s) > 0. Mostrato questo, siccome g′(0) = 0, si deve avere per forza g(s) > g(0) per

(69) Questa e una proprieta generale delle forme quadratiche definite positive in Rn. Per renderci contoche funziona, immaginiamo di diagonalizzare la matrice che definisce la forma quadratica; allora in essacompariranno solo i termini ξ2i , con gli autovalori—tutti strettamente positivi—della matrice. Ne segueche

Qξ · ξ = λ1ξ21 + . . .+ λnξ

2n > λmin(ξ21 + . . .+ ξ2n) = λmin||ξ||

2.

(70) Risultato ammesso per buono; ma credibile, dato che gli autovalori soddisfano l’equazione caratte-ristica della matrice e i vari coefficienti dipendono con continuita dagli elementi della matrice (perche sonocostruiti solo con moltiplicazioni e addizioni).

57

Figura 26. L’insieme Kρ.

s > 0. Ecco perche abbiamo calcolato le derivate seconde: con le stesse notazioni delladimostrazione del principio dell’azione stazionaria abbiamo

g′′(s) =

∫ t1

t0

n∑i,j=1

(∂2L

∂qi∂qjηiηj +

∂2L

∂qi∂qjηiηj +

∂2L

∂qi∂qjηiηj +

∂2L

∂qi∂qjηiηj

)dt.

Il bello e che adesso, siccome siamo in Kρ, possiamo sfruttare le proprieta delle derivateseconde della lagrangiana e stimare tutti i termini come segue:

(1.35) g′′(s) > ν∗∫ t1

t0

||η(t)||2 dt− 2c

∫ t1

t0

n∑i,j=1

ηiηj dt− c∫ t1

t0

n∑i,j=1

ηiηj dt.

Usiamo ora l’elementare disuguaglianza

ab 6ε

2a2 +

1

2εb2, (ε > 0) (71)

58

per osservare chen∑

i,j=1

ηiηj 6n∑

i,j=1

2η2i +

1

2εη2j

)=nε

2‖η‖2 +

n

2ε‖η‖2,

mentre, usandola per ε = 1, abbiamo, per l’ultimo termine della (1.35),n∑

i,j=1

ηiηj 6n∑

i,j=1

(1

2η2i +

1

2η2j

)= n‖η‖2.

Inserendo tutti questi risultati nella (1.35), troviamo

g′′(s) > ν∗‖η‖22 − cnε‖η‖2

2 −cn

ε‖η‖2

2 − cn‖η‖22

dove abbiamo “inserito” gli integrali nell’indice 2 delle norme, secondo quanto stabilitodalle (1.32). Prendiamo ora ε in modo che

cnε 6ν∗

2,

ossia ε 6 ν∗/(2cn), e continuare quindi con

g′′(s) >ν∗

2‖η‖2

2 −2c2n2

ν∗‖η‖2

2 − cn‖η‖22 =

ν∗

2‖η‖2

2 −(

2c2n2

ν∗+ cn

)‖η‖2

2.

Siccome infine η = 0 fuori da ]τ − δ, τ + δ[, il lemma 1.25 ci dice che

‖η‖2 6 2δ‖η‖2

e quindi possiamo continuare la disuguaglianza trovando

g′′(s) >ν∗

2‖η‖2

2 − 4δ2

(2c2n2

ν∗+ cn

)‖η‖2

2.

A questo punto, se δ e scelto cosı piccolo da aversi

4δ2

(2c2n2

ν∗+ cn

)6ν∗

4,

troviamo

g′′(s) >ν∗

4‖η‖2

2 > 0

che completa la prima parte del teorema. La restante parte e facile: se SL verifica laproprieta di locale minimalita, prendiamo η come nella definizione di locale minimalita.Dalla dimostrazione del principio dell’azione stazionaria, abbiamo anche

g′(0) =

∫ t1

t0

n∑i=1

(∂L

∂qi− d

dt

∂L

∂qi

)ηi dt.

Siccome 0 e per ipotesi punto di minimo locale per g, abbiamo che g′(0) = 0, e dunque,osservando che la η usata in quella stessa dimostrazione, moltiplicata eventualmente per

(71) Non e altro che (√εa− b√

ε

)2

> 0.

59

una costante in modo che ‖η‖ 6 δ (72), e una perturbazione ammissibile secondo la defi-nizione di locale minimalita, ripercorrendo il ragionamento fatto nel principio dell’azionestazionaria, devono valere le equazioni di Lagrange.�

1.12. Covettori e spazio cotangente

Nella dimostrazione della seconda forma delle equazioni di Lagrange avevamo visto chela forma piu generale, in una determinata carta, di definire l’energia cinetica era p · v.Sappiamo pero dalla Meccanica Razionale che in generale p e un covettore p, e quindi chela definizione giusta debba essere

K =1

2

N∑s=1

〈ps,vs〉.

(Nella dimostrazione citata non abbiamo insistito su questo fatto, ma la generalizzazionee evidente).

Se vogliamo pero estendere questo concetto alla varieta M ci troviamo un primo proble-ma: l’equivalente sulla varieta dello stato cinetico dell’insieme delle velocita {vs} e q, chesappiamo essere un vettore tangente. (73). Ma cos’e l’equivalente di un insieme di covettoricome {ps}? Tenete presente che non e una domanda banale, perche anche le forze sonocovettori, e quindi il concetto e certamente importante.

Una risposta e abbastanza semplice: sappiamo che lo spazio TcM e uno spazio vettorialedi dimensione n, e che i vettori tangenti sono dei vettori in questo spazio vettoriale. Dunque,possiamo anche aspettarci di avere delle forme lineari in questo spazio, che sono appuntoi covettori tangenti. Pertanto un covettore tangente in c ∈ M e una forma lineare inTcM . Se, in una determinata carta, i vettori tangenti si indicano con q (o (q1, . . . , qn) sepreferite), allora i covettori tangenti si indicano con p, e hanno componenti (p1, . . . , pn).

I covettori sono delle quantita abbastanza astratte, almeno nella loro essenza covettoria-le: l’esistenza di un prodotto scalare in TcM , per esempio, assocerebbe immediatamentei covettori tangenti a dei vettori tangenti. Pero la loro versione nello spazio fisico e im-portante: sono delle forme lineari sulle velocita, e dunque, perlomeno nel caso di vincolifissi—nel quale velocita virtuali e reali coincidono—sono semplicemente delle forze.

Semmai c’e un problema piu grave, che investe anche i vettori tangenti, ed e l’ideadi “campo vettoriale regolare” (o “covettoriale” se avete covettori invece di vettori). Sesiamo, per esempio, in E3, non abbiamo problemi a definire cosa sia un campo vettorialecontinuo, o differenziabile: per calcolare la derivata del campo vettoriale v in x calcoliamoil campo in y, formiamo la differenza dei campi, eccetera. Qui, come abbiamo sottolineato

(72) E facile controllare chesup

[τ−δ,τ+δ]|ηk| < 2δ7,

per cui basta prendere, per esempio, ηk/(2δ6) al posto di ηk.

(73) Abbiamo gia detto, ma conviene ripeterlo, che i “puristi” non riconoscerebbero la precedenza dellevelocita vs, ma che esse risulterebbero dall’immersione della varieta M , vero e unico oggetto primigenio,nella varieta E3N , tramite la trasformazione di vettori tangenti alla varieta M in vettori tangenti—N -upledi vettori applicati—alla varieta E3N .

60

varie volte, non lo possiamo fare, perche non abbiamo modo di fare la differenza di vettoritangenti in punti diversi della varieta perche appartenenti a spazi tangenti diversi.

A questo punto entra in gioco il fibrato. Siccome tanto M che TM sono varieta e hannouna loro topologia (cioe i loro aperti, chiusi e cosı via), e possibile parlare di funzioni con-tinue, differenziabili, ecc. da una all’altra. Il fibrato, inoltre, non e una varieta qualsiasi,perche “reca traccia” della varieta M : in ogni carta, la prima componente (o le primen se preferite) del generico elemento (q,v) ∈ TM sta in M . C’e quindi (proprio nelladefinizione di fibrato) una proiezione canonica π che associa a un generico (q,v) ∈ TM ilcorrispondente q. L’idea di definire quindi un campo vettoriale e la seguente: e un’applica-zione υ : M → TM tale che π(υ(c)) = c. In pratica vuol dir questo: prendiamo un punto qin M , e associamogli con continuita un punto (q,v) ∈ TM , ma, badate bene, con lo stessoq. Questa applicazione si chiama sezione del fibrato tangente, per la ragione seguente: seTM si rappresenta con un cilindro, come TS1, allora una sezione non e che un modo di“sezionare” con continuita il cilindro (ma mai in modo “tangente alle generatrici”, ed equesta la richiesta sulla proiezione canonica).

Figura 27. La sezione di un fibrato tangente.

Ecco cos’e un campo vettoriale: una sezione del fibrato tangente.A questo punto, con un po’ di fantasia, e possibile “dualizzare” tutto. L’insieme di tutti

i covettori tangenti in un punto c e lo spazio cotangente alla varieta M in c e si indica conT ∗cM . E uno spazio vettoriale come TcM (non pensate allo spazio ortogonale o cose delgenere), e l’insieme di tutte le “coppie”

T ∗M = {(c, p) : c ∈M, p ∈ T ∗cM}

si chiama fibrato cotangente.In maniera molto simile a quanto abbiamo visto per il fibrato tangente, anche il fibrato

cotangente si puo munire di una struttura di varieta di dimensione 2n. Infatti, basta solovedere come possono essere scelte delle carte per i momenti cinetici p.

Sappiamo che

(1.36) vs =n∑i=1

∂Ps∂qi

qi

61

e che ps e una forma lineare su vs, ossia

〈ps,vs〉 =

⟨ps,

n∑i=1

∂Ps∂qi

qi

⟩(74)

Per linearita troviamo

〈ps,vs〉 =n∑i=1

qi

⟨ps,

∂Ps∂qi

⟩.

Ora, i vettori ∂Ps/∂qi sono dei vettori applicati in Ps ∈ E3 che chiamiamo eqi [Ps] (perricordare che possono formare una base locale nel punto Ps). Se introduciamo la baseduale eqi [Ps] definita da

〈eqi [Ps], eqj [Ps]〉 = δijabbiamo che ps si esprimera per mezzo dei coefficienti reali pi rispetto a questa base:

p =n∑i=1

pieqi [Ps].

E usuale indicare con dqi i covettori base, per motivi che non stiamo ad approfondire.Dunque questa formula si scrive semplicemente

p =n∑i=1

pi dqi[Ps].

Confrontando questa formula con la (1.36), scritta cosı

vs =n∑i=1

qi∂

∂qi[Ps]

abbiamo che essa sara l’omologa della (1.36).Da questa formula discende, in maniera analoga a quanto fatto per il fibrato tangente, il

fatto che il fibrato cotangente T ∗M si puo dotare della struttura di varieta differenziabile.Se C e la carta che da c, allora

Γα : Vα × Rn → T ∗M

Γα : (q1, . . . , qn, p1, . . . , pn) 7→ (C(q),p dq[C]))) =

(C(q1, . . . , qn),

n∑i=1

pi dqi(q1, . . . , qn)[C]

)sara la carta che da (c, p) in T ∗M .Infine, un “campo differenziabile di covettori”, cioe una sezione del fibrato cotangente,

si chiama 1-forma differenziale su M .Gia, proprio cosı: forma differenziale. Noi le conosciamo di sfuggita dalle forze in E3,

ma, se ci pensate bene, una forza e proprio un “campo di covettori”, e sappiamo che in E3 icovettori applicati sono covettori tangenti, e non a caso nel paragrafo sulle forze potenzialiabbiamo parlato di cose tipo f = dU .

In una carta, le forme differenziali sono poi degli oggetti tranquilli come 2x dx + 2y dy,o, se preferite, 2q1 dq1 + 2q2 dq2, o, ancora, 2ρ dρ. Esse si applicano ai vettori tangenti

(74) Qui, e in tutto il discorso che seguira, s non e sommato.

62

per formare dei numeri. Per esempio, quando abbiamo illustrato il fibrato tangente allacirconferenza S1, abbiamo fatto uso della coordinata ϑ. Prendiamo allora, sempre peresempio, la forma differenziale f = −mg senϑ�eϑ (o −mg senϑ dϑ che e la stessa cosa),avremo

〈f, ϑ~eϑ〉 = −mg senϑϑ〈�eϑ, ~eϑ〉 = −mg senϑϑ

e ritroviamo la potenza della forza peso del pendolo semplice.Con questa interpretazione potremmo dunque affermare che un campo di forze e una

forma differenziale su M , e interpretare anche geometricamente le Qi. In realta, c’e lacomplicazione delle forze dipendenti dalla velocita: siccome q non e un elemento di M maentra a far parte del fibrato tangente, in questo modo non avremmo la possibilita di parlaredi forze dipendenti dalla velocita. In aggiunta, anche le τi dipendono dalle q (e anche dalleq), per cui la situazione e in realta piu complicata e non andiamo a sondare ulteriormente.

Torniamo ai momenti cinetici. Essi sono, abbiamo scoperto, dei covettori tangenti. Manon solo: c’e un ben preciso legame tra un vettore tangente (q in una data carta) e il suoconiugato:

p = Kq (75).

L’energia cinetica e dunque un’applicazione che associa a un vettore tangente un vettorecotangente:

K : TM → T ∗M (76).

Sappiamo poi, per motivi elementari, che in ogni carta questa trasformazione e simmetricae, soprattutto, definita positiva (77), per cui

〈Kv,v〉 = 〈p,v〉 > 0, 〈p,v〉 = 0 ⇒ v = 0.

1.13. Varieta riemanniane ed energia cinetica

L’esistenza dell’energia cinetica aggiunge un fatto fondamentale al quadro della nostravarieta meccanica M . Fino a questo punto, essa era “semplicemente” una varieta diffe-renziabile. Adesso la presenza dell’energia cinetica arricchisce la varieta di un fatto fonda-mentale: la possibilita di misurare delle “distanze” sulla varieta, facendone quella che sichiama una varieta riemanniana.

In E3 e facile fare delle misure, per esempio, della velocita: possiamo usare metri alsecondo, chilometri all’ora, eccetera. Allo stesso modo possiamo misurare l’intensita dellequantita duali delle velocita, che sono le forze. Supponiamo che le velocita, di solitomisurate in metri al secondo, siano di colpo misurate in km/h. Allora 1 m/s diventa, comesappiamo, 3.6 km/h. Supponiamo anche di assegnare un ruolo particolare alla potenza,come abbiamo fatto fin dall’inizio. Ora, l’unita di misura della potenza e il watt. Se

(75) Non avrete certo dimenticato che non consideriamo forze dipendenti dal tempo, e quindi k e K00

sono nulli.

(76) E quello che in Geometria Differenziale si chiama tensore covariante, per la gioia dei Relativisti.

(77) Nessun Purista potra rinunciare ad ammettere che questa proprieta si spiega pensando al buonvecchio spazio E3N e al caso p = mv. Comunque sia, se si vuol essere ’puri’, l’energia cinetica deve esseredefinita su M come un’applicazione simmetrica e definita positiva, che, interpretata meccanicamente,risulta essere l’energia cinetica totale classica.

63

vogliamo che il valore della potenza in watt sia un invariante, c’e poco da fare: dobbiamomisurare la forza in watt/(m/s), cioe in watt fratto metri al secondo. Ne segue che lamisura di una forza verrebbe divisa per 3.6 per mantenere inalterata la potenza (78)

In E3 questa operazione e semplice, ma se ci pensiamo neanche tanto: abbiamo presoun vettore, la velocita, gli abbiamo cambiato valore grazie a un cambiamento di scala, egli abbiamo associato un covettore, la forza, in modo che la potenza, che e la loro dualita,restasse costante. Dunque abbiamo associato a un nuovo vettore (il valore della velocitamoltiplicato per 3.6) un nuovo covettore (il valore della forza diviso per 3.6), in modo chela dualita non cambiasse. Si tratta quindi di una applicazione che a un vettore tangente,la velocita, associa un vettore cotangente, la forza, e quindi qualcosa che assomiglia a“TM → T ∗M”.

Questo ‘qualcosa’ si chiama tensore metrico o metrica sulla varieta, ed e legato, comeabbiamo visto, alle misurazioni (donde il nome). Esso dice come si devono cambiare vettorie covettori quando si cambiano le scale, in modo da conservare le dualita (79).

Ma il tensore metrico ha un’altra fondamentale funzione, ed e quella di calcolare delledistanze. Vediamo perche. Cominciamo con l’attribuire qualche simbolo. Utilizziamo G,anziche K, per il tensore metrico, e supponiamo comunque che sia simmetrico definitopositivo, ossia 〈Gv,v〉 = 0 ⇒ v = 0.

Questa proprieta fa della dualita un prodotto scalare, in questo modo: definiamo

(u,v) = 〈Gu,v〉e verifichiamo che tutte le usuali proprieta del prodotto scalare sono vere. La bilinearita ebanale. Vediamo la simmetria:

(v,u) = 〈Gv,u〉 = 〈G∗u,v〉 = (80) = 〈Gu,v〉 = (u,v).

Infine, la definitezza positiva dice che ‖u‖G =√

(u,u) e una norma, perche (u,u) = 0implica u = 0 (81).

Fin qui siamo in un singolo spazio tangente, col suo rispettivo cotangente. Prendiamopoi una curva regolare γ : t 7→ c(t) sulla varieta che congiunga q0 e q1 e definiamo

(1.37) LG[γ] =

∫ t1

t0

‖γ ′(t)‖G(t) dt.

Questa e la lunghezza della curva. Possiamo poi anche porre

d(q0,q1) = inf{LG[γ] : γ e una curva che congiunge q0 e q1.}che si verifica essere una distanza (82).

(78) In realta le unita di misura della forza sono derivate dalla legge di Newton F = ma, il che assegnaall’inerzia un ruolo particolare. Un esempio piu calzante con quello che vogliamo dire e la dualita posizione-campo elettrico (la posizione si misura in metri e il campo elettrico in volt/metro), ma qui preferiscomantenere il discorso sulla dualita che interessa, cioe quella forza-velocita.

(79) Anche i nomi “covariante” e “contravariante” vengono da qui: le quantita covarianti varianoseguendo i cambi di scala, le altre al contrario dei cambi di scala

(80) G∗ indica l’aggiunto (sarebbe il trasposto con le matrici), che per simmetria equivale a dire proprioquello che sta scritto nell’uguaglianza successiva.

(81) Anche le altre proprieta della norma sono verificate per quanto avete visto in Analisi.

(82) Verificare...

64

Ma cosa accade nel caso euclideo? Qui ci sono gia un prodotto scalare e una norma, einfatti in questo caso (u,v) = u · v, cosicche G e l’identita e LG la lunghezza euclidea.

Di conseguenza, siamo portati a definire geodetiche su una varieta le curve, se esistono,che hanno lunghezza minima (83. Naturalmente, esse saranno geodetiche rispetto allametrica presente sulla varieta, e se ce ne sono due, capitera che ci siano curve di lunghezzaminima per l’una che non lo sono per l’altra.

I Fisici, che amano tantissimo le forme differenziali perche ricordano loro delle quantitainfinitesime, chiamano ds2 l’“oggetto” corrispondente al quadrato dell’integrando della(1.37), e precisamente scrivono

ds2 = gik dxi dxk (84)

Per noi questa formula significa questo: c’e una curva derivabile su M , con vettore derivatou, e la quantita (u,u) = 〈Gu,u〉 da il quadrato di una norma di questo vettore, chepermette di definire una distanza (85).

Adesso torniamo alla Meccanica. Se M e la varieta delle configurazioni di un sistemaolonomo, non e assolutamente detto che la metrica piu conveniente da darle sia quellaeuclidea (86). Infatti, la presenza dell’energia cinetica e esattamente quello che ci vuole.Siccome essa (lo scalare, intendo) e data da

K(q, q) =1

2〈p, q〉 =

1

2〈Kq, q〉 =

1

2‖q‖2

K,

la lunghezza di una curva sara definita da

LK[q] =

∫ t1

t0

√2K(q, q) dt.

Adesso calcoliamo:

d

dt

∂√

2K

∂q=

d

dt

(1√2K

∂K

∂q

)= − 1√

(2K)3

∂K

∂q

dK

dt+

1√2K

∂K

∂q

e∂√

2K

∂q=

1√2K

∂K

∂q.

(83) Non e detto che esistano: per esempio, il piano R2 senza il punto (0, 0) e una varieta e la metricaeuclidea ne fa una varieta riemanniana. Quindi (−1, 0) e (0, 1) hanno distanza 2. Pero non esiste nessunageodetica che li congiunge. In compenso, se la varieta e compatta, allora questo e vero.

(84) Siccome a loro interessa anche capire se un oggetto e covariante o contravariante, mettonorispettivamente gli indici in basso o in alto, e naturalmente omettono la sommatoria.

(85) In realta, si potrebbe vedere il ds2 come una 2-forma differenziale su M , ma bisognerebbe introdurretensori, ecc., per poi ritrovare in un solo caso quello che abbiamo appena visto: e chiaro che la nostraposizione di Meccanici ci permette di non entrare in tutti i dettagli matematici della cosa. Ad esempio,volendo essere pignoli, la varieta M deve essere connessa, altrimenti come si fa a congiungere due punti?E via dicendo...

(86) Cosa che potremmo sempre fare, dato che M e immergibile in E3N e su questo spazio la metricaeuclidea c’e dappertutto. Per una generica varieta differenziabile, non e detto che ci sia una metricaeuclidea definita dappertutto: cio e legato a questioni abbastanza profonde sulla curvatura, molto bellema che ci porterebbero troppo lontano.

65

Ricordando la (1.21), troviamo infine

d

dt

∂√

2K

∂q− ∂√

2K

∂q=

1√2K

(d

dt

∂K

∂q− ∂K

∂q

)− 1√

(2K)3

∂K

∂qτ · q.

Pertanto, se non vi sono sollecitazioni applicate, lungo le soluzioni delle equazioni diLagrange τ = 0, e abbiamo

d

dt

∂K

∂q− ∂K

∂q= 0 ⇐⇒ d

dt

∂√

2K

∂q− ∂√

2K

∂q= 0

Quindi abbiamo il

Teorema 1.26 (Principio dell’azione stazionaria, versione geometrica). Le soluzioni delleequazioni di Lagrange corrispondenti a sollecitazioni nulle (moti per inerzia) rendono sta-zionaria la loro lunghezza rispetto nella metrica dell’energia cinetica e rispetto a tutte lecurve passanti per gli stessi punti iniziale e finale.

In realta e vero molto di piu: sempre nel caso del moto per inerzia, la lunghezza nellametrica dell’energia cinetica e localmente minima, e inoltre sulle geodetiche K e costante.

Questo e vero perche su una geodetica, l’energia cinetica resta costante. Infatti, dalla(1.21) abbiamo

dK

dt= τ · q

e dunque K e costante sul moto reale. A questo punto, siccome, nel caso di forze esternenulle, la lagrangiana coincide coll’energia cinetica, e la lagrangiana e localmente minima,sara localmente minima anche

√2K.

Abbiamo pertanto il

Teorema 1.27 (Principio della minima azione, versione geometrica). Le soluzioni delleequazioni di Lagrange corrispondenti a sollecitazioni nulle (moti per inerzia) rendono lo-calmente minima la loro lunghezza rispetto nella metrica dell’energia cinetica e rispettoa tutte le curve passanti per gli stessi punti iniziale e finale, e inoltre su queste soluzionil’energia cinetica e costante.

Questo e un bellissimo risultato: trovare le soluzioni delle equazioni di Lagrange inassenza di forze corrisponde a trovare le curve di lunghezza localmente minima (87) rispettoal modo “cinetico” di definire la distanza. E non e una tautologia.

L’energia cinetica permette anche di aggiungere struttura alla varieta “puramente geo-metrica” di un sistema meccanico. Per esempio, sappiamo che la varieta M corrispondenteall’ormai nostro famoso pendolo coll’estremo che scorre su una retta e un cilindro, parame-trizzato, per esempio, dall’ascissa x dell’estremo vincolato e dall’angolo ϕ come abbiamodetto fin qui (vedi figura 28).

L’energia cinetica e, come abbiamo visto nella (1.14), e

K1 = mx2 − 2mlxϕ senϕ+ 2ml2ϕ2.

(87) Il “localmente” e essenziale, perche, per esempio, supponiamo che i due punti stiano su una sfera:allora esistono due geodetiche per i due punti: entrambe stanno sul cerchio massimo che li contiene, mauna sara piu lunga e l’altra piu corta.

66

Consideriamo ora quest’altro sistema, leggermente ma essenzialmente diverso dal primo:il punto vincolato e stavolta il punto medio del segmento, sempre vincolato alla rettaorizzontale. Anche questo sistema si puo individuare con le stesse coordinate del primo,con gli stessi intervalli, e cosı via, per cui la sua varieta delle configurazioni e lo stessocilindro.

L’energia cinetica del secondo sistema si trova nel solito modo, individuando le coordinatedei punti, eccetera: fatelo per esercizio. Il risultato e

K2 = mx2 + 4ml2ϕ2.

Quali sono le equazioni di Lagrange di questo sistema: semplicissime. Derivare per credere:

mx = 0, 8ml2ϕ = 0

e quindi il moto e uniforme sia in x che in ϕ. Qual e allora la traiettoria sulla varieta?E un arco di elica cilindrica, che corrisponde proprio alla composizione del moto circolareuniforme con quello rettilineo uniforme sulla direzione perpendicolare. Lo potete vedere adestra nella figura 28. Osservate anche che la metrica associata a K2 e diagonale (in questocaso e una matrice 2× 2)

K2 =

[2m 00 8ml2

]ed e molto simile a quella euclidea, perche differisce da essa solo per delle costanti mol-tiplicative. E in effetti le geodetiche sul cilindro rispetto alla metrica euclidea sono leeliche.

Quali saranno le traiettorie del primo sistema, sempre nell’ipotesi che non ci siano forze?Be’, abbiamo trovato l’equazione del moto per ϕ, e precisamente l’equazione (1.29)

ml2(2− sen2 ϕ)ϕ2 −mgl senϕ = E − p2x

4m.

Se poniamo g = 0, avremo il caso senza forza

ml2(2− sen2 ϕ)ϕ2 = E − p2x

4m= C.

Ben difficilmente questa equazione sara risolubile in maniera esplicita (88), ne ci serveessere Weierstrass: basta osservare che ϕ non si annulla mai, se C 6= 0, per cui il moto diϕ sara sempre progressivo.

Immaginiamo allora di dare una velocita iniziale al punto vincolato sulla retta e lavelocita dell’altro estremo con la stessa componente orizzontale, ma nel verso opposto. Inpoche parole, la quantita di moto totale del sistema e tutta verticale, e siccome quellaorizzontale si conserva, il baricentro del sistema si deve muovere solo in su e in giu. Maallora certamente x non sara sempre crescente, ma oscillera avanti e indietro, mentre ϕ

(88) Anche se per poco: ponendo u = tgϕ/2, risulta∫ tgϕ(t/2)

tg(ϕ0/2)

√8(1 + u4) du = C(t− t0).

67

Figura 28. Le geodetiche di due sistemi meccanici.

continuera a crescere. Comunque vada a finire, le traiettorie non saranno mai delle eliche,perche la metrica della varieta e diversa, ed e infatti

K1 =

[2m −2ml senϕ

−2ml senϕ 4ml2

].

68

2. Meccanica hamiltoniana

2.1. La funzione e le equazioni di Hamilton

Introduciamo subito questa funzione, ricordando che abbiamo posto

(2.1) p =∂L

∂qo pi =

∂L

∂qi.

Definizione 2.1. Dato un sistema olonomo con lagrangiana L, poniamo

(2.2) H(q,p, t) = supq{p · q− L(q, q, t)}.

La funzione H si chiama funzione di Hamilton o Hamiltoniana del sistema. In componenti

H(q1, . . . , qn, p1, . . . , pn, t) = sup(q1,...,qn)

{n∑i=1

piqi − L(q1, . . . , qn, q1, . . . , qn, t)}.

Proposizione 2.2. Per ogni p, q e t, esiste il massimo della funzione q 7→ p·q−L(q, q, t),per cui

(2.3) H(q,p, t) = p · ˜q(p,q, t)− L(q, ˜q(p,q, t), t)

dove ˜q e il punto di massimo della funzione q 7→ p · q− L(q, q, t).

Dimostrazione. Deriviamo rispetto alle q per trovare il massimo e otteniamo

p =∂L

∂q.

Ora, dalle proprieta di L sappiamo che

(2.4)∂L

∂q= K(q, t)q + k(q, t)

e quindi, dalle proprieta di K, troviamo che l’eventuale unico punto di massimo verifica

˜q = K−1(p− k).

Ma l’hessiano della funzione q 7→ p · q− L(q, q, t) e proprio

− ∂2L

∂q∂q= −K

che e definita negativa. Pertanto il punto trovato e il punto di massimo.�La precedente dimostrazione fa capire che il punto di massimo si trova semplicemente

risolvendo il sistema (2.4) rispetto a q e sostituire nella H.Vediamo un esempio, semplicissimo: un punto materiale sulla retta con coordinata x,

soggetta a forza con potenziale U(x). Allora

L(x, x, t) =1

2mx2 + U(x).

69

Per trovare x in funzione di p dobbiamo risolvere rispetto a p l’equazione p = mx, cioex = p/m. Quindi

H(x, p, t) = “px− L” =p2

m− 1

2m( pm

)2

− U(x) =p2

2m− U(x).

Se i gradi di liberta sono di piu, il calcolo si complica ma i passaggi restano gli stessi. Nelnostro esempio del pendolo vincolato all’estremo l’hamiltoniana risulta essere, dopo alcuninoiosi passaggi,

H(x, ϕ, px, pϕ, t) =1

2− sen2 ϕ

(p2x

m+pxpϕ senϕ

ml+

p2ϕ

2ml2

).

Il seguente teorema riassume le principali proprieta algebriche della funzione H.

Teorema 2.3. Si ha

(2.5)∂H

∂q= −∂L

∂q,

∂H

∂p= ˜q,

∂H

∂t= −∂L

∂t.

Dimostrazione. Abbiamo intanto, ragionando in componenti,

∂H

∂qi=

n∑j=1

pj∂ ˜qj∂qi− ∂L

∂qi−

n∑j=1

∂L

∂qj

∂ ˜qj∂qi

.

Adesso non dimentichiamo che ∂L/∂qj e espresso in funzione delle qi e delle pi, e dunqueper definizione e uguale a pi. Ne segue subito che

∂H

∂qi= −∂L

∂qi.

Poi∂H

∂pi= ˜qi −

n∑j=1

pj∂ ˜qj∂pi−

n∑j=1

∂L

∂qj

∂ ˜qj∂pi

e per lo stesso motivo risulta∂H

∂pi= ˜qi.

Infine∂H

∂t=

n∑j=1

pj∂ ˜qj∂t− ∂L

∂t−

n∑j=1

∂L

∂qj

∂ ˜qj∂t

= −∂L∂t.�

Vediamo ora cosa accade se t 7→ q(t) e una soluzione delle equazioni di Lagrange cor-rispondenti alla lagrangiana L. Chiaramente, dalla (2.1) si otterra una corrispondentefunzione t 7→ p(t).

Teorema 2.4 (Equazioni di Hamilton). Se t 7→ (q(t),p(t)) dove t 7→ q(t) e una soluzionedelle equazioni di Lagrange e p e definito dalla (2.1), allora

q =∂H

∂p, p = −∂H

∂q

oppure, in componenti,

qi =∂H

∂pi, pi = −∂H

∂qi,

70

e viceversa.

Dimostrazione. Siccome lungo il moto

∂L

∂q=

d

dt

∂L

∂q=dp

dt,

dalla prima delle (2.5) abbiamo la seconda equazione. La seconda delle (2.5), quando vienevalutata su t 7→ (q(t),p(t)), implica che q sia la derivata di q, cioe

q(t) =dq

dt(t)

e quindi troviamodq

dt(t) =

∂H

∂p(q(t),p(t), t)

che e la prima equazione. Se viceversa t 7→ (q(t),p(t)) e una soluzione delle equazioni diHamilton, si deve avere

dp

dt= −∂H

∂q=∂L

∂q

e ricordando che p = ∂L/∂q si ricavano le equazioni di Lagrange.�

2.2. Trasformazione di Legendre e spazio degli stati

Il sistema delle equazioni di Hamilton, a prima vista, sembra diverso da quello di Lagran-ge. Anche se non e una differenza sostanziale, perche entrambi riflettono lo stesso principiomeccanico, c’e una differenza “matematica” che salta subito all’occhio: le equazioni di La-grange sono un sistema di n equazioni del secondo ordine, mentre quelle di Hamilton unsistema di 2n equazioni del primo.

Questo ha come conseguenza immediata che, mentre nelle equazioni di Lagrange nonbastava dare la posizione iniziale per risolvere il moto, in quelle di Hamilton sı, a pattopero di considerare “posizione iniziale” la coppia (q0,p0).

Dal punto di vista della matematica bruta, poi cambia poco: se le equazioni di Lagrangeerano difficili da risolvere, non sara che quelle di Hamilton diventino semplicissime. Cambiail punto di vista: sembra ora che l’“oggetto” di interesse non sia piu solo la configurazioneq ma anche il suo “stato cinetico” p, cioe la coppia (q,p).

Geometricamente, non abbiamo fatto altro che sostituire il vettore tangente q con ilcovettore tangente p e cambiare la funzione da lagrangiana ad hamiltoniana mediante latrasformazione (2.2). Quindi ora il nostro problema, che era originariamente impostato sulfibrato tangente TM , e stavolta impostato sul fibrato cotangente T ∗M , e le sue coordinatelocali sono proprio le (q,p). Questa varieta di dimensione 2n si chiama talvolta varietadegli stati, in omaggio al fatto che s = (q,p) e lo “stato dinamico” del corpo (posizione-velocita) (1).

(1) Ricordate il paradosso di Zenone della freccia? “La freccia, in ogni istante fissato, e ferma. Dunqueil moto e una successione di stati di quiete, ed e una illusione”. Zenone si sbagliava su questo punto: ilmoto non e solo la posizione, ma la coppia posizione-velocita, cioe lo stato dinamico.

71

La trasformazione (2.2) si chiama trasformazione di Legendre ed e un concetto importanteanche al di fuori della Meccanica.

Definizione 2.5. Data una funzione convessa f : Rn → R, dipendente dal parametroa ∈ Rm si definisce coniugata di f o trasformata di Legendre di f la funzione

f ∗(y, a) = supx∈Rn

{〈x,y〉 − f(x, a)}. (2)

Nel nostro caso, la f e L e dipende da q, e in piu il “parametro” e dato da a = (q, t).Se f e di classe C2, allora tutto procede come mostrato sopra: per trovare il massimo sideriva rispetto a x e si trova

(2.6)∂f

∂x= y

dopodiche si ricava x = g(y) e si ottiene

(2.7) f ∗(y) = 〈g(y),y〉 − f(g(y)).

La cosa interessante e che la trasformazione di Legendre e involutoria, ossia

Proposizione 2.6. Si ha (f ∗)∗ = f .

Dimostrazione. Per definizione

(f ∗)∗(z) = supy∈Rn

{〈y, z〉 − f ∗(y)}.

Ora, dalla (2.7) troviamo che per determinare il punto di estremo di

y 7→ 〈y, z〉 − f ∗(y) = z 7→ 〈y, z〉 − 〈g(y),y〉 − f(g(y))

dobbiamo annullare la derivata rispetto a y, cioe

0 = z − ∂

∂y(〈g(y),y〉 − f(g(y))) .

Sviluppando i vari termini risulta

0 = z −⟨∂g

∂y(y),y

⟩− g(y)−

⟨∂f

∂x(g(y)),

∂g

∂y

⟩.

Dalla (2.6) segue ora∂f

∂x(g(y)) = y

e dunque la precedente condizione diviene z = g(y). Ma allora

(f ∗)∗(z) = 〈g−1(z), z〉 − f ∗(g−1(z)) = 〈g−1(z), z〉 − 〈g(g−1(z)), g−1(z)〉+ f(z) = f(z).�

Da quanto detto segue che la trasformata di Legendre della funzione di Hamilton e dinuovo la funzione di Lagrange.

Non lo dimostriamo, ma possiamo intuire che questa definizione e queste proprieta val-gono anche quando ad Rn si sostituisce una varieta differenziabile di dimensione n e alprodotto scalare una dualita (ecco perche abbiamo usato i simboli 〈·, ·〉). La richiesta

(2) Per questo discorso, facciamo finta che x · y si scriva 〈x,y〉. Il motivo sara chiaro fra poco.

72

di convessita di f , unitamente alla regolarita, implica che il punto di massimo, cioe lasoluzione dell’equazione ∂f/∂x = y, sia unico (3).

La descrizione hamiltoniana e dunque, in un certo senso, “duale” di quella lagrangiana.Si parte da M e si puo atterrare indifferentemente su TM o T ∗M , che sono collegati dallatrasformazione di Legendre, come illustra la fig. 29.

Figura 29. La triade.

La cosa bella di S = T ∗M , rispetto ad M e che, fissato su di essa un punto, automati-camente per esso, se valgono i teoremi di esistenza e unicita delle soluzioni delle equazionidifferenziali, passa una e una sola soluzione del problema del moto (4).

2.3. Intermezzo: sistemi dinamici

Avrei potuto inserire questa parte anche quando abbiamo parlato del sistema di equazionidi Lagrange, giacche concerne piu le proprieta delle equazioni differenziali che propriamentela Meccanica; tuttavia, come vedrete, la Meccanica riapparira alla fine in maniera moltointeressante.

Il sistema di equazioni di Hamilton puo essere messo nella forma

(2.8) u = F(u, t)

(3) Pensate che questa definizione si riporta uguale nel caso in cui f non sia derivabile (ma sempreconvessa) e al posto di Rn c’e uno spazio metrico completo.

(4) In verita questo e vero anche per TM , ma T ∗M , oltre ad essere fatto in modo piu naturale per viadei covettori, ha delle proprieta ulteriori che lo rendono preferibile a TM .

73

o, se preferiteu(t) = F(u(t), t)

dove u : R → Rm e F : Rm × R → Rm (scrivo m e non n perche nel caso hamiltonianom = 2n). Un pregio del sistema hamiltoniano e che e del primo ordine; comunque, fosseanche stato un sistema del secondo, come quello delle equazioni di Lagrange, del tipo cioe

q = F(q, q, t)

avremmo potuto ricondurlo al primo ordine ponendo p = q e trovando{q = p

p = F(q,p, t) (5)

raddoppiando il numero di equazioni. Anche le condizioni iniziali si sistemano, in quantonel sistema del secondo ordine serve conoscere (q(t0), q(t0)) = (q0, q0), e in quello delprimo appunto si ha (q(t0),p(t0)) = (q0, q0).

In questo ambito si suole fare una grande distinzione a seconda del fatto che F dipendadal tempo o meno. Se F dipende dal tempo (esplicitamente, come si dice), si parla disistemi non autonomi, mentre se F non dipende dal tempo si parla di sistemi autonomi.In questa parte ci occuperemo solo di sistemi autonomi, del tipo cioe

(2.9) u = F(u).

Meccanicamente, cio corrisponde a sistemi olonomi conservativi con forze e vincoli nondipendenti dal tempo.

Consideriamo piu precisamente il cosiddetto problema ai valori iniziali

(2.10)

{u = F(u)

u(t0) = u0.

Sappiamo dalla teoria delle equazioni differenziali che se F e lipischitziana (quindi, peresempio, di classe C1 va bene), allora esiste un’unica soluzione di questo problema suun intervallo massimale I del tempo. Nel seguito faremo sempre l’ipotesi che I sia dellaforma [t0,+∞[, ossia che la soluzione esista per tutti i tempi t > t0. Se non fosse cosı, laproprieta di semigruppo, che vedremo tra poco, avrebbe senso sin quando tutti gli istanticitati appartengono ad I, mentre il concetto di stabilita, che seguira, perderebbe di senso.

La soluzione t 7→ u(t) del problema (2.10) dipende ovviamente anche da u0, tant’e chemolti scrivono u(t; u0) per questa funzione.

(5) Non lasciatevi ingannare dalla notazione: non e affatto detto che questo sia un sistema hamiltoniano.Lo e in casi molto speciali, quelli in cui K e diagonale nelle q2i e le masse sono pari a uno; infatti in quelcaso H vale

H =

n∑i=1

p2i2− U(q1, . . . , qn, p1, . . . , pn, t)

e il sistema di Hamilton diventaqi = pi

pi = −∂H∂qi

= −∂V∂qi

= Fi(q1, . . . , qn, p1, . . . , pn, t),

e in questi casi, inoltre, U non puo dipendere dalle pi = qi in maniera qualunque, come abbiamo vistoquando abbiamo parlato del potenziale generalizzato.

74

PoniamoS(t)u0 = u(t+ t0).

Il significato di questo e: S(t) calcola la soluzione “dopo t secondi” a partire da t0, il datoiniziale. In altre parole, S(t) prevede lo stato futuro traslato di t. Questa notazione e unpo’ sciagurata perche questa non e una funzione solo di t, ma anche di u0: andrebbe scrittaS(t)(u0), ma la scelta piu logica sarebbe ϕ(t,u0). Pazienza, siamo elastici e pieghiamoci:vuol dire che “sara un interessante esercizio” (si dice sempre cosı) trasferire le varie identitanelle altre notazioni (6)

Un primo risultato utile e il seguente.

Proposizione 2.7. Se t 7→ u(t) e soluzione di un sistema autonomo

u = F(u),

allora, per ogni τ > 0, posto v(t) = u(t + τ), si ha che t 7→ v(t) e soluzione dello stessosistema, cioe

v = F(v).

Dimostrazione. E una di quelle belle dimostrazioni di una riga:

v =d

dtu(t+ τ) = F(u(t+ τ)) = F(v).�

Notate due cose: primo, che se F fosse stato dipendente dal tempo, questo risultatopotrebbe non essere stato vero per tutti i τ (anzi, in generale e falso per tutti i τ (7)), esecondo, piu importante, anche se v risolve lo stesso sistema non vuol dire che v risolva lostesso problema ai valori iniziali, perche ovviamente, se τ 6= 0, v(t0) = u(t0 + τ) 6= u0.

La proposizione teste dimostrata permette, come tutti i Fisici sanno, di decidere arbitra-riamente l’origine dei tempi delle soluzioni di un sistema autonomo. Infatti, supponiamodi avere il sistema (2.10) e prendiamo un qualunque t1 ∈ R; poniamo v(t) = u(t+ t0− t1) eosserviamo che v(t1) = u(t0). Siccome v risolve lo stesso sistema che risolveva u, e dunqueil sistema {

v = F(v)

v(t1) = u0.

che e lo stesso problema (2.10), solo con t1 al posto di t0. Quindi nulla di male se neisistemi autonomi il tempo comincia a scorrere, per esempio, da zero.

Siamo pronti per dimostrare un primo interessante risultato.

Teorema 2.8 (Proprieta di semigruppo). Si ha per ogni t, s > 0

S(0) = Id;(2.11)

S(t) ◦ S(s) = S(t+ s).(2.12)

(6) Altra notazione frequente e ϕt(u0).

(7) Perche

F(u(t+ τ), t+ τ) 6= F(u(t+ τ), t).

Una interessante semi-eccezione sono le funzioni periodiche in t di periodo T , ossia tali che

F(u, t+ T ) = F(u, t).

Per queste la proposizione e vera per τ = kT , con k ∈ N.

75

Dimostrazione. Ricordiamo che S(t)u0 e la soluzione del problema

(2.13)

{u = F(u)

u(t0) = u0.

all’istante t+ t0 (8).Pertanto S(0)u0 = u(t0) = u0 e dunque S(0) e l’identita su Rm. Per la seconda parte

dell’enunciato, vediamo intanto che, se u denota la soluzione del problema, allora

u(t+ s+ t0) = S(t+ s)u0.

D’altro canto, dalla (2.13) abbiamo anche

S(s)u0 = u(s+ t0).

Poniamo ora v(t) = u(t+ s). Dalla proposizione 2.7 abbiamo che v verifica{v = F(v)

v(t0) = u(t0 + s),

per cui

v(t+ t0) = S(t)v(t0) = S(t)u(t0 + s) = S(t) (u(s+ t0)) = S(t) (S(s)u0)) = S(t) ◦ S(s)u0.

D’altra parte,

v(t+ t0) = u(t+ s+ t0) = S(t+ s)u0

e l’arbitrarieta di u0 completa la dimostrazione.�Nella “notazione ϕ” il risultato si scrive

ϕ(0,x) = x, ϕ(t,ϕ(s,x)) = ϕ(t+ s,x).

Per esempio, all’equazione x = x (m = 1) e associato il semigruppo {x0 7→ x0et}t>0, che

consiste nelle moltiplicazioni di x0 per et (9). Comporre due moltiplicazioni per et ed es

equivale, infatti, alla moltiplicazione per et+s.Non solo le soluzioni dei sistemi di equazioni differenziali autonomi verificano la proprieta

di semigruppo (10). Per esempio, se X e un insieme qualunque e G : X → R e una funzioneinvertibile, allora la famiglia di funzioni

S(t)x = G−1(t+G(x))

verifica la proprieta di semigruppo, come si constata facilmente, pero nessuno assicura cheG sia derivabile.

Se le applicazioni S(t) : Rm → Rm sono invertibili per un certo t > 0, allora si suoleporre

S(−t) = S(t)−1.

Se poi cio e vero per ogni t, tanto meglio. L’idea e chiara: se applicare S(t) equivale aspostare avanti il tempo di t, allora la funzione inversa riportera il tempo indietro di t.

(8) Se volete, potete pure porre t0 = 0.

(9) Non e l’esponenziale, per carita.

(10) Il nome, evidentemente, deriva dal fatto che la famiglia {S(t)}t>0 verifica le proprieta di grupporispetto alla composizione, a parte l’invertibilita.

76

La cosa simpatica e che la proprieta (2.12) si conserva, anche se s o t sono negativi. Esolo noioso fare la verifica, perche ci sono vari casi (11).

Le famiglie di funzioni, dipendenti da un parametro reale, che verificano questa proprieta(per t > 0 o per t ∈ R, non fa differenza nella terminologia) si chiamano sistemi dinamici.

Se F e lineare, allora il sistema si dice lineare. In questo caso esiste una matrice quadrataA tale che F(u) = Au, e quindi un sistema lineare ha la forma

(2.14) u = Au

e gode della ben nota proprieta che la combinazione lineare di due sue soluzioni e ancorauna soluzione.

E possibile trovare una soluzione generale (cioe, valida per ogni matrice A) del sistema(2.14)? Be’, dipende da quello che si e disposti a sopportare. Mi spiego subito: andiamoper tentativi, una volta tanto. Prendiamo u0 e vediamo se, per esempio, u e lineare in t,e se magari e proprio u1 = tAu0 + u0; l’idea puo sembrare stupida, ma questa funzione hau(0) = u0 e la derivata u1 = Au0 e “quasi” giusta: c’e che u0 non e u1. Proviamo allorau2 = u1 + t2Bu0, con B da determinare (se non ci fosse il t2, sarebbe stato come cambiareA e avrei peggiorato). Adesso

u2 = Au0 + 2tBu0

e mi accorgo che non c’e verso di tirar fuori u2 perche non riesco in nessun modo a farcomparire t2; pero se B = A2/2 (12) mi viene

u2 = Au0 + tA2u0 = Au1.

Allora vado avanti e cerco u3 = u2 + t3Cu0, e cosı via, e trovero che se C = A3/3 mi verrau3 = Au2, e cosı via. Se vado a vedere come e fatta u3, risulta

u3 = u0 + tAu0 +t2

2A2u0 +

t3

3A3u0.

A questo punto potrei pensare (se sono un Fisico) che se t e piccolo, queste sono approssi-mazioni sempre migliori della soluzione, e (se sono un matematico) che sto costruendo laserie

u(t) = u0 + tAu0 +t2

2A2u0 +

t3

3A3u0 + . . .+

tn

n!Anu0 + . . . = (I + tA +

t2

2A2 + . . .)u0.

In effetti, se deriviamo questa u e supponiamo che i puntini non facciano scherzi, troviamo

u(t) = (A + tA2 +t3

2A3 + . . .)u0 = A(I + tA +

t2

2A2 + . . .)u0 = Au(t).

(11) Per esempio, un caso antipatico e quello in cui t > 0, s < 0 e t + s < 0. Dunque ho che−s = −(s+ t) + t e i due addendi del membro di destra sono positivi, e quindi per la vecchia regola

S(−s) = S(−(t+ s)) ◦ S(t)

Componendo a sinistra con S(t+ s) = S(−(t+ s))−1 e a destra con S(s) = S(−s)−1 troviamo

S(t+ s) = S(t) ◦ S(s)

che e quello che vogliamo. Gli altri casi si trattano analogamente. Fateli per esercizio.

(12) A2 vuol dire A · A, prodotto righe per colonne.

77

Di fronte a un’“evidenza” del genere, non c’e che da fare una cosa: dar senso all’espressione

I + tA +t2

2A2 + . . .

e dimostrare che si puo derivare per serie. La prima parte e facile, perche le matrici hannouna norma, per cui si puo definire una serie di matrici esattamente come si definisce unaserie di numeri: essa convergera se la successione delle matrici somme parziali della serieconvergera alla matrice limite, ecc. ecc.. La seconda e piu difficilina, ma i corsi di Analisici sono anche per questo.

Per finire, l’assonanza con lo sviluppo dell’esponenziale (e la voglia di dividere per u—che non si puo perche e un vettore—e integrare la (2.14) e molto grande) ci obbligano aporre

etA = I + tA +t2

2A2 + . . . =

∞∑k=0

tAk

k!.

Bene. Se avete digerito questo, sentite quest’altro: adesso la mia soluzione del problemaai valori iniziali e

u(t) = etAu0,

che e un vettore. Gia, ma quali sono le sue componenti? Come faccio a calcolare Ak perogni k? Devo fare il prodotto righe per colonne. Ecco che la nostra bella scoperta cisi rivolta contro: sebbene abbiamo una “formula” bella, non sappiamo che farcene. Be’,allora tentiamo questo: dove ci sono le matrici c’entrano gli autovalori, per cui se avessimoun autovettore v relativo a un autovettore λ risulterebbe

etAv = v + tAv +t2

2A2v + . . .+

tk

k!Akv = v + tλv + t2

λ2

2v + . . .+ tk

λk

k!v + . . . = eλtv

dove l’ultima espressione ha senso se λ e reale (13). Pertanto, se gli autovettori generanotutto lo spazio, dato il valore iniziale u0, ci bastera porre

(2.15) u0 =m∑k=1

(u0 · vk)vk

e trovare, nel caso di autovalori reali e distinti,

u(t) =m∑k=1

(u0 · vk)eλktvk.

(per autovalori complessi coniugati la situazione e, come immaginate, simile).Il guaio e che non sempre e cosı: quando gli autovalori sono multipli, puo capitare

che i corrispondenti autovettori non generino tutto lo spazio. In questo caso, allora, isemplici esponenziali non bastano, e servono altre soluzioni, generate da altri autovettoridetti autovettori generalizzati, sui quali non ci soffermiamo. Ci basta dire che in quei casile nuove soluzioni sono della forma theλt, con h intero > 1 e con l’ovvia generalizzazionequando λ e complesso. Pertanto abbiamo motivato (dimostrato e una parola troppo pesantein questo caso) la

(13) Se λ = α+ iβ sappiamo che risulta eαt cos(βt) oppure eαt sen(βt).

78

Proposizione 2.9. Sia A una matrice quadrata a valori reali e siano λi (i = 1, . . . , k) isuoi autovalori. Allora esistono una costante C > 0 e due interi h, j > 0 tale che

(2.16) ‖etA‖ 6 C th e(maxj Reλj)t.

Si ha poi h = 0 se tutti gli autovalori sono semplici.

Le soluzioni di equilibrio di un sistema autonomo sono le soluzioni costanti. Evidente-mente una soluzione u(t) = u e di equilibrio se e solo se F(u) = 0 e u(t0) = u. Chiaramente,un sistema lineare ha sempre 0 come soluzione di equilibrio, ma puo averne di altre: inquesto caso, pero, esse saranno in numero infinito e genereranno un sottospazio vettorialedi Rm. Se abbiamo un semigruppo, una posizione di equilibrio non e altro che un puntounito di S(t) per ogni t:

S(t)u = u ∀t > t0.

2.4. Stabilita dell’equilibrio

Dire che un sistema autonomo ammette una posizione di equilibrio non e abbastanzaper poter dire “il sistema olonomo tale stara in equilibrio”. Perche? Abbiamo sbagliato iconti? No: se u0 = u (u e la posizione di equilibrio, allora u(t0) = 0 perche F(u) = 0),e quindi tutto resta fermo. Dov’e stavolta la fregatura? Di sicuro c’entreranno di nuovoquelle dannate varieta...

Tranquilli: la matematica e giusta; e il mondo, se cosı si puo dire, che e sbagliato. Inrealta, nell’applicazione pratica, non accade mai che la posizione u0 sia esattamente u, acausa degli inevitabili errori di approssimazione, e cosı via. Dunque in realta quello che siosserva e, se volete, la soluzione di un altro problema ai valori iniziali, con un valore inizialeche puo essere lievemente diverso da quello di equilibrio.

La stabilita assicura proprio che in questi casi, anche se il sistema non stara in equilibrio,si muovera vicino alla posizione di equilibrio (ed anzi con precisione voluta, a patto di esserecapaci di partire vicino all’equilibrio), o tendera ad avvicinarsi ad esso man mano che iltempo passa. In questo senso e una condizione di “osservabilita fisica”.

A dire il vero, non e solo la condizione iniziale ad essere soggetta ad imprecisione nelmondo reale. Una cosa ben piu frequente e ragionevole e che tutto il sistema potrebbeessere lievemente diverso da quello “modello” che stiamo considerando: un caso frequen-tissimo e l’aver trascurato l’attrito per avere la conservazione dell’energia, o cose simili.Lo studio della stabilita rispetto a questo tipo di imprecisioni, detta stabilita strutturaleo stabilita totale, e pero molto difficile, e non possiamo nemmeno permetterci di accen-narvi. Accontentiamoci della stabilita dell’equilibrio, che riserva comunque delle proprietainteressanti.

Diamo allora la definizione di stabilita dell’equilibrio, per un generico semigruppo (maovviamente noi abbiamo in mente le soluzioni delle equazioni differenziali).

Definizione 2.10. Una soluzione di equilibrio u di un semigruppo si dice stabile se perogni intorno V di u esiste un intorno U di u tale che per ogni u0 ∈ U si abbia per ognit > 0

S(t)u0 = u(t) ∈ V.

79

La spiegazione e questa: V rappresenta la precisione che si vuole (o si puo) raggiungerenel movimento “perturbato” della soluzione, mentre U rappresenta la “zona di sicurezza”dalla quale si deve partire per avere la precisione voluta.

Se riscriviamo la parafrasi “per ogni u0 ∈ U , S(t)u0 ∈ V ” come S(t)U ⊆ V (doveS(t)X rappresenta semplicemente l’insieme di tutte le soluzioni uscenti da X “fotografate”all’istante t), possiamo riscrivere la definizione in maniera equivalente cosı:

“Per ogni intorno V di u esiste un intorno U di u tale che per ogni t > t0 si abbia

S(t)U ⊆ V .”

Come ricorderete certamente, questa definizione sembra quella di continuita della fun-zione S(t) (14). Pero e diversa, perche c’e quel “per ogni t > t0” che e fondamentale: essodice che tutta l’orbita deve stare in V una volta partiti da U , o, che e lo stesso, che l’intornoU deve funzionare per tutti i t (15).

Questa definizione coinvolge solo gli intorni, ed e pertanto “topologica”, o “locale”.Questo significa che si puo verificare se la posizione di equilibrio e stabile guardando a cioche accade in un intorno di u. Supponiamo infatti che si conosca cio che dice la definizionenon per tutti gli intorni V di u, ma solo per quelli contenuti in un certo intorno Z di u.Allora u e stabile. Infatti, preso un qualunque intorno V di u, l’insieme V ∩Z e un intornodi u. Dunque esso ammette un intorno V ′ ⊆ V ∩ Z ⊆ Z tale che S(t)u0 ∈ V ′ per ognit > t0. Ma allora si avra anche S(t)u0 ∈ V .

Siccome pero gli intorni in Rm hanno una ben precisa proprieta, cioe contengono dellepalle aperte di centro u, e possibile riformulare la definizione di stabilita dell’equilibrio inmaniera equivalente cosı:

Proposizione 2.11. Una posizione di equilibrio u di un semigruppo e stabile se e solose per ogni ε > 0 esiste δ > 0 tale che se ‖u0 − u‖ < δ, allora per ogni t > t0 si ha‖S(t)u0 − u‖ < ε.

La dimostrazione e semplice e segue esattamente gli stessi passaggi che avete fatto perpassare dalla definizione di limite con gli intorni a quella “ε − δ”; si basa sul fatto che lepalle aperte sono intorni e che ogni intorno di u contiene una palla aperta di centro u.Provateci per esercizio.

Come e possibile verificare se una posizione di equilibrio e stabile? Be’, se si conosce lasoluzione e una questione di pazienza, usando la proposizione appena scritta. Per esempio,prendiamo m = 1 e il sistema x = −x. La posizione di equilibrio e x = 0 e le soluzionidel problema ai valori iniziali con t0 = 0 sono S(t)x0 = x0e

−t. Allora, fissato ε, prendiamoδ = ε. Se |x0| 6 δ, allora

|x(t)− x| = |x(t)| = |x0|e−t 6 |x0| < δ = ε

e quindi x = 0 e stabile.Un esempio in due dimensioni e {

x = y

y = −x.

(14) S(t) non e l’immagine di niente, a causa della sciagurata scelta della notazione. Nella “notazioneϕ” sarebbe ϕ(·, t).

(15) Questa definizione di stabilita si deve al matematico russo A.M. Ljapunov, e per questo molti lachiamano “stabilita secondo Ljapunov”.

80

La posizione di equilibrio e (0, 0). Le soluzioni t 7→ (x(t), y(t)) di questo sistema, corri-spondenti ai vari valori iniziali (x0, y0) sono

x(t) = x0 cos t+ y0 sen t y(t) = −x0 sen t+ y0 cos t

e verificano l’interessante proprieta che per ogni t

x(t)2 + y(t)2 = x20 + y2

0.

Prendiamo anche stavolta δ = ε; allora se ‖(x0, y0)− (x, y)‖ =√x2

0 + y20 < δ, abbiamo per

ogni t > t0

‖(x(t), y(t)− (x, y)‖ =√x(t)2 + y(t)2 =

√x2

0 + y20 < δ = ε

e quindi la posizione di equilibrio e stabile.Nel primo dei due esempi ci siamo forse accorti che la soluzione “perturbata” t 7→ x(t)

aveva una particolarita che quella del secondo esempio non aveva, e cioe che tendeva allaposizione di equilibrio. Quando, oltre alla stabilita, c’e anche questa proprieta, si parla distabilita asintotica.

Definizione 2.12. Una soluzione di equilibrio u di un semigruppo si dice asintoticamentestabile se e stabile e se esiste un intorno W di u tale che per ogni u0 ∈ W si abbia che perogni intorno V di u esiste t > t0 tale che per ogni t > t si abbia S(t)u0 ∈ V .

Non spaventatevi: e cosı perche non ho voluto introdurre la definizione di limite. Questa,in Rm, e equivalente ed e quella che serve.

Definizione 2.13. Una soluzione di equilibrio u ∈ Rm di un semigruppo in Rm si diceasintoticamente stabile se e stabile e se esiste un intorno W di u tale che per ogni u0 ∈ Wsi abbia

limt→+∞

‖S(t)u0 − u‖ = 0.

Un esempio in due dimensioni e {x = −x+ y

y = −x− y.

La posizione di equilibrio e sempre (0, 0). Le soluzioni t 7→ (x(t), y(t)) di questo sistema,corrispondenti ai vari valori iniziali (x0, y0) sono stavolta

x(t) = e−t(x0 cos t+ y0 sen t) y(t) = e−t(−x0 sen t+ y0 cos t)

e verificano la proprieta che per ogni t

x(t)2 + y(t)2 = (x20 + y2

0)e−2t.

Siccome e−t 6 1, la stabilita si mostra come prima prendendo δ = ε. Poi abbiamo che seW = R2, allora

limt→+∞

‖(x(t), y(t)− (x, y)‖ = limt→+∞

√x(t)2 + y(t)2 = e−t

√x2

0 + y20 = 0

e dunque (0, 0) e asintoticamente stabile.Ma se non si conoscono le soluzioni, come si fa? Non sembra facile, almeno a partire

dagli esempi. Vediamo.

81

Magari e il sistema ad essere semplice, per esempio lineare. Si puo dire qualcosa nel casolineare? Sı, e anzi il problema della stabilita si puo risolvere completamente, a patto disaper calcolare gli autovalori di una matrice qualunque.

Intanto osserviamo che, siccome 0 e sempre posizione di equilibrio di un sistema lineare,possiamo iniziare a studiare la stabilita di questa; quando ne esisteranno altre, ci pensere-mo. Notiamo anche che l’equazione per u−u e la stessa che per u, cioe u = Au. Ci basteraquindi studiare il comportamento delle soluzioni del sistema per trarre informazioni sullastabilita dell’origine.

Teorema 2.14 (di stabilita dei sistemi lineari). Sia dato il sistema lineare

u = Au.

Allora valgono i seguenti fatti:

(1) Se tutti gli autovalori della matrice A hanno parte reale strettamente negativa, lasoluzione nulla del sistema e asintoticamente stabile;

(2) Se esiste un autovalore della matrice A con parte reale strettamente positiva, laposizione nulla e instabile;

(3) Se tutti gli autovalori della matrice A hanno parte reale negativa o nulla e sonosemplici, la posizione nulla e stabile;

(4) Se esiste un autovalore della matrice A con parte reale nulla, associato ad unasoluzione del tipo th cos(βkt) o th sen(βkt) con h > 1, la soluzione nulla e instabile;

(5) Se esistono autovalori nulli della matrice A, esistono infinite posizioni di equilibriocon le stesse proprieta di stabilita della soluzione nulla.

Dimostrazione. Dalla (2.16) abbiamo che

‖u(t)‖ 6 ‖etA‖‖u0‖.

Se tutti gli autovalori della matrice A hanno parte reale strettamente negativa, alloraesistono senz’altro h > 0 e p > 0 tali che

(2.17) ‖etA‖ 6 the−pt

e quindi

‖etA‖ 6 Kh < +∞

per ogni t > t0; dunque per ogni t > t0

‖u(t)‖ 6 Kh‖u0‖.

Preso quindi ε > 0, basta porre δ = ε/Kh per avere la stabilita. Poi, sempre dalla (2.17),troviamo per ogni u0

limt→+∞

‖u(t)‖ = 0

che prova la stabilita asintotica.Se esiste invece un autovalore con parte reale p strettamente positiva, tra le soluzioni

possibili c’e senz’altro una soluzione della forma t 7→ th ept cos(qt), con q ∈ R. Scegliendo

82

le condizioni iniziali in modo che almeno una componente uk abbia questa forma, essadivergera in modulo per t→ +∞ e quindi l’equilibrio e instabile (16).

Altrimenti, se tutti gli autovalori di A hanno parte reale nulla e sono semplici, alloraintanto si puo prendere h = 0 nel ragionamento fatto sopra e quindi, ugualmente ‖A‖ elimitata. Ne segue la stabilita.

Se invece vi sono autovalori multipli, significa che e possibile, per opportuni dati iniziali,una soluzione che abbia una componente del tipo t 7→ th cos(qt) (o sen(qt)), che diverge inmodulo, e quindi si ha instabilita.

Se infine vi sono autovalori nulli, allora detA = 0 e si hanno infinite posizioni di equilibrio,tra cui quella nulla. Detta u una di queste, allora, posto v(t) = u(t)− u, abbiamo

v = u = Au = Au− Au = Av.

Ne segue che alla posizione u per u corrisponde la posizione 0 per v, ma essendo il sistemalo stesso, le proprieta di stabilita debbono coincidere.�

Osserviamo in particolare che l’unico caso in cui tutte le soluzioni tendono a zero e quellodegli autovalori a parte reale strettamente negativa. Infatti, se tutti meno uno verificanoquesta condizione e l’ultimo e nullo, allora, partendo da una posizione di equilibrio nonnulla, non si tende alla posizione nulla. Quindi in questo caso vi e stabilita (e infatti siamonel caso (3)) ma non stabilita asintotica.

Notiamo infine che quando vi sono infinite soluzioni di equilibrio, si possono sempreapplicare i casi (3) e (4), per cui il problema si risolve in tutti i casi.

Dunque, le matrici con tutti gli autovalori a parte reale strettamente negativa sonoun caso di particolare interesse, in quanto il sistema lineare ad esse associato ha equilibrioasintoticamente stabile. Il seguente teorema, dovuto a Ljapunov, da delle condizioni neces-sarie e sufficienti affinche una matrice abbia tutti gli autovalori a parte reale strettamentenegativa.

Teorema 2.15 (di Ljapunov sui sistemi lineari). Una matrice m × m A ha tuttiautovalori a parte reale strettamente negativa se e solo se l’equazione matriciale

(2.18) ATW + WA = −I

ammette una soluzione (17) data dalla matrice dei coefficienti di una forma quadraticadefinita positiva.

Dimostrazione. Se gli autovalori di A hanno tutti parte reale strettamente negativa, allora,per il teorema di stabilita dei sistemi lineari, se t 7→ x(t) denota ogni soluzione del sistemalineare

x(t) = Ax(t)

(16) Qui, e anche nel discorso che seguira sotto, bisogna tener conto del fatto che alle soluzioni conqueste proprieta sono associati degli autospazi (eventualmente generalizzati) della matrice A. Basteraquindi prendere le condizioni iniziali in questi autospazi per trovarvi le soluzioni per ogni t > t0.

(17) Siccome l’equazione (2.18) e di primo grado, puo avere una, nessuna o infinite soluzioni. Incomponenti si scrive

ajixjk + xijajk = δik.

83

si ha

(2.19) limt→+∞

x(t) = 0.

Consideriamo allora una forma quadratica W (x) = xTWx, con W simmetrica, in modoche, lungo le soluzioni del sistema lineare x = Ax, si abbia

d

dtW (x) = −‖x‖2.

Mostriamo che tale forma deve essere definita positiva. Supponiamo allora per assurdo cheesista x0 6= 0 tale che W (x0) 6 0. Allora, pero,

d

dtW (x) = −‖x‖2 < 0

e quindi W e negativa e decrescente in t, il che contraddice il fatto che, per continuita eper la (2.19),

limt→+∞

W (x) = limx→0

W (x) = 0.

A questo punto, siccome

d

dtW (x(t)) = xTWx + xTWx = xTATWx + xTWAx,

si deve avere per ogni x

d

dtW (x(t)) = xTWx + xTWx = xTATWx + xTWAx = −‖x‖2 = xTIx,

e dunque W verifica ATW + WA = −I.Viceversa, se W verifica l’equazione matriciale (2.18) e la forma associata W e definita

positiva, allora, lungo le soluzioni del sistema lineare x = Ax,

d

dtW (x) = −‖x‖2.

Dunque

W (x) = W (x0)−∫ t

t0

‖x‖2(t) dt.

Mostriamo che x(t) = etAx0 deve tendere a zero per x0 6= 0, col che necessariamente, peril teorema di stabilita per i sistemi lineari, si debbono avere tutti gli autovalori con partereale strettamente negativa. Supponiamo per assurdo che non sia cosı; allora esiste ν > 0tale che ‖x‖ > ν per ogni t > t0. Dunque, dall’uguaglianza appena vista,

W (x) < W (x0)− νt,e dunque, per t abbastanza grande, W diviene negativa, contrariamente all’ipotesi.�

Questo teorema ci sara utile in seguito, come si dice sempre quando si fa una dimostra-zione difficile e non si sa perche.

Se invece di un sistema lineare si ha a che fare con un sistema qualsiasi (autonomo), lecose si fanno piu dure. Infatti non conosciamo le soluzioni in questo caso, e non possiamoapparentemente dire nulla sulla stabilita dell’equilibrio.

Invece sussiste un fondamentale teorema, sempre dovuto a Ljapunov, che permette ditrarre informazioni sulla stabilita a partire dalla linearizzazione del sistema.

84

Definizione 2.16. Dato un sistema

u = F(u)

avente posizione di equilibrio u, chiamiamo sistema linearizzato attorno alla posizione diequilibrio u il sistema nell’incognita v = u− u

v =∂F

∂u(u)v = A(u)v.

Il motivo del nome e evidente: siccome u e posizione di equilibrio, F(u) = 0 e quindiA(u) e il primo termine dello sviluppo di Taylor di F:

F(u) = F(u) +∂F

∂u(u)(u− u) + R(u) = A(u)v + R(u).

Per il sistema linearizzato vale il seguente

Teorema 2.17 (di linearizzazione). Se tutti gli autovalori del sistema linearizzato hannoparte reale strettamente negativa, allora la posizione di equilibrio del sistema originario easintoticamente stabile. Se esiste almeno un autovalore del sistema linearizzato con partereale strettamente positiva, allora la posizione di equilibrio del sistema originario e instabile.

A proposito di questo e importante sapere che questo teorema non fornisce alcuna in-formazione sulla stabilita quando vi sia anche un solo autovalore a parte reale nulla. Inquesto caso la parte lineare del sistema non e sufficiente per studiare la stabilita. Spessoquesto crea confusione, perche la soluzione nulla del sistema linearizzato (che e un sistemalineare) e magari stabile, ma la conclusione del teorema di linearizzazione si riferisce alsistema non lineare, e in questo caso non da informazione: vedremo che ci sono esempi disistemi non lineari con parte reale ad autovalori nulli che sono sia stabili, che instabili, cheasintoticamente stabili.

Dimostrazione. Per le proprieta del resto di Peano abbiamo che per ogni η > 0 esiste unintorno W di u tale che per ogni u ∈ U si abbia

‖R(u)‖ 6 η‖u− u‖.Posto quindi v = u− u, abbiamo che il sistema si scrive

v = u = F(u) = A(u)v + R(u).

A questo punto, siccome A(u) ha tutti autovalori a parte reale strettamente negativa, esisteuna forma quadratica definita positiva W con matrice simmetrica W tale che

ATW + WA = −Ie quindi, omettendo la dipendenza da u0 e da u,

d

dtW (v) =

d

dt(vTWv) = vTWv + vTWv = vT(ATW + WA)v + RTWv + vTWR

= −vTv + RTWv + vTWR = −‖v‖2 + RTWv + vTWR.

Usando la disuguaglianza di Schwarz e la proprieta del resto di Peano abbiamo che in Wla matrice W e limitata, per cui, preso η = 1/(4 supU ‖W‖), risulta facilmente

(2.20)d

dtW (v) 6 −‖v‖2 +

1

2‖v‖2 = −1

2‖v‖2.

85

A questo punto e quasi fatta. Siccome W e definita positiva,√W e una norma su Rm, e

quindi deve essere equivalente a quella canonica. Pertanto esiste una costante γ > 0 taleche

‖v‖2 > 2γW (v)

per ogni v ∈ Rm, e pertantod

dtW (v) 6 −γW (v).

Combinando questo fatto con la (2.20), troviamo

d

dtW 6 −γW

ossia, dopo facili passaggi,

(2.21) W (v) 6 W (v0)e−γ(t−t0).

Ora dimostriamo che u e stabile. Siccome√W e una norma, l’insieme

{v : W (v) < δ}

e un intorno di u per ogni δ > 0. Dalla relazione appena scritta si ha che se W (v0) < δ,allora per ogni t > t0 si ha W (v(t)) 6 δ e quindi si ha stabilita. Inoltre dalla (2.21) segueanche che

limt→+∞

W (v(t)) = 0

e quindi, sempre per il fatto che W e definita positiva, si trova che ‖v‖ → 0, il che mostrala stabilita asintotica.

Adesso vediamo l’instabilita. In questo caso sappiamo che esiste un sottospazio Σ di Rm

tale che, se le condizioni iniziali sono prese in Σ, si ha Av = λv, dove λ e uno degli autovaloria parte reale strettamente positiva (18). Ne segue che si deve avere Av0 · v0 = λ‖v0‖2.

Dal momento che Reλ > 0, avremo poi evidentemente

Av0 · v0 > (Reλ)‖v0‖2 >Reλ

2‖v0‖2

e quindi, per continuita, avremo che esistera un τ > t0 tale che

Av(t) · v(t) >Reλ

2‖v(t)‖2

per ogni t ∈ [t0, τ [.Ora, in questo intervallo di tempo,

1

2

d

dt‖v‖2 = v · v = Av · v + R · v > Reλ

2‖v‖2 + R · v.

Dalle proprieta del resto di Peano esiste un intorno U di u tale che,

‖R(u)‖ 6 Reλ

4‖v‖

(18) Facciamo per semplicita il caso in cui λ ∈ R. Se λ ∈ C, il ragionamento e analogo: alla peggio(anzi, alla meglio) Av · v > Reλ ‖v‖2.

86

e quindi dalla disuguaglianza di Schwarz (al contrario, stavolta)

1

2

d

dt‖v‖2 >

Reλ

4‖v‖2.

Da qui segue facilmente

‖v‖2(t) > ‖v0‖2 exp

(Reλ

4(t− t0)

)per ogni t ∈ [t0, τ [. Sempre per il fatto che Reλ > 0 si ha che

‖v(t)‖ > κ‖v0‖,

con κ > 1, per ogni t ∈ [t0, τ [.Siccome ora le condizioni iniziali sono prese in un sottospazio vettoriale, esso contiene

senz’altro lo zero (di v, che corrisponde a u), ed e un suo intorno, e quindi V = H ∩ U eun intorno di zero. Consideriamo ora una palla B(0, R) ⊆ V , e prendiamo le condizioniiniziali in B tali che ‖v0‖ = R/κ. Allora esiste certamente un istante t∗ tale che

‖v(t∗)‖ > κ‖v0‖ = R

e quindi v(t∗) 6∈ B(0, R), che e esattamente la definizione di instabilita di 0.�

Come esempio “paradigmatico” prendiamo il pendolo semplice. Siccome l’equazione delmoto e x+ ω2 senx = 0, esso si scrive sotto forma di sistema come

(2.22)

{x = y

y = −ω2 senx

Le posizioni di equilibrio di questo sistema sono x = 0 e x = π (x = 2π coincide conx = 0 e le altre si ripetono nel primo giro). La matrice A in una generica posizione (x, 0)(qui non dobbiamo dimenticare che u = (x, y)) e[

0 1−ω2 cosx 0

]Quindi

A(π, 0) =

[0 1ω2 0

]che ha autovalori λ = ±ω. Siccome ve n’e uno a parte reale strettamente negativa, laposizione (π, 0) (che e quella nel punto piu alto) e instabile. Ecco perche non abbiamo maivisto un pendolo in alto!

La matrice A(0, 0) e invece

A(0, 0) =

[0 1−ω2 0

]che ha autovalori ±iω. Siccome anche solo uno di essi ha parte reale nulla, non possiamodire niente sulla stabilita.

87

2.5. I teoremi di Ljapunov sulla stabilita

Ljapunov non ha ancora finito di tormentarci. Egli, infatti, ha dimostrato tre teoremi(noi ne dimostreremo solo uno) che permettono di determinare stabilita, stabilita asintoticao instabilita dell’equilibrio per i sistemi non lineari, a patto di trovare una particolarefunzione (relativa all’equilibrio e al sistema in esame), detta, manco a dirlo, funzione diLjapunov.

Definizione 2.18. Una funzione continua W : Rm → R si dice funzione di Ljapunovrelativa all’equilibrio u di un sistema dinamico continuo in t se W ha un minimo localestretto in u ed esiste un intorno X di u tale che per ogni u0 ∈ U si abbia che la funzionet 7→ W (S(t)u0) e non crescente.

Nel caso particolare dei sistemi autonomi, che generano sistemi dinamici sempre continui(anzi derivabili) in t, spesso W e derivabile e la seconda condizione su W si trova nellaforma

d

dtW (u(t)) 6 0.

Inoltre, si constata facilmente che se W e una funzione di Ljapunov relativa a u, allora perogni costante C anche W + C e una funzione di Ljapunov relativa alla stessa posizione diequilibrio.

Ecco il primo (e piu bel) risultato.

Teorema 2.19 (Teorema di Ljapunov sulla stabilita). Se un sistema dinamico con-tinuo ha una posizione di equilibrio che ammette una relativa funzione di Ljapunov, allorala posizione di equilibrio e stabile.

Dimostrazione. Sia V un intorno di u, che non e restrittivo, per quanto detto allo scorsoparagrafo, supporre cosı piccolo da far sı che W abbia in V un minimo assoluto in u e cheV sia contenuto nell’intorno X della definizione di funzione di Ljapunov. Non e nemmenorestrittivo pensare, per quanto detto, che W > 0 per ogni x ∈ Rm.

Sia ε > 0 tale che B(u, ε) ⊆ V e sia Sε(u) il bordo di B(u, ε). Siccome u 6∈ Sε(u), si hache W > 0 su Sε(u). Siccome W e continua e Sε compatta, per il teorema di Weierstrassessa ammettera un minimo mε raggiunto su Sε(u) e sara quindi mε > 0. Siccome W econtinua e mε > 0, l’insieme

U = {x ∈ Rm : W (x) < mε} = W−1(]−∞,mε[)

e un intorno di u. Se u0 ∈ U , allora W (u0) < mε. Supponiamo per assurdo che esistat∗ tale che u(t∗) = S(t∗)u0 6∈ V . Dunque ‖u(t∗) − u‖ > ε, e, per il teorema dei valoriintermedi applicato alla funzione continua t 7→ ‖u(t) − u‖, esiste t tale che u(t) ∈ Sε.Ma allora W (u(t)) > mε, ma questo e assurdo, perche W (u0) < mε e, per ipotesi, e noncrescente sulle soluzioni del sistema, dunque W (u(t)) < mε. Quindi S(t)u0 ∈ V per ognit > t0 e si ha la stabilita.�

Questo teorema aiuta a risolvere il problema del pendolo semplice. Infatti la funzioneW (x, y) = y2 +2ω2(1−cosx) ha un minimo stretto in (0, 0) e, lungo le soluzioni del sistema(2.22),

d

dtW (x(t), y(t)) = 2y(t)y(t) + 2ω2 senx(t)x(t) = −2ω2y(t) senx(t) + 2ω2y(t) senx(t) = 0,

88

e pertanto (0, 0) e stabile.In modo un po’ simile a quanto fatto a proposito della linearizzazione si puo dimostrare

il

Teorema 2.20 (di Ljapunov sulla stabilita asintotica). Se un sistema dinamico ha unaposizione di equilibrio isolata che ammette una relativa funzione W di Ljapunov, e se esisteun intorno U di detta posizione tale che per per ogni u0 ∈ U , u 6= u, si abbia che t 7→W (S(t)u0) e strettamente decrescente, allora la posizione di equilibrio u e asintoticamentestabile (19).

Per esempio, il sistema {x = y − x3

y = −x− y3

ha per posizioni di equilibrio il solo punto (0, 0) e la matrice del sistema linearizzato attornoa questa posizione e

A(0, 0) =

[0 1−1 0

]che ammette due autovalori a parte reale nulla. Posto pero W (x, y) = x2 + y2, abbiamo(omettendo le dipendenze da t),

dW

dt= 2xx+ 2yy = 2xy − 2x4 − 2xy − 2y4 = −2(x4 + y4).

Ne segue che, se (x, y) 6= (0, 0), allora dW/dt < 0 e quindi (0, 0) e asintoticamente stabile.Infine vale il

Teorema 2.21 (Primo teorema di Ljapunov sull’instabilita). Se un sistema dina-mico ha una posizione di equilibrio u ed esiste una funzione positiva che ammette in uun minimo stretto, e se per ogni intorno U di u esiste u0 tale che t 7→ W (S(t)u0) estrettamente crescente, allora u e instabile.

Per esempio, il sistema {x = y + x3

y = −x+ y3

(19) Un caso di frequente interesse, con delle ipotesi piu forti di quelle indicate qui, si ha quando lafunzione

G(u) =∂W

∂u· F(u)

ha un u un massimo stretto (come nell’esempio subito dopo il teorema, con G(x, y) = −x4 − y4) ed e unafunzione continua di u. In questo caso gli insiemi {u ∈ Rm : G(u) > −δ, δ > 0} sono intorni di u per ogniδ > 0 e quindi, se per assurdo una generica traiettoria non tendesse a u, si avrebbe

dW

dt< −δ

per ogni t > t0, e quindi, per t abbastanza grande, W sarebbe negativa, contro l’ipotesi. Come vedete, eproprio la generalizzazione del ragionamento fatto nel teorema di linearizzazione.

89

ammette la sola posizione di equilibrio nulla (0, 0), e si constata subito che la matriceA(0, 0) ha autovalori immaginari puri. Posto di nuovo W = x2 + y2, si ha subito

dW

dt= 2(x4 + y4)

e quindi per ogni intorno di (0, 0) c’e una condizione iniziale (in realta tutte quelle nonnulle) per cui dW/dt > 0 lungo il moto. Ne segue che (0, 0) e instabile.

Bello, no? Immagino che stiate pensando “ok, ho un sistema non lineare, trovo unaposizione di equilibrio, e se la linearizzazione non mi dice nulla, prendo una funzione diLjapunov e sono a posto”. Gia, ma come faccio a trovare la funzione di Ljapunov? Qui stail problema: nessuno sa come, in generale. Bisogna avere fortuna, oppure conoscere piu afondo la natura del problema, magari tramite qualche particolare integrale primo. Ma noiabbiamo fortuna: per i sistemi olonomi, in certi casi, c’e un candidato “naturale” per lafunzione di Ljapunov.

2.6. Stabilita nei sistemi olonomi

In un sistema olonomo le cose sono leggermente piu particolari che in un sistema di-namico qualsiasi. Naturalmente, visto che abbiamo considerato solo sistemi autonomi, cilimiteremo al caso in cui i vincoli siano fissi e le forze non dipendenti dal tempo.

Definizione 2.22. Una sollecitazione applicata a un sistema olonomo si dice dissipativase per ogni moto diverso dalla quiete le sue componenti lagrangiane verificano

Q · q < 0.

Tipiche forze dissipative sono le forze viscose; sappiamo gia che per esse la potenza spesasui moti diversi dalla quiete e strettamente negativa. Sappiamo gia poi quando una forzae conservativa, e che in quel caso esiste un potenziale (eventualmente generalizzato), mache si conserva l’energia meccanica totale con il potenziale ordinario.

Ecco il principale risultato che ci riguarda.

Teorema 2.23 (di Dirichlet-Lagrange sulla stabilita). Se un sistema olonomo e sog-getto a vincoli fissi, a forze che dipendono da un potenziale, ed eventualmente a forzedissipative o giroscopiche, se il potenziale ammette un massimo locale stretto in q, alloraquesta posizione e di equilibrio stabile.

Dimostrazione. Mettiamoci in un intorno nel quale U0 abbia un massimo globale stretto evediamo dapprima che in questo intorno l’energia totale

E(q, q) = K(q, q)− U0(q) = K(q, q) + V (q)

(dove l’energia potenziale e stata scelta in modo che E(q,0) = 0) ha le caratteristiche difunzione di Ljapunov relativa a u = (q,0). Innanzitutto E > 0 se (q, q) 6= (q,0). Se poiE = 0, siccome K e V sono entrambi positivi, si deve avere K = 0 e V = 0; dalla primarelazione segue allora necessariamente, per le proprieta dell’energia cinetica, q = 0, e dallaseconda, per le ipotesi fatte su V , si trae q = q. Dunque E ha un minimo stretto in u.

90

Siccome, per le ipotesi fatte, si hadE

dt6 0

lungo il moto, allora intanto, se (q0, q0) = (q,0), allora l’energia e zero e deve restare zeroper ogni t > t0. Ma allora, per l’unicita del minimo di E, si deve avere q(t) = q per ognit > t0 e quindi q e posizione di equilibrio. Dal teorema di Ljapunov sulla stabilita seguepoi che q e stabile.�

Nel nostro esempio del pendolo semplice, avrete senz’altro riconosciuto che W eraproporzionale all’energia meccanica totale del punto.

Se si rafforzano un po’ le ipotesi, e possibile dimostrare il

Teorema 2.24 (di Dirichlet-Lagrange sulla stabilita asintotica). Se un sistema olo-nomo e soggetto a vincoli fissi, a forze che dipendono da un potenziale e a forze dissipativeo giroscopiche, se il potenziale ammette un massimo stretto in q, allora questa posizione edi equilibrio asintoticamente stabile.

Attenzione! Sembrano le stesse ipotesi, ma prima c’era scritto “ed eventualmente aforze dissipative”, mentre qui c’e scritto “e a forze dissipative”: qui le forze dissipative civogliono, mentre prima erano un “optional”.Dimostrazione. L’energia totale e una funzione di Ljapunov come prima, ed anzi stavolta,su ogni moto diverso dalla quiete si ha

dE

dt< 0.

Pertanto, come nel precedente teorema, (q,0) e posizione di equilibrio, ed e anche isolataperche V ha un minimo stretto. Infine, siccome su ogni traiettoria non di equilibrio l’energiae strettamente decrescente, il teorema di Ljapunov sulla stabilita asintotica conclude ladimostrazione.�

Scommetto che alcuni di voi si aspettano ora il “teorema di Dirichlet-Lagrange sull’in-stabilita”. Be’, sı e no: se l’energia potenziale V ha un massimo in q, capita che E non hane massimo ne minimo in u = (q,0)! Non dimentichiamo che E e funzione di 2n variabili,e l’energia cinetica e sempre definita positiva.

In effetti il problema dell’inverso del teorema di Dirichlet-Lagrange e un problema diffi-cilissimo, non ancora del tutto risolto. Per il nostro uso e consumo, citiamo tuttavia senzadimostrare il

Teorema 2.25 (Secondo teorema di Ljapunov sull’instabilita). Se in un sistemaolonomo soggetto a vincoli fissi l’energia potenziale non ha un minimo in una posizione diequilibrio q, e se l’hessiano dell’energia potenziale e ivi definito negativo, allora la posizioneq e instabile.

2.7. Conservazione dell’energia

Torniamo ai nostri sistemi hamiltoniani.

91

Proposizione 2.26. Lungo le soluzioni t 7→ (q(t),p(t)) di un sistema hamiltoniano conhamiltoniana H si ha

dH

dt=∂H

∂t.

Naturalmente, con dH/dt intendiamo la derivata dell’applicazione

t 7→ d

dtH(q(t),p(t), t).

Dimostrazione. Abbiamo

dH

dt=

n∑i=1

(∂H

∂qiqi +

∂H

∂pipi

)+∂H

∂t

e quindi, siccome t 7→ (q(t),p(t)) e una soluzione diqi =

∂H

∂pi

pi = −∂H∂qi

,

sostituendo troviamo

dH

dt=

n∑i=1

(∂H

∂qi

∂H

∂pi− ∂H

∂pi

∂H

∂qi

)+∂H

∂t=∂H

∂t.�

2.8. Il principio dell’azione hamiltoniana

Definizione 2.27. Sia t 7→ (q(t),p(t)) una funzione regolare [t0, t1] → R2n. Data unafunzione H : R2n+1 → R, definiamo azione hamiltoniana sull’intervallo [t0, t1] il numero

SH [q,p] =

∫ t1

t0

(n∑i=1

piqi −H(q,p, t)

)dt =

∫ t1

t0

(p · q−H(q,p, t)) dt.

Allo stesso modo si chiama l’applicazione SH , che assegna ad ogni funzione regolare t 7→(q(t),p(t)) il valore SH [q,p].

Osserviamo due cose: primo, nell’espressione dell’azione lagrangiana c’erano soltanto leqi e le corrispondenti qi, oltre al tempo, mentre qui a queste variabili si aggiungono lepi (anche se non ci sono le pi); secondo, sembra che l’integrando sia H∗ = L, ma nonc’e il massimo: in effetti esso e diverso, perche non si richiede, a questo punto, che lepi e le qi siano legate dalle relazioni pi = ∂L/∂qi. Se fosse cosı, allora i due integrandicoinciderebbero.

Se poniamo M(q,p, q, p) = p · q−H(q,p, t) (anche se in realta non c’e la dipendenzada p), e se poniamo

s = (q,p),

abbiamo che l’azione hamiltoniana si esprime nella forma

SH [s] =

∫ t1

t0

M(s(t), s(t)) dt.

92

Pertanto la condizione di stazionarieta di questo funzionale si esprimera esattamente comeabbiamo fatto per l’azione lagrangiana,

d

dt

∂M

∂s− ∂M

∂s= 0

con l’avvertenza che, siccome s ha 2n variabili, le equazioni vanno distinte in quelle delleq e quelle delle p.

Ma quali sono queste equazioni? Be’, visto che

∂M

∂q= p,

∂M

∂q=∂H

∂q,

∂M

∂p= 0,

∂M

∂p= q− ∂H

∂p,

troviamo subito

q− ∂H

∂p= 0,

dp

dt− ∂H

∂q= 0

che sono esattamente le equazioni di Hamilton!La cosa pero non e proprio finita, perche, come abbiamo detto, M non e L. Per dare

una versione “hamiltoniana” del principio dell’azione stazionaria dobbiamo dimostrare ilseguente

Teorema 2.28. Ogni soluzione delle equazioni

d

dt

∂M

∂s− ∂M

∂s= 0

e soluzione delle equazioni di Lagrange, e viceversa.

Dimostrazione. Supponiamo che t 7→ q(t) sia una soluzione delle equazioni di Lagrange,ossia che rende stazionaria l’azione lagrangiana. Allora sappiamo anche che, se poniamop = ∂L/∂q, valgono le equazioni di Hamilton, dove H = L∗. Siccome esse sono anche leequazioni di Eulero-Lagrange per il funzionale SH , anche il funzionale SH e stazionario (sut 7→ (q(t),p(t))).

Viceversa, se t 7→ (q(t),p(t)) e una soluzione che rende stazionario SH , allora, tra leequazioni alle quali deve soddisfare la traiettoria ci sono le relazioni

q =∂H

∂p.

Ma questo sta a significare che, lungo le soluzioni dette, se si esprimono le pi in funzionedelle qi e delle qi, allora M = H∗ = L∗∗ = L e quindi L e stazionario. Pertanto la partet 7→ q(t) risolve il sistema di equazioni di Lagrange.�

Da questo teorema abbiamo il seguente importante risultato:

Teorema 2.29 (Principio dell’azione hamiltoniana stazionaria). Una funzione t 7→ (q(t),p(t))verifica il sistema di equazioni di Hamilton se e solo se rende stazionaria l’azione hamilto-niana.

93

2.9. Trasformazioni canoniche, prima parte

Definizione 2.30. Un sistema di 2n equazioni differenziali ordinarie del primo ordine sidice hamiltoniano se esiste una funzione H(u1, . . . u2n, t) tale che il sistema abbia la forma

u1 =∂H

∂un+1

un+1 = −∂H∂u1

......

un =∂H

∂u2n

u2n = − ∂H∂un

.

Non avrete fatto fatica a riconoscere in q le prime n componenti u1, . . . , un e in p lealtre.

Prendiamo ora un sistema di equazioni di Hamilton molto semplice: un grado di libertaq =

∂H

∂p

p = −∂H∂q

e poniamo Q = 2q (Q non c’entra niente con la componente lagrangiana di una forza: e unanuova variabile). Allora evidentemente Q = 2q e, posto H(q, p, t) = H ′(Q, p, t), avremo

∂H

∂q=∂H ′

∂Q

dQ

dq= 2

∂H ′

∂Q

per cui il sistema diviene Q =

1

2

∂H

∂p=

1

2

∂H ′

∂p

p = −2∂H ′

∂Q.

Come vedete, questo sistema non e piu un sistema di tipo hamiltoniano. Pero, se pongoP = p/2, potete verificare facilmente che, posto H ′′(Q,P, t) = H ′(Q, p, t), allora il sistematorna hamiltoniano con hamiltoniana H ′′.

Perche un sistema hamiltoniano sia piu “bello” di uno non hamiltoniano si vede, peresempio, dalla proprieta 2.26, ma ci sono altre proprieta, che vedremo piu avanti, chefanno dei sistemi hamiltoniani delle “perle” nel grande insieme dei sistemi di equazionidifferenziali (del primo ordine).

Sorge quindi spontanea una domanda: quali sono le caratteristiche delle trasformazioniche cambiano un sistema hamiltoniano in un sistema ancora hamiltoniano? La domandanon e puramente matematica: se osserviamo bene il sistema delle equazioni di Hamilton,infatti, ci accorgiamo che se per caso H non dipende da qk, allora si conserva il corrispon-dente momento cinetico pk (infatti ∂H/∂pk0 = 0). Questo non e altro che il corrispondentehamiltoniano del teorema 1.20. Pero, se fossimo cosı bravi da trasformare le nostre variabili

94

(q,p) in (Q,P) e la corrispondente hamiltoniana in H con ∂H/∂qk = 0, avremmo guada-gnato la conservazione della quantita Qk(q,p), e quindi un nuovo integrale primo. Stessodiscorso rispetto al tempo: se ∂H/∂t = 0, allora sara H a conservarsi lungo il moto (20).

Abbiamo quindi due problemi: primo, individuare le trasformazioni che trasformano unsistema hamiltoniano in un sistema hamiltoniano e, secondo, trovare quella o quelle chetrasformano un sistema hamiltoniano in un sistema hamiltoniano prescelto.

Le trasformazioni che risolvono il primo problema si chiamano trasformazioni canoniche.E un argomento un po’ ostico, per un motivo banale ma profondo: la notazione correttae pesante, quella leggera trae in inganno. Percio siamo costretti a fare dei compromessi.Useremo comunque la notazione

Q = Q(q,p, t), P = P(q,p, t).

L’osservazione fondamentale e capire come si modifica l’azione hamiltoniana per uncambio di coordinate.

Supponiamo allora di avere una trasformazione

(2.23) Q = Q(q,p, t), P = P(q,p, t)

e di potere ricavare (21) per ogni t le q,p dalle relazioni (2.23) ottenendo delle funzioni

q = q(Q,P, t), p = p(Q,P, t).

Da qui troviamo

q =n∑i=1

(∂q

∂Qi

Qi +∂q

∂PiPi

)+∂q

∂t

e sostituendo tutte queste espressioni nell’integrale dell’azione hamiltoniana, esso assumela forma ∫ t1

t0

f(Q,P, Q, P, t) dt.

Ora, nulla dice che la funzione f sia della forma P · Q − H(Q,P, t) per una certa H (ed

anzi in generale non sara cosı, in quanto in linea di principio f dipende anche da P).Supponiamo pero che si abbia∫ t1

t0

f(Q,P, Q, P, t) dt =

∫ t1

t0

(P · Q− H(Q,P, t)

)dt

per una opportuna H. In questo caso quindi si avrebbe

(2.24) SH [q,p] = SH [Q,P]

(20) Non si puo dare il caso in cui H non dipenda da pk. Infatti, dalla definizione di H, questosignificherebbe che L non dipende da qk, ossia che, per le equazioni di Lagrange, che L non dipendenemmeno da qk. Ma allora qk che ci sta a fare? E d’altro canto, dalle equazioni di Hamilton seguirebbeche qk sarebbe costante, contro l’ipotesi che sia un parametro lagrangiano.

(21) Qui (e da ora in poi, ma in realta lo eravamo gia da tempo) dobbiamo lavorare localmente, perchenon e detto che si possano avere delle trasformazioni globalmente invertibili. Questo e un altro grandemotivo che ha portato, come potrete immaginare, allo sviluppo del concetto di varieta.

95

e quindi le traiettorie di stazionarieta di SH , che sono le soluzioni delle equazioni di Hamil-ton con hamiltoniana H, si trasformeranno nelle traiettorie del sistema di Eulero-Lagrangeper l’azione SH , che, per quanto visto sopra, e hamiltoniano con hamiltoniana H.

La condizione (2.24) equivale a chiedere che esista una funzione F (Q,P, t) tale che, perogni t ∈ [t0, t1]

p(t) · ˙q(t)−H(q(t), p(t), t) = P(t) · Q(t)− H(Q(t),P(t), t) +dF

dt(t),

oppure, simmetricamente,

(2.25) p(t) · q(t)−H(q(t),p(t), t) = P(t) · ˙Q(t)− H(Q(t), P(t), t) +

dF

dt(t) (22).

La funzione F (o F ) si chiama talvolta funzione generatrice e permette di determinare letrasformazioni canoniche, nel modo seguente.

Poniamo per esempioF (t) = G(q(t),Q(t), t) (23).

E chiaro che se

(2.26) p(t) · ˙q(t)−H(q(t), p(t), t) = P(t) · Q(t)− H(Q(t),P(t), t) +dG

dt(t),

allora la trasformazione sara ugualmente canonica (perche anche in questo caso le dueazioni differiranno per una costante), e quindi, poiche

dG

dt=∂G

∂Q· Q +

∂G

∂q· ˙q +

∂G

∂t

sostituendo nella (2.26), troviamo (per ogni t che omettiamo)(p− ∂G

∂q

)· ˙q−

(P +

∂G

∂Q

)· Q− H(Q,P, t) +H(q, p, t) +

∂G

∂t= 0.

Adesso ragioniamo cosı: fissata una funzione arbitraria G, possiamo verificare la relazioneappena scritta se

(2.27) p =∂G

∂q, P = −∂G

∂Q, H(Q,P, t) = H(q, p, t) +

∂G

∂t.

Allora, dalle n relazioni

pi =∂G(q,Q, t)

∂qipossiamo pensare di invertire (localmente) e trovare Q in funzione di q,p, t:

Q = Q(q,p, t)

e successivamente, sostituendo nelle seconde n equazioni (2.27), troviamo

P = P(q,p, t).

(22) In questo caso, chiaramente, F dipende da q,p, t.

(23) Che vorra dire che

F (Q,P, t) = G(q,Q, t).

96

Infine, l’ultima equazione delle (2.27) ci dice che la nuova hamiltoniana H in funzione diQ,P, t sara data (la scriviamo per esteso) da

(2.28) H(Q,P, t) = H(q(Q,P, t), p(Q,P, t), t) +∂G

∂t(q(Q,P, t),Q)

oppure, in una maniera turpe ma efficace,

H = H +∂G

∂t.

Vediamo come funziona con un esempio. Prendiamo ovviamente n = 1 e

H(q, p, t) =p2

2m+ V (q).

Poniamo allora come esempio

G(q,Q) = qQ.

Allora abbiamo

p =∂G

∂q= Q(p)

e

P (q) = −qper cui Q = p e P = −q. La nuova Hamiltoniana diviene allora

H(Q,P ) =Q2

2m+ V (−P ).

Il sistema di equazioni di Hamilton originario q =p

mp = −V ′(q)

diventa quindi P = −Qm

Q = V ′(P ).

Non e il massimo, ma e pur sempre hamiltoniano.Un altro esempio simpatico e quello nel quale V (q) = 1/2kq2, ossia il caso di un punto

su una retta soggetto a una forza elastica di richiamo nell’origine. Allora avremo

H(q, p) =p2

2m+

1

2kq2 =

p2

2m+

1

2mω2q2

dove abbiamo messo in evidenza la pulsazione ω2 = k/m. Una funzione generatrice moltointelligente in questo caso e

G(q,Q) =1

2mq2 cotgQ.

Vediamo di nuovo come funziona:

p =∂G

∂q= mq

cosQ

senQ, P = −∂G

∂Q=

1

2mq2 1

sen2Q.

97

Elevando al quadrato la prima e sostituendovi la seconda troviamo facilmente

(2.29) q = ±√

2P

mωsenQ, p = ±

√2mωP cosQ.

Siccome la trasformazione non dipende esplicitamente da t, avremo

H(Q,P ) = H(±√

2P

mω,±√

2mωP cosQ) = ωP (sen2Q+ cos2Q) = ωP.

Ecco l’intelligenza della trasformazione: H non dipende da Q! Ne segue che il sistematrasformato e {

P = 0

Q = ω.

Facile da risolvere, no? Dalla prima segue P (t) = P0, mentre dalla seconda Q(t) = ωt+Q0.Se ora vogliamo q(t), basta sostituire nella prima delle (2.29) e trovare

q(t) = ±√

2P0

mωsen(ωt+Q0)

Dalle (2.29) si vede anche subito che Q deve essere un angolo (24), per cui possiamo anche

scrivere Q0 = ϑ0. Siccome poi H si conserva, in quanto non e esplicitamente dipendentedal tempo, abbiamo, lungo il moto,

ωP = E = cost.

e quindi P0 = E/ω e di conseguenza

q(t) =

√2E

mω2sen(ωt+ ϑ0) =

√2E

ksen(ωt+ ϑ0)

che e una delle tante espressioni del moto armonico.Si possono poi immaginare altre espressioni per la funzione generatrice. Una di queste e

che essa dipenda da q e P. Allora poniamo, per motivi per ora imperscrutabili,

F (t) = G(q,P)−PQ

e calcoliamodF

dt=∂G

∂q· q +

∂G

∂P· P− P ·Q−P · Q

per cui sostituendo nella (2.25), troviamo senza difficolta (omettiamo le dipendenze precise)(p +

∂G

∂q

)· q−

(Q− ∂G

∂P

)· P + H −H − ∂G

∂t= 0.

Questa equazione e identicamente soddisfatta se

p = −∂G∂q

, Q =∂G

∂P, H = H +

∂G

∂t.

A questo punto, dalle prime n equazioni

pi = −∂G∂qi

(q,P)

(24) P ha invece le dimensioni di un’azione, e infatti queste variabili si chiamano variabili azione-angolo.

98

e possibile invertire localmente e trovare la relazione P = P(q,p), che reinserita poi nelleseconde n equazioni

Qi =∂G

∂Pi(q, P(q,p))

permettono di trovare le altre n componenti della trasformazione. Infine

H(Q,P, t) = H(q(Q,P, t), p(Q,P, t), t) +∂G

∂t(q(Q,P, t),P).

In modo analogo si procede se la funzione generatrice dipende da p e Q, oppure da p e P.Adesso che abbiamo scoperto come generare una trasformazione canonica, ci rivolgiamo

al secondo problema, ben piu difficile. Supponiamo di volere giungere a un sistema hamil-toniano molto semplice. Il piu semplice di tutti e quello in cui H e nulla (o costante, che inquesto caso e lo stesso). Allora l’incognita diventa la funzione generatrice. Se supponiamoche essa sia funzione di q e Q, avremo, ricordando la prima delle (2.27) e l’equazione (2.28),

∂G

∂t+H

(q,∂G

∂q, t

)= 0

che e nota come equazione di Hamilton-Jacobi. Se si trova F , il gioco e fatto: il sistemahamiltoniano diventa Q = 0, P = 0 e quindi Q e P sono costanti, dopodiche dalletrasformazioni inverse si ricava il moto (25)

Si tratta di un’equazione alle derivate parziali, quindi in linea di principio ben piu difficiledi un sistema di equazioni ordinarie, che inoltre va risolto in un modo molto particolare,che accenneremo nel prossimo paragrafo.

2.10. Metodo di Hamilton-Jacobi

Non avrete scordato che, nell’equazione di Hamilton-Jacobi

(2.30)∂G

∂t+H

(q,∂G

∂q, t

)= 0

la funzione incognita G, la funzione generatrice della magica trasformazione che annullal’hamiltoniana, dipendeva non solo dalle qi ma anche dalle Qi. Dove e finita questa dipen-denza? E chiaro che se si trova una soluzione della (2.30), funzione di t e di q, ci si puoaggiungere una funzione qualunque di Q senza modificare l’equazione. Questo e un pregiodelle equazioni alle derivate parziali, ma qui, proprio perche le Qi sono “nascoste” nellatrasformazione, non ci va bene una soluzione del genere.

Quello che ci serve e cio che prende il nome di integrale completo di Lagrange della(2.30), che e una soluzione che non dipende da una funzione arbitraria, ma da n costantiarbitrarie. L’idea e che le costanti arbitrarie debbono permettere di calcolare i valori di Pi,perche sappiamo che si devono conservare, ma la grana e che non sappiamo come trovarle.

(25) In realta non e cosı semplice, ma o vedremo fra poco.

99

Allora supponiamo di avere un integrale completo G = I(q, t, ξ1, . . . , ξn) dell’equazione diHamilton-Jacobi e poniamo

(2.31) Πi = −∂G∂ξi

Cosa sono le Πi? Siccome P = −∂G/∂Q, abbiamo che le Πi sono i valori costanti dellePi, che saranno note conoscendo le condizioni iniziali (e la trasformazione canonica). Poi,scrivendo meglio le (2.31), abbiamo

Πi = −∂G∂ξi

(q, t, ξ1, . . . , ξn, t)

per cui sara possibile trovare la dipendenza dal tempo delle q invertendo queste relazioni.Volendo infine determinare le pi, bastera usare le prime n equazioni (2.27),

pi(t) =∂G

∂qi(q(t), t, ξ1, . . . , ξn).

Sembra facile, ma non lo e affatto. Un caso un po’ piu semplice e quello in cui H nondipenda da t, per cui una delle n costanti ξi e nota: e l’energia totale E del sistema, chesappiamo doversi conservare lungo il moto. Allora cerchiamo G della forma

G(q, t) = W (q)− Et

e osserviamo che quindi l’equazione per W e

(2.32) H

(q,∂W

∂q

)= E.

Se ora W = J(q, ξ1, . . . , ξn−1;E) e un integrale completo (contenente n − 1 costanti

ξ1, . . . , ξn−1) delle equazioni (2.32), allora evidentemente G = J(q, ξ1, . . . , ξn−1, E)−Et e unintegrale completo di Lagrange dell’equazione originaria, con le n costanti ξ1, . . . , ξn−1, E.Possiamo allora applicare il metodo descritto sopra e scrivere, rispetto alla n-esima costan-te,

∂G

∂E=∂J

∂E− t = −t0 (26)

e quindi si puo trovare t in funzione di q dalle relazioni

(2.33) t− t0 =∂J

∂E(q, ξ1, . . . , ξn−1, E).

In modo analogo a quanto visto sopra, troviamo poi le qi in funzione del tempo e delle altrecostanti Πi.

Il metodo di Hamilton-Jacobi fornisce il modo piu assurdo che conosca per integrarel’oscillatore armonico su una retta (naturalmente, serve anche ad altro...). In questo caso,siccome l’hamiltoniana e

H =p2

2m+

1

2mω2q2,

(26) Non e magnifico? La costante associata all’energia totale e il valore del tempo in un dato istante...

100

l’equazione di Hamilton-Jacobi dice: sostituisci p con∂W

∂xnella (2.32) e cerca un integrale

completo. Ma qui succede un miracolo: siccome n = 1, allora n − 1 e zero e non servonoaltre costanti: basta risolvere per ogni E l’equazione (ordinaria)

1

2m

(dW

dq

)2

+1

2mω2q2 = E.

Ma le equazioni come queste le facciamo dormendo (27) e infatti la soluzione e (scrivo W

al posto di J , tanto qui sono la stessa cosa)

W (q, E)−W (q0) =

∫ q

q0

√2mE −m2ω2q2 dq.

Usando la (2.33) abbiamo infine, derivando sotto il segno di integrale,

t− t0 =∂W

∂E=

∫ q

q0

m√2mE −m2ω2q2

dq =

∫ q

q0

1√2E/m− ω2q2

dq.

Ponendo infine A =√

2E/(mω2), con facili passaggi l’integrale diventa∫ q

q0

1√2E/m− ω2q2

dq =1

ω

(arccos

q

A− arccos

q0

A

)e infine, ponendo ϑ0 = arccos(q0/A), troviamo la formula finale

q(t) = A cos(ωt+ ϑ0).

2.11. Parentesi di Poisson

Bene, ora sappiamo (in linea di principio) come cambiare un sistema hamiltoniano inun altro in modo da ottenere degli integrali primi. C’e pero anche un altro concetto moltoutile per trovare integrali primi di un sistema olonomo, ed e la parentesi di Poisson.

Definizione 2.31. Date due funzioni di classe C1 F,G : R2n+1 → R, definiamo parentesidi Poisson di F e G la funzione [F,G] : R2n+1 → R data da

[F,G] =n∑i=1

(∂F

∂qi

∂G

∂pi− ∂G

∂qi

∂F

∂pi

)=∂F

∂q· ∂G∂p− ∂G

∂q· ∂F∂p

.

Questo concetto gode di numerose proprieta che andiamo a scoprire subito.

Teorema 2.32. La parentesi di Poisson di due funzioni F,G verifica le seguenti proprieta:

i) [λF + µG,H] = λ[F,H] + µ[G,H] (λ, µ ∈ R);

(27) Facendo magari brutti sogni: vi state accorgendo che, nel caso piu generale di un’energia potenzialeV (q) stiamo ritrovando il vecchio integrale ∫

1√E − V (q)

dq?

Non ci ricorda un certo signor Weierstrass?

101

ii) [F, λG+ µH] = λ[F,G] + µ[F,H] (λ, µ ∈ R);

iii) [G,F ] = −[F,G];

iv)∂

∂t[F,G] =

[∂F

∂t,G

]+

[F,∂G

∂t

];

v) [ [F,G], H] + [ [G,H], F ] + [ [H,F ], G] = 0 (identita di Jacobi).

Dimostrazione. La i) e la ii) sono evidenti perche le derivate di F e G compaiono linear-mente nell’espressione della parentesi. La iii) e pure banale. Vediamo la iv). Siccome

∂t

∂F

∂qi

∂G

∂pi=

∂2F

∂t∂qi

∂G

∂pi+∂F

∂qi

∂2G

∂t∂pi=

∂2F

∂qi∂t

∂G

∂pi+∂F

∂qi

∂2G

∂pi∂t=

(∂

∂qi

∂F

∂t

)∂G

∂pi+∂F

∂qi

(∂

∂pi

∂G

∂t

)e analogamente per l’altro termine, la tesi segue per linearita. Infine la v) e noiosa e laprendiamo per buona.�

Queste sono le proprieta algebriche della parentesi di Poisson. Ora vediamo di combinarlecon un dato sistema hamiltoniano avente una funzione di Hamilton H.

Proposizione 2.33. Se F : R2n+1 → R e una funzione di classe C1 e t 7→ (q(t),p(t)) ela traettoria di un sistema hamiltoniano con hamiltoniana H, allora

d

dtF (q(t),p(t), t)

∂F

∂t(q(t),p(t), t) + [F,H](q(t),p(t), t).

Dimostrazione. Abbiamo, omettendo la dipendenza da q(t),p(t), t per brevita,

dF

dt(q(t),p(t), t) =

∂F

∂t+

n∑i=1

(∂F

∂qiqi +

∂F

∂pipi

)=∂F

∂t+

n∑i=1

(∂F

∂qi

∂H

∂pi+∂F

∂pi

(−∂H∂qi

))=

=∂F

∂t+ [F,H].�

Corollario 2.34. Una funzione F : R2n+1 → R, F = F (q,p, t) e un integrale primodel moto di un sistema hamiltoniano con hamiltoniana H se e solo se per ogni soluzionet 7→ (q(t),p(t)) del sistema

∂F

∂t(q(t),p(t), t) = −[F , H](q(t), p(t), t).

In particolare, troviamo che se F non dipende dal tempo, allora F e un integrale primose e solo se [F,H] = 0. La conservazione di H si traduce cosı in [H,H] = 0, che discendedall’antisimmetria.

Enunciamo e dimostriamo infine il teorema piu importante riguardo alle parentesi diPoisson

Teorema 2.35 (di Jacobi-Poisson). Se F e G sono due integrali primi di un sistemahamiltoniano, anche [F,G] lo e.

Dimostrazione. Per ipotesi abbiamo, lungo il moto che omettiamo di scrivere,

∂F

∂t+ [F,H] = 0,

∂G

∂t+ [G,H] = 0.

102

Abbiamo poi, dalla proposizione 2.33

d

dt[F,G] =

∂t[F,G] + [ [F,G], H].

Dalla quarta proprieta algebrica delle parentesi di Poisson e dalle ipotesi abbiamo

d

dt[F,G] =

[∂F

∂t,G

]+

[F,∂G

∂t

]+ [ [F,G], H] = −[ [F,H], G]− [F, [G,H] ] + [ [F,G], H]

e a questo punto la tesi discende dall’antisimmetria e dall’identita di Jacobi.�Naturalmente, se per caso disponessimo di due integrali primi, non e che ne abbiamo

scoperti infiniti altri: dopo un po’ le varie parentesi di Poisson o sono zero o si ripetono.Il teorema e comunque interessante e anche bello.

Le parentesi di Poisson sono poi legate alle trasformazioni canoniche: infatti esiste uncriterio che permette di esprimere la canonicita di una trasformazione mediante le parentesidi Poisson. Ma per questo serve ancora un po’ di lavoro.

2.12. Invariante integrale di Poincare

Supponiamo che il funzionale di azione lagrangiana

SL[q] =

∫ t1

t0

L(q(t), q(t), t) dt

(dove q = (q1, . . . , qn)) sia calcolato supponendo che gli istanti iniziali e finali t0 e t1, cosıcome le coordinate lagrangiane in questi istanti, q0 e q1, non siano fissi, ma possano anch’essivariare. Piu precisamente, queste quantita saranno funzioni regolari di un parametro α eporremo

g(α) =

∫ t1(α)

t0(α)

L(q(t, α), q(t, α), t) dt

dove abbiamo indicato per bellezza con q la derivata parziale ∂q/∂t.Calcoliamo g′(α), avvalendoci della nota relazione

d

ds

∫ b(s)

a(s)

f(s, t) dt = f(b(s))b′(s)− f(a(s))a′(s) +

∫ b(s)

a(s)

∂sf(s, t) dt.

Abbiamo

g′(α) =d

∫ t1(α)

t0(α)

L (q(t, α), q(t, α), t) dt

L (q(t1(α), α), q(t1(α), α), t1(α)) t′1(α)+

− L (q(t0(α), α), q(t0(α), α), t0(α)) t′0(α)+

+

∫ t1(α)

t0(α)

∂αL (q(t, α), q(t, α), t) dt

:=L1 t′1(α)− L0 t

′0(α) +

∫ t1(α)

t0(α)

n∑i=1

(∂L

∂qi

∂qi∂α

+∂L

∂qi

∂qi∂α

)dt.

103

Figura 30. Per il calcolo dell’integrale di Poincare-Cartan.

Procedendo come abbiamo fatto per trovare le equazioni di Lagrange possiamo conti-nuare il calcolo e trovare, scambiando la derivazione su t e su α,

g′(α) =L1 t′1(α)− L0 t

′0(α) +

∫ t1(α)

t0(α)

n∑i=1

[∂L

∂qi

∂qi∂α− d

dt

(∂L

∂qi

)∂qi∂α

+d

dt

(∂L

∂qi

∂qi∂α

)]dt =

= L1 t′1(α)− L0 t

′0(α) +

∫ t1(α)

t0(α)

n∑i=1

[∂L

∂qi− d

dt

(∂L

∂qi

)]∂qi∂α

dt+n∑i=1

(∂L

∂qi

∂qi∂α

)∣∣∣∣t1(α)

t0(α)

.

A questo punto osserviamo che

n∑i=1

(∂L

∂qi

∂qi∂α

)∣∣∣∣t1(α)

t0(α)

=n∑i=1

(pi(t1(α))

∂qi(t1(α), α)

∂α− pi(t0(α))

∂qi(t0(α), α)

∂α

)e che

∂qi(t1(α), α)

∂α=

d

dαqi(t1(α), α)− qi(t1(α), α)t′1(α) =

dq1i (α)

dα− qi(t1(α), α)t′1(α)

e similmente per t0(α). Inserendo tutti questi risultati nell’espressione di g′(α) troviamo

g′(α) =

∫ t1(α)

t0(α)

n∑i=1

[∂L

∂qi− d

dt

(∂L

∂qi

)]∂qi∂α

dt+n∑i=1

(pi(t1(α))

dq1i

dα− pi(t0(α))

dq0i

)+

+n∑i=1

[(piqi − L)|t=t1(α) t

′1(α)− (piqi − L)|t=t0(α) t

′0(α)

].

104

Nel caso in cui le traiettorie qi(t, α) siano, per ogni α, delle soluzioni delle equazioni diLagrange, avremo, ricordando la definizione di hamiltoniana, l’espressione semplificata

g′(α) =n∑i=1

(pidq1

i

dα−Hdt1

)t=t1(α)

−n∑i=1

(pidq0

i

dα−Hdt0

)t=t0(α)

:=n∑i=1

(pidqidα−H dt

)∣∣∣∣10

.

Consideriamo ora, nello spazio delle coordinate (qi, pi, t), una curva chiusa γ0 parame-trizzata dal parametro α ∈ [0, 1] tale che per ogni α la traiettoria soluzione del sistemadelle equazioni di Hamilton avente per valori iniziali (qi(t0(α)), pi(t0(α)), t0(α)), non siatangente alla curva. Supponiamo di considerare la famiglia di curve soluzioni uscenti daivari punti della curva e consideriamo su questo insieme una curva chiusa γ1, sempre inmodo tale da essere trasversale alle soluzioni del sistema hamiltoniano. L’integrale dellaquantita g′(α) tra 0 e 1 sara nullo e avremo quindi, per quanto appena visto,

0 = g(1)− g(0) =

∫ 1

0

(pidqidα−H dt

)∣∣∣∣10

dα =

=

∫ 1

0

[n∑i=1

(pidq1

i

dα−Hdt1

)t=t1(α)

−n∑i=1

(pidq0

i

dα−Hdt0

)t=t0(α)

]dα =

=

∮γ1

(n∑i=1

pi dqi −H dt

)−∮γ0

(n∑i=1

pi dqi −H dt

).

Da quanto visto segue che la quantita∮γ

(n∑i=1

pi dqi −H dt

)e invariante lungo tutte le curve chiuse trasversali alle traiettorie del sistema hamiltonianoe prende il nome di invariante integrale di Poincare-Cartan.

Si pu= poi dimostrare che se nello spazio di coordinate (q, p, t) si prende una famigliadi curve integrali di un sistema di equazioni differenziali

qi = Qi(q, p, t) pi = P (q, p, t)

tali che l’integrale di Poincare-Cartan (con una data funzione H(q, p, t)) si conserva lungotutte le curve chiuse trasversali al flusso, allora necessariamente

Qi =∂H

∂pi, Pi = −∂H

∂qi,

ossia il flusso e hamiltoniano con hamiltoniana H.Noi vedremo questo fatto solo in un caso particolare, relativo al cosiddetto invariante

integrale di Poincare.Questo invariante integrale si ha quando le curve γi giacciono in un piano a t costante,

per cui ovviamente il termine −H dt si annulla (i cosiddetti stati simultanei). L’integraleche rimane,

I1 =

∮ n∑i=1

pi dqi,

105

si chiama appunto invariante integrale di Poincare. Esso e costante in ogni sistemahamiltoniano, visto che non contiene la funzione H.

Mostriamo quindi che se un flusso e generato da un sistema di equazioni differenziali

(2.34) qi = Qi(q, p, t) pi = P (q, p, t)

e conserva l’integrale I1, allora necessariamente il sistema e hamiltoniano.Infatti, parametrizzando al solito la curva γ (calcolata a t costante), abbiamo

0 =dI1

dt=

d

dt

∮ n∑i=1

pi dqi =d

dt

∫ 1

0

n∑i=1

(pidqidα

)dα =

∫ 1

0

n∑i=1

(dpidt

dqidα

+ pid

dt

dqidα

)dα.

Ora

pid

dt

dqidα

= pid

(dqidt

)=

d

dα(piqi)− qi

dpidα

per cui

0 =

∫ 1

0

n∑i=1

(pidqidα− qi

dpidα

)dα +

∫ 1

0

n∑i=1

d

dα(piqi) dα.

Siccome la curva e chiusa, l’ultimo termine si annulla, e, sostituendo le (2.34) troviamo

0 =

∫ 1

0

n∑i=1

(pidqidα− qi

dpidα

)dα =

∮γ

n∑i=1

(Pi dqi −Qi dpi).

Siccome ora l’integrale a destra si annulla su ogni curva chiusa (a t costante), deve esistereuna funzione H(q, p, t) tale che

n∑i=1

(Pi dqi −Qi dpi) = −dH = −n∑i=1

(∂H

∂qidqi +

∂H

∂pidpi

)ossia

n∑i=1

[(Pi +

∂H

∂qi

)dqi +

(Qi −

∂H

∂pi

)]= 0.

Siccome infine le qi e le pi sono variabili indipendenti, i differenziali sono linearmenteindipendenti e si ottiene

Qi =∂H

∂pi, Pi = −∂H

∂qi,

ossia il sistema (2.34) e hamiltoniano.

2.13. Sistemi simplettici e parentesi di Lagrange

Sappiamo che la conservazione della 1-forma∑n

i=1 pi dqi−H dt implica che il sistema diequazioni che genera il flusso e hamiltoniano con hamiltoniana H. Pertanto una trasfor-mazione sara canonica se e solo se conserva l’invariante integrale di Poincare-Cartan. Inaltre parole, posto

(2.35) Qi = Qi(q, p, t), Pi = Pi(q, p, t),

106

ci= implica che ∮Γ

(n∑i=1

Pi dQi −H dt) =

∮γ

(n∑i=1

pi dqi −H dt)

e ci= avviene sen∑i=1

Pi dQi −H dt =n∑i=1

pi dqi −H dt− dF (q, p, t)

(col che si spiega il significato geometrico della funzione generatrice). Se esprimiamo dQi

attraverso la prima delle (2.36) e sostituiamo troviamo, a t fissato,

dQi =n∑k=1

(∂Qk

∂qidqi +

∂Qk

∂pidpi

)e quindi

n∑i=1

Φi dqi + Ψi dpi :=n∑i=1

[n∑k=1

(Pk∂Qk

∂qi− pi

)dqi +

n∑k=1

Pk∂Qk

∂pidpi

]= −dF

e dunque la forma differenziale a sinistra e esatta se

∂Φi

∂qk=∂Φk

∂qi,

∂Ψi

∂pk=∂Ψk

∂pi,∂Φi

∂pk=∂Ψk

∂qi

ossia

∂Φi

∂qk=

n∑j=1

(∂Pj∂qk

∂Qj

∂qi+ Pj

∂2Qj

∂qk∂qi

)=

n∑j=1

(∂Pj∂qi

∂Qj

∂qk+ Pj

∂2Qj

∂qi∂qk

)=∂Φk

∂qi

ossia, eliminando i termini uguali,n∑j=1

(∂Pj∂qk

∂Qj

∂qi− ∂Pj∂qi

∂Qj

∂qk

)= 0.

Le seconde forniscono

∂Ψi

∂pk=

n∑j=1

(∂Pj∂pk

∂Qj

∂pi+ Pj

∂2Qj

∂pk∂pi

)=

n∑j=1

(∂Pj∂pi

∂Qj

∂pk+ Pj

∂2Qj

∂pi∂pk

)=∂Ψk

∂pi

che dannon∑j=1

(∂Pj∂pk

∂Qj

∂pi− ∂Pj∂pi

∂Qj

∂pk

)= 0.

Le ultime infine si scrivono

∂Φi

∂pk=

n∑j=1

(∂Pj∂pk

∂Qj

∂qi+ Pj

∂2Qj

∂pk∂qi− δik

)=

n∑j=1

(∂Pj∂qi

∂Qj

∂pk+ Pj

∂2Qj

∂pk∂qi

)=∂Ψk

∂qi

che implicanon∑j=1

(∂Pj∂pk

∂Qj

∂qi− ∂Pj∂qi

∂Qj

∂pk

)= δik.

107

Introducendo la cosiddetta parentesi di Lagrange delle 2n funzioni Qi, Pi di due variabiliα, β (qui non sono vettori) data da

{α, β} =n∑j=1

(∂Qj

∂α

∂Pj∂β− ∂Qj

∂β

∂Pj∂α

)e considerando fi, gi come Qi, Pi, troviamo che il criterio di canonicita della trasformazionee dato da

{qi, qk} = 0, {pi, pk} = 0, {qi, pk} = δik.

Vediamo piu da vicino il significato delle parentesi di Lagrange.Supponiamo di avere una trasformazione canonica di equazioni

(2.36) Qi = Qi(q, p, t), Pi = Pi(q, p, t),

e consideriamo la matrice 2n× 2n jacobiana di questa trasformazione

M =

∂Q1

∂q1

· · · ∂Q1

∂qn

∂Q1

∂p1

· · · ∂Q1

∂pn· · · · · ·

∂Qn

∂q1

· · · ∂Qn

∂qn

∂Qn

∂p1

· · · ∂Qn

∂pn∂P1

∂q1

· · · ∂P1

∂qn

∂P1

∂p1

· · · ∂P1

∂pn· · · · · ·

∂Pn∂q1

· · · ∂Pn∂qn

∂Pn∂p1

· · · ∂Pn∂pn

=

∂Q

∂q

∂Q

∂p

∂P

∂q

∂P

∂p

.

Poniamo poi

E =

0 · · · 0 −1 · · · 0· · · · · ·

0 · · · 0 0 · · · −11 · · · 0 0 · · · 0· · · · · ·

0 · · · 1 0 · · · 0

=

[0 −II 0

].

Proposizione 2.36. La matrice di una trasformazione simplettica verifica la proprieta

(2.37) MT EM = E.

Dimostrazione. Si verifica facilmente che

MTE =

(∂P

∂q

)T

−(∂Q

∂q

)T

(∂P

∂p

)T

−(∂Q

∂p

)T

108

e che quindi

MT EM =

(∂P

∂q

)T∂Q

∂q−(∂Q

∂q

)T∂P

∂q

∂P

∂q

T∂Q

∂p−(∂Q

∂q

)T∂P

∂p(∂P

∂p

)T∂Q

∂q−(∂Q

∂p

)T∂P

∂q

∂P

∂p

T∂Q

∂p−(∂Q

∂p

)T∂P

∂p

.Se esprimiamo ora i termini della matrice finale troviamo per esempio[(

∂P

∂q

)T∂Q

∂q−(∂Q

∂q

)T∂P

∂q

]=

[n∑j=1

(∂Pj∂qi

∂Qj

∂qk− ∂Qj

∂qi

∂Pj∂qk

)]= [{qi, qk}] = 0

mentre per esempio per il secondo blocco[∂P

∂q

T∂Q

∂p−(∂Q

∂q

)T∂P

∂p

]=

[n∑j=1

(∂Pj∂qi

∂Qj

∂pk− ∂Qj

∂qi

∂Pj∂pk

)]= [−{qi, pk}] = −I

per cui si trova la tesi.�Le matrici che verificano la (2.37) si dicono simplettiche. Il loro determinante e ±1, per

cui non sono mai singolari.La (2.37) implica poi

M−TEM−1 = E,

e passando alle inverse, osservando che E−1 = −E, troviamo

(2.38) MEMT = E.

Per scrivere in forma matriciale questa equazione, notiamo che M e stata sostituita dallasua trasposta e cosı pure MT. Dunque nella matrice M gli indici i, k della riga e della

colonna sono stati scambiati. Per esempio avremo che∂Qi

∂qkin M diviene

∂Qk

∂qiin MT, che

∂Pi∂qk

in M diviene∂Qk

∂piin MT, e cosı via.

Ora, se indichiamo con un asterisco ∗ questa trasposizione di indici, avremo che la (2.38)implica quindi le relazioni

{qi, qk}∗ = 0, {pi, pk}∗ = 0, {qi, pk}∗ = δik.

Osserviamo infine che

{qi, qk}∗ =

(n∑j=1

(∂Qj

∂qi

∂Pj∂qk− ∂Qj

∂pi

∂Pj∂qk

))∗=

n∑j=1

(∂Qi

∂qj

∂Qk

∂pj− ∂Qi

∂pj

∂Qk

∂pj

)= [Qi, Qk],

ossia che la parentesi di Lagrange diviene quella di Poisson delle funzioni Qi e Qk.Possiamo cosı concludere che un criterio di canonicita di una trasformazione e

[Qi, Qk] = 0, [Pi, Pk] = 0, [Qi, Pk] = δik.