222
M ECÂNICA C LÁSSICA RUDI GAELZER (I NSTITUTO DE FÍSICA - UFRGS) Apostila preparada para a disciplina de Mecânica Clássica II, ministrada para os Cursos de Física do Instituto de Física da Universidade Federal do Rio Grande do Sul, Porto Alegre - RS. Início: Fevereiro de 2014. Impresso: 26 de novembro de 2018

RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

MECÂNICA CLÁSSICA

RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

Apostila preparada para a disciplina de MecânicaClássica II, ministrada para os Cursos de Física doInstituto de Física da Universidade Federal do RioGrande do Sul, Porto Alegre - RS.

Início: Fevereiro de 2014. Impresso: 26 de novembro de 2018

Page 2: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

Apostila escrita usando:PROCESSADOR DE DOCUMENTOS LYXhttp://www.lyx.org/http://wiki.lyx.org/LyX/LyX

Page 3: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

SUMÁRIO

1 A Formulação Lagrangiana da Mecânica Clássica 11.1 Revisão da mecânica Newtoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Leis de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Teoremas de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.2.1 Conservação do momentum linear . . . . . . . . . . . . . . . . . . . . . 31.1.2.2 Conservação do momentum angular . . . . . . . . . . . . . . . . . . . . 41.1.2.3 Conservação de energia . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Introdução ao cálculo variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.1 Definições iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.2 O problema básico no cálculo variacional . . . . . . . . . . . . . . . . . . . . . 101.2.3 A equação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.2.4 Diferenciação forte de funcionais . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2.5 Uma segunda forma para a equação de Euler . . . . . . . . . . . . . . . . . . . 181.2.6 Funcionais com diversas variáveis dependentes . . . . . . . . . . . . . . . . . . 191.2.7 Equações de Euler com vínculos . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.2.8 Equação de Euler com vínculo integral . . . . . . . . . . . . . . . . . . . . . . . 23

1.3 Vínculos na mecânica clássica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.3.1 Equações de vínculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.3.2 Classificação dos vínculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.4 O Princípio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.5 Coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331.6 Equações de Euler-Lagrange em coordenadas generalizadas (vínculos holônomos) . 361.7 Potenciais generalizados e forças dissipativas . . . . . . . . . . . . . . . . . . . . . . . 42

1.7.1 Forças e potenciais generalizados em vínculos holônomos . . . . . . . . . . . . 431.7.2 Forças generalizadas dissipativas ou motrizes . . . . . . . . . . . . . . . . . . . 46

1.8 Formalismo lagrangiano com vínculos não-holônomos . . . . . . . . . . . . . . . . . . 481.8.1 Tratamento geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481.8.2 Sistemas holônomos com multiplicadores de Lagrange . . . . . . . . . . . . . . 511.8.3 Lagrangianas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521.8.4 Sistemas não holônomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 531.8.5 Forças de vínculo e forças generalizadas . . . . . . . . . . . . . . . . . . . . . . 55

1.8.5.1 Vínculos holônomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551.8.5.2 Vínculos não-holônomos . . . . . . . . . . . . . . . . . . . . . . . . . . 57

1.9 Propriedades de simetria das equações de Euler-Lagrange e leis de conservação . . 571.9.1 Invariância sob transformações de coordenadas . . . . . . . . . . . . . . . . . 571.9.2 Simetria e leis de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

1.9.2.1 Constantes de movimento . . . . . . . . . . . . . . . . . . . . . . . . . 591.9.2.2 Translações e rotações virtuais . . . . . . . . . . . . . . . . . . . . . . 591.9.2.3 Teoremas de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . 60

2 A Formulação Hamiltoniana da Mecânica Clássica 672.1 As equações canônicas de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672.2 Simetrias e leis de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

2.2.1 Coordenadas cíclicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.2.2 Conservação dos momenta linear e angular totais . . . . . . . . . . . . . . . . . 72

i

Page 4: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

ii

2.2.3 Conservação da Hamiltoniana e da energia total . . . . . . . . . . . . . . . . . 722.3 Aplicações importantes do formalismo Hamiltoniano . . . . . . . . . . . . . . . . . . . 77

2.3.1 Teorema do Virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 772.3.2 Teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

3 A Dinâmica dos Corpos Rígidos 873.1 Referenciais para a dinâmica do corpo rígido . . . . . . . . . . . . . . . . . . . . . . . 87

3.1.1 Rotações de eixos e transformações ortogonais . . . . . . . . . . . . . . . . . . 883.1.2 Propriedades da matriz de rotação . . . . . . . . . . . . . . . . . . . . . . . . . . 91

3.2 Cinemática dos corpos rígidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 943.2.1 Taxa de variação temporal de vetores dinâmicos . . . . . . . . . . . . . . . . . 943.2.2 A matriz de rotações infinitesimais . . . . . . . . . . . . . . . . . . . . . . . . . 953.2.3 A lei de transformação da taxa de variação temporal de um vetor e a veloci-

dade angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 973.2.3.1 Vetores polares, axiais e a velocidade angular . . . . . . . . . . . . . . 983.2.3.2 A unicidade da velocidade angular . . . . . . . . . . . . . . . . . . . . 99

3.3 A dinâmica em referenciais não inerciais . . . . . . . . . . . . . . . . . . . . . . . . . . 1013.4 Dinâmica de um corpo rígido. Equações fundamentais . . . . . . . . . . . . . . . . . 102

3.4.1 O momentum angular de um corpo rígido e o seu tensor de inércia . . . . . . 1023.4.2 Momentos e produtos de inércia . . . . . . . . . . . . . . . . . . . . . . . . . . . 1043.4.3 O tensor de inércia e sua lei de transformação . . . . . . . . . . . . . . . . . . 106

3.5 Energia cinética rotacional e o momento de inércia do corpo rígido . . . . . . . . . . 1093.6 O teorema dos eixos paralelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1133.7 Diagonalização do tensor de inércia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1153.8 A Lagrangiana de um corpo rígido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

3.8.1 A energia cinética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1203.8.2 A Energia potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1223.8.3 A condição de rolamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

3.9 Os ângulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1283.9.1 Velocidade angular em termos dos ângulos de Euler . . . . . . . . . . . . . . . 1303.9.2 Integrabilidade da velocidade angular . . . . . . . . . . . . . . . . . . . . . . . . 132

3.10O pião simétrico com um ponto fixo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1323.11Equações de Euler para um corpo rígido . . . . . . . . . . . . . . . . . . . . . . . . . . 138

3.11.1Movimento livre de um pião simétrico . . . . . . . . . . . . . . . . . . . . . . . . 1403.11.2A construção de Poinsot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1413.11.3Estabilidade das rotações livres . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

3.12Dinâmica de corpos rígidos sem pontos fixos . . . . . . . . . . . . . . . . . . . . . . . 1463.12.1Precessões e oscilações do eixo de rotação da Terra . . . . . . . . . . . . . . . . 146

3.12.1.1Precessão do eixo rotacional . . . . . . . . . . . . . . . . . . . . . . . . 1473.12.1.2A oscilação de Chandler . . . . . . . . . . . . . . . . . . . . . . . . . . . 1503.12.1.3Determinação do terceiro momento principal de inércia . . . . . . . . 151

3.12.2Esferas rolando sobre superfícies . . . . . . . . . . . . . . . . . . . . . . . . . . 1523.12.3O disco de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

4 Oscilações Acopladas 1594.1 Oscilações de pequena amplitude em sistemas com um grau de liberdade . . . . . . 159

4.1.1 Configurações de equilíbrio e critério de estabilidade . . . . . . . . . . . . . . . 1594.1.2 Oscilações de pequena amplitude em torno do ponto de equilíbrio . . . . . . . 160

4.2 Oscilações em sistemas com vários graus de liberdade . . . . . . . . . . . . . . . . . . 1624.3 Oscilações acopladas de pequena amplitude . . . . . . . . . . . . . . . . . . . . . . . . 164

4.3.1 Oscilações acopladas: modos normais de vibração . . . . . . . . . . . . . . . . 1664.3.2 Coordenadas normais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

4.4 Oscilações longitudinais em uma rede periódica unidimensional . . . . . . . . . . . . 1734.5 Oscilações arbitrárias de pequena amplitude: a corda carregada . . . . . . . . . . . . 1824.6 A corda contínua: introdução a uma teoria de campos clássicos . . . . . . . . . . . . 187

4.6.1 A densidade Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1874.6.2 A integral de ação e a equação do campo . . . . . . . . . . . . . . . . . . . . . . 1884.6.3 A equação da onda para uma corda homogênea . . . . . . . . . . . . . . . . . . 1894.6.4 Generalizações para uma teoria de campos clássicos . . . . . . . . . . . . . . . 189

4.7 Soluções da equação da onda para a corda homogênea . . . . . . . . . . . . . . . . . 191

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 26 DE NOVEMBRO DE 2018

Page 5: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

iii

4.7.1 Método de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1914.7.2 Solução geral: método de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . 193

4.8 Movimento forçado ou amortecido da corda homogênea . . . . . . . . . . . . . . . . . 1944.9 Equação da onda em meios dispersivos . . . . . . . . . . . . . . . . . . . . . . . . . . 198

4.9.1 Meio não dispersivo; método das transformadas integrais . . . . . . . . . . . . 1984.9.2 Ondas estacionárias a partir da solução geral . . . . . . . . . . . . . . . . . . . 2024.9.3 Exemplos de meios dispersivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2034.9.4 Propagação de um pulso unidimensional em um meio dispersivo . . . . . . . . 2064.9.5 A velocidade de grupo em um meio dispersivo . . . . . . . . . . . . . . . . . . . 208

4.10Equação da onda em meios não uniformes . . . . . . . . . . . . . . . . . . . . . . . . 2104.10.1Tratamento geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2114.10.2Reflexão e transmissão na interface entre meios distintos . . . . . . . . . . . . 212

Referências Bibliográficas 214

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 26 DE NOVEMBRO DE 2018

Page 6: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

iv

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 26 DE NOVEMBRO DE 2018

Page 7: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

1A FORMULAÇÃO LAGRANGIANA DA

MECÂNICA CLÁSSICA

N ESTE CAPÍTULO será realizada uma introdução às formulações Lagrangiana e Ha-miltoniana da mecânica clássica. De forma distinta em relação ao formalismo

original proposto por Isaac Newton (1642 - 1727) em seu livro Philosophiæ NaturalisPrincipia Mathematica1 (publicado em 1687), as formulações Lagrangiana e Hamiltoniana fazemuso dos métodos do cálculo variacional para postular que a evolução espaço-temporal de umdado sistema físico é determinada por princípios extremantes impostos a certos funcionais, osquais são determinados pelas quantidades dinâmicas desse sistema.

A proposição de princípios extremantes que determinam o comportamento de sistemas natu-rais tem sido realizada por filósofos naturais em períodos tão remotos quanto o século XIII, comonos trabalhos do filósofo natural alemão Jordanus Nemorarius (Jordanus de Nemore) (1225 –1260). As principais contribuições para a formulação atual foram realizadas a partir do séculoXVIII, com os trabalhos de Johann Bernoulli (1667 - 1748), Jean le Rond d’Alembert (1717 -1783), Joseph-Louis Lagrange (1736 - 1813) e William Rowan Hamilton (1805 - 1865). Cabeaqui mencionar também o Princípío de Tempo Mínimo proposto por Pierre de Fermat (1601(7) -1665) para a óptica geométrica.

As formulações da mecânica baseadas em princípios extremantes são equivalentes e com-plementares à formulação Newtoniana. Em determinadas situações, como por exemplo na di-nâmica de sistemas sujeitos a restrições (vínculos) de natureza geométrica ou cinemática, aformulação Lagrangiana revela-se mais adequada que a Newtoniana, uma vez que esta últimaexige a determinação de forças de vínculo para a obtenção das equações de movimento, o quenem sempre é possível.

Outro aspecto positivo da formulação Lagrangiana está na sua conexão a leis de conservaçãoe às propriedades de simetria dos sistemas dinâmicos. Além disso, o fato de ser baseada emprincípios extremantes, o que também é realizado em outras áreas da física além da mecânica,introduz uma uniformidade nos formalismos que permite estabelecer de forma direta a interre-lação entre fenômenos nas distintas áreas. Estas vantagens revelaram-se convenientes para oposterior desenvolvimento, ao longo do século XX, da mecânica quântica e da teoria quântica decampos.

1.1 REVISÃO DA MECÂNICA NEWTONIANA

Antes de se introduzir os métodos matemáticos e princípios físicos associados às formulaçõesLagrangiana e Hamiltoniana, é importante realizar uma revisão da mecânica Newtoniana.

1.1.1 LEIS DE NEWTON

As três leis de Newton para o movimento de corpos materiais sob a ação de forças são apre-sentadas brevemente a seguir. Discussões a respeito das interpretações e das consequênciasdesses postulados não serão realizadas aqui.

1Princípios Matemáticos de Filosofia Natural.

1

Page 8: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

2 1.1. Revisão da mecânica Newtoniana

Primeira Lei. Existem sistemas de referência, denominados inerciais, em relação aos quais todapartícula isolada descreve um movimento retilíneo uniforme.

Neste postulado, uma partícula é “isolada” se estiver distante o suficiente de qualquer outroobjeto material. Está implícita também a noção de tempo absoluto, que flui uniformementeem qualquer referencial inercial.

Segunda Lei. Em qualquer referencial inercial, o movimento de uma partícula é determinadopela equação de movimento

p = F , (1.1)

onde p (t) = mr (t) é o momentum linear da partícula, sendo r = r (t) a sua posição instan-tânea e v (t) = r = dr/dt a velocidade instantânea. Ainda em (1.1), a quantidade F é a forçatotal que atua sobre a partícula.

A segunda lei pressupõe que a cada partícula está associada uma quantidade escalar posi-tiva m, denominada a massa da mesma, e que possui o mesmo valor em todos os referen-ciais inerciais.

Terceira Lei. A cada ação corresponde uma reação igual e oposta. Isto é, se F ab é a forçaexercida sobre a partícula a pela partícula b, então

F ba = −F ab, (1.2)

sendo F ba a força sobre b devida à partícula a.

Este enunciado é denominada a forma fraca da terceira lei.

Na forma forte, exige-se também que, além de iguais e opostas, as forças F ab e F ba sejamdirigidas ao longo da linha que une as duas partículas. Um exemplo de força que viola estacondição é a força magnética exercida entre duas cargas elétricas em movimento.

Quando o sistema físico em estudo é composto por um conjunto de N partículas interagentese que sofrem de forma simultânea a ação de forças que se originam de outras fontes, a forçatotal na equação de movimento (1.1) pode ser decomposta em:

Forças internas. As quais surgem devido às interações entre as partículas que compõe o sis-tema. Será assumido que as forças internas obedecem a terceira lei de Newton (eq. 1.2).

Forças externas. Produzidas por agentes externos ao sistema de N partículas.

Com estas definições, a equação de movimento da partícula a (com a = 1, 2, . . . , N ) é escritacomo

pa =

N∑b=1b6=a

F ab + F (e)a , (1.3)

ondepa =

d

dt(mava) =

d

dt(mara) , (1.4)

sendo pa = pa (t) o momentum linear da partícula a, com ma e va sendo respectivamente a massae a velocidade instantânea da mesma. A quantidade F (e)

a denota a força externa total atuandosobre a partícula.

Deve se observar também que a equação (1.3) descarta a possibilidade de auto-interação, ouseja, a ação da partícula a sobre si mesma. Na mecânica clássica, a auto-interação é supostainexistente.

1.1.2 TEOREMAS DE CONSERVAÇÃO

A partir das quantidades definidas e regidas pelas Leis de Newton, pode-se definir diversasoutras grandezas dinâmicas importantes, tais como energia (cinética, potencial e mecânica) emomentum angular. Estas grandezas, juntamente com o momentum linear definido em (1.4),satisfazem teoremas de conservação, os quais podem ser deduzidos a partir das Leis de Newton.

Inicialmente, algumas grandezas adicionais associadas ao sistema de N partículas regido por(1.3) serão definidas:

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 9: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 3

Centro de massa. O centro de massa do sistema de N partículas é aquele ponto no espaço aoqual pode ser atribuída a massa total do sistema e que se move somente sob a ação dasforças externas. Este ponto, denotado por R (t), é definido pela expressão

R (t) =

∑Na=1mara (t)∑N

a=1ma

=1

M

N∑a=1

mara, (1.5a)

sendo M =∑Na=1ma a massa total do sistema.

Momentum linear total. Definido como o vetor resultante da soma de todos os momenta linea-res do sistema,

P (t) =

N∑a=1

pa (t) , (1.5b)

sendo P (t) o momentum linear total.

Momentum angular total. O momentum angular total do sistema de partículas em relação aum ponto P no espaço, localizado pelo vetor posição rP , é dado por

LP =

N∑a=1

ma (ra − rP )× (ra − rP ) =

N∑a=1

(ra − rP )× (pa −marP ) , (1.5c)

sendo definidos também raP.= ra−rP o vetor posição instantânea da partícula a em relação

ao ponto P e raP.= ra − rP a correspondente velocidade relativa instantânea da partícula

em relação a P .

Energia cinética total. Esta é definida simplesmente como

T =1

2

N∑a=1

mav2a =

1

2

N∑a=1

mar2a. (1.5d)

A partir destas quantidades, os seguintes teoremas de conservação podem ser deduzidos.

1.1.2.1 CONSERVAÇÃO DO momentum LINEAR

Somando-se as equações (1.3) sobre todas as partículas do sistema, obtém-se

N∑a=1

pa =

N∑a,b=1b6=a

F ab +

N∑a=1

F (e)a .

Porém,N∑

a,b=1b 6=a

F ab =1

2

N∑a,b=1b 6=a

(F ab + F ba)(1.2)−−−→ 1

2

N∑a,b=1b6=a

(F ab − F ab) = 0,

resultando em,N∑a=1

pa = P =

N∑a=1

F (e)a ≡ F

(e), (1.6a)

sendo F (e) a força externa resultante sobre o sistema de partículas. Ou seja, se a força externaresultante sobre o sistema de partículas é nula, então o momentum linear total é conservado.

Uma consequência importante é obtida a partir da definição de centro de massa. Se asmassas das partículas não variam, então a taxa de variação do momentum total pode ser escritacomo

P = MR = F (e), (1.6b)

ou seja, o centro de massa se movimenta como uma partícula com a massa total do sistema soba ação da força externa resultante. Se F (e) = 0, o centro de massa se move como uma partículalivre.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 10: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

4 1.1. Revisão da mecânica Newtoniana

1.1.2.2 CONSERVAÇÃO DO momentum ANGULAR

Derivando-se (1.5c) em relação ao tempo e assumindo novamente que ma = 0, resulta

LP =

N∑a=1

ma (ra − rP )× (ra − rP )

=

N∑a=1

(ra − rP )× pa −N∑a=1

ma (ra − rP )× rP

(1.3)−−−−→(1.5a)

∑a,ba6=b

(ra − rP )× F ab +

N∑a=1

(ra − rP )× F (e)a −M (R− rP )× rP .

Mas, novamente,

∑a,ba6=b

(ra − rP )× F ab =1

2

∑a,ba6=b

[(ra − rP )× F ab + (rb − rP )× F ba]

(1.2)−−−→ 1

2

∑a,ba6=b

(ra − rb)× F ab =1

2

∑a,ba6=b

rab × F ab,

sendo rab.= ra − rb a posição da partícula a em relação à partícula b. Contudo, se as forças

internas obedecem a forma forte da terceira lei, então rab × F ab = 0.Portanto,

LP = N(e)P −M (R− rP )× rP , (1.7a)

onde

N(e)P =

N∑a=1

(ra − rP )× F (e)a

é o torque externo resultante em relação ao ponto P . Por sua vez, o segundo termo resulta

(R− rP )× rP = 0

se pelo menos uma das condições for satisfeita: (i) rP = R; (ii) rP = 0 ou (iii) rP ‖ R − rP . Nestecaso,

LP = N(e)P . (1.7b)

Portanto, se o torque externo total for nulo, o momentum angular total do sistema de partículasem relação ao seu centro de massa ou em relação a um ponto fixo no espaço é conservado.

Um outro resultado importante para o momentum angular total envolvendo o centro de massado sistema pode ser deduzido. Retornando a (1.5c) e considerando como ponto fixo a origem,escreve-se

L =

N∑a=1

mara × ra,

sendo L o momentum angular total em relação à origem. Definindo-se agora os vetores posição(r′a) e velocidade (v′a) relativas instantâneas da partícula a em relação ao centro de massa, então

ra = R+ r′a e va = V + v′a, (1.8a)

sendo V = R. Ou seja, L pode ser escrito como

L = MR× V +R×(d

dt

N∑a=1

mar′a

)+

N∑a=1

mar′a × V +

N∑a=1

r′a × p′a.

Uma vez queN∑a=1

mar′a =

N∑a=1

mara −MR = MR−MR = 0, (1.8b)

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 11: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 5

resulta que

L = R× (MV ) +

N∑a=1

r′a × p′a. (1.8c)

Ou seja, o momentum angular total do sistema em relação à origem é igual ao momentumangular do centro de massa em relação à origem acrescido do momentum angular total emrelação ao centro de massa.

1.1.2.3 CONSERVAÇÃO DE ENERGIA

Alguns importantes teoremas relacionados com a energia do sistema de partículas podem serobtidos.

Em primeiro lugar, a energia cinética total do sistema de partículas, definida em (1.5d), podeser reescrita em termos dos vetores relativos ao centro de massa, definidos em (1.8a), como

T =1

2

N∑a=1

ma (V + v′a) · (V + v′a)ma=0−−−−→ 1

2MV 2 +

1

2

N∑a=1

mav′2a + V · d

dt

(N∑a=1

mar′a

),

T(1.8b)

=1

2MV 2 +

1

2

N∑a=1

mav′2a . (1.9)

Ou seja, a energia cinética total do sistema pode ser escrita como a soma da energia cinética docentro de massa com a energia cinética das partículas em relação ao centro de massa.

Os resultados (1.7) e (1.9) são particularmente úteis na dinâmica do corpo rígido.

TEOREMA TRABALHO-ENERGIA CINÉTICA. Este importante teorema é obtido calculan-do-se o trabalho total realizado por todas as forças que agem sobre o sistema de partículasquando este parte de uma configuração inicial A e atinge uma configuração final B. Estasconfigurações inicial e final correspondem aos dois conjuntos, em princípio distintos, de posiçõesinstantâneas das partículas em dois instantes distintos de tempo. Ou seja, se t = tA é o instantecorrespondente à configuração A e t = tB corresponde à configuração B, então

A 7→ ra,A = ra (tA) , ∀a = 1, . . . , N, e

B 7→ ra,B = ra (tB) , ∀a = 1, . . . , N.

Dada a partícula a, o trabalho total realizado por todas as forças que sobre ela atuam entreas configurações A e B é

Wa,AB.=

ˆ B

A

F (e)a +

∑b6=a

F ab

· dra =

ˆ B

A

F (e)a · dra +

∑b 6=a

ˆ B

A

F ab · dra.

Então, o trabalho total realizado por todas as forças que atuam sobre o sistema na transforma-ção A→ B é

WAB =

N∑a=1

Wa,AB =

N∑a=1

ˆ B

A

F (e)a · dra +

∑a,ba6=b

ˆ B

A

F ab · dra.

Independente da forma de atuação das forças externas e internas, o trabalho total semprepode ser escrito em termos dos momenta lineares. Além disso, para todo tA 6 t 6 tB, o deslo-camento infinitesimal dra, da partícula a, pode ser sempre parametrizado como dra = va (t) dt.Então, de (1.3),

WAB =

N∑a=1

ˆ B

A

pa · drama=0−−−−→

N∑a=1

ˆ tB

tA

mava · vadt =

N∑a=1

ˆ tB

tA

d

dt

(1

2mav

2a

)dt.

Ou seja, dada (1.5d), resultaWAB = TB − TA, (1.10)

o qual é o teorema trabalho-energia cinética para o sistema de partículas. Este teorema écompletamente geral.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 12: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

6 1.1. Revisão da mecânica Newtoniana

CONSERVAÇÃO DA ENERGIA MECÂNICA. Assumindo-se agora que tanto as forças exter-nas quanto as internas sejam conservativas, um outro importante teorema de conservação éobtido.

Pode-se caracterizar as forças externasF (e)a = F (e)

a (ra)

como conservativas de diferentesmaneiras.

• A forças são irrotacionais, ou seja,∇a × F (e)

a = 0,

sendo ∇a o operador gradiente aplicado às coordenadas da partícula a.

Se um campo vetorial é irrotacional, então este sempre pode ser determinado a partir deum campo escalar U (e)

a = U(e)a (ra), denominado a função energia potencial. Esta relação é

definida comoF (e)a = −∇aU

(e)a . (1.11)

• O trabalho total realizado pela força conservativa sobre a partícula a, quando esta executaum caminho fechado no espaço, é nulo. O trabalho realizado na transformação A → B édado por

W(e)a,AB =

ˆ B

A

F (e)a · dra.

Se F (e)a pode ser determinada pela relação (1.11), então

W(e)a,AB = −

ˆ B

A

(∇aU

(e)a

)· dra = −

ˆ U(e)a,B

U(e)a,A

dU (e)a ,

pela definição de gradiente. Na última integral acima, U (e)a,A = U

(e)a (ra,A) e U (e)

a,B = U(e)a (ra,B).

Ou seja,W

(e)a,AB = U

(e)a,A − U

(e)a,B .

Por conseguinte, se A = B, o trabalho realizado pela força conservativa é nulo.

O trabalho total realizado pelas forças externas durante a transformação A → B é definidocomo

W(e)AB =

N∑a=1

W(e)a,AB .

Se todas as forças externas forem conservativas, então pode-se definir uma função energia po-tencial total externa U (e) = U (e) (r1, . . . , rN ) como

U (e) (r1, . . . , rN ) =

N∑a=1

U (e)a (ra) ,

a partir da qual pode-se escrever

W(e)AB =

N∑a=1

(U

(e)a,A − U

(e)a,B

)= U

(e)A − U (e)

B .

Já para as forças internas, uma suposição adicional deve ser feita. O trabalho total realizadopelas mesmas sobre o sistema de partículas é

W(int)AB =

∑a,ba 6=b

ˆ B

A

F ab · dra,

onde W (int)AB denota a quantidade referida. Mas, se estas obedecerem a terceira lei,

W(int)AB =

1

2

N∑a,b=1a 6=b

ˆ B

A

F ab · (dra − drb) =

N∑a,b=1(b>a)

ˆ B

A

F ab · (dra − drb) .

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 13: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 7

Assume-se então que todas as forças F ab são conservativas. Portanto, relações semelhantesa (1.11) são válidas, sendo introduzidas as funções energia potencial interna Uab = Uab (ra, rb)através de

F ab = −∇aUab. (1.12)

Para que a relação (1.12) satisfaça a terceira lei de Newton, é necessário que

F ba = −F ab =⇒∇bUba (ra, rb) = −∇aUab (ra, rb) .

Esta condição é satisfeita se

Uab (ra, rb) = Uab (ra − rb) = Uab (rab) , e

Uab (rab) = Uba (rba) ,(1.13)

sendo rab = ra − rb (a 6= b).

Com estas suposições, W (int)AB pode ser escrito como

W(int)AB = −1

2

∑a,ba 6=b

ˆ B

A

(∇aUab) · drab = −1

2

∑a,ba6=b

ˆ B

A

(∇abUab) · drab

= −1

2

∑a,ba6=b

ˆ Uab,A

Uab,A

dUab =1

2

∑a,ba6=b

(Uab,A − Uab,B) ,

uma vez que facilmente pode-se verificar que ∇aUab = −∇bUba =∇abUab.Definindo-se então a energia potencial total do sistema como

U = U (ra) = U (e) +1

2

N∑a,b=1a6=b

Uab = U (e) +

N∑a,b=1(a<b)

Uab, (1.14)

o teorema trabalho-energia cinética (1.10) atesta que

WAB = TB − TA.

Portanto, o trabalho total realizado por todas as forças que agem sobre o sistema durante atransformação A→ B é

WAB = W(e)AB +W

(int)AB = U

(e)A − U (e)

B +1

2

∑a,ba6=b

(Uab,A − Uab,B) = TB − TA,

a qual pode ser expressa como

UA + TA = UB + TB ,

sendo U + T a energia mecânica total do sistema.Ou seja, se todas as forças atuando sobre o sistema de partícula forem conservativas, a energia

mecânica total E = T + U é conservada.

1.2 INTRODUÇÃO AO CÁLCULO VARIACIONAL

Como já mencionado, os formalismos Lagrangiano e Hamiltoniano foram elaborados usandométodos do cálculo variacional, a partir de princípios extremantes. Nesta seção, portanto, serárealizada uma breve introdução ao cálculo variacional de uma maneira que tenha interessedireto à mecânica clássica.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 14: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

8 1.2. Introdução ao cálculo variacional

1.2.1 DEFINIÇÕES INICIAIS

Inicialmente, serão estabelecidas algumas definições de entidades matemáticas com o intuitode facilitar a compreensão do conteúdo. O cálculo variacional, conforme o mesmo é aplicado àmecânica, faz uso massivo do conceito de funcional. É importante, então, esclarecer a distinçãoentre um funcional e uma função. Para tanto, assume-se um conhecimento básico em teoria deconjuntos e espaços vetoriais, os quais serão utilizados nas definições apresentadas a seguir.

Definição 1.1 (Função). Uma função é uma relação ou mapeamento entre dois conjuntos,sendo um conjunto de entrada, denominado o domínio e um conjunto de saída, denominado ocontradomínio. O mapeamento entre entre os conjuntos é estabelecido por um conjunto de regrasespecíficas, com a exigência de que cada elemento do domínio seja mapeado a somente umelemento do contradomínio. Um par entrada-saída da função é denominado um par ordenado eo conjunto de todos os pares ordenados é denominado o gráfico da mesma. Se os elementos desaída da função formarem um subconjunto do contradomínio, este é usualmente denominado aimagem da função.

Se X for o domínio de uma função denominada f e Y o seu contradomínio, o mapeamento doelemento x ∈ X para o correspondente elemento em Y é representado por

f : X 7→ Y ou Xf7−→ Y.

A operação realizada por f sobre o elemento x ∈ X é usualmente representada por f (x), quandoentão x é denominado o argumento de f . O resultado ou a saída desta operação correspondeao mapeamento de x ao elemento em Y que pode ser identificado por y e somente a este. Estemapeamento é usualmente representado por

y = f (x) .

A figura 1.1 ilustra o mapeamento entre conjuntos realizado pela função f : X 7→ Y .

Figura 1.1: Representação do mapeamento entre osconjunto domínio (X) e contradomínio (Y ) da fun-ção f (x). O subconjunto amarelo de Y representa aimagem da função.

Em análise funcional,2 bem como para a física, a maior parte das funções de interesse sãomapeamentos entre conjuntos de números, de acordo com a definição realizada acima. Porém,observa-se que existem grupos ou classes de funções que estabelecem determinados espaçosvetoriais,3 denominados de espaços funcionais, os quais possuem importância singular. Certosoperadores, aqui denominados de funcionais, atuam sobre um ou mais vetores desses espaçosfuncionais, projetando-os sobre um elemento de um conjunto, normalmente numérico.

Definição 1.2 (Classe funcional). Se X e Y são conjuntos (numéricos), então o conjunto detodas as funções f : X 7→ Y , denotado porM ou Y X , forma uma classe funcional.

Alguns exemplos relevantes dessas classes funcionais são:

2Ramo da matemática formado pelo estudo de espaços vetoriais dotados de propriedades adicionais (como produtointerno, norma, topologia, etc) e dos operadores lineares que atuam sobre esses espaços, de acordo com suas proprie-dades particulares.

3Ou, mais corretamente, espaços topológicos.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 15: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 9

• C [a, b], o conjunto de todas as funções reais f : R 7→ R contínuas no intervalo (fechado)[a, b] ⊂ R.

• Cr [a, b], o conjunto de todas as funções reais que são contínuas até a derivada de ordem rno intervalo [a, b] ⊂ R.

• C0 (R), o conjunto de todas as funções reais contínuas que são nulas no infinito.

• Cr (R), o conjunto de todas as funções reais que são contínuas até a derivada de ordem r.

• C∞ (R), o conjunto de todas as funções reais que possuem derivadas em todas as ordens.Estas funções também são denominadas de funções suaves.

• L1 [a, b], o conjunto de todas as funções reais cujo valor absoluto é integrável no intervalo[a, b] ⊂ R.

• L2 [a, b], o conjunto de todas as funções reais quadraticamente integráveis no intervalo[a, b] ⊂ R.

As classes apresentadas acima constituem somente alguns poucos exemplos dos espaços funci-onais conhecidos.

Definição 1.3 (Funcional). Denomina-se funcional uma correspondência ou mapeamento Jque associa a cada função f (x) de uma classe M um elemento de um conjunto X, denotadocomumente por J f (x). Este mapeamento pode ser representado como

fJ7−→ J f (x) , sendo J f (x) ∈ X.

A classe M é denominada o domínio do funcional J , ao passo que uma função f (x) ∈ M édenominada ponto do domínio.

Pode-se dizer que se uma função é um mapeamento entre dois conjuntos numéricos, umfuncional é um mapeamento entre um espaço funcional e um conjunto numérico. Em outraspalavras, trata-se de uma operação que toma um vetor (elemento do espaço funcional) como en-trada e retorna um escalar (elemento de X) como sua saída. Uma última descrição simplificadaseria afirmar que um funcional é uma função de uma função.

Exemplo 1.1. Dada a classe C [0, 1], define-se Jy (x) ∈ R para toda y (x) ∈ C [0, 1] pela operação

J y (x) =

ˆ 1

0

y (x) dx.

Assim, o elemento y (x) = 1 será mapeado em

J 1 =

ˆ 1

0

1dx = 1.

Por sua vez, o elemento y (x) = ex ∈ C [0, 1] será mapeado em

J ex =

ˆ 1

0

exdx = e− 1.

Exemplo 1.2. A operaçãoJx0y (x) = y′ (x0) ,

onde x0 ∈ [a, b] define um funcional que mapeia um elemento de C1 [a, b] a um número real.Assim, para a = 1, b = 3 e x0 = 2, o elemento y (x) = x2, será mapeado em

J2

x2

= 2x|x=2 = 4.

Por sua vez, o elemento y (x) = ln (1 + x) será mapeado em

J2 ln (1 + x) =1

1 + x

∣∣∣∣x=2

=1

3.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 16: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

10 1.2. Introdução ao cálculo variacional

Uma categoria importante de funcionais, tanto para a análise funcional quanto para a física,são aqueles definidos a partir de um operador integral. Ou seja, dada f (x) ∈ Cr [a, b], define-se ofuncional I [f ] como

I [f ] =

ˆ b

a

Gf (x) , f ′ (x) , . . . , f (r) (x) ;x

g (x) dx, (1.15)

sendo g (x) uma função peso conhecida e G · · · um funcional aplicado a Cr [a, b]. Assume-seimplicitamente que g (x) é tal que a integral exista. Esta definição também deve ser alteradapara o caso de integrais impróprias. Contudo, este é o tipo de funcional de interesse para amecânica Lagrangiana.

Exemplo 1.3. Para y (x) ∈ C [−1, 1], define-se o funcional

I [y] =

ˆ 1

−1

G y (x) ;x dx.

Assim, seG y;x =

x

1 + y2,

a escolha y (x) = 1 + x resulta em

I [y] =

ˆ 1

−1

x

1 + y2dx −→ I [1 + x] =

ˆ 1

−1

x

1 + (1 + x)2 dx = ln

√5− arctan 2.

Exemplo 1.4. A operação

I [y] =

ˆ b

a

√1 + y′2dx

associa a cada y (x) ∈ C1 [a, b] o comprimento do arco da curva y = y (x) no intervalo [a, b].

Definição 1.4 (Funcional linear). Um funcional L y (x) de domínioM será dito ser um funci-onal linear se satisfizer as condições:

1. L cy (x) = cL y (x), para c = cte.

2. L y1 (x) + y2 (x) = L y1 (x)+ L y2 (x), para todos y1 (x) , y2 (x) ∈M.

Um funcional que satisfaz a definição 1.4 é um caso particular de um funcional linear ouforma linear na teoria de espaços vetoriais.4

Finalmente, será apresentada a seguir, sem demonstração, a regra integral de Leibniz paradiferenciação sob o símbolo de integração.

Afirmação (Regra integral de Leibniz). Sejam c ∈ R e as funções a (c) , b (c) ∈ C1 (R). Se f (x, c)for uma função da classe C1 [a (c) , b (c)], então

d

dc

ˆ b(c)

a(c)

f (x, c) dx =

ˆ b(c)

a(c)

∂cf (x, c) dx+ f (b, c)

db

dc− f (a, c)

da

dc. (1.16)

1.2.2 O PROBLEMA BÁSICO NO CÁLCULO VARIACIONAL

Uma vez apresentadas as definições de função e funcional, pode-se agora discutir o problemabásico do cálculo variacional. Para a mecânica clássica, o tipo de funcional mais empregado foidefinido em (1.15). Assim, o problema básico do cálculo variacional consiste em determinar afunção y (x) ∈ C2 [x1, x2] tal que a integral

J [y] =

ˆ x2

x1

G y (x) , y′ (x) ;x dx (1.17)

é um extremum, isto é, ou um máximo ou um mínimo.A forma adotada para o funcional J [y] e apresentada em (1.17) possui algumas particulari-

dades que devem ser mencionadas:

4Ver, por exemplo, Apostila de Física-Matemática, seção 4.4.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 17: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 11

Caminho

variado

Caminho extremo, y(x)

Figura 1.2: Representação da função y (x) que irá fornecer o extremum de J, juntamente com funções vizinhas,obtidas a partir da variação do parâmetro α.

• assume-se que o funcional G · · · depende somente de y (x) e y′ (x), além de poder serexplicitamente dependente de x.

• Os limites de integração são considerados fixos, ou seja, dentre todas as infinitas funçõesy (x) da classe C2 [x1, x2], serão consideradas para o cálculo do extremum somente aquelasque possuem as mesmas imagens nos limites da integração.

O procedimento do cálculo variacional para a determinação do extremum de J consiste emvariar a forma funcional de y (x), mantendo-se os limites de integração fixos, até que a integraçãoem (1.17) forneça o valor extremo. Este será necessariamente o valor mínimo para J , umavez que qualquer forma funcional nas vizinhanças daquela y (x) que resulta no extremum teránecessariamente um valor maior para J .

Há infinitas maneiras de como efetivamente realizar a variação na forma funcional de y (x).Um procedimento consiste no uso de um parâmetro α ∈ R. Assume-se que as funções da classeC2 [x1, x2] em (1.17) dependam parametricamente desta quantidade, ou seja, y = y (x, α). Assume-se também que o extremum é obtido para α = 0, quando então y = y (x, 0) = y (x). Neste caso,as funções vizinhas a y (x), e que também pertencem à mesma classe, são obtidas com α 6= 0. Amaneira mais simples de se implementar este procedimento consiste em escrever

y (x, α) = y (x) + αη (x) , (1.18)

sendo η (x) ∈ C2 [x1, x2] tal que η (x1) = η (x2) = 0. Esta situação está representada na figura 1.2.Aplicando-se este procedimento ao funcional (1.17), este passa a ser escrito formalmente

como

J (α) =

ˆ x2

x1

G y (x, α) , y′ (x, α) ;x dx, (1.19)

sendo que y′ (x, α) = ∂y/∂x. Por conseguinte, uma variação dα no valor do parâmetro α iráresultar em uma variação no funcional J (α). Esta última pode ser expressa como

δJ =∂J

∂αdα,

onde o símbolo δJ representa esta variação do funcional, resultante não da variação na variávelindependente, mas da forma funcional de y (x, α).

Então, a condição de valor extremo para J (α) é obtida através de

∂J

∂α

∣∣∣∣α=0

= 0, (1.20)

para todas as funções η (x).

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 18: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

12 1.2. Introdução ao cálculo variacional

Exemplo 1.5. Considere o funcional

G y′ (x, α) = [y′ (x, α)]2

em (1.19). Mostre que o extremum de J (α) é obtido pela forma y (x) = x no intervalo 0 6 x 6 2π,usando η (x) = senx.

Demonstração. Empregando-se as formas propostas, escreve-se

y (x, α) = x+ α senx.

Ou seja,G y′ (x, α) = [1 + α cosx]

2,

resultando então de (1.19) o funcional

J (α) =

ˆ 2π

0

[1 + α cosx]2dx = 2π + α2π.

Portanto, pela condição (1.20), observa-se que realmente o valor extremo (neste caso, um pontode mínimo) é obtido por J (0).

1.2.3 A EQUAÇÃO DE EULER

Dados então o funcional (1.17) e a condição de extremum (1.20), pode-se determinar agorauma nova equação, denominada equação de Euler, cuja solução irá fornecer a forma funcionalpara y (x).

Esta equação é obtida derivando-se (1.17) em relação ao parâmetro α,

∂αJ (α) =

∂α

ˆ x2

x1

G y (x, α) , y′ (x, α) ;x dx.

Empregando-se a regra de Leibniz (1.16) e lembrando que os limites de integração são pon-tos fixos na variação de y (x, α), pode-se permutar os símbolos de diferenciação e integração,resultando

∂αJ (α) =

ˆ x2

x1

∂αG y (x, α) , y′ (x, α) ;x dx

=

ˆ x2

x1

(∂G

∂y

∂y

∂α+∂G

∂y′∂y′

∂α

)dx.

De (1.18) percebe-se que∂y

∂α= η (x) e

∂y′

∂α=dη

dx.

Então,∂

∂αJ (α) =

ˆ x2

x1

(∂G

∂yη (x) +

∂G

∂y′dη

dx

)dx.

A segunda integral acima pode ser manipulada empregando-se integração por partes comoˆ x2

x1

∂G

∂y′dη

dxdx =

∂G

∂y′η (x)

∣∣∣∣x1

x1

−ˆ x2

x1

(d

dx

∂G

∂y′

)η (x) dx.

O primeiro termo é nulo, uma vez que η (x1) = η (x2) = 0. Resulta então

∂αJ (α)

∣∣∣∣α=0

=

ˆ x2

x1

(∂G

∂y− d

dx

∂G

∂y′

)η (x) dx = 0,

onde já foi aplicada a condição (1.20). Deve-se lembrar agora que η (x) é qualquer função daclasse C1 [x1, x2] que se anula nos limites de integração. Portanto, a condição (1.20) é satisfeitapara uma função η (x) arbitrária se e somente se

∂G

∂y− d

dx

∂G

∂y′= 0, (1.21)

quando y = y (x).A expressão (1.21) é denominada a equação de Euler. Dado o funcional G y (x) , y′ (x) ;x, o

cálculo de (1.21) irá fornecer uma equação diferencial de segunda ordem para y (x), cuja soluçãoserá a forma funcional para o extremum de J .

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 19: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 13

Exemplo 1.6. Retornando ao exemplo 1.4, o funcional

I [y] =

ˆ b

a

√1 + y′2dx

calcula a extensão da curva traçada por uma função y (x) ∈ C2 [a, b]. A equação de Euler (1.21)será agora empregada para calcular o extremum de I [y]. Para tanto, a partir de (1.17) identifica-se

G y (x) , y′ (x) ;x =√

1 + y′2.

Portanto,

∂G

∂y− d

dx

∂G

∂y′= −d

dx

(y′√

1 + y′2

)= − y′′√

1 + y′2+

y′2y′′

(1 + y′2)3/2

= − y′′

(1 + y′2)3/2

= 0,

ou seja, obtém-se a EDO

y′′ = 0 =⇒ y (x) = c1x+ c2, (c1, c2 ctes.) .

Ou seja, o extremum é uma reta, como já é bem sabido. Novamente neste caso o extremum éum ponto de mínimo, ou seja, a reta é a menor distância entre dois pontos. A curva traçada porqualquer outra função da classe C2 [a, b] que tenha os mesmos pontos fixos em x = a e x = b teráuma extensão maior que a reta.

Exemplo 1.7 (A braquistócrona). Pode-se empregar a equação de Euler (1.21) para a soluçãodo problema clássico da braquistócrona.5

Considere uma partícula movendo-se nas vizinhanças da superfície terrestre, sob a ação daforça peso. Se a partícula parte do repouso no ponto P1 = (x1, y1) e chega a P2 = (x2, y2), qualdeve ser a sua trajetória para que este percurso seja realizado no menor tempo possível?

Figura 1.3: O problema da braquistócrona: deter-minar a trajetória para que a partícula percorra adistância entre os pontos (x1, y1) e (x2, y2) sob aação da força peso no menor tempo possível.

Solução. Sem perda de generalidade, pode-se colocar P1 na origem e orientar o sistema decoordenadas conforme representado na figura 1.3. Como a força peso é conservativa, a energiamecânica da partícula é conservada, T + U = const. Definindo arbitrariamente U (x = 0) = 0,então a equação de movimento da mesma é

1

2mv2 −mgx = 0 =⇒ v =

√2gx.

Sendo v = d`/dt, onde d` é o elemento de arco tangencial à trajetória da partícula e com o sentidode movimento da mesma, então dt = d`/v e o tempo total para o percurso é obtido pelo cálculoda integral

T =

ˆ P2

P1

d`

v=

ˆ P2

P1

√dx2 + dy2

√2gx

=1√2g

ˆ x2

0

√1 + (y′)

2

xdx.

5Do grego: βραχιστoς: brachistos - “o mais curto” e χρoνoς: chronos - “tempo”. Este problema foi proposto e resolvidopela primeira vez por Johann Bernoulli, em 1696.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 20: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

14 1.2. Introdução ao cálculo variacional

Cicloide

Figura 1.4: A solução do problema da braquistócrona: um cicloide.

Este resultado está na forma do funcional (1.17), onde se identifica

G y (x) , y′ (x) ;x =

√1 + (y′)

2

x.

Empregando então (1.21), observa-se que ∂G/∂y = 0, o que permite escrever

d

dx

∂G

∂y′= 0 =⇒ ∂G

∂y′= cte. = (2a)

−1/2,

sendo a uma constante a ser determinada posteriormente. Calculando ∂G/∂y′, obtém-se então

y′2

x (1 + y′2)=

1

2a=⇒ y′2 =

x

2a− x,

a qual pode ser escrita como

y =

ˆxdx√

2ax− x2.

Realizando a mudança de variável

x = a (1− cos θ) , dx = a sen θdθ,

resulta a primitiva

y = a

ˆ(1− cos θ) dθ,

cuja solução éy = a (θ − sen θ) + b,

sendo b a segunda constante, a qual é nula pelas condições iniciais.Portanto, a solução é apresentada na forma paramétrica como

x = a (1− cos θ)

y = a (θ − sen θ) .

Esta solução está representada na figura 1.4. A mesma define um cicloide6 que passa pelaorigem.

Para finalizar o problema, é necessário encontrar o valor do parâmetro a, dados x2 e y2. Paratanto, é necessário também encontrar o valor de θ = θ2 neste ponto. Resulta então um sistemade duas equações não lineares para a e θ2 que somente podem ser resolvidas por métodosnuméricos. Por exemplo, se (x2, y2) = (1, 1), resultam a ≈ 0, 572917 e θ2 ≈ 2, 41201. Se (x2, y2) =(2, 3) resultam a ≈ 1, 00133 e θ2 ≈ 3, 06878.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 21: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 15

Figura 1.5: A superfície gerada pela revolução da curva entre P1 e P2 em torno do eixo y.

Exercício 1.1 (A catenária). Considere uma superfície de revolução gerada por uma curvaqualquer que conecta os pontos fixos P1 = (x1, y1) e P2 = (x2, y2) e que é então revolvida emtorno do eixo y, como representado na figura 1.5. Encontre a curva y (x) que minimiza a área dasuperfície de revolução.Solução. Na figura 1.5, observa-se que o elemento de área dA é dado por

dA = 2πxds = 2πx√dx2 + dy2 = 2πx

√1 + y′2dx.

Portanto, a área total será

A =

ˆdA = 2π

ˆ x2

x1

x√

1 + y′2dx.

Identificando-se esta integral com (1.17), obtém-se de (1.21)

d

dx

[xy′√1 + y′2

]= 0 =⇒ xy′√

1 + y′2= a,

sendo a uma constante. Ou seja,

y =

ˆadx√x2 − a2

,

cuja solução é

y = a cosh−1(xa

)+ b⇐⇒ x = a cosh

(y − ba

),

a qual é a forma de uma catenária, isto é, a forma da curva de uma corda flexível pendurada pordois pontos de sustentação.

1.2.4 DIFERENCIAÇÃO FORTE DE FUNCIONAIS

O procedimento adotado na seção 1.2.2, onde foi assumido que a variação na forma funcionalda função y (x) é realizada de forma paramétrica na expressão (1.18), resultando na variação δJdo funcional (1.19).

Este procedimento é denominado de diferenciação fraca do funcional, uma vez que embora omesmo tenha levado à equação de Euler (1.21), a dedução desta foi levada a cabo empregando-se o parâmetro α. Essa dedução contempla somente uma maneira particular de se realizar avariação de J , dentre infinitas outras.

6Uma animação de um cicloide pode ser vista em <http://mathworld.wolfram.com/Cycloid.html>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 22: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

16 1.2. Introdução ao cálculo variacional

~y(x)

y(x)

Figura 1.6: Variação forte δy = y (x) − y (x) daforma funcional de y (x).

A dedução da equação de Euler como uma con-dição necessária e suficiente para o extremum é re-alizada através da diferenciação forte do funcional.Assumindo novamente que o funcional J [y], dadopor (1.17), está definido sobre um conjunto de fun-ções y (x) ∈ C2 [x1, x2], e assumindo que y = y (x)determina o extremum de J [y], então a partir dequalquer outra função y (x) ∈ C2 [x1, x2], consis-tente com a condição de limites de integração fixosy (x1) = y (x1) e y (x2) = y (x2),7 pode-se definir avariação ou deslocamento virtual

δy = δy (x) = y (x)− y (x) ,

com δy (x1) = δy (x2) = 0, conforme representado nafigura 1.6. O deslocamento virtual δy irá resultar,por sua vez, na variação ∆J de J [y], definida por

∆J [y, δy] = ∆J.= J [y]− J [y]

= J [y (x) + δy (x)]− J [y (x)] .

Serão apresentadas a seguir algumas definições envolvidas na diferenciação forte de umfuncional.

Definição 1.5 (Norma de uma função em uma classe). Seja y (x) ∈ C [a, b] (o conjunto de todasas funções contínuas em a 6 x 6 b). Sendo Y o contradomínio de y (x), a norma de y (x) em C [a, b]é o número ‖y‖C ∈ Y dado por

‖y‖C = maxa6x6b

|y (x)| .

Se a classe funcional formar também um espaço vetorial, então a norma ‖y‖C, dotada depropriedades adicionais, pode também ser a norma do espaço, em cuja situação será constituídoentão um espaço vetorial normado.8

Definição 1.6 (Diferencial forte de funcional). Se existir um funcional L [y (x) , δy], o qual élinear (definição 1.4) em relação a δy (x), tal que qualquer acréscimo

∆J [y, δy] = J [y (x) + δy (x)]− J [y (x)]

do funcional J [y] admitir a representação

∆J = L [y, δy] + β [y, δy] ‖δy‖ ,

com β [y, δy]→ 0 quando ‖δy‖ → 0, então L [y, δy] será denominado o diferencial forte do funcionalJ [y], o qual é representado por δJ .

= L [y, δy].

Definição 1.7 (Mínimo absoluto de um funcional). Diz-se que um funcional J [y] possui ummínimo absoluto em y = y (x) se para qualquer função y (x) dentro de seu domínio se cumprir

J [y] 6 J [y] ,

sendo que J [y] = J [y] se e somente se y (x) = y (x).

Pode-se estabelecer também a definição do máximo absoluto do funcional, o que é realizadode forma simétrica à definição de mínimo.

A partir das definições acima, pode-se deduzir os seguintes teoremas, que serão apresentadossem demonstração.

Teorema 1.1 (Extremum de um funcional). Se um funcional diferenciável J [y] admitir um ex-tremum (máximo ou mínimo) no ponto y = y (x) interior ao seu domínio de definição, então

δJ [y (x)] = 0.

7E consistente também com os vínculos impostos a y (x), como será posteriormente visto.8Ver, por exemplo, Apostila de Física-Matemática, seção 4.6.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 23: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 17

As funções para as quais δJ = 0 são denominadas pontos estacionários de J .

Teorema 1.2 (Teorema fundamental do cálculo de variações). Dada uma função f (x) ∈C (a, b), se ˆ b

a

f (x)ϕ (x) dx = 0,

para toda função ϕ (x) ∈ C1 (a, b), então f (x) = 0 neste intervalo.

As demonstrações dos teoremas acima não serão aqui apresentadas. Pode-se, outrossim,apresentar a seguinte argumentação, justificada pelos mesmos. Dado o funcional J [y], paratodas as funções y (x) = y (x) + δy (x) ∈ C2 [x1, x2] existem funções δy (x) ∈ C2 [x1, x2] tais que‖δy (x)‖ < ε, sendo ε > 0; ou seja, sempre é possível encontrar-se uma função δy (x) tal que 0 <ε 1. Neste caso, para um determinado valor fixo de x1 6 x 6 x2, e nas condições estabelecidaspela definição 1.6, é possível desenvolver-se J [y] (caso isso faça sentido) em uma série de Taylorem torno de y (x) como

∆J [y, δy] =∂J

∂y

∣∣∣∣y=y

(δy)︸ ︷︷ ︸δJ[y]

+1

2

∂2J

∂y2

∣∣∣∣y=y

(δy)2

︸ ︷︷ ︸δ(2)J[y]

+ · · · .

A condição necessária para que y = y (x) seja um extremum de J [y] é, portanto,

δJ [y] = 0, para δy (x) arbitrário.

Porém, esta condição apenas define um extremum fraco, pois a mesma não especifica se o pontoestacionário é de máximo ou mínimo. Para tanto, é necessário também examinar δ(2)J [y]; seδ(2)J [y] for negativo (positivo), para todo x1 6 x 6 x2, então y = y (x) é um ponto de máximo(mínimo) de J [y].

A argumentação acima serve apenas para traçar um paralelo entre o problema de se encon-trar os extremos de funcionais com a procura dos pontos de máximo ou mínimo de funções.Para os casos de interesse na mecânica, os funcionais J [y] usualmente estão na forma (1.17),para a qual a argumentação não é aplicável. Contudo, o desenvolvimento apresentado a seguiré sempre válido.

A partir das definições e teoremas acima, Calcula-se agora a variação de (1.17), resultando

δJ =

ˆ x2

x1

[G y (x) , y′ (x) ;x −G y (x) , y′ (x) ;x] dx

=

ˆ x2

x1

[G y + δy, y′ + δy′;x −G y (x) , y′ (x) ;x] dx.

Para variações infinitesimais, isto é, para y (x) suficientemente próximas de y (x) de tal formaque seja possível determinar-se ‖δy‖ → 0, ∀x1 6 x 6 x2, pode-se desenvolver a forma funcionalde G y + δy, y′ + δy′;x em uma série de Taylor como

G y + δy, y′ + δy′;x = G y, y′;x+∂G

∂yδy +

∂G

∂y′δy′ +O

(δy2, δy′2, δyδy′

).

Mantendo então somente os termos de primeira ordem na série, resulta

δJ =

ˆ x2

x1

(∂G

∂yδy +

∂G

∂y′δy′)dx.

No segundo termo da integral acima, é importante notar que

δy′ = y′ (x)− y′ (x) =dy

dx− dy

dx=d

dx(y − y) =

d

dx(δy) .

Ou seja,

δJ =

ˆ x2

x1

[∂G

∂yδy +

∂G

∂y′d

dx(δy)

]dx.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 24: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

18 1.2. Introdução ao cálculo variacional

Novamente, o segundo termo é desenvolvido via integração por partes, o que leva a

ˆ x2

x1

∂G

∂y′d

dx(δy) dx =

∂G

∂y′δy

∣∣∣∣x2

x1

−ˆ x2

x1

d

dx

∂G

∂y′(δy) dx = −

ˆ x2

x1

d

dx

∂G

∂y′δydx.

Ou seja,

δJ =

ˆ x2

x1

(∂G

∂y− d

dx

∂G

∂y′

)δydx.

Portanto, a partir dos teoremas acima, o extremum de J [y] irá ocorrer para δJ = 0. Alémdisso, como δy é uma variação arbitrária em torno do ponto estacionário do funcional, resultaque a condição necessária e suficiente para a determinação do extremum é dada por

∂G

∂y− d

dx

∂G

∂y′= 0,

a qual é justamente a equação de Euler (1.21), já deduzida na seção 1.2.3.

1.2.5 UMA SEGUNDA FORMA PARA A EQUAÇÃO DE EULER

Quando o funcional G · · · em (1.17) não depende explicitamente na variável independente x,a equação resultante de (1.21) pode ser integrada, o que irá então fornecer uma segunda formapara a equação de Euler, sendo agora uma equação diferencial de primeira ordem para y (x).

Inicialmente, observa-se que

d

dxG y, y′;x =

∂G

∂y

dy

dx+∂G

∂y′dy′

dx+∂G

∂x= y′

∂G

∂y+ y′′

∂G

∂y′+∂G

∂x

=⇒ y′′∂G

∂y′=dG

dx− ∂G

∂x− y′ ∂G

∂y.

Por outro lado,

d

dx

(y′∂G

∂y′

)= y′′

∂G

∂y′+ y′

d

dx

∂G

∂y′=⇒ d

dx

(y′∂G

∂y′

)=dG

dx− ∂G

∂x− y′

(∂G

∂y− d

dx

∂G

∂y′

).

Se G · · · satisfaz a equação de Euler (1.21), então o último termo acima é nulo. Este resul-tado pode então ser colocado na forma

∂G

∂x− d

dx

(G− y′ ∂G

∂y′

)= 0. (1.22a)

Esta é a chamada segunda forma da equação de Euler. Agora, se ∂G/∂x = 0, esta equação podeser integrada exatamente, resultando em

G− y′ ∂G∂y′

= constante. (1.22b)

Esta última forma fornece uma equação diferencial de primeira ordem para y (x).

Exercício 1.2 (Geodésica). Uma geodésica é a curva de menor distância entre dois pontosquaisquer sobre uma superfície arbitrária. Encontre a geodésica sobre uma superfície esférica.Resolução: Dada uma esfera de raio ρ, escreve-se inicialmente as coordenadas de (x, y, z) emcoordenadas esféricas como

x = ρ sen θ cosϕ y = ρ sen θ senϕ z = ρ cos θ.

Então, o elemento de comprimento d` =√dx2 + dy2 + dz2 sobre a esfera é obtido a partir de

dx = ρ cos θ cosϕdθ − ρ sen θ senϕdϕ dy = ρ cos θ senϕdθ + ρ sen θ cosϕdϕ dz = −ρ sen θdθ,

de onde é obtidod` = ρ

√dθ2 + sen2 θdϕ2.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 25: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 19

Portanto, a distância entre os pontos A .= (θ1, ϕ1) e B .

= (θ2, ϕ2) sobre a esfera fica

` =

ˆ B

A

d` =

ˆ B

A

ρ√dθ2 + sen2 θdϕ2 =

ˆ ϕ2

ϕ1

ρ

√(dθ

)2

+ sen2 θdϕ.

Ou seja, o funcional

` [θ] = ρ

ˆ ϕ2

ϕ1

√θ′2 + sen2 θdϕ,

sendo θ′ = dθ/dϕ, irá fornecer a distância entre os pontos A e B ao longo de um caminho sobrea esfera.

Para a aplicação da equação de Euler, identifica-se

G = G θ, θ′ =√θ′2 + sen2 θ,

o qual é independente de ϕ. Pode-se empregrar então a segunda forma dada por (1.22b), deonde resulta √

θ′2 + sen2 θ − θ′ ∂∂θ′

√θ′2 + sen2 θ = a = cte.,√

θ′2 + sen2 θ − θ′2√θ′2 + sen2 θ

= a.

Esta equação pode ser escrita como

sen2 θ = a√θ′2 + sen2 θ,

a qual pode ser resolvida escrevendo-se dϕ/dθ = 1/θ′, resultando em

dθ=

a csc2 θ√1− a2 csc2 θ

.

Esta EDO pode ser resolvida para ϕ = ϕ (θ), resultando em

ϕ = − sen−1

(1

βcotan θ

)+ α,

sendo β2 = (1− a2)/a2 e α = cte.Escrevendo a solução na forma equivalente

cotan θ = −β sen (ϕ− α) ,

escreve-secos θ = −β cosα sen θ senϕ+ β senα sen θ cosϕ

e, retornando às coordenadas Cartesianas, resulta

z = β senαx− β cosαy =⇒ z = Ax−By,

com A = β senα e B = β cosα.Esta solução corresponde à equação de um plano que passa pela origem (0, 0, 0). A intersecção

deste plano com a esfera de raio ρ determina as geodésicas sobre esta última. A figura 1.7 ilustraalgumas dessas geodésicas sobre uma esfera de raio ρ = 1. Já a figura 1.8 ilustra a diferença dasdistâncias entre duas cidades situadas à mesma latitude, tanto ao longo da geodésica quantoao longo da paralela. A curva geodésica é menos extensa devido a curvatura do globo.

1.2.6 FUNCIONAIS COM DIVERSAS VARIÁVEIS DEPENDENTES

A discussão realizada até este ponto assumia a existência de uma única função incógnitay (x), a ser descoberta a partir de um princípio extremante. Contudo, na física com frequênciaum funcional é proposto com dependência em diversas funções yi (x) (i = 1, 2, . . . ) incógnitas.Estas devem também ser descobertas a partir dos métodos do cálculo variacional.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 26: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

20 1.2. Introdução ao cálculo variacional

Figura 1.7: Algumas geodésicas sobre a esfera de raiounitário. As geodésicas são obtidas pelas equações deplano z = 0, z = x/2 e z = 3x/2.

Figura 1.8: Distâncias entre Norfolk, EUA(37N, 76O) e Cabo São Vicente, Portugal(37N, 9O), medidas ao longo da geodésica (greatcircle, 3141 nm) e ao longo da paralela (direct course,3213 nm). A distância pela geodésica é 72 nm (milhasnáuticas) (≈ 133, 34 km) menor.

Considera-se então um funcional contido no integrando de (1.17) que depende de n > 1incógnitas, até as suas primeiras derivadas, tal como

J [y1, y2, . . . , yn] =

ˆ x2

x1

G yi (x) , y′i (x) ;x dx, (1.23a)

onde

G ≡ G yi (x) , y′i (x) ;x .= G y1 (x) , y′1 (x) , y2 (x) , y′2 (x) , . . . , yn (x) , y′n (x) ;x (i = 1, . . . , n) ,(1.23b)

sendo que a condição de limites fixos ainda é mantida para todas as incógnitas. Aplicandonovamente os métodos apresentados na seção 1.2.4 ao novo funcional J [yi], a condição deocorrência do extremum resulta em

δJ =

ˆ x2

x1

n∑i=1

(∂G

∂yiδyi +

∂G

∂y′iδy′i

)dx =

ˆ x2

x1

n∑i=1

(∂G

∂yi− d

dx

∂G

∂y′i

)δyidx = 0. (1.24)

Novamente, como todas as variações δyi são arbitrárias e independentes, a condição acima levaao seguinte conjunto de equações, as quais determinam os pontos estacionários do funcional,

∂G

∂yi− d

dx

∂G

∂y′i= 0, (i = 1, . . . , n) . (1.25)

Ou seja, resulta um conjunto de equações de Euler, uma para cada função yi (x).

1.2.7 EQUAÇÕES DE EULER COM VÍNCULOS

A questão que se impõe agora é como modificar o tratamento do cálculo variacional quandohá duas ou mais variáveis dependentes yi (x) (i > 2), mas estas não podem sofrer variaçõesindependentes. Isto é, uma variação δy1, aplicada a y1 (x), implica necessariamente em variações

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 27: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 21

impostas também sobre pelo menos uma das outras variáveis y2, y3, etc. Neste caso, a hipótesede variações independentes que levou ao conjunto de equações de Euler (1.25) não é mais válidae o formalismo deve ser modificado. Estas dependências ou condições impostas às variações deduas ou mais variáveis são denominadas vínculos.

Considera-se inicialmente o caso particular quando existem duas variáveis dependentes y (x)e z (x) (coordenadas), relacionadas entre si por uma equação de vínculo

f (y, z, x) = 0. (1.26)

Neste caso o funcional (1.23b) fica escrito

G = G y, y′, z, z′;x

e o extremo do funcional J [y, z] é determinado por (1.24), o qual se reduz a

δJ =

ˆ x2

x1

[(∂G

∂y− d

dx

∂G

∂y′

)δy +

(∂G

∂z− d

dx

∂G

∂z′

)δz

]dx = 0.

Porém, ao contrário do que ocorreu no tratamento apresentado na seção 1.2.6, quando asvariações das variáveis δyi foram supostas independentes, agora estas não o são. Uma variaçãoδy deve necessariamente determinar a variação δz através da equação de vínculo (1.26). Como ovínculo entre as variáveis dependentes y e z deve sempre ser obedecido, então qualquer variaçãoδy deve implicar em uma variação δz de forma a manter f (y, z, x) invariável, ou seja, δf = 0.Assim,

δf =∂f

∂yδy +

∂f

∂zδz = 0 =⇒ δz = −∂f/∂y

∂f/∂zδy,

ou seja, foi obtida uma relação entre as variações das coordenadas. Inserindo esta expressão nointegrando acima, resulta

δJ =

ˆ x2

x1

[(∂G

∂y− d

dx

∂G

∂y′

)−(∂G

∂z− d

dx

∂G

∂z′

)∂f/∂y

∂f/∂z

]δydx = 0.

Agora é possível empregar-se novamente o teorema fundamental 1.2 e concluir que o pontoestacionário do funcional é dado por(

∂G

∂y− d

dx

∂G

∂y′

)−(∂G

∂z− d

dx

∂G

∂z′

)∂f/∂y

∂f/∂z= 0.

Esta expressão pode ser escrita como(∂G

∂y− d

dx

∂G

∂y′

)(∂f

∂y

)−1

=

(∂G

∂z− d

dx

∂G

∂z′

)(∂f

∂z

)−1

.

No resultado acima, observa-se que o lado esquerdo envolve somente derivadas de G e fem relação a y e y′, ao passo que o lado direito envolve somente derivadas em z e z′. Comoambas as variáveis dependentes são funções da variável independente x, a igualdade somenteserá satisfeita se ambos os lados forem iguais à mesma função de x, a qual será escrita como−λ (x). Isto permite desacoplar as equações em y e z, formando o sistema

∂G

∂y− d

dx

∂G

∂y′+ λ (x)

∂f

∂y= 0 (1.27a)

∂G

∂z− d

dx

∂G

∂z′+ λ (x)

∂f

∂z= 0. (1.27b)

A solução completa do problema envolve agora a determinação de 3 funções: y (x), z (z) eλ (x). Isto é possível, em princípio, porque há 3 equações: o vínculo (1.26) e as equações deEuler (1.27a,b). A função λ (x) também é conhecida como o multiplicador indeterminado deLagrange.

Para o caso geral de existirem n coordenadas (variáveis dependentes) y1 (x), y2 (x), . . . , yn (x)com m (< n) vínculos na forma

fj = fj (y1, y2, . . . , yn, x) = 0, (j = 1, 2, . . . ,m) ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 28: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

22 1.2. Introdução ao cálculo variacional

o tratamento acima pode ser facilmente generalizado.Dado novamente o funcional (1.23a), observa-se que, para um conjunto de m funções λj (x),

inicialmente indeterminadas, segue que

λj (x) fj (y1, . . . , yn, x) = 0 =⇒ˆ x2

x1

λj (x) fj (y1, . . . , yn, x) = 0, (j = 1, . . . ,m) .

Portanto, o funcional (1.23a) pode ser escrito de forma equivalente como

J [y1, y2, . . . , yn] =

ˆ x2

x1

G yi (x) , y′i (x) ;x+

m∑j=1

λj (x) fj (yi , x)

dx,o que não altera o seu valor.

A condição de ocorrência do extremum (δJ = 0) resulta agora em

δJ [yi] =

ˆ x2

x1

n∑i=1

∂G∂yi− d

dx

(∂G

∂y′i

)+

m∑j=1

λj (x)∂fj∂yi

δyi dx = 0.

Agora, a condição necessária e suficiente para que δJ se anule para quaisquer variações δyiarbitrárias é

n∑i=1

∂G∂yi− d

dx

(∂G

∂y′i

)+

m∑j=1

λj (x)∂fj∂yi

δyi = 0. (1.28)

Se todas as variáveis dependentes no conjunto yi (x) sofressem variações independentes,então a condição acima demandaria que os termos dentro de [· · · ] fossem individualmente nulos.Contudo, as funções yi (x) também devem satisfazer aos vínculos fj (yi , x) = 0 (j = 1, . . . ,m).Devido a estes vínculos, m variáveis em yi (x) são dependentes das n−m restantes e a imposição[· · · ] = 0 não pode ser imediatamente realizada. A técnica dos multiplicadores indeterminadosde Lagrange permite resolver este problema, levando a uma nova forma para as equações deEuler-Lagrange em sistemas vinculados.

As m funções λj (x) podem ser determinadas se o conjunto yi (x) for ordenado de tal formaque as primeiras m variáveis sejam dependentes das n−m restantes e se for imposto na equação(1.28) que os primeiros m termos do lado esquerdo sejam identicamente nulos, i. e., que

∂G

∂yi− d

dx

(∂G

∂y′i

)︸ ︷︷ ︸

Φiyi,y′i;x

+

m∑j=1

λj (x)∂fj∂yi

= 0, (i = 1, . . . ,m) .

Como G yi , y′i ;x é um funcional conhecido, então as quantidades Φi definidas acima tam-bém o são. O mesmo se aplica a φij (x)

.= ∂fj/∂yi. Portanto,

Φi +

m∑j=1

λjφij = 0, (i = 1, . . . ,m)

consiste em um sistema linear de equações para as incógnitas λj que pode, em princípio, serresolvido e de onde resultam λj = λj (yi , y′i , x). Obtendo-se as soluções finais yi = yi (x),resultam finalmente os multiplicadores indeterminados de Lagrange λj = λj (x).

Uma vez determinados os m multiplicadores de Lagrange, a equação (1.28) se reduz a

n∑i=m+1

∂G∂yi− d

dx

(∂G

∂y′i

)+

m∑j=1

λj (x)∂fj∂yi

δyi = 0,

a qual contém as variações δyi (i = m+ 1, . . . , n) independentes. Portanto, agora a imposição[· · · ] = 0 pode ser realizada.

Desta maneira, a solução completa do problema pode ser obtida pela solução do sistema deequações

∂G

∂yi− d

dx

∂G

∂y′i+

m∑j=1

λj (x)∂fj∂yi

= 0, (i = 1, . . . , n) (1.29a)

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 29: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 23

fj (y1, . . . , yn, x) = 0, ou

dfjdx

=

n∑i=1

∂fj∂yi

y′i +∂fj∂x

= 0,(j = 1, . . . ,m) . (1.29b)

Neste sistema, há n+m incógnitas (coordenadas + vínculos), com n+m equações, o que torna osistema, em princípio, solúvel.

1.2.8 EQUAÇÃO DE EULER COM VÍNCULO INTEGRAL

Uma outra situação de interesse surge quando o vínculo também está escrito em termos deuma integração. Para caracterizar o problema, considera-se novamente o funcional J [y] dado em(1.17), porém agora com um vínculo imposto sobre o extremum do mesmo, sendo este vínculoexpresso na forma de um segundo funcional K [y] = K, onde K é um valor constante que devesempre ser respeitado. Este novo funcional, portanto, fica escrito como

K [y] =

ˆ x2

x1

g y, y′;x dx = K.

A solução este problema de vínculos é determinada pelo seguinte teorema.

Teorema 1.3. Dado o funcional

J [y] =

ˆ x2

x1

G y, y′;x dx,

tal que y (x) ∈ C1 [x1, x2] e tal que y (x1) = y1 e y (x2) = y2. Dado também o funcional

K [y] =

ˆ x2

x1

g y, y′;x dx = K,

onde K ∈ R é constante. Seja y = y (x) um extremum de J [y]. Então, se y (x) não for um extremumde K [y], existe uma constante λ tal que y (x) é um extremum do funcional

J [y] =

ˆ x2

x1

(G+ λg) dx, (1.30)

isto é, y (x) satisfaz a equação diferencial

∂G

∂y− d

dx

∂G

∂y′+ λ

(∂g

∂y− d

dx

∂g

∂y′

)= 0. (1.31)

Exemplo 1.8 (O Problema de Dido). Um problema onde o uso de um vínculo integral se faznecessário é o problema de Dido. Dada uma curva y (x) de extensão fixa ` e que cruza as abcissasnos pontos (−a, 0) e (a, 0), qual será a forma de y (x) que maximiza a área sob a mesma?

Figura 1.9: Deseja-se encontrar a função y (x) tal quea área delimitada pela mesma seja a maior possível,para um perímetro fixo.

Resolução: A situação está representada na figura 1.9. A área hachurada indica um elementode área dA = ydx. Então a área total sob a curva é

A [y] =

ˆ a

−aydx.

Deseja-se maximizar A [y] mantendo-se a extensão total da curva constante. Este vínculo éexpresso por

L [y] =

ˆ a

−ad` =

ˆ a

−a

√1 + y′2dx = `,

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 30: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

24 1.2. Introdução ao cálculo variacional

onde d` é o elemento de arco ao longo da curva. Identificam-se então em (1.31) os funcionais

G y, y′;x = y g y, y′;x =√

1 + y′2.

Assim,

∂G

∂y= 1

∂G

∂y′= 0,

∂g

∂y= 0

∂g

∂y′=

y′√1 + y′2

,

e a equação (1.31) fica

1− λddx

(y′√

1 + y′2

)= 0 =⇒ d

dx

(y′√

1 + y′2

)=

1

λ,

cuja solução geral é

y (x) = ±√λ2 − (x− c1)

2+ c2, (c1, c2 = ctes.)

a qual pode ser reescrita na forma

(x− c1)2

+ (y − c2)2

= λ2,

a qual é a equação de uma (semi) circunferência de raio λ. Aplicando as condições de contorno,

(a+ c1)2

+ c22 = λ2, (a− c1)2

+ c22 = λ2 ; a+ c1 = ± (a− c1)⇒ c1 = 0,

a2 + c22 = λ2 ⇒ c2 = −√λ2 − a2.

Ou seja, necessariamente a 6 λ, e

x2 +(y +

√λ2 − a2

)2

= λ2,

o que mostra que o centro da circunferência localiza-se ao longo do eixo y, no ponto (0, c2). Asituação mais simples ocorre se a = λ, quando então

x2 + y2 = a2,

resultando então em uma semicircunferência de raio a centrada na origem. Neste caso, a exten-são da semicircunferência determina o valor da constante λ:

` = πa = πλ⇒ λ =`

π.

Exemplo 1.9 (O “caminho” de Gibbs para a entropia). Uma aplicação interessante da açãode vínculos sobre variações foi proposta por Josiah Willard Gibbs (1839 – 1930) para a determi-nação da probabilidade de ocupação de um determinado estado físico de um sistema estatísticoem equilíbrio termodinâmico.

Dado um sistema estatístico com W estados discretos de energia acessíveis, a sua entropiatotal (S), em equilíbrio termodinâmico, é dada pela fórmula de Boltzmann

S [pi] = −kBW∑i=1

pi ln pi,

sendo kB = 1, 3807×10−23 J/K a constante de Boltzmann e 0 6 pi 6 1 a probabilidade de ocupaçãodo i-ésimo estado físico com energia εi.

De acordo com Gibbs, a probabilidade de ocupação de um determinado estado físico é tal quea entropia é máxima, sob os vínculos do ensemble em questão. Deste ponto de vista, a entropiaS [pi] é interpretada como um funcional das probabilidades pi (i = 1, . . . ,W ), o qual será ma-ximizado sob um ou mais vínculos. Essas probabilidades serão obtidas para dois ensembles, omicrocanônico e o canônico.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 31: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 25

• Ensemble microcanônico. Neste ensemble, o número de partículas, o volume e a ener-gia total do sistema são fixos. Neste caso, a maximização da entropia será obtida com oemprego de um único vínculo:

f1 (p1, . . . , pW ) =

W∑i=1

pi = 1,

isto é, a exigência de normalização da distribuição das probabilidades de ocupação dosestados.

Como S é um funcional das probabilidades pi e como essas, por sua vez, são simples-mente números e não funções, a maximização desejada será obtida a partir do funcional

S [pi] = S [pi] + λ1f1 (pi) = −kBW∑i=1

pi ln pi + λ1

(W∑i=1

pi

),

de forma semelhante ao realizado em (1.30). Neste caso,

δS = δ (S + λ1f1) = 0,

W∑i=1

[−kB (ln pi + 1) + λ1] δpi = 0 =⇒ −kB (ln pi + 1) + λ1 = 0

=⇒ pi = eλ1/kB−1 = cte.

Ou seja, todos os estados têm a mesma probabilidade de ocorrência. O valor do multi-plicador de Lagrange λ1 é obtido retornando-se à condição de normalização, de onde seobtém

W∑i=1

pi =

W∑i=1

eλ1/kB−1 = eλ1/kB−1W = 1 =⇒ λ1 = (1− lnW ) kB =⇒ pi = W−1.

Portanto, a entropia de um ensemble microcanônico fica simplesmente

S = kB lnW,

a qual é a famosa expressão obtida por Boltzmann.

• Ensemble canônico. Neste ensemble, o sistema ainda possui número de partículas cons-tante, mas pode trocar energia com o ambiente. Ao atingir o equilíbrio termodinâmico,o sistema passa a ter uma energia interna fixa, a qual é determinada por um parâmetrointensivo denominado temperatura. Neste caso, a maximização da entropia será realizadapor meio de um vínculo adicional, dado pela exigência de energia média 〈E〉 fixa:

f2 (p1, . . . , pW ; ε1, . . . , εW ).= 〈E〉 =

W∑i=1

piεi = U,

sendo U denominado a energia interna do sistema.

Então, o funcional a ser maximizado é agora

S [pi] = S [pi] + λ1f1 (pi) + λ2f2 (pi) = −kBW∑i=1

pi ln pi + λ1

(W∑i=1

pi

)+ λ2

(W∑i=1

piεi

).

Dessa forma,

δS = 0 ;

W∑i=1

[−kB (ln pi + 1) + λ1 + λ2εi]

δpi = 0,

=⇒ −kB (ln pi + 1) + λ1 + λ2εi = 0 (1.32)

=⇒ pi = pi (εi) = e(λ1+λ2εi)/kB−1.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 32: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

26 1.3. Vínculos na mecânica clássica

Retornando à condição de normalização, determina-se λ1:

W∑i=1

pi = 1 =⇒ e1−λ1/kB .= Z (εi, . . . , εW ) =

W∑i=1

eλ2εi/kB ,

sendo Z (εi, . . . , εW ) denominada a função de partição do ensemble canônico.

Para obter o segundo multiplicador de Lagrange, retorna-se a (1.32), multiplica-se por pi erealiza-se a soma, resultando

S +

W∑i=1

(λ1 − kB) pi + λ2

W∑i=1

piεi = 0 ; S − kB lnZ + λ2U = 0⇒ S = kB lnZ − λ2U.

Empregando-se agora a conhecida relação termodinâmica

1

T=∂S

∂U,

resulta λ2 = −T−1.

Portanto, a probabilidade de ocupação do i-ésimo estado físico no ensemble canônico re-sulta

pi (εi) = Z−1e−εi/kBT =e−εi/kBT∑Wi=1 e

−εi/kBT,

a qual é a conhecida distribuição de Boltzmann.

Todo o formalismo do cálculo variacional desenvolvido nesta seção será agora empregado naformulação Lagrangiana da mecânica clássica.

1.3 VÍNCULOS NA MECÂNICA CLÁSSICA

A existência de vínculos em grande parte dos sistemas físicos é um dos grandes motivadorespara o desenvolvimento e uso do cálculo variacional, uma vez que o mesmo possibilita um tra-tamento mais simplificado da dinâmica de sistemas vinculados do que é possível na formulaçãoNewtoniana.

Vínculos são limitações à dinâmica de um sistema físico. Esses vínculos em geral são denatureza geométrica ou cinemática. Na mecânica, a existência de vínculos sobre a dinâmica daspartículas terá uma influência equivalente às forças que agem sobre as mesmas. Um exemploimediato de dinâmica com vínculos pode ser fornecido pelo problema do movimento de uma par-tícula deslocando-se sob a ação da força peso sobre uma superfície esférica. A forma geométricada superfície sobre a qual a partícula se desloca implica na existência de uma força adicionalsobre a mesma, além do peso; no caso, a força normal, a qual é sempre perpendicular à super-fície. Se além disso, existirem forças de atrito atuando sobre a partícula, então estas tambémserão determinadas pela forma geométrica da esfera.

Na formulação Newtoniana, a ação desses vínculos deve ser traduzida na forma de forças, asquais são determinadas tanto pela dinâmica das partículas quanto pelas limitações geométricasimpostas pelos mesmos. Usualmente, esse tratamento não pode ser feito de uma maneira trivial.Por outro lado, na formulação Lagrangiana, a ação dos vínculos é realizada através da imposiçãode equações de vínculos, os quais são incorporados pelo cálculo variacional de uma maneirarelativamente mais simples, pois não demanda a definição de campos vetoriais complicados (asforças de vínculo).

1.3.1 EQUAÇÕES DE VÍNCULOS

O movimento de um sistema dinâmico é com frequência delimitado por agentes externosque aplicam forças sobre o sistema e que são, muitas vezes, difíceis de serem determinadas oumesmo desconhecidas. Por outro lado, em geral é possível expressar-se esses vínculos na formade equações de vínculos, as quais são determinadas pela natureza geométrica ou cinemáticadesses.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 33: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 27

Considerando-se a dinâmica de um conjunto de N partículas que se deslocam no E3, assume-se que estas têm seu movimento delimitado por um conjunto de K < 3N equações de vínculosna forma

f` (r1, . . . , rN ; r1, . . . , rN , t) = 0, (` = 1, . . . ,K) , (1.33)

sendo ri = ri (t) (i = 1, . . . , N) a posição instantânea da i-ésima particula e onde se assume queas funções f` são diferenciáveis nos seus argumentos. A figura 1.10 ilustra o caso de umapartícula movendo-se sob a ação de uma força resultante F , porém com movimento restrito poruma equação de vínculo do tipo f (r, t) = 0. A ação conjunta das forças e do vínculo é tal que atrajetória da partícula fica sempre restrita à superfície.

F

partícula

Superfície

Trajetória da partícula

Figura 1.10: Uma partícula movendo-se no E3 sob a ação de uma força resultante F e restrita a uma superfíciedeterminada por uma equação na forma f (r, t) = 0.

1.3.2 CLASSIFICAÇÃO DOS VÍNCULOS

Uma classe particular importante de vínculos são os denominados holônomos.9 Estes ocor-rem quando as equações de vínculo (1.33) se reduzem a

f` (r1, . . . , rN , t) = 0, (` = 1, . . . ,K) , (1.34)

as quais descrevem restrições de natureza puramente geométrica, sem dependência na cinemá-tica da partícula.

Se um vínculo holônomo não depende do tempo, este é denominado também fixo ou esclerô-nomo. Por outro lado, se a dependência temporal existe, o vínculo móvel também é denominadoreônomo.10

Vínculos gerais, que dependem das velocidades das partículas, são então denominados não-holônomos. Os exemplos a seguir ilustram alguns tipos de vínculos usuais na mecânica.

Exemplo 1.10. Uma partícula está restrita a uma superfície fixa. Sendo r = (x1, x2, x3) o ve-tor posição da mesma em um sistema Cartesiano, em relação ao qual a superfície permanece

9Do grego hólos (inteiro, completo) e nómos (regra, lei). Isto é, vínculos integráveis.10Do inglês scleronomic e rheonomic, respectivamente.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 34: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

28 1.3. Vínculos na mecânica clássica

fixa, então as coordenadas (x1, x2, x3) não são variáveis independentes mas devem satisfazer aequação de superfície

f (r) = f (x1, x2, x3) = 0,

a qual consiste em um vínculo esclerônomo. Se a superfície for uma esfera de raio R centradana origem,

f (r) =

3∑i=1

x2i −R2 = 0

é a equação de vínculo.

Exemplo 1.11. Uma partícula está restrita a uma superfície móvel ou deformável. Neste caso,o vínculo reônomo é dado por

f (x1, x2, x3, t) = 0,

onde se nota a dependência temporal explícita na equação.

Exemplo 1.12. Duas partículas se movem no espaço sempre unidas por uma haste rígida. Esteé um caso onde as forças de vínculo são difíceis de modelar. Porém, a equação de vínculo é,simplesmente,

(r2 − r1)2 − L2 = 0,

sendo L o comprimento da haste.

Exemplo 1.13 (Pêndulo duplo). Um pêndulo duplo oscila em um plano vertical fixo, conformeestá representado na figura 1.11. Se o movimento das partículas ocorre no plano (x, y), então asequações de vínculo nos movimentos das mesmas são:

x21 + y2

1 − l21 = 0

(x2 − x1)2

+ (y2 − y1)2 − l22 = 0.

LIN

HA

VE

RT

ICA

L D

E R

EF

ER

ÊN

CIA

Figura 1.11: Pêndulo duplo plano.

Exercício 1.3 (Cilindro rolando sobre plano inclinado). Considere um cilindro rolando semdeslizar sobre um plano inclinado, conforme representado na figura 1.12. Determine a equaçãode vínculo em termos das coordenadas generalizadas y e θ.Solução. Definindo como condição inicial θ (y = 0) = 0, sendo θ o ângulo de rotação do cilindroem torno de seu centro de simetria, então a relação entre as duas coordenadas é y = Rθ, sendoR o raio do cilindro. Ou seja, a equação de vínculo pode ser escrita

f (y, θ) = y −Rθ = 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 35: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 29

Figura 1.12: Um cilindro rola plano abaixo sem deslizar.

Esta equação exprime a condição de que o aumento na coordenada y ocorre somente devido àrotação do cilindro, sem permitir o deslizamento.

Neste exercício e no próximo serão oferecidos também importantes exemplos da diferençaentre vínculos holônomos e não-holônomos. No caso do cilindro, a equação de vínculo f (y, θ)poderia ser diferenciada, resultando em

g(y, θ)

= y −Rθ = 0,

a qual, aparentemente, se trata de um vínculo não-holônomo, conforme a classificação acima.Contudo, este vínculo é, de fato, holônomo, pois a equação g

(y, θ)

= 0 pode ser integrada,

resultando em f (y, θ). Já no exercício a seguir, os vínculos não são integráveis.

Exercício 1.4 (Disco rolando sobre superfície horizontal. Parte 1). Considere um disco deraio R que rola sobre um plano horizontal, conforme a figura 1.13. O disco pode agora rolar etambém girar em torno de um eixo de rotação vertical (paralelo a x3). O disco não pode, contudo,“tombar”, isto é girar em torno da reta horizontal oblíqua ilustrada na figura. Determine asequações de vínculo do movimento do disco e classifique as mesmas.

ψ

φ

Figura 1.13: Disco rolando sem deslizar ou tombarsobre uma superfície horizontal.

Solução: como ψ é a velocidade angular o disco em relação ao centro geométrico, então R∣∣ψ∣∣ é o

módulo da velocidade deste ponto em relação a origem do referencial. Portanto, as equações de

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 36: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

30 1.4. O Princípio de Hamilton

vínculos podem ser escritas

f1 = x1 −Rψ cosφ = 0 f2 = x2 −Rψ senφ = 0.

Ao contrário do exercício anterior, os vínculos f1 e f2 não são integráveis, uma vez que acoordenada φ também é uma variável dependente neste caso. Portanto, este é um exemplo devínculos não holonômicos.

Uma discussão didática acerca das diferênças entre vínculos holônomos e não-holônomospode ser consultada em (LEMOS, 2003).

1.4 O PRINCÍPIO DE HAMILTON

Princípios de minimização possuem uma longa história na física. A ideia subjacente a essesprincípios é a suposição de que a natureza sempre tende a se comportar de tal forma que certaspropriedades fundamentais são “economizadas,” isto é, possuem os mínimos valores dentretodas as possibilidades de evolução dos sistemas naturais.

O primeiro princípio de minimização conhecido se deve a Hero de Alexandria (∼10 – 70 AD),que demonstrou que um raio de luz refletindo-se em um espelho sempre percorre a trajetóriamais curta possível. Como consequência deste princípio, verifica-se que os ângulos de incidênciae reflexão são sempre os mesmos. Este princípio fundamental da óptica geométrica foi poste-riormente generalizado por Fermat em 1657, afirmando que um raio de luz sempre se propagade um ponto a outro em um meio diáfano ao longo da trajetória de menor tempo. Com baseneste princípio, é possível deduzir-se não somente as leis de reflexão da óptica geométrica, mastambém a lei de Snell da refração.

As primeiras proposições de princípios de minimização aplicados à mecânica podem ser tra-çados a partir de Jordanus Nemorarius, no século XIII. A partir da formulação Newtoniana damecânica, as ideias de Jordanus foram desenvolvidas pelo matemático suiço Johann Bernoulli(1667 – 1748), o qual propôs o Princípio dos Trabalhos Virtuais, segundo o qual para um sistemade partículas em equilíbrio a sua configuração será tal que dentre todos os deslocamentos vir-tuais possíveis das mesmas, consistentes com os vínculos impostos ao sistema, o trabalho totalrealizado pelas forças que atuam sobre as partículas ao longo destes deslocamentos virtuais ésempre nulo.

O princípio dos trabalhos virtuais foi posteriormente generalizado para a dinâmica de umsistema de partículas pelo filósofo natural francês Jean le Rond d’Alembert (1717 – 1783). Emsua obra Traité de dynamique,11 publicada em 1743, foi formulado o Princípio de d’Alembert,segundo o qual um sistema de partículas sempre evolui de tal forma que∑

i

(F

(a)i − pi

)· δri = 0, (1.35)

sendo F (a)i a força total aplicada à i-ésima partícula do sistema, pi o seu momentum linear e

δri qualquer deslocamento virtual consiste com os vínculos impostos ao sistema. O Princípio ded’Alembert já representou um avanço em relação à formulação Newtoniana, ao excluir qualquerreferência às forças de vínculo. Por outro lado, os deslocamentos virtuais não são independentesentre si, pois eles devem respeitar esses vínculos. Os deslocamentos virtuais δri eram tambémdenominados velocidades virtuais pelos filósofos naturais do séculos XVIII. Por esta razão, oprincípio de d’Alembert também é conhecido como o Princípio das Velocidades Virtuais.

Outra contribuição foi realizada pelo filósofo natural francês Pierre Louis Maupertuis (1698– 1759) em sua obra Ensaio de Cosmologia, publicada em 1750. O Princípio de Mínima Ação foiproposto a partir de seu dogma religioso pessoal de que Deus, em sua infinita sabedoria, criou ouniverso de tal forma que este sempre evoluirá com base no princípio da economia. Assim, todosos corpos do universo irão sempre se movimentar de tal forma que sua ação será minimizada.Na definição de Maupertuis, a ação de um corpo é o produto de sua massa pela distância que omesmo percorre e pela velocidade com a qual está se deslocando. Em sua obra, Maupertuis afir-mou que seus princípios de parcimônia no comportamento da natureza demonstram a infinitasabedoria do Criador e, portanto, demonstram irrefutavelmente a existência de Deus.

11Tratado de dinâmica.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 37: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 31

A coroação dos esforços realizados durante o século XVIII, pelos estudiosos mencionadosacima e por outros, para desenvolver uma formulação racional e consistente da mecânica foialcançada no tratado Mécanique Analytique,12 publicado em 1787 pelo matemático e astrônomoítalo-francês Joseph-Louis Lagrange (1736 – 1813). Nesta importante obra, Lagrange deriva, en-tre outras contribuições, as equações de Euler-Lagrange. A sua dedução foi fortemente baseadanos princípios de Maupertuis e d’Alembert, fazendo uso também do formalismo do cálculo devariações, ao qual Lagrange prestou diversas contribuições.

Já durante o século XIX, novas contribuições foram apresentadas, por exemplo, pelo físico ematemático alemão Carl Friederich Gauss (1777 – 1855). Em seu artigo Uber ein neueŊ allgemeineŊGrundgesetz der MeĚanik,13 Gauss escreveu:

... Na natureza das coisas, não pode haver nenhum novo princípio na ciência doequilíbrio e movimento que não inclua os princípios precedentes, ou que não possaser deduzido a partir destes.

Contudo, um novo princípio pode não ser totalmente sem valor. É sempre interes-sante e instrutivo considerar-se as leis da natureza a partir de um novo e vantajosoponto de vista, de forma a resolver este ou aquele problema de maneira mais simples,ou de forma a se obter uma representação mais precisa.

Dentro deste espírito, Gauss propôs então o Princípio do Menor Vínculo, segundo o qual

(...) o movimento de um sistema de pontos materiais (...) ocorre a cada momentoem máxima concordância com o movimento livre ou sob o menor vínculo. (...) Amedida do vínculo, (...) é considerada como a soma dos produtos das massas e dosquadrados dos desvios do movimento livre.

Por movimento livre Gauss se refere às acelerações que os corpos corpos teriam somente devidasàs ações das forças aplicadas ao sistema livre de vínculos. Então, para um sistema de N corpos,se alivre

k = F(a)k /mk é a aceleração livre de vínculos da k-ésima partícula do sistema e ak é a

aceleração do mesmo corpo devida ao movimento vinculado, a medida para o vínculo (Zwang) dosistema, denotado por Z, é

Z =

N∑k=1

mk

∣∣∣∣ak − F kmk

∣∣∣∣2 ,e o movimento real de cada partícula é tal que Z é minimizado.

O princípio de menor vínculo foi mais tarde empregado pelo físico alemão Heinrich RudolfHertz (1857 – 1894) em sua obra Die Prinzipien der MeĚanik in neuem Zusammenhang dargeĆellt,14

publicada em 1894. Nesta obra, Hertz propõe seu Princípio de Menor Curvatura, segundo o qualo movimento de um sistema isolado de corpos materiais ocorre ao longo de uma trajetória demenor curvatura com uma velocidade constante, de forma consistente com os vínculos impostos.Sendo um sistema composto por N corpos, a quantidade

K =

N∑i=1

∣∣∣∣d2rkds2

∣∣∣∣2é a medida da curvatura local da trajetória do sistema em um espaço de configuração de dimen-são 3N , sendo rk a posição instantânea da k-ésima partícula e ds2 o elemento de arco ao longoda trajetória. Segundo Hertz, a trajetória do sistema é tal que a quantidade K é minimizada.A determinação da trajetória que minimiza K é equivalente à obtenção da curva geodésica, aolongo da qual o sistema evolui. A importância do princípio da menor curvatura está no estabe-lecimento de uma fundamentação conceitual para o posterior desenvolvimento da relatividadegeneralizada em espaços curvos.

A formulação mais conhecida de princípios extremantes aplicados à mecânica é devida aofísico, astrônomo e matemático irlandês Sir William Rowan Hamilton (1805 – 1865), descrita emdois artigos publicados em 1834 e 1835 na importante revista Philosophical Transactions of theRoyal Society of London. O Princípio de Hamilton possui a seguinte formulação:

12Mecânica analítica.13Acerca de uma nova lei fundamental da mecânica.14Os princípios da mecânica apresentados em um novo contexto.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 38: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

32 1.4. O Princípio de Hamilton

Princípio 1.1 (Princípio de Hamilton). Dentre todas as possíveis trajetórias ao longo das quaisum sistema dinâmico pode ser mover entre dois pontos, dentro de um determinado intervalo detempo e de forma consistente com os vínculos impostos ao mesmo, a trajetória real seguida éaquela que minimiza a integral no tempo da diferença entre as energias cinética e potencial dosistema.

Considera-se inicialmente o movimento de uma única partícula em um campo de forçasconservativas. As energias cinética e potencial da mesma são:

T = T (r) e U = U (r) ,

ou seja, a energia cinética é função somente da velocidade da partícula, ao passo que a energiapotencial depende somente de sua posição. Define-se então a denominada função de Lagrangeou, simplesmente, a Lagrangiana da partícula como a diferença

L = T (r)− U (r) .

Rigorosamente, a Lagrangiana é um funcional onde os pontos do domínio são as coordenadasda partícula xi = xi (t) ∈ C2 [t1, t2] (i = 1, 2, 3), as quais são funções implícitas do tempo, que atuacomo a variável independente; ou seja,

L = L r, r = T (r)− U (r) .

Nota-se também que no caso de forças conservativas a Lagrangiana não depende explicitamentedo tempo.

Assim, o princípio de Hamilton se refere à integral no tempo

S =

ˆ t2

t1

L r, r dt =

ˆ t2

t1

[T (r)− U (r)] dt. (1.36)

Observa-se que o funcional S tem a dimensão de energia × tempo, ou massa × deslocamento ×velocidade; ou seja, S possui a mesma dimensão da ação definida no princípio de Maupertuis.Em decorrência, a quantidade S é denominada a integral de ação ou, simplesmente, a açãodo sistema. Deste ponto de vista, o princípio de Hamilton é uma generalização do princípio demínima ação proposto por Maupertuis.

Então, o princípio de Hamilton afirma que dentre todas as trajetórias da partícula, aquelarealmente seguida irá minimizar a sua integral de ação. Este ponto extremante é obtido atravésdo cálculo de

δS = δ

ˆ t2

t1

L r, r dt = 0. (1.37)

Como somente são consideradas as trajetórias possíveis no intervalo de tempo t2−t1 que levam apartícula do ponto inicial r1 = r (t1) ao ponto final r2 = r (t2), os limites de integração são pontosfixos na variação de S. Portanto, as trajetórias serão determinadas novamente pelas equações(1.25), as quais passam a ser escritas

∂L

∂xi− d

dt

∂L

∂x′i= 0, (i = 1, 2, 3) . (1.38)

Estas são as equações de movimento de Euler-Lagrange para uma partícula movimentando-sesob a ação de forças conservativas.

Como a energia cinética de uma partícula de massa m é simplesmente

T =1

2mr2,

a aplicação das equações (1.38) sobre a Lagrangiana, com

∂L

∂xi= − ∂U

∂xie∂L

∂xi= mxi,

resulta nas equações de movimento

∂L

∂xi− d

dt

∂L

∂x′i= 0 =⇒ d

dt(mxi) = − ∂U

∂xi= Fi,

onde Fi é a i-ésima coordenada da força total sobre a partícula. Ou seja, o princípio de Hamiltonresulta nas mesmas equações obtidas a partir da formulação Newtoniana. Alguns exemplossimples são apresentados a seguir.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 39: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 33

Exemplo 1.14 (O oscilador harmônico unidimensional). Abordando o exemplo clássico deuma partícula movimentando-se ao longo do eixo x sob a ação de uma força restauradora dotipo F = −kx, a qual é conservativa e possui a função energia potencial dada por

U (x) =1

2kx2,

sendo k a constante elástica, a Lagrangiana do sistema é

L = T − U =1

2mx2 − 1

2kx2.

Desta, obtém-se a partir de (1.38) as equações de movimento:

∂L

∂xi− d

dt

∂L

∂xi= 0 =⇒ mx+ kx = 0,

cuja solução é bem conhecida.

Exemplo 1.15 (O pêndulo plano). Outro problema clássico em mecânica. A massa m ilustradana figura 1.14 oscila sem atrito sob a ação da gravidade a partir do ângulo inicial θ0.

y

x

Figura 1.14: O pêndulo plano, no qual a massa m oscila sem atrito a partir do ângulo inicial θ0.

Estabelecendo o ponto θ = 0 como o nível U = 0, a energia potencial do pêndulo é U (θ) =mgl (1− cos θ). Assim a Lagrangiana da partícula fica escrita, em coordenadas polares, como

L =1

2ml2θ2 −mgl (1− cos θ) .

A coordenada polar θ será denominada uma coordenada generalizada, sendo tratada da mesmaforma que uma coordenada retangular. Neste caso, a equação de Euler-Lagrange (1.38) ficaescrita como

∂L

∂θ− d

dt

∂L

∂θ= 0 =⇒ −mgl sen θ −ml2 d

dtθ = 0,

ou seja,θ +

g

lsen θ = 0,

a qual é a conhecida equação de movimento do pêndulo plano. A solução exata desta equaçãoserá discutida no exercício 2.4.

1.5 COORDENADAS GENERALIZADAS

Os exemplos anteriores de aplicação do formalismo Lagrangiano estavam restritos ao casoextremamente particular de uma única partícula se movimentando ao longo de uma única di-mensão espacial.

Um sistema físico geral pode ser composto por uma coleção de N partículas puntiformes,algumas das quais podem estar conectadas entre si de tal forma que a distância típica entre asmesmas pode ser considerada arbitrariamente pequena. Estas coleções de partículas formamentão corpos extensos.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 40: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

34 1.5. Coordenadas generalizadas

Para especificar o estado deste sistema geral em um dado instante de tempo, é necessárioempregar-se um conjunto de N vetores posição. Ou seja, o número total de coordenadas noespaço Euclideano E3 é igual a 3N . Se o sistema tiver a sua dinâmica restringida por umconjunto de m < 3N equações de vínculo, então as 3N coordenadas não são independentesentre si; de fato, um total de m coordenadas sempre será dependente das demais. Neste caso, osistema é dito possuir n = 3N −m graus de liberdade.

Para se descrever a dinâmica deste sistema de N partículas, é necessário primeiro distinguiros componentes dos vetores posição e velocidade para cada partícula. Em um sistema Cartesi-ano, estes vetores podem ser distinguidos por um índice grego α, β, γ, · · · = 1, 2, . . . , N , enquantoque as coordenadas individuais de cada partícula continuam sendo identificadas por índiceslatinos i, j, k, · · · = 1, 2, 3. Desta forma a posição e velocidade da α-ésima partícula do sistemapodem ser representadas por

rα =

3∑i=1

xα,i xi, (α = 1, 2, . . . , N) (1.39a)

rα =

3∑i=1

xα,i xi, (1.39b)

sendo xi (i = 1, 2, 3) os vetores ortonormais canônicos no E3. Nesta representação, a Lagrangianatotal do sistema passa a ser escrita como

L = L r1, r2, . . . , rN , r1, r2, . . . , rN ; t= L x1,1, x1,.2, x1,3, . . . , xN,1, xN,2, xN,3, x1,1, x1,2, x1,3, . . . xN,1, xN,2, xN,3; t , (1.39c)

existindo também um total de m equações de vínculos (holônomos) na forma

fk (x1,1, . . . xN,3; t) = fk (xα,i , t) = f (rα , t) = 0,

α = 1, 2, . . . , N

i = 1, 2, 3

k = 1, 2, . . . ,m.

(1.39d)

Como é possível perceber, a notação começa a se tornar complicada. Além disso, em muitossistemas o emprego de um sistema de coordenadas Cartesiano não é adequado. Um sistema emparticular pode apresentar certas simetrias ou configurações geométricas as quais são melhordescritas com o uso de um sistema de coordenadas curvilíneas. Esta situação já ocorreu noexemplo 1.15 do pêndulo plano, onde foi conveniente adotar-se o sistema plano-polar. De fato, oemprego deste sistema explicitou que o número de graus de liberdade do pêndulo é igual a um,uma vez que a massa oscila no plano xy, porém com o vínculo x2 + y2 = l2.

A descrição matemática do comportamento de um sistema em geral pode ser consideravel-mente simplificada com o emprego de um sistema de coordenadas generalizadas, escolhido detal forma que:

1. Os vetores posição e velocidade de cada partícula do sistema são univocamente determina-dos a cada instante por esse novo sistema de coordenadas.

2. Os vínculos holônomos na forma (1.34) são identicamente satisfeitos neste sistema.

Em geral, é conveniente escolher-se um conjunto de coordenadas generalizadas tal que todassejam independentes entre si.

As novas coordenadas podem apresentar as características comuns às leis de transformação.Por exemplo, elas podem ter dimensão de comprimento ou uma outra dimensão física. Podematé mesmo ser adimensionais, como foi o caso da escolha q = θ realizada no exemplo 1.15.

Nesta descrição, portanto, o sistema de N partículas restringido por m equações de vínculopassa a ser descrito por um conjunto de n = 3N−m coordenadas generalizadas.15 Denotando-seestas coordenadas por qj (j = 1, . . . , n), deve existir então um conjunto de leis de transformaçãodo tipo

xα,i = xα,i (q1, q2, . . . , qn, t) ≡ xα,i (qj , t) ≡ xα,i (q, t) ,

α = 1, . . . N

i = 1, 2, 3

j = 1, . . . , n,

(1.40a)

15Quando os vínculos forem todos holônomos

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 41: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 35

onde q .= (q1, q2, . . . , qn). Para que as leis de transformação acima sejam válidas, é necessário

também existir as transformações inversas

qj = qj (x1,1, . . . , xN,3, t) = qj (r1, . . . , rN , t) , (j = 1, . . . , n) . (1.40b)

Por sua vez, os componentes do vetor velocidade de cada partícula devem ser expressos peloconjunto de leis de transformação

xα,i = xα,i (q1, . . . , qn, q1, . . . , qn, t) = xα,i (q, q, t) (1.40c)

qj = qj (x1,1, . . . , xN,3, x1,1, . . . , xN,3, t) = qj (r1, . . . , rN , r1, . . . , rN , t) . (1.40d)

As quantidades qj (j = 1, . . . , n) são denominadas velocidades generalizadas.Finalmente, as m = 3N − n equações de vínculos holônomos são dadas por (1.39d) e devem

ser identicamente satisfeitas pelas coordenadas generalizadas.

Exemplo 1.16 (Pêndulo plano). Retornando ao exemplo 1.15, o vínculo x2 + y2 − l2 = 0 foiexplicitamente empregado na escolha da nova coordenada generalizada q = θ, o que reduziu adimensionalidade da Lagrangiana ao número de graus de liberdade do sistema (n = 1) e possibi-litou a derivação imediata da equação de movimento do pêndulo.

Um procedimento alternativo seria partir do conjunto de equações de Euler-Lagrange comN = 1, i = 1, 2 para as coordenadas Cartesianas da partícula e usar o método dos multiplicadoresde Lagrange para tratar o seu movimento vinculado. Neste caso, a partir do sistema (1.29)resulta

∂L

∂x− d

dt

∂L

∂x+ λ (t)

∂f

∂x= 0

∂L

∂y− d

dt

∂L

∂y+ λ (t)

∂f

∂y= 0

f (x, y) = x2 + y2 − l2 = 0,

sendoL = L x, y =

1

2m(x2 + y2

)−mg (y − l) −→ 1

2m(x2 + y2

)−mgy,

onde a constante mgl/2 foi ignorada na Lagrangiana por não alterar as equações de movimento.Ou seja, as equações de movimento vinculadas ficam

mx− 2xλ (t) = 0

my +mg − 2yλ (t) = 0

x2 + y2 = l2.

Observa-se que o sistema de equações é de difícil tratamento. Por isso, é conveniente mudar-separa o sistema de coordenadas plano-polares, cujas leis de transformação são

x = r sen θ e y = −r cos θ =⇒ x = r sen θ + r cos θθ e y = −r cos θ + r sen θθ

=⇒ x = r sen θ + 2 cos θrθ − r sen θθ2 + r cos θθ

e y = −r cos θ + 2 sen θrθ + r cos θθ2 + r sen θθ.

Portanto, a dinâmica do pêndulo é descrita por

m(r sen θ + 2 cos θrθ − r sen θθ2 + r cos θθ

)− 2r sen θλ (t) = 0

m(−r cos θ + 2 sen θrθ + r cos θθ2 + r sen θθ

)+mg + 2r cos θλ (t) = 0

r2 = l2 = constante.

Com a equação de vínculo, observa-se uma simplificação no sistema de equações:

ml(− sen θθ2 + cos θθ

)− 2l sen θλ (t) = 0 (× cos θ)

ml(

cos θθ2 + sen θθ)

+mg + 2l cos θλ (t) = 0 (× sen θ) .

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 42: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

36 1.6. Equações de Euler-Lagrange em coordenadas generalizadas (vínculos holônomos)

Realizando-se as multiplicações indicadas acima e somando-se as equações, resulta

θ +g

lsen θ = 0,

a qual é a equação de movimento desejada. Observa-se neste exemplo como a dedução foi bemmais trabalhosa.

Retornando agora ao problema da descrição do estado físico do sistema de N partículasrestringido por m vínculos, como o número de graus de liberdade é n = 3N −m, diz-se tambémque n é a dimensionalidade deste sistema. Então, escolhendo-se um conjunto adequado de ncoordenadas generalizadas é possível passar-se a representar o estado do sistema em um espaçoEuclideano de dimensão n, denominado espaço de configuração e que pode ser representado porEn.

Cada dimensão deste espaço corresponde a uma das coordenadas qj independentes e a evo-lução temporal do sistema de partículas é representado por uma curva no En, sendo que ospontos ao longo da mesma são obtidos pela evolução paramétricas das coordenadas qj = qj (t)(j = 1, . . . , n). Para um dado instante t, o conjunto de coordenadas qj (t) representa a configu-ração do sistema físico neste instante.

1.6 EQUAÇÕES DE EULER-LAGRANGE EM COORDENA-DAS GENERALIZADAS (VÍNCULOS HOLÔNOMOS)

Tendo em vista a discussão sobre coordenadas generalizadas acima, o Princípio de Hamiltonpode ser reapresentado da seguinte maneira.

Princípio 1.2 (Princípio de Hamilton). Dentre todas as possíveis trajetórias ao longo das quaisum sistema dinâmico pode se mover entre dois pontos no seu espaço de configuração dentro deum determinado intervalo de tempo, a trajetória real seguida é aquela que minimiza a integral notempo da Lagrangiana do sistema.

Dadas então as leis de transformação (1.40), a energia cinética total do sistema passa a serescrita como

T = T (r1, . . . , rN ) = T (q, q, t)

e a energia potencial total como

U = U (r1, . . . , rN ) = U (q, t) .

Em consequência, a Lagrangiana do sistema passa a ser escrita como

L = L q, q; t = T (q, q, t)− U (q, t) .

Inserindo esta Lagrangiana em (1.37) e calculando-se novamente a variação da integral de ação,obtém-se diretamente as equações de Euler-Lagrange em coordenadas generalizadas

∂L

∂qj− d

dt

∂L

∂qj= 0, (j = 1, . . . , n) . (1.41)

É importante enfatizar que a validade das equações de Euler-Lagrange é garantida pelo cum-primento das seguintes condições:

1. As forças aplicadas no sistema (excetuando-se as forças de vínculo) devem ser deriváveis apartir de potenciais. Isto não necessariamente implica em que as forças sejam conservati-vas.

2. As equações de vínculo devem ser holônomas. Se houver vínculos não-holônomos agindosobre o sistema, a derivação das equações de Euler-Lagrange deve ser revisada.

Alguns problemas envolvendo a formulação Lagrangiana serão discutidos a seguir.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 43: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 37

Figura 1.15: Uma partícula movendo-se nointerior de um cone com ângulo de aberturaα. São empregadas coordenadas cilíndricascomo coordenadas generalizadas.

Exercício 1.5. Uma partícula de massa m é restringida a se mover sobre a superfície internade um cone liso de ângulo de abertura α, conforme representado na figura 1.15. Se somente éaplicada a força peso sobre m, determine as coordenadas generalizadas, as equações de vínculoe encontre as equações de movimento.Resolução. Como coordenadas generalizadas, emprega-se as coordenadas cilíndricas. Contudo,a equação de vínculo é

z = r cotα,

portanto, o sistema possui 2 graus de liberdade com as coordenadas

q1 = r e q2 = θ.

A velocidade em coordenadas cilíndricas é

v2 = r2 + r2θ2 + z2 = r2 + r2θ2 + r2 cot2 α = r2 cosec2 α+ r2θ2,

onde foi empregado o vínculo. A energia potencial é

U = mgz = mgr cotα.

Então, a Lagrangiana fica

Lr, θ, r, θ

=

1

2m(r2 cosec2 α+ r2θ2

)−mgr cotα.

As equações de Euler-Lagrange ficam então

∂L

∂r− d

dt

∂L

∂r= 0

∂L

∂θ− d

dt

∂L

∂θ= 0.

Mas como L não depende de θ, a segunda equação se reduz a

d

dt

∂L

∂θ= 0 =⇒ ∂L

∂θ= mr2θ = constante.

Como mr2θ = mr2ω é o momento angular sobre o eixo z, esta equação exprime simplesmente aconservação do momento angular.

A outra equação fica

rθ2 − g cotα− r cosec2 α = 0 =⇒ r − rθ2 sen2 α+ g senα cosα = 0.

Pode-se eliminar θ nesta equação com a expressão para o momento angular.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 44: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

38 1.6. Equações de Euler-Lagrange em coordenadas generalizadas (vínculos holônomos)

Figura 1.16: Um pêndulo simples conectado a um disco em rotação com velocidade angular constante.

Exercício 1.6. O ponto de apoio na extremidade de um pêndulo de comprimento b está presoà borda de um disco vertical de raio a, o qual está girando com velocidade angular constanteω, como ilustrado na figura 1.16. Obtenha a expressão para os componentes Cartesianos davelocidade e aceleração da massa m. Obtenha também a equação de movimento do pêndulo.Resolução. Posiciona-se a origem do sistema de coordenadas no centro do disco em rotação.Neste caso, as coordenadas Cartesianas da posição da massa m ficam

x = b sen θ + a cos (ωt) e y = −b cos θ + a sen (ωt) .

Neste caso, as componentes da velocidade são

x = b cos θθ − aω sen (ωt) e y = b sen θθ + aω cos (ωt) .

Portanto, as componentes da aceleração são:

x = b(

cos θθ − sen θθ2)− aω2 cos (ωt)

y = b(

sen θθ + cos θθ2)− aω2 sen (ωt) .

Tomando-se a energia potencial nula em y = 0, a Lagrangiana do sistema se torna:

L =1

2m(x2 + y2

)−mgy

=1

2m(b2θ2 + a2ω2 + 2abω sen (θ − ωt) θ

)−mg [a sen (ωt)− b cos θ] .

Como a única variável dinâmica restante é θ = θ (t), as derivadas de L são:

∂L

∂θ= −mb

[g sen θ − aω cos (θ − ωt) θ

]∂L

∂θ= mb

[bθ + aω sen (θ − ωt)

],

e a equação de movimento resulta em:

∂L

∂θ− d

dt

∂L

∂θ= 0

g sen θ − aω cos (θ − ωt) θ + bθ + aω cos (θ − ωt)(θ − ω

)= 0,

bθ + g sen θ − aω2 cos (θ − ωt) = 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 45: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 39

Exercício 1.7. Um pêndulo simples foi instalado no teto de um vagão de trem que se move comaceleração constante, conforme ilustrado na figura 1.17. (a) Encontre o ângulo de equilíbrio θe,para o qual o pêndulo fica em equilíbrio com o movimento do trem. (b) Encontre a frequência depequenas oscilações do pêndulo.

Figura 1.17: (a) Um pêndulo está fixo no teto de umvagão que se move com aceleração constante. (b)Existe um ângulo θe no qual o pêndulo está em equi-líbrio.

Solução: (a) Sejam ` o comprimento do pêndulo, m a massa do mesmo, a a aceleração do vagãoe θ o ângulo que o pêndulo faz com a linha vertical, a posição e a velocidade instantâneas dopêndulo serão sempre medidas em relação a um referencial inercial fixo ao solo. Este referencialserá posicionado de tal forma que o eixo x é horizontal e o eixo y é vertical. A energia poten-cial gravitacional será assumida nula quando θ = ±π/2, ou seja, quando o pêndulo estiver nahorizontal. Desta forma,

T =1

2m(x2 + y2

)U (y) = mg (y − yP ) ,

sendo yP a distância do solo ao ponto fixo do pêndulo. Assim, a Lagrangiana do pêndulo é

L = T − U =1

2m(x2 + y2

)−mg (y − yP ) .

Agora, deve-se levar em conta que o movimento de m é vinculado. A partícula está semprea uma distância constante do ponto fixo P , mas este se move com aceleração constante, juntocom o vagão, na direção x. Então, as fórmulas cinéticas do ponto fixo são:

yP = cte. xP (t) = x0 + v0t+1

2at2.

Desta maneira,

x (t) = xP (t) + ` sen θ y (t) = yP − ` cos θ,

sendo que θ > 0 significa uma oscilação no sentido anti-horário em relação à vertical.Inserindo as equações de vínculos (holônomos) na Lagrangiana, resulta então

L =1

2m

[(v0 + at+ ` cos θθ

)2

+ `2 sen2 θθ2

]+mg` cos θ.

Ou seja, a única variável dinâmica é θ = θ (t). As derivadas de L são:

∂L

∂θ= m

[−(v0 + at+ ` cos θθ

)` sen θθ + `2 sen θ cos θθ2

]−mg` sen θ

∂L

∂θ= m

[(v0 + at+ ` cos θθ

)` cos θ + `2 sen2 θθ

]d

dt

∂L

∂θ= m

[`2θ − (v0 + at) ` sen θθ + a` cos θ

].

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 46: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

40 1.6. Equações de Euler-Lagrange em coordenadas generalizadas (vínculos holônomos)

A equação de Euler-Lagrange fica então

∂L

∂θ− d

dt

∂L

∂θ= 0

θ +g

`sen θ +

a

`cos θ = 0.

Embora a equação de movimento tenha sido obtida, a sua solução analítica é tão difícilquanto a equação de um pêndulo simples. Contudo, é possível encontrar o ângulo de equilíbrioθe como sendo aquele para o qual θe = θe = 0. Este ângulo é

tan θe = −ag

=⇒ θe = − tan−1

(a

g

).

O sinal “−” indica que θe está orientado no sentido oposto à aceleração.(b) Dado então o ângulo de equilíbrio, é possível obter a equação do pêndulo quando as

oscilações são de pequenas amplitudes em torno de θe. Para tanto, define-se a variável η (t) =θ (t)− θe, onde é assumido que |η| |θe|.

Realizando-se esta aproximação, a equação de movimento pode ser escrita

η + ω20η = 0,

a qual é a equação de um oscilador harmônico com frequência angular

ω20 =

1

`

√a2 + g2.

É interessante observar como a frequência aumenta com a aceleração do trem.

Exercício 1.8. Uma conta desliza sem atrito sobre um arame liso e curvado ao longo da parábolaz = cr2, como ilustrado na figura 1.18. A conta roda ao longo de uma circunferência de raio Rquando o arame está girando em torno de seu eixo de simetria vertical com uma velocidadeangular ω. Encontre o valor da constante c para a conta permanecer em equilíbrio.

φ

Figura 1.18: Uma conta desliza sobre um arame lisoque está rotando em torno do eixo z.

Solução: Como o problema tem simetria cilíndrica, serão escolhidas como coordenadas genera-lizadas r, φ e z, que definem um sistema de coordenadas cilíndricas. Neste sistema, a energiacinética da partícula fica

T =1

2m(r2 + z2 + r2φ2

).

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 47: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 41

Determinando para a energia potencial U (z = 0) = 0, esta fica escrita U = mgz.As equações de vínculo para este problema são

z = cr2 =⇒ z = 2crr =⇒ T =1

2m[(

1 + 4c2r2)r2 + r2φ2

], U = mgcr2,

φ = ωt =⇒ φ = ω = cte.

A última equação resulta da exigência que a partícula permaneça sempre sobre o arame queestá girando em torno de z.Assim, a única variável dinâmica restante é r, resultando a Lagrangiana

L r, r =1

2m[(

1 + 4c2r2)r2 + ω2r2

]−mgcr2

e da equação de Euler-Lagrange temos(1 + 4c2r2

)r + 4c2rr2 +

(2gc− ω2

)r = 0,

cuja solução fornece o movimento geral da partícula.Entretanto, foi solicitado em que condições a conta permanece em equilíbrio, ou seja, com

r = R = cte. Nesta situação, r = r = 0 e a equação de movimento se reduz a(2gc− ω2

)R = 0,

de onde segue que

c =ω2

2g,

conforme solicitado.

Exercício 1.9. Considere o sistema de polias duplas com massas desprezíveis ilustrado nafigura 1.19. Determine as equações de movimento das massas m1, m2 e m3, empregando ascoordenadas indicadas.

Polia 1

Polia 2

Figura 1.19: Uma máquina de Atwood com duas polias.

Solução: Sendo `1 e `2 os comprimentos totais das cordas que prendem as massas a partir daslinhas tracejadas horizontais, se as distâncias x e y são medidas a partir dos centros das polias,então

para m1 : v1 = x

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 48: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

42 1.7. Potenciais generalizados e forças dissipativas

para m2 : v2 =d

dt(`1 − x+ y) = −x+ y

para m3 : v3 =d

dt(`1 − x+ `2 − y) = −x− y.

Portanto,

T =1

2m1x

2 +1

2m2 (x− y)

2+

1

2m3 (x+ y)

2.

Definindo-se U = 0 em x = 0,

U = −m1gx−m2g (`1 − x+ y)−m3g (`1 − x+ `2 − y) .

Portanto, as equações de movimento para x e y podem ser obtidas, resultando no sistema deequações

m1x+m2 (x− y) +m3 (x+ y) = (m1 −m2 −m3) g

−m2 (x− y) +m3 (x+ y) = (m2 −m3) g,

o qual pode ser resolvido.

Exercício 1.10 (Pêndulo duplo). Retornando ao exemplo 1.13 do pêndulo duplo, derive asequações de movimento das massas.Resolução. Verificando a figura 1.11, as seguintes transformações de coordenadas são conveni-entes:

x1 = l1 sen θ1 y1 = l1 cos θ1 x2 = l1 sen θ1 + l2 sen θ2 y2 = l1 cos θ1 + l2 cos θ2.

Ou seja,

x1 = l1 cos θ1θ1 y1 = −l1 sen θ1θ1

x2 = l1 cos θ1θ1 + l2 cos θ2θ2 y2 = −l1 sen θ1θ1 − l2 sen θ2θ2.

Então, as energias cinética e potencial ficam escritas

T =1

2(m1 +m2) l21θ

21 +

1

2m2l

22θ

22 +m2l1l2θ1θ2 cos (θ1 − θ2)

U = − (m1 +m2) gl1 cos θ1 −m2gl2 cos θ2.

Finalmente, as equações de Lagrange para θ1 e θ2 resultam nas equações de movimento

(m1 +m2) l21θ1 +m2l1l2 cos (θ1 − θ2) θ2 +m2l1l2 sen (θ1 − θ2) θ22 + (m1 +m2) gl1 sen θ1 = 0

m2l22θ2 +m2l1l2 cos (θ1 − θ2) θ1 −m2l1l2 sen (θ1 − θ2) θ2

1 +m2gl2 sen θ2 = 0.(1.42)

A figura 1.20 ilustra a solução numérica do sistema de equações para o pêndulo duplo paraum certo conjunto de condições iniciais. Simulações que visualizam dinamicamente as soluçõesde (1.42) estão disponíveis para Mathematica,16 python17 ou em outras fontes.18

1.7 POTENCIAIS GENERALIZADOS E FORÇAS DISSIPA-TIVAS

Nesta seção, será realizada uma breve discussão a respeito da generalidade das equações deLegendre e serão também apresentadas situações importantes nas quais, dentre todas as forçasaplicadas ao sistema de partículas, podem existir forças não conservativas tais como forças quedependem de velocidade, forças dissipativas ou forças motrizes. Nos dois últimos casos, asexpressões obtidas serão importantes para a discussão a respeito de vínculos não-holônomos, aser realizada na próxima seção.

16<http://www.wolfram.com/mathematica/new-in-9/advanced-hybrid-and-differential-algebraic-equations/double-pendulum.html>.

17<https://matplotlib.org/gallery/animation/double_pendulum_sgskip.html>.18Simulações do pêndulo duplo podem ser visualizadas em <https://www.youtube.com/watch?v=QXf95_EKS6E>

ou <https://www.youtube.com/watch?v=zX2R3BxBe74>. Um vídeo mostrando um pêndulo duplo pode ser visto em<https://www.youtube.com/watch?v=U39RMUzCjiU>. Note que este é um pêndulo físico, cuja dinâmica deve ser des-crita incluindo-se também os conceitos abordados no capítulo 3.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 49: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 43

Figura 1.20: Trajetórias das massas m1 (curva vermelha) e m2 (curva azul) de um pêndulo duplo, obtidas apartir da solução numérica do sistema de equações (1.42). As condições iniciais são x1 (0) = 1, y1 (0) = 0,x2 (0) = 1 e y2 (0) = −1, com ambas partindo do repouso.

1.7.1 FORÇAS E POTENCIAIS GENERALIZADOS EM VÍNCULOS HOLÔ-NOMOS

Como foi mencionado na seção anterior, quando os vínculos são holônomos as equações deEuler-Lagrange podem ser escritas na forma (1.41) mesmo se as forças não forem conservativas,basta que as forças sejam deriváveis de potenciais. O importante exemplo da Lagrangiana deuma partícula carregada no campo eletromagnético será apresentado a seguir.

Exemplo 1.17 (Lagrangiana da carga em um campo eletromagnético). Considera-se umapartícula de massa m e carga q submetida a um campo elétromagnético com E = E (r, t) eB = B (r, t). A força exercida pelos campos sobre q é a força de Lorentz19

F = q

(E +

1

cv ×B

).

Escrevendo os campos em termos do potencial escalar elétrico φ = φ (r, t) e do potencial vetorA = A (r, t), como

E = −∇φ− 1

c

∂A

∂tB =∇×A,

resulta

F = q

[−∇φ− 1

c

∂A

∂t+

1

cv× (∇×A)

]= −q∇

(φ− 1

cv ·A

)− q

c

[∂A

∂t+ (v · ∇)A

], (1.43)

pois v× (∇×A) =∇ (v ·A)− (v · ∇)A.Deseja-se escrever agora a força de Lorentz como uma força generalizada, a qual é obtida a

partir de uma função potencial generalizado, dependente de velocidade. A expressão genéricapara tais forças generalizadas é apresentada mais adiante, na equação (1.48). Ou seja, deseja-seescrever a força de Lorentz acima como

Fk (r, r, t) = −∂∂xk

U (r, r, t) +d

dt

∂xkU (r, r, t) , (k = 1, 2, 3) , (1.44)

sendo U (r, r, t) o potencial generalizado em questão.Para tanto, observa-se inicialmente que à medida que a carga q se desloca no espaço sob

a ação dos campos, esta passa por regiões onde os mesmos variam, tanto devido às suas de-pendências explícitas no tempo quanto devido às dependências espaciais. Então, se o potencialvetor for escrito da seguinte maneira:

A = A (r (t) , t) ,

19No sistema de unidades Gaussiano.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 50: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

44 1.7. Potenciais generalizados e forças dissipativas

sendo r (t) a posição instantânea da carga, a expressão acima ilustra como os campos experi-mentados pela partícula variam ao longo de sua trajetória. Pode-se calcular então

dA

dt=∂A

∂t+

3∑i=1

∂A

∂xi

dxidt

=∂A

∂t+ (v · ∇)A.

Assim, a k-ésima componente da força de Lorentz em (1.43) resulta escrita como

Fk = −q ∂∂xk

(φ− 1

cv ·A

)− q

c

dAkdt

.

Como nem φ nem A dependem explicitamente da velocidade da partícula, a seguinte identidadeé válida:

Ak =∂

∂xk(r·A) =

∂xk(r ·A−cφ) .

Portanto, a força de Lorentz pode ser expressa na forma (1.44) como

Fk = −∂∂xk

(qφ− q

cr·A

)+d

dt

∂xk

(qφ− q

cr·A

),

onde se identifica o potencial generalizado

U (r, r, t) = qφ (r, t)− q

cr ·A (r, t) ,

de modo que a Lagrangiana da carga no campo eletromagnético fica escrita

L r, r; t =1

2mr2 − qφ (r, t) +

q

cr ·A (r, t) .

Será realizada agora a derivação da Lagrangiana de um sistema de partículas cuja dinâmica édeterminada tanto por potenciais generalizados quanto por vínculos holonômicos. Na derivação,será assumido que existe um conjunto de n coordenadas generalizadas, sendo n número degraus de liberdade do sistema, de acordo com a discussão realizada nas seções 1.5 e 1.6.

Retornando inicialmente ao caso particular de forças conservativas, a função energia poten-cial total do sistema é escrita como U = U (q, t) e as equações de Euler-Lagrange ficam

∂qk[T (q, q, t)− U (q, t)]− d

dt

∂qkT (q, q, t) = 0, (k = 1, . . . , n) ,

as quais podem ser escritas como

∂qkT (q, q, t)− d

dt

∂qkT (q, q, t) =

∂qkU (q, t) = −Fk (q, t) , (1.45)

ondeFk (q, t) = −∂

∂qkU (q, t)

são as componentes das forças conservativas em termos das coordenadas generalizadas. Aforma acima para a equação de Euler-Lagrange foi justamente aquela obtida por Lagrange apartir do Princípio de d’Alembert.

Na última expressão acima, a função energia potencial U (q, t) é um campo escalar que atuano espaço de configuração En, ao passo que as forças conservativas Fk (q, t) são campos vetoriaisque atuam também no En. Estes campos vetoriais podem ser expressos na forma de uma n-uplacomo F (q, t) = (F1, F2, . . . , Fn) ∈ En.

A relação entre estes campos que atuam no espaço de configuração do sistema com as forçase os potenciais no E3, os quais atuam sobre as partículas do sistema, pode ser estabelecida daseguinte maneira. Retornando à discussão realizada na seção 1.5 a respeito de coordenadasgeneralizadas, a força total que atua sobre a α-ésima partícula do sistema pode ser expressacomo F α = F α (r1, . . . , rα, . . . , rN ), onde já se assume que todas as forças no sistema são conser-vativas. Neste caso, de acordo com os resultados obtidos na seção 1.1.2.3, a força total sobrecada partícula sempre pode ser expressa em termos de uma função energia potencial como

F α = −∇αU (r1, . . . , rN ) = −3∑i=1

∂U

∂xα,ixi.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 51: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 45

Levando em conta agora as leis de transformação (1.40), observa-se que para todo j = 1, . . . , n,

N∑α=1

F α ·∂rα∂qj

= −N∑α=1

∇αU ·∂rα∂qj

= −N∑α=1

3∑i=1

∂U

∂xα,i

∂xα,i∂qj

= −∂∂qj

U (q, t) .

Ou seja, o campo de forças que atua no espaço de configuração do sistema está relacionado comas forças que atuam individualmente sobre as partículas do sistema através de

Fj (q, t) =

N∑α=1

F α ·∂rα∂qj

, (j = 1, . . . , n) . (1.46)

Agora a hipótese de forças exclusivamente conservativas será descartada. Assume-se queexistem forças não conservativas, porém tais que elas podem ser derivadas a partir de um po-tencial dependente também das velocidades generalizadas. O exemplo 1.17, onde a Lagrangianade uma carga no campo eletromagnético foi derivada, servirá de modelo para tais potenciaisgeneralizados.

As forças em questão devem ser deriváveis a partir de potenciais do tipo

U = U (r1, . . . , rN ,v1, . . . ,vN , t) ,

através da relação

Fα,i (r1, . . . , rN ,v1, . . . ,vN , t) = − ∂U

∂xα,i+d

dt

∂U

∂vα,i.

Neste caso,N∑α=1

F α ·∂rα∂qj

= −N∑α=1

3∑i=1

∂U

∂xα,i

∂xα,i∂qj

+

N∑α=1

3∑i=1

∂xα,i∂qj

d

dt

∂U

∂vα,i.

Mas,∂xα,i∂qj

d

dt

∂U

∂vα,i=

d

dt

(∂xα,i∂qj

∂U

∂vα,i

)− ∂U

∂vα,i

d

dt

∂xα,i∂qj

.

Além disso, dadas as leis de transformação rα = rα (q, t) e vα = vα (q, q, t), observa-se que

vα = rα =drαdt

=

n∑`=1

∂rα∂q`

q` +∂rα∂t

,

de forma que∂vα∂qj

=∂rα∂qj

=∂rα∂qj

. (1.47a)

Da mesma maneira,

d

dt

∂xα,i∂qj

=

n∑`=1

∂q`

∂xα,i∂qj

q` +∂

∂t

∂xα,i∂qj

=∂

∂qj

(n∑`=1

∂xα,i∂q`

q` +∂xα,i∂t

)=∂vα,i∂qj

. (1.47b)

Portanto,

N∑α=1

F α ·∂rα∂qj

= −N∑α=1

3∑i=1

(∂U

∂xα,i

∂xα,i∂qj

+∂U

∂vα,i

d

dt

∂xα,i∂qj

)+

N∑α=1

3∑i=1

d

dt

(∂xα,i∂qj

∂U

∂vα,i

)

= −N∑α=1

3∑i=1

(∂U

∂xα,i

∂xα,i∂qj

+∂U

∂vα,i

∂vα,i∂qj

)+

N∑α=1

3∑i=1

d

dt

(∂U

∂vα,i

∂vα,i∂qj

),

o qual se reduz aN∑α=1

F α ·∂rα∂qj

= −∂U∂qj

+d

dt

∂U

∂qj,

sendo U = U(rα,rα, t), ou seja, ainda dado em termos das grandezas cinemáticas das

partículas do sistema.Então, se o potencial puder ser escrito agora em termos das coordenadas e velocidades gene-

ralizadas como U = U (q, q, t), sendo denominado neste caso potencial generalizado ou potencial

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 52: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

46 1.7. Potenciais generalizados e forças dissipativas

dependente de velocidades, e se as forças generalizadas Qk = Qk (q, q, t) forem obtidas a partirdas expressões

Qj (q, q, t) = −∂U∂qj

+d

dt

∂U

∂qj, (j = 1, . . . , n) , (1.48a)

onde

Qj (q, q, t) =

N∑α=1

F α (r1, . . . , rN ,v1, . . . ,vN , t) ·∂rα∂qj

, (1.48b)

então, retornando a (1.45) e substituindo Fk por Qk, resulta

∂qkT (q, q, t)− d

dt

∂qkT (q, q, t) = −Qk (q, q, t) =

∂U

∂qk− d

dt

∂U

∂qk,

a qual pode ser colocada novamente na forma das equações (1.41), com a Lagrangiana do sis-tema escrita como

L q, q; t = T (q, q, t)− U (q, q, t) .

1.7.2 FORÇAS GENERALIZADAS DISSIPATIVAS OU MOTRIZES

Nem todas as forças podem ser derivadas a partir de potenciais. Quando isso ocorre a dis-cussão realizada acima a respeito de forças e potenciais generalizados não é mais válida. Porexemplo, forças dissipativas que se originam do atrito entre dois corpos ou da viscosidade deum fluido são, em geral, dependentes da velocidade da partícula, mas não podem ser derivadasa partir de um potencial, como foi feito para a força de Lorentz. Nesta situação, é necessárioampliar o conceito de forças e potenciais generalizados, de forma a incluir estes casos.

Considera-se novamente a força total que atua sobre a α-ésima partícula do sistema. Estaforça será escrita agora como

F totα = F α + fα,

sendo F α a força discutida na seção anterior, a qual pode ser derivada a partir de um potencial,mesmo que não seja conservativa, e fα a força total que não pode ser obtida a partir do potencial.Então, seguindo a definição realizada em (1.46), define-se Q′j (j = 1, . . . , n) como a parte dasforças generalizadas que não é oriunda de nenhum potencial, através de

Q′j =

N∑α=1

fα ·∂rα∂qj

. (1.49)

Desta forma, as componentes das forças generalizadas totais existentes no espaço de confi-guração podem ser escritas como

Qj = −∂U∂qj

+d

dt

∂U

∂qj+Q′j , (j = 1, . . . , n) .

Substituindo-se agora esta expressão em (1.45), as equações de Euler-Lagrange tornam-se

∂L

∂qk− d

dt

∂L

∂qk= −Q′k, (1.50)

onde, novamente,L q, q; t = T (q, q, t)− U (q, q, t) .

Uma vez que as forças generalizadas Q′k não são derivadas a partir de uma função energiapotencial, elas, em geral, violam a conservação da energia mecânica do sistema. Quando aenergia mecânica decresce, as forças Q′k são denominadas forças generalizadas dissipativas;quando a energia aumenta, elas são denominadas forças generalizadas motrizes.

Usualmente, forças motrizes são dependentes explicitamente do tempo. Assim, serão consi-deradas em mais detalhes as forças dissipativas, pois elas não necessitam de uma dependênciatemporal explícita.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 53: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 47

AS FUNÇÕES DISSIPATIVA E DE RAYLEIGH

De particular importância entre as forças dissipativas são aquelas que se originam da vis-cosidade do meio através do qual as partículas do sistema se movimentam. Essas forças sãousualmente dependentes das velocidades das partículas e são sempre dirigidas nos sentidosopostos aos movimentos das mesmas. Ou seja, se fα é a força dissipativa que atua sobre aα-ésima partícula, então

fα = −gα (vα)vα. (1.51)

Muitas vezes, a função gα (vα) > 0 é determinada empiricamente e é do tipo gα ∝ v`α, com` = 0, 1, . . . , dependendo de |vα|. A força fα modelada acima sempre irá realizar um trabalhonegativo sobre cada partícula do sistema, levando à dissipação da energia total do sistema.

De (1.49) segue que

Q′j = −N∑α=1

gα (vα)vα ·∂rα∂qj

.

Mas, empregando novamente a identidade (1.47a), resulta que

Q′j = −N∑α=1

gα (vα)vα ·∂vα∂qj

.

Por outro lado,

vα ·∂vα∂qj

=1

2

∂v2α

∂qj= vα

∂vα∂qj

.

Assumindo também que gα (vα) = gα (vα), ou seja, que não há uma direção preferencial para aforça dissipativa, resulta então

Q′j = −N∑α=1

gα (vα) vα∂vα∂qj

.= −∂F

∂qj, (1.52a)

sendo F a função dissipativa, dada por

F =

N∑α=1

ˆ vα

0

gα (v′) v′dv′, (1.52b)

o que pode ser verificado a partir da regra de Leibniz (1.16).Portanto, as equações de Euler-Lagrange na forma (1.50) são escritas agora como

∂L

∂qj− d

dt

∂L

∂qj− ∂F∂qj

= 0, (j = 1, . . . , n) . (1.53)

Quando a função gα (vα) = bα = cte., a força dissipativa é proporcional à velocidade e a funçãodissipativa em (1.52) fica escrita simplesmente

F =1

2

N∑α=1

bαv2α, (1.54)

sendo então denominada função de Rayleigh.O exemplo a seguir ilustra o uso da função de Rayleigh para um sistema dissipativo.

Exemplo 1.18 (Pêndulo simples com resistência do ar proporcional à velocidade). Retoma-se o problema de um pêndulo simples, mas agora será incluída uma força dissipativa atuandosobre o mesmo devido à pequena viscosidade do ar. Usando novamente coordenadas plano-polares e já considerando o vínculo sobre a massa, a Lagrangiana do pêndulo simples é

Lθ, θ

=1

2m`2θ2 +mg` cos θ,

sendo ` o comprimento do pêndulo e definindo U (θ = π/2) = 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 54: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

48 1.8. Formalismo lagrangiano com vínculos não-holônomos

Se a velocidade do pêndulo for pequena o suficiente, a força resistiva será sempre proporcio-nal à mesma. Dessa forma, a expressão (1.51) pode ser escrita

f = −gv,

sendo g = cte. Com esta expressão a função de Rayleigh (1.54) é, simplesmente,

F =1

2bv2 =

1

2b`2θ2.

Então, a equação de Euler-Lagrange na presença de forças dissipativas (1.53) fica

∂L

∂θ− d

dt

∂L

∂θ− ∂F∂θ

= 0,

fornecendo a equação de movimento

θ +b

mθ +

g

`sen θ = 0.

No caso de pequenas oscilações (|θ| 1), esta se reduzirá à equação de um oscilador harmônicoamortecido.

1.8 FORMALISMO LAGRANGIANO COM VÍNCULOS NÃO-HOLÔNOMOS

Nesta seção, o formalismo lagrangiano será estendido para o caso mais geral de um sistemarestringido por vínculos não-holônomos. Inicialmente, os vínculos continuarão supostos todosholônomos, mas serão obtidas expressões equivalentes às discutidas na seção anterior, sendoexplicitada a relação entre as forças de vínculos e as forças generalizadas. Posteriormente o casomais geral será discutido.

Conforme discutido na seção 1.2.7, quando um sistema com N partículas é sujeito a mequações de vínculos, o número de graus de liberdade se reduz a n = 3N −m e o formalismo docálculo variacional deve ser modificado pelo método dos multiplicadores de Lagrange. No casode vínculos holônomos e com o uso de coordenadas generalizadas adequadamente escolhidas,foi argumentado na seção 1.6 que as equações de Euler-Lagrange podem ser escritas em termosdas n coordenadas generalizadas, as quais satisfazem automaticamente os vínculos. Contudo,mesmo neste caso em certas situações é vantajoso manter-se os multiplicadores de Lagrange,principalmente quando as forças de vínculo agem somente durante um intervalo finito de tempona dinâmica total do sistema.

Por outro lado, quando há vínculos não-holônomos presentes, é em geral impossível introduzir-se coordenadas generalizadas tais que os vínculos sejam satisfeitos e o tratamento formal doproblema deve necessariamente envolver o uso dos multiplicadores de Lagrange.

1.8.1 TRATAMENTO GERAL

Retorna-se às coordenadas e às velocidades de cada uma das N partículas do sistema. Porém,para economizar a notação, ao invés de se identificar coordenadas e velocidades por xα,i e vα,irespectivamente, será mantida a notação em termos das variáveis qj e qj. Assim, o sistemadeverá ser descrito por 3N coordenadas e velocidades, juntamente com m equações de vínculosdo tipo

f` (q1, . . . , q3N , q1, . . . , q3N t) ≡ f` (q, q, t) = 0, (` = 1, . . . ,m) , (1.55a)

sendo que as coordenadas q1, . . . , q3N continuam sendo interpretadas como coordenadas genera-lizadas. Estas equações também podem ser escritas na forma diferencial como

df` =

3N∑j=1

(∂f`∂qj

dqj +∂f`∂qj

dqj +∂f`∂t

dt

)= 0. (1.55b)

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 55: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 49

Como já argumentado em diversos momentos, estes vínculos são devidos a restrições im-postas aos movimentos das partículas do sistema que podem ser de natureza geométrica e/oucinemática. No formalismo Newtoniano estas restrições surgem devido a forças de contato (forçanormal) ou a forças dissipativas/motrizes. Por essa razão, diz-se que as equações (1.55) descre-vem a ação de forças de vínculo que atuam sobre o sistema físico.

Retornando agora à formulação do Princípio de Hamilton em (1.37), a trajetória do sistemadeve ser tal que a integral de ação é minimizada, isto é,

δS =

ˆ t2

t1

δL q, q; t dt =

ˆ t2

t1

3N∑j=1

(∂L

∂qj− d

dt

∂L

∂qj

)δqjdt = 0.

É importante observar aqui que a Lagrangiana L = T − U somente leva em conta as forçasaplicadas às partículas do sistema, sem inclusão das forças de vínculos. Porém, agora as vari-ações δqj não são mais independentes entre si, justamente devido a esses vínculos. De fato,em (1.55) observa-se que dentre estas variações, m (< 3N) são linearmente dependentes dasn = 3N −m restantes através do sistema de equações

δf` (q, q, t) =

3N∑j=1

(∂f`∂qj

δqj +∂f`∂qj

δqj

)= 0, (` = 1, . . . ,m) . (1.56)

A questão que se impõe agora é como levar em conta estas relações de dependência (entreas variações das coordenadas generalizadas) durante o processo de minimização da ação dosistema, quando δqj 6= 0.

A solução deste dilema pode ser obtida através da aplicação, sem muito rigor, de propriedadesconhecidas de espaços vetoriais com produto interno em álgebra abstrata.20 Na ausência devínculos, as variações δqj são todas independentes entre si. Assumindo então que tanto oconjunto de funções δqj = δqj (t) quanto os funcionais

Λj q, q; t =∂L

∂qj− d

dt

∂L

∂qj, (j = 1, . . . , 3N)

são componentes de vetores em um espaço vetorial de dimensão 3N , aqui identificado por F 3N ,então a condição δS = 0 pode ser escrita como21

δS =

ˆ t2

t1

3N∑j=1

Λjδqj

dt = 0.

Como já mencionado, devido ao teorema 1.2 este resultado leva às equações de Euler-Lagrange conhecidas para um sistema sem vínculos. Entretanto, a mesma condição pode seragora interpretada como o resultado do produto interno entre os vetores Λ = (Λ1, . . . ,Λ3N ) eδq = (δq1, . . . , δq3N ), ambos do espaço F 3N . Este produto interno pode ser escrito como

δS = 〈Λ, δq〉 = 0,

ou seja, Λ ⊥ δq. Como as componentes do vetor δq, em um sistema sem vínculos, são todasindependentes entre si, cada variação arbitrária δqj serve como base de um subespaço F 1 ⊂ F 3N

de dimensão um. Por isto, o conjunto δqj é linearmente independente. Como as variações sãoarbitrárias, então qualquer combinação das mesmas gera uma nova variação arbritrária. Poresta razão, o vetor δq necessariamente pertence a uma base de F 3N . Portanto, a condição deproduto interno nulo entre Λ e δq implica que Λ é ortogonal a qualquer vetor da base de F 3N ,

20Ver, por exemplo, Apostila de Física-Matemática, seção 4.7.21Em F3N , os vetores são as 3N-uplas h .

= (h1 (t) , . . . , h3N (t)), sendo hj (t) (j = 1, . . . , 3N) funções da classe C1 [t1, t2],integráveis neste intervalo, enquanto que os escalares são os números reais. Dados h, g ∈ F3N , a adição vetorial édefinida como h + g = (h1 + g1, . . . , h3N + g3N ) ∈ F3N , o vetor nulo é 0 = (0, . . . , 0) e o produto do vetor h pelo escalarα ∈ R é αh .

= (αh1, . . . , αh3N ) ∈ F3N . O produto interno entre h e g é definido como

〈h, g〉 .=ˆ t2t1

3N∑j=1

hjgj

dt = α ∈ R.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 56: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

50 1.8. Formalismo lagrangiano com vínculos não-holônomos

implicando por sua vez, que Λ = 0, ou seja, é um vetor nulo, de onde se obtém novamente asequações de Euler-Lagrange (1.41).

Por outro lado, em um sistema vinculado um total de m variações em δq são linearmentedependentes das n = 3N − m restantes. Sem perda de generalidade, pode-se assumir que asvariações δqn+1, . . . , δq3N são escritas em termos de δq1, . . . , δqn. Portanto, nesta situação o vetorδq = (δq1, . . . , δqn) pertence agora à base do subespaço Fn ⊂ F 3N . Neste caso, Λ não é mais umvetor nulo, pois a condição 〈Λ, δq〉 = 0 implica em que o vetor Λ é simplesmente ortogonal aosubespaço Fn; ou seja, Λ ∈ Fm = F 3N−n, sendo Fm o complemento ortogonal de Fn.

Retorna-se agora a (1.56) e multiplica-se cada equação do sistema por uma função µ` (t) ∈C1 [t1, t2] suficientemente bem comportada, somando-se então as equações e integrando a resul-tante em t1 6 t 6 t2. Com isso, obtém-se

ˆ t2

t1

m∑`=1

3N∑j=1

µ` (t)

(∂f`∂qj

δqj +∂f`∂qj

δqj

) dt =

ˆ t2

t1

3N∑j=1

m∑`=1

[µ`∂f`∂qj− d

dt

(µ`∂f`∂qj

)]δqj

dt = 0,

resultado este que pode ser escrito como

ˆ t2

t1

3N∑j=1

(m∑`=1

χ`j

)δqj

dt ≡ ⟨ m∑`=1

χ`, δq

⟩= 0,

onde cada χ` é um vetor no F 3N cujos componentes são

χ`j = µ`∂f`∂qj− d

dt

(µ`∂f`∂qj

).

Este resultado deve ser válido para todos os vetores χ` possíveis (obtidos a partir de todasas funções µ` (t) possíveis), o que implica em que os vetores χ` não somente são ortogonais aosubespaço Fn, mas também que eles varrem um subespaço Fχ ⊂ F 3N que é complementoortogonal de Fn. Portanto, como todo espaço vetorial finito pode ser dado pela soma direta deum subespaço pelo seu complementar ortogonal e como tanto Fm (que contém Λ) quanto Fχ

são ambos complementares ortogonais a Fn, segue que Fχ = Fm.Por consequência, como os vetores χ` varrem Fm, deve existir um conjunto de coeficientes

α` (` = 1, . . . ,m) os quais permitem escrever

Λ =

m∑`=1

α`χ`,

ou seja,

Λj =

m∑`=1

α`χ`j = −m∑`=1

[λ` (t)

∂f`∂qj− d

dt

(λ` (t)

∂f`∂qj

)],

onde se definiuλ` (t) = −α`µ` (t) ,

os quais são os multiplicadores de Lagrange.Assim, as equações de Euler-Lagrange para um sistema vinculado ficam escritas

∂L∂qj− d

dt

∂L∂qj

= 0, (j = 1, . . . , 3N) , (1.57a)

onde

Lq, q; t = L q, q; t+

m∑`=1

λ` (t) f` (q, q, t) . (1.57b)

Estas 3N equações, em conjunto com as m equações de vínculos (1.55) permitem, em princípio,encontrar-se as 3N +m incógnitas.

Embora solúvel a princípio, o sistema (1.55) + (1.57) possui um sério inconveniente: eleimplica em um conjunto de m equações de primeira ordem para os multiplicadores λ` (t), oque por sua vez implica em condições iniciais para as forças de vínculo e/ou para as qj. Taiscondições iniciais não têm sentido físico em geral. Uma alternativa para a solução deste conflito,válida em casos particulares, será apresentada na seção 1.8.4.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 57: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 51

1.8.2 SISTEMAS HOLÔNOMOS COM MULTIPLICADORES DE LAGRAN-GE

Como mencionado anteriormente, mesmo com vínculos holônomos é às vezes convenienteempregar-se o método dos multiplicadores de Lagrange. Se os vínculos são holônomos, entãoas equações (1.55) ficam escritas simplesmente

f` (q, t) = 0, (` = 1, . . . ,m)

ou3N∑j=1

(a`jdqj + a`tdt) = 0,

onde

a`j = a`j (q, t) =∂f`∂qj

e a`t = a`t (q, t) =∂f`∂t

,

e as equações (1.57) ficam

∂L

∂qj− d

dt

∂L

∂qj+

m∑`=1

λ` (t)∂f`∂qj

= 0, (j = 1, . . . , 3N) . (1.58)

Este sistema de equações simplesmente reproduz as expressões já obtidas na seção 1.2.7.Embora não necessário no caso de vínculos holônomos, o emprego dos multiplicadores de

Lagrange pode ser útil quando a dinâmica do sistema é tal que os vínculos se tornam inválidosou são violados a partir de um determinado ponto. O exercício a seguir ilustra uma situaçãoonde isso ocorre.

Exercício 1.11. Uma partícula de massa m é liberada do repouso quase no ápice de um hemis-fério fixo de raio a, conforme ilustrado na figura 1.21. Encontre a força de vínculo e determine oângulo θc no qual a partícula abandona o hemisfério.

Figura 1.21: Uma partícula de massa m movendo-sesem atrito sobre um hemifério de raio a.

Solução: Empregando coordenadas esféricas e assumindo U (θ = π/2) = 0, a Lagrangiana dapartícula fica

Lr, r, θ, θ

=

1

2m(r2 + r2θ2

)−mgr cos θ.

Note que já foi assumido que o movimento da partícula ocorre sobre um plano. A equação devínculo sobre o movimento da partícula é

f (r, θ) = r − a = 0 =⇒ ∂f

∂r= 1,

∂f

∂θ= 0.

Assim, as equações de Euler-Lagrange (1.58) ficam

∂L

∂r− d

dt

∂L

∂r+ λ (t)

∂f

∂r= 0 =⇒ mr −mrθ2 +mg cos θ − λ (t) = 0

∂L

∂θ− d

dt

∂L

∂θ+ λ (t)

∂f

∂θ= 0 =⇒ d

dt

(r2θ)− gr sen θ = 0,

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 58: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

52 1.8. Formalismo lagrangiano com vínculos não-holônomos

onde λ (t) é o multiplicador de Lagrange. Tendo obtido o sistema de equações acima, aplica-seagora o vínculo r = a = cte., resultando

maθ2 −mg cos θ + λ = 0, θ =g

asen θ.

A segunda equação pode ser integrada da seguinte maneira,

θ =dθ

dt=dθ

dt= θ

dθ=g

asen θ,ˆ

θdθ =g

a

ˆsen θdθ =⇒ 1

2θ2 = −g

acos θ + α.

Foi dito que a partícula foi abandonada do repouso quase no ápice do hemisfério, isto é, em umângulo 0 < θ0 θc. Assim,

θ2 = 2g

a(cos θ0 − cos θ) .

Inserindo esta solução na primeira equação, resulta

2mg (cos θ0 − cos θ)−mg cos θ + λ = 0 =⇒ λ = (3 cos θ − 2 cos θ0)mg,

obtendo-se assim a expressão para força de vínculo.Observa-se então que a força de vínculo se torna nula para θ > θc, dado por λ (θc) = 0; ou

seja, em

θc = cos−1

(2

3cos θ0

)& 48, 2.

A partir deste ângulo a partícula abandona o hemisfério e se movimenta como um projétil.Uma análise das forças mostra que a força de vínculo é, de fato, a força normal exercida pelohemisfério sobre a partícula. O vínculo some quando essa força normal se anula.

1.8.3 LAGRANGIANAS EQUIVALENTES

Antes de se abordar o problema dos vínculos não-holônomos, é necessário realizar a deriva-ção de uma importante propriedade matemática da Lagrangiana.

Definição 1.8 (Lagrangianas equivalentes). Duas Lagrangianas L1 q, q; t e L2 q, q; t sãoditas equivalentes se diferem entre si pela derivada total em relação ao tempo de uma funçãoarbitrária das coordenadas generalizadas e do tempo g (q, t), ou seja,

L2 q, q; t − L1 q, q; t =d

dtg (q, t) .

Desta definição, o seguinte teorema segue.

Teorema 1.4. Lagrangianas equivalentes originam as mesmas equações de movimento.

Demonstração. Sendo L1 q, q; t e L2 q, q; t duas Lagrangianas equivalentes, calculam-se asintegrais de ação S1 e S2 associadas às mesmas a partir da definição de equivalência, resultandoem ˆ t2

t1

L2 q, q; t dt =

ˆ t2

t1

L1 q, q; t dt+

ˆ t2

t1

d

dtg (q, t) dt,

ou seja,S2 = S1 + g (q (t2) , t2)− g (q (t1) , t1) .

Como os instantes t1 e t2 são fixos, a aplicação do Princípio de Hamilton ao resultado acimaresultará em

δS2 = δS1.

Portanto, as equações de movimento resultantes serão as mesmas.

O teorema acima também pode ser demonstrado diretamente a partir das equações de Euler-Lagrange para cada Lagrangiana.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 59: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 53

1.8.4 SISTEMAS NÃO HOLÔNOMOS

Em uma situação mais geral, deseja-se um método que permita integrar uma classe de vín-culos não-holônomos, porém sem surgir o inconveniente mencionado anteriormente a respeitodas condições iniciais para os multiplicadores de Lagrange. Isto é possível para uma classeparticular de vínculos não-holônomos, determinados pelas equações

f` (q, q, t) =

3N∑j=1

a`j (q, t) qj + a`t (q, t) = 0, (` = 1, . . . ,m) , (1.59)

cuja forma diferencial pode ser expressa como

3N∑j=1

a`j (q, t) dqj + a`t (q, t) dt = 0, (` = 1, . . . ,m) .

De acordo com a discussão realizada anteriormente, vínculos não-holônomos não são inte-gráveis, i. e., não é possível encontrar-se um fator integrante que transforme a equação diferen-cial de primeira ordem acima em uma diferencial exata. Contudo, para vínculos na forma (1.59),pode-se argumentar que uma vez obtida a solução das equações de movimento, as funçõesqj = qj (t) se tornam conhecidas e tais que satisfazem os vínculos. É razoável supor, portanto,que existe uma função f` = f` (q (t) , t) tal que

df`dt

= f` =⇒ f` (q (t) , t) =

ˆf` (q (t) , q (t) , t) dt,

sendo f` (q, q, t) um vínculo na forma (1.59). Ou seja, as equações de vínculo podem ser escritascomo22

f` (q, q, t) =d

dtf` (q, t) =

3N∑j=1

∂f`∂qj

qj +∂f`∂t

,

o que permite identificar

∂f`∂qj

= a`j (q, t)∂f`∂t

= a`t (q, t) .

Observa-se também que∂f`∂qj

=∂f`∂qj

.

Esta será a forma adotada para os vínculos não-holônomos nesta seção.Retornando agora às equações de Euler-Lagrange que devem ser empregadam para sistemas

vinculados em geral, dadas por (1.57a,b), a Lagrangiana para este sistema vinculado pode serescrita como

L q, q; t = L q, q; t+

m∑`=1

η` (t) f` = L q, q; t+

m∑`=1

η` (t)df`dt,

onde η` (t) são os multiplicadores de Lagrange associados as vínculos e L q, q; t = T q, q; t −U q, q; t é a parte da Lagrangiana associada às forças generalizadas deriváveis de potenciais.

Considera-se agora uma outra Lagrangiana Lq, q; t definida por

Lq, q; t .= L q, q; t −m∑`=1

η`f`.

Observa-se então que

L q, q; t − Lq, q; t =

m∑`=1

(η`df`dt

+dη`dtf`

)=d

dt

(m∑`=1

η` (t) f` (q, t)

).

22Este argumento torna-se ainda mais convincente se for suposto que f` (q, q, t) =˙f` + (η`)

−1 g` (t), onde η` (t) é omultiplicador de Lagrange e g` é uma função tal que a expressão seja válida.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 60: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

54 1.8. Formalismo lagrangiano com vínculos não-holônomos

De acordo com o teorema sobre Lagrangianas equivalentes, como a diferença entre L e L éa derivada temporal de uma função do tempo e das coordenadas generalizadas, estas devemresultar nas mesmas equações de movimento. Portanto, pode-se empregar a forma dada porLq, q; t, ao invés de L q, q; t, para a determinação da dinâmica do sistema vinculado.

Como as funções η` são indeterminadas, pode-se escrever sem perda de generalidade η` (t) =−λ` (t), resultando então na seguinte Lagrangiana

Lq, q; t = L q, q; t+

m∑`=1

λ` (t) f` (q, t) . (1.60a)

A partir desta, as equações de Euler-Lagrange (1.57a) ficam

∂L

∂qj− d

dt

∂L

∂qj+

m∑`=1

λ`∂f`∂qj

= 0, (j = 1, . . . , 3N) . (1.60b)

Esta equação é empregada mesmo em situações em que f` é não linear em qj.O exercício a seguir ilustra uma aplicação do formalismo desenvolvido nesta seção.

Exercício 1.12. Considere uma partícula movendo-se livremente sobre um plano, exceto pelovínculo não-holônomo

f (x, y) = x− ωy = 0,

onde ω = cte.(a) Mostre que o vínculo acima não é holônomo, i. e., mostre que não existe um fator integranteque transforme f em um vínculo holônomo.(b) Obtenha e resolva as equações de movimento e a força de vínculo.Solução: (a) Um vínculo que aparenta ser não-holônomo é na verdade holônomo se existir umfator integrante não nulo h (x, y, t) tal que permita integrar a equação. Ou seja, se

hx− ωhy =d

dtH =

∂H

∂xx+

∂H

∂yy +

∂H

∂t= 0.

Se isso for verdade, então a equação acima se transforma na equação de vínculo holônomo

F (x, y, t) = H (x, y, t)− C = 0, (C = cte.)

Então, supondo que exista h (x, y, t), identifica-se

∂H

∂x= h,

∂H

∂y= 0,

∂H

∂t= −ωhy.

Porém, neste caso as derivadas de 2ª ordem devem satisfazer as condições

∂2H

∂y∂x=

∂2H

∂x∂y=⇒ ∂h

∂y= 0 =⇒ h = h (x, t) ,

∂2H

∂t∂x=∂2H

∂x∂t=⇒ ∂h

∂t= −ωy∂h

∂x,

∂2H

∂y∂t=∂2H

∂t∂y=⇒ −ωh = 0 =⇒ h = 0.

Ou seja, não existe um fator integrante h (x, y, t) e, portanto, o vínculo é de fato não-holônomo.(b) Para resolver a dinâmica da partícula, considera-se agora sua Lagrangiana, dada simples-

mente por

L x, y =1

2m(x2 + y2

).

Da equação de vínculo temos

∂f

∂x= 0,

∂f

∂y= −ω, ∂f

∂x= 1,

∂f

∂y= 0.

A solução é obtida a partir das equações (1.60). De acordo com as mesmas, temos

∂L

∂x− d

dt

∂L

∂x+ λ

∂f

∂x= 0 =⇒ mx− λ = 0

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 61: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 55

∂L

∂y− d

dt

∂L

∂y+ λ

∂f

∂y= 0 =⇒ y = 0 =⇒ y (t) = y0 + v0t.

Usando o vínculo,

x = ωy =⇒ x (t) =

(y0 +

1

2v0t

)ωt+ x0,

resultando então para λ (t)

λ = mx = mωv0.

1.8.5 FORÇAS DE VÍNCULO E FORÇAS GENERALIZADAS

O termo “forças de vínculo” foi anteriormente empregado em relação aos vínculos impostosao sistema e os multiplicadores de Lagrange. Essa relação será agora discutida em maioresdetalhes, tanto em sistemas vinculados holônomos quanto não holônomos.

1.8.5.1 VÍNCULOS HOLÔNOMOS

Para ilustrar a relação entre vínculos holônomos e forças de vínculo, é conveniente antesintroduzir a definição do momento canônico conjugado.

Definição 1.9 (Momento canônico conjugado). Seja Lq, q; t

a Lagrangiana de um sistema

físico com n graus de liberdade. A quantidade pk, definida por

pk =∂L

∂qk(1.61)

é denominada o momento canônico conjugado à coordenada qk.

Como a dimensão física da Lagrangiana é de energia([L] = ML2T−2

), a dimensão do momento

conjugado é

[p] = [L] [q]−1T

se [q] = L−−−−−−→ [p] = MLT−1;

isto é, o momento canônico tem a dimensão de momentum linear se a coordenada conjugada qkpossuir dimensão de comprimento. Entretanto, como será ilustrado em exemplos posteriores,mesmo neste caso o momento conjugado não necessariamente será igual ao momentum linear.

Seja agora um sistema com N partículas submetido a m vínculos holônomos, descritos pelasfunções f` = f` (q, t); por conseguinte este sistema possui n = 3N −m graus de liberdade. Porsimplicidade, será inicialmente suposto que não atuam sobre o mesmo forças dissipativas e/oumotrizes.

Empregando-se o método dos multiplicadores de Lagrange, a dinâmica deste sistema serádescrita pelas equações de Euler-Lagrange (1.58), as quais podem ser escritas como

d

dtpj = pj =

∂L

∂qj+

m∑`=1

λ` (t)∂f`∂qj

, (j = 1, . . . , 3N) .

A expressão acima deve ser comparada com a segunda lei de Newton p = F . De acordo comessa interpretação, o lado direito da equação contém as forças (generalizadas) que atuam sobreo sistema.

Se a energia cinética total do sistema depende somente das velocidades generalizadas, entãoa taxa de variação do momento canônico será

pj = −∂U∂qj

+

m∑`=1

λ` (t)∂f`∂qj

= − ∂

∂qj

(U −

m∑`=1

λ` (t) f`

)= −∂Uef

∂qj,

sendo

Uef = U −m∑`=1

λ` (t) f`

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 62: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

56 1.8. Formalismo lagrangiano com vínculos não-holônomos

a energia potencial efetiva sob a qual o sistema se desloca. O primeiro termo consiste na energiapotencial propriamente dita, criada pelas forças conservativas aplicadas ao sistema. Já o gra-diente do segundo termo irá gerar as forças de vínculo aplicadas ao mesmo. A força reativa naj-ésima direção oriunda dos vínculos impostos ao sistema será então

F reatj =

m∑`=1

λ` (t)∂f`∂qj

(j = 1, . . . , 3N) .

A contribuição do k-ésimo vínculo a Fj é

F reatkj = λk (t)

∂fk∂qj

(k = 1, . . . ,m) .

Dessa forma, a dimensão física de λ` é

[λ`] = [f`]−1

[q] [p]T−1.

Dependendo das quantidades envolvidas, o multiplicador de Lagrange pode realmente ter adimensão de força.

Exemplo (“Variações sobre o tema:” pêndulo plano). Retorna-se ao problema do pênduloplano simples, abordado com multiplicadores de Lagrange no exemplo 1.16. A dinâmica destesistema será analisado de duas maneiras distintas.

(i) Empregando-se coordenadas plano-polares (ver figura 1.14),

x = r sen θ y = −r cos θ,

escreve-se a Lagrangiana como

Lr, θ, r, θ

=

1

2m(r2 + r2θ2

)+mgr cos θ.

Nota-se que é inicialmente assumido que r 6= 0. A equação de vínculo pode ser escrita como

f (r) = r − l = 0.

Assim, as equações de Euler-Lagrange são∂L

∂r− d

dt

∂L

∂r+ λ

∂f

∂r= 0

∂L

∂θ− d

dt

∂L

∂θ+ λ

∂f

∂θ= 0

=⇒

mrθ2 +mg cos θ −mr + λ = 0

−gr sen θ − d

dt

(r2θ)

= 0.

Empregando-se agora o vínculo, r = r = 0, a segunda equação se reduz à conhecida equação dopêndulo

θ +g

lsen θ = 0,

enquanto que a primeira equação fornece o valor do multiplicador de Lagrange

λ = −m(lθ2 + g cos θ

).

Realizando-se a decomposição de forças na figura 1.14, observa-se que, λ = Tr = −T , sendo Tr acomponente da força de tensão do cabo na direção radial e T seu módulo. Portanto, de fato λ éa força que cria o vínculo imposto à partícula.

(ii) Se ao invés do tratamento acima for empregada a formulação (1.50), a qual trata a forçade vínculo como uma força generalizada, então a relação entre a força de vínculo e a tensão docabo é dada por (1.46), que resulta em

Qr = T ·∂r∂r

T=−T r−−−−−→r=rr

= −T = −m(lθ2 + g cos θ

).

Ou seja, novamente Qr = Tr = λ.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 63: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 57

1.8.5.2 VÍNCULOS NÃO-HOLÔNOMOS

Retornando à discussão realizada na seção 1.7.2 a respeito de forças generalizadas que nãosão deriváveis de potenciais, realizou-se a separação da força total que atua sobre a α-ésimapartícula como

F totα = F α + fα,

sendo F α a força derivável de um potencial que pode depender do tempo e fα a força que não éderivável de potenciais e que será aqui relacionada com as forças de vínculo. Definiu-se então aforça generalizada Q′j conforme a equação (1.49) e as equações de Euler-Lagrange foram escritascomo em (1.50). Ou seja, a força generalizada fica expressa como

Q′j = −(∂L

∂qj− d

dt

∂L

∂qj

),

onde a Lagrangiana contém somente as contribuições das forças generalizadas Qj (q, q, t), deri-váveis de potenciais.

Em suma, a discussão realizada na seção 1.7.2 tratou a dinâmica de um sistema de partícu-las em termos de forças generalizadas que podem ser dissipativas ou motrizes, mas que possuema propriedade comum de não serem deriváveis a partir de potenciais. Obteve-se então o sistemade equações (1.50) que descreve a evolução dinâmica do sistema. Por outro lado, a seção 1.8.4discutiu a evolução do mesmo sistema de partículas em termos de vínculos não-holônomos, de-nominados também de forças de vínculo. Foram derivadas então as equações de movimento(1.60). Obviamente, a dinâmica do sistema é única e ambas as descrições devem produzir osmesmos resultados. Por conseguinte, para que ambos os sistemas de equações descrevam amesma dinâmica, é necessário estabelecer a seguinte relação entre as forças generalizadas e asforças de vínculo:

Q′j =

m∑`=1

λ` (t)∂f`∂qj

=

m∑`=1

λ`a`j .

1.9 PROPRIEDADES DE SIMETRIA DAS EQUAÇÕES DE

EULER-LAGRANGE E LEIS DE CONSERVAÇÃO

Algumas propriedades matemáticas importantes da Lagrangiana de um sistema e de suascorrespondentes equações de Euler-Lagrange serão apresentadas nesta seção.

1.9.1 INVARIÂNCIA SOB TRANSFORMAÇÕES DE COORDENADAS

Durante a discussão realizada na seção 1.6, assumiu-se que o Princípio de Hamilton propostoinicialmente no espaço Euclideano E3 também é válido quando são realizadas as transforma-ções para as coordenadas generalizadas, em cuja situação a dinâmica passa a ser descrita noespaço de configuração do sistema. Com essa suposição, foram derivadas as equações de Euler-Lagrange (1.41). A validade dessa suposição será agora demonstrada. De fato, será mostradoaqui que as equações de Euler-Lagrange são invariantes em forma frente a qualquer transfor-mação de coordenadas.

Parte-se da suposição de que as equações de Euler-Lagrange determinam corretamente adinâmica do sistema quando este possui um total de n graus de liberdade, sendo o seu espaçode configuração determinado pelas coordenadas generalizadas q1, . . . , qn, as quais podem seras coordenadas xα,i das partículas no espaço E3. Define-se agora um conjunto de n novascoordenadas s1, . . . , sn, relacionadas a qj através das leis de transformação

sk = sk (q1, . . . , qn, t) , (k = 1, . . . , n) . (1.62a)

Nota-se que a lei de transformação pode depender explicitamente do tempo. Porém, umacondição importante é imposta. Empregando-se conceitos de análise funcional, a definição dosmapeamentos sk (q, t), onde as coordenadas qj fazem o papel de elementos do domínio dafunção e as coordenadas sk são as imagens, devem sempre ser tais que o mapeamento ébijetivo, ou seja, sobrejetivo e injetivo, a cada instante de tempo.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 64: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

58 1.9. Propriedades de simetria das equações de Euler-Lagrange e leis de conservação

Uma discussão mais moderna a respeito das condições impostas sobre as leis de transfor-mação emprega conceitos avançados de geometria e topologia. Não se deseja realizar aqui umadiscussão aprofundada sobre este assunto. Basta mencionar que o conjunto das coordenadasgeneralizadas qj, as quais variam de forma contínua dentro de seus domínios de validade, de-finem um espaço topológico métrico, no qual as noções geométricas de pontos no espaço contidosem uma vizinhaça e de distância entre dois pontos quaisquer podem ser definidas sem ambigui-dades. Adicionalmente, a dinâmica do sistema não está necessariamente restrita a um espaçoEuclideano, caracterizado por ser plano. A dinâmica pode ocorrer também em espaços curvos,tal como ocorre com partículas confinadas a se deslocar sobre superfícies esféricas (ou hiperes-féricas). Porém, aqui uma nova condição é imposta: mesmo se o espaço topológico for curvo,essa curvatura deve ser suficientemente “suave” para que a vizinhaça em torno de qualquerponto deste espaço se assemelhe a um espaço Euclideano plano. Adicionando então esta últimacondição à propriedade de diferenciabilidade do espaço topológico (por ser métrico e contínuo),caracteriza o mesmo como uma variedade diferenciável.23

Portanto, empregando-se a linguagem de espaços topológicos, os conjuntos das coordena-das qj e sk definem duas variedades diferenciáveis que podem ser identificadas por Q e S,respectivamente, e que estão relacionadas entre si pelo mapeamento

r : Q 7−→ S,

o qual é operacionalizado pelas leis de transformação (1.62a). Pelas condições impostas aomapeamento, o mesmo é sempre bijetivo e é também diferenciável (nas coordenadas ou noparâmetro t). Agora, impõe-se uma última condição: este mapeamento deve ser inversível, porse tratar de duas descrições distintas do mesmo sistema físico. Ou seja, devem existir tambémas leis de transformações inversas

qj = qj (s1, . . . , sn, t) , (j = 1, . . . , n) , (1.62b)

as quais executam o mapeamento inverso r−1 : S 7−→ Q, e este mapeamento inverso tambémdeve ser diferenciável. Na área de topologia, tal mapeamento bijetivo e inversível entre variedadesdiferenciáveis é denominado um difeomorfismo, e os espaços Q e S são ditos difeomórficos entresi.

Retornando às equações de movimento, diferenciando-se (1.62b) no tempo,

qj =

n∑`=1

∂qj∂s`

s` +∂qj∂t

=⇒ ∂qj∂sk

=∂qj∂sk

.

Realizando-se a transformação (1.62a) na Lagrangiana original L q, q, t, esta pode ser expressacomo

L s, s, t = L q (s, t) , q (s, s, t) , t .Agora, derivando-se L:

∂L

∂sk=

n∑`=1

(∂L

∂q`

∂q`∂sk

+∂L

∂q`

∂q`∂sk

)∂L

∂sk=

n∑`=1

∂L

∂q`

∂q`∂sk

(1.47a)=

n∑`=1

∂L

∂q`

∂q`∂sk

,

mas

d

dt

∂L

∂sk=

n∑`=1

(d

dt

∂L

∂q`

∂q`∂sk

+∂L

∂q`

d

dt

∂q`∂sk

)(1.47b)−−−−→

n∑`=1

(d

dt

∂L

∂q`

∂q`∂sk

+∂L

∂q`

∂q`∂sk

).

Portanto, calculando-se

∂L

∂sk− d

dt

∂L

∂sk=

n∑`=1

(∂L

∂q`− d

dt

∂L

∂q`

)∂q`∂sk

= 0,

uma vez que as equações de Euler-Lagrange são supostas válidas no espaço Q. Ou seja,demonstrou-se que estas equações também são válidas no espaço S e são invariantes sob dife-omorfismos.

23Em inglês: differentiable manifold.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 65: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 59

1.9.2 SIMETRIA E LEIS DE CONSERVAÇÃO

Uma outra vantagem da formulação Lagrangiana será ressaltada agora: a obtenção de leisde conservação a partir das simetrias envolvidas na dinâmica de um sistema físico no espaçoe no tempo. Essas leis de conservação serão obtidas a partir da procura das constantes demovimento contidas dentro da Lagrangiana. Essas constantes de movimento podem ser sim-plesmente coordenadas generalizadas que se conservam na dinâmica do sistema mas tambémsão propriedades globais do sistema, tais como os momenta linear e angular e a energia totais.

1.9.2.1 CONSTANTES DE MOVIMENTO

Como mencionado, constantes de movimento, ou integrais primeiras são grandezas físicasconservadas, ou seja, que permanecem estacionárias, durante a evolução dinâmica do sistema.Tratam-se de funções g das coordenadas e velocidades generalizadas tais que

dg

dt= 0, ou g (q, q, t) = constante.

Um tipo de constante de movimento que é facilmente percebido na Lagrangiana do sistema éuma coordenada cíclica. As definições e teoremas a seguir determinam a sua existência.

Definição 1.10 (Coordenada cíclica). Seja Lq, q; t

a Lagrangiana de um sistema físico com

n graus de liberdade. Se a Lagrangiana não depender da coordenada qk, ou seja, se

∂L

∂qk= 0,

então esta coordenada é dita cíclica.Com as definições de coordenada cíclica e momento canônico conjugado (definição 1.9), o

seguinte teorema é válido quando os vínculos forem holônomos.

Teorema 1.5. Seja Lq, q; t

a Lagrangiana de um sistema físico com n graus de liberdade sub-

metido a vínculos holônomos. Se a coordenada qk for cíclica, então o seu momento conjugado éuma constante de movimento.

Demonstração. Como os vínculos são holônomos, então a equação de Euler-Lagrange da coor-denada qk é

∂L

∂qk− d

dt

∂L

∂qk= 0 =⇒ dpk

dt= 0.

Exemplo 1.19 (Partícula submetida a força central. Formulação Lagrangiana). Seja umapartícula movimentando-se sob a ação de uma força central. Neste caso, supõe-se que a força ésempre conservativa e o seu potencial é do tipo U = U (r). Empregando coordenadas esféricas, aLagrangiana completa da partícula fica então escrita

Lr, θ, r, θ, ϕ

=

1

2m(r2 + r2θ2 + r2 sen2 θϕ2

)− U (r) . (1.63)

Nesta Lagrangiana, observa-se que a coordenada ϕ é cíclica; portanto,

pϕ =∂L

∂ϕ= mr2 sen2 θϕ = constante.

Verifica-se facilmente que pϕ é a componente z do momentum angular da partícula.

1.9.2.2 TRANSLAÇÕES E ROTAÇÕES VIRTUAIS

A possível existência de coordenadas cíclicas, as quais implicam na conservação do momentoconjugado a elas, mostram que a dinâmica do sistema é invariante frente a deslocamentosarbitrários ao longo dessas coordenadas. Por exemplo, se a coordenada cíclica tiver dimensãode comprimento, então a dinâmica é invariante frente a uma translação arbitrária ao longo damesma; por sua vez, se a coordenada for um ângulo, então o sistema é invariante frente arotações. Estes deslocamentos podem ser tanto reais quanto virtuais (imaginários), e podem ser

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 66: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

60 1.9. Propriedades de simetria das equações de Euler-Lagrange e leis de conservação

tanto passivos (quando é o referencial que é deslocado) quanto ativos (quando é o sistema físicoque sofre a transformação).

A invariância na forma e/ou nas propriedades de um sistema físico frente a transforma-ções arbitrárias indica a existência de uma simetria do mesmo. Quando as transformações sãoaplicadas ao sistema físico per se, a existência de uma simetria implica em que a “forma” dosistema, ou seja, a distância relativa entre dois pontos quaisquer do sistema, permanece invari-ante frente a transformação. Neste caso, diz-se que o sistema apresenta uma isometria frente aessa transformação em particular. Uma importante consequência da existência de simetrias naforma e/ou propriedades de um sistema consiste no surgimento de constantes de movimentoque estarão associadas a essas simetrias.

Para verificar se a Lagrangiana de um sistema físico qualquer, composto por N partículas,contém informações sobre suas propriedades de simetria, estuda-se como a Lagrangiana dosistema varia devido a transformações virtuais do tipo

rα −→ r′α = rα + δrα

vα −→ v′α = vα + δvα,(α = 1, 2, . . . , N) ,

onde δrα e δvα são variações realizadas sobre as coordenadas e velocidades das partículas.Sob estas transformações, a Lagrangiana L = L r1, . . . , rN ,v1, . . . ,vN ; t sofre a variação

δL = L r′1, . . . , r′N ,v′1, . . . ,v′N ; t − L r1, . . . , rN ,v1, . . . ,vN ; t .

Se as variações forem suficientemente pequenas,

δL =

N∑α=1

(∂L

∂rα· δrα +

∂L

∂vα· δvα

), (1.64)

onde ∂L/∂rα e ∂L/∂vα indicam, respectivamente, os gradientes nas coordenadas e componentesda velocidade da α-ésima partícula.

Diferentes tipos de transformações podem levar a diferentes tipos de variações na Lagrangi-ana e se esta for invariante frente a uma ou mais transformações, isto indicará a existência desimetrias no sistema físico que levarão às constantes de movimento associadas a estas últimas.Algumas dessas simetrias que levam às leis de conservação em sistemas de partículas serãoabordadas a seguir.

1.9.2.3 TEOREMAS DE CONSERVAÇÃO

Será considerado um sistema composto por N partículas, submetidas a m equações de vín-culos holônomos do tipo

f` (r1, . . . , rN , t) = 0, (` = 1, . . . ,m) .

Neste caso, a Lagrangiana é dada por (1.57b),

Lr1, . . . , rN ,v1, . . . ,vN ; t = L r1, . . . , rN ,v1, . . . ,vN ; t+

m∑`=1

λ` (t) f` (r1, . . . , rN , t) (1.65)

e as equações de movimento podem ser dadas por (1.57a).As leis de conservação consideradas aqui são as seguintes.

CONSERVAÇÃO DO momentum LINEAR TOTAL

A conservação do momentum linear total de um sistema está associado à invariância daLagrangiana do mesmo frente a translações rígidas, ou seja, deslocamentos virtuais que mantêmas distâncias relativas fixas e não alteram as velocidades. Este tipo de tranformações é descritopor

δrα = ε en, δvα = 0, (α = 1, . . . , N) ,

sendo |ε| < 1 um parâmetro real pequeno e en um vetor unitário que indica a direção e o sentidoda transformação. Nesta situação, o seguinte teorema se aplica.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 67: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 61

Teorema 1.6 (Conservação do momentum linear total). Seja um sistema de partículas cuja di-nâmica é descrita pela Lagrangiana (1.65). Se a Lagrangiana permanecer invariante frente a umatranslação rígida arbitrária ao longo de uma dada direção, então a componente do momentumlinear total do sistema ao longo dessa direção é conservada.

Demonstração. Se L é invariante frente a uma translação rígida, então de (1.64),

δL =

N∑α=1

∂L∂rα· (ε en) = ε en ·

N∑α=1

∂L∂rα

= 0.

Como ε é arbitrário, resulta que

en ·N∑α=1

∂L∂rα

= 0.

Contudo, observa-se que∂L∂vα

=∂L∂rα

=∂L

∂rα

(1.61)= pα = mαrα,

onde pα é o momento conjugado à coordenada rα, ou seja, o momentum linear da α-ésimapartícula.

Assim, da equação de movimento (1.57a) resulta que

∂L∂rα

=d

dt

∂L∂vα

=dpαdt

.

Portanto, se a Lagrangiana for invariante frente as translações rígidas,

en ·N∑α=1

dpαdt

=d

dt

(en ·

N∑α=1

)=

d

dt( en · P ) = 0,

sendo P .=∑α pα o momentum linear total do sistema de partículas.

Ou seja, se a Lagrangiana é invariante frente a uma translação rígida do sistema de partícu-las, então o momentum linear total do sistema é conservado na direção da translação.

Exemplo 1.20. Considere a Lagrangiana de uma partícula movendo-se sob a ação da força peso,

L =1

2m(x2

1 + x22 + x2

3

)−mgx3.

Esta Lagrangiana é claramente invariante frente a translação rígida

δr = ε (cos η e1 + sen η e2) , (0 6 η 6 2π) .

Portanto, as componentes p1 = mx1 e p2 = mx2 do momentum da partícula são conservados. Esteresultado é trivialmente estendido para um sistema de N > 1 partículas movendo-se sob a açãode seus pesos.

CONSERVAÇÃO DO momentum ANGULAR TOTAL

Agora será verificada a consequência da invariância da Lagrangiana frente a uma rotaçãorígida do sistema em torno de um determinado eixo de rotação. Esta transformação é realizadaescolhendo-se inicialmente um eixo de rotação cuja direção e sentido será dada pelo vetor uni-tário en. Em torno desse eixo será então efetuada uma rotação de todos os vetores do sistemapor um ângulo δθ. Definindo-se o vetor axial δθ = δθ en, a rotação rígida é assim descrita por

δrα = δθ× rα, δvα = δθ× vα. (1.66)

A figura 1.22 ilustra a rotação do vetor rα. Nesta situação o seguinte teorema se aplica.

Teorema 1.7 (Conservação do momentum angular total). Seja um sistema de partículas cujadinâmica é descrita pela Lagrangiana (1.65). Se a Lagrangiana permanecer invariante frente auma rotação rígida arbitrária, então a componente do momentum angular total do sistema aolongo do eixo de rotação é conservada.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 68: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

62 1.9. Propriedades de simetria das equações de Euler-Lagrange e leis de conservação

β

rα r′α

δrα

en

Figura 1.22: Rotação rígida de um sistema de partículas.

Demonstração. Se L é invariante frente a uma rotação rígida, então de (1.64),

δL =

N∑α=1

[∂L∂rα· (δθ× rα) +

∂L∂vα· (δθ× vα)

]= 0.

Como a· (b× c) = b· (c× a), a expressão acima pode ser escrita

δL = δθ en ·N∑α=1

(rα ×

∂L∂rα

+ vα ×∂L∂vα

)= 0.

O elemento de ângulo δθ é arbitrário; além disso, já foi visto que

∂L∂vα

= pα,∂L∂rα

= pα.

Portanto,

en ·N∑α=1

(rα × pα + rα × pα) = en ·d

dt

N∑α=1

(rα × pα) = en ·d

dt

N∑α=1

`α =d

dt( en ·L) = 0,

sendo L =∑α `α o momentum angular total do sistema.

Ou seja, se a Lagrangiana é invariante frente a uma rotação rígida do sistema de partículas,então o momentum angular total do sistema é conservado ao longo da direção do eixo de rotação.

Lembrando do exemplo 1.19, a Lagrangiana de uma partícula submetida a uma força centralé invariante a rotações em torno do eixo x3. Por isso, a componente do momentum angular dapartícula ao longo de x3 é conservada.

CONSERVAÇÃO DA ENERGIA TOTAL

Por fim, será discutida a conservação da energia total do sistema. Neste caso, serão emprega-das novamente as coordenadas e velocidades generalizadas, mas os vínculos serão consideradosholônomos, para simplificar a discussão. Assim, a Lagrangiana do sistema será aqui um funci-onal do tipo

L = L q1, . . . , qn, q1, . . . , qn; t , (n = 3N −m) .

Neste caso, o seguinte teorema se aplica.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 69: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 63

Teorema 1.8. Dada a Lagrangiana L q, q; t que descreve a dinâmica de um sistema movimen-tando-se sob vínculos holônomos. Se L não depende explicitamente do tempo, i. e., se ∂L/∂t = 0,então a função h (q, q, t), definida por

h (q, q, t) =

n∑j=1

qj∂L

∂qj− L q, q; t , (1.67)

é uma constante de movimento.

Demonstração. Para demonstrar este teorema, basta realizar a derivada total de h em relação aotempo:

dh

dt=

n∑j=1

[qj∂L

∂qj+ qj

d

dt

(∂L

∂qj

)]− dL

dt

=

n∑j=1

[qj∂L

∂qj+ qj

d

dt

(∂L

∂qj

)]−

n∑j=1

(∂L

∂qjqj +

∂L

∂qjqj

)− ∂L

∂t

=

n∑j=1

qj

:0[d

dt

(∂L

∂qj

)− ∂L

∂qj

]− ∂L

∂t, (1.68)

ou seja,dh

dt= −∂L

∂t.

Portanto, se L não possui dependência temporal explícita, a função h é conservada.

A função h (q, q, t) é com frequência denominada integral de Jacobi. Em certos casos particu-lares, esta função é justamente a energia total do sistema. Para verificar quando isto é verdade,considera-se o caso restrito em que a função energia potencial não depende das velocidades.Então, a função h em (1.67) fica

h (q, q, t) =

n∑j=1

qj∂T

∂qj− (T − U) . (1.69)

Considera-se agora a energia cinética total do sistema. Como estão sendo empregadas coor-denadas generalizadas, de acordo com a lei de transformação (1.40a) pode-se escrever

d

dtrα = rα =

n∑j=1

∂rα∂qj

qj +∂rα∂t

.

Desta forma, a energia cinética total do sistema fica

T =1

2

N∑α=1

mα (rα · rα) =1

2

N∑α=1

n∑j=1

∂rα∂qj

qj +∂rα∂t

· n∑j=1

∂rα∂qj

qj +∂rα∂t

,

a qual pode ser escrita como

T (q, q, t) = M0 +

n∑j=1

Mj qj +1

2

n∑j,k=1

Mjkqj qk, (1.70a)

sendo

M0.=

1

2

N∑α=1

mα∂rα∂t· ∂rα∂t

Mj.=

N∑α=1

mα∂rα∂qj· ∂rα∂t

Mjk.=

N∑α=1

mα∂rα∂qj· ∂rα∂qk

. (1.70b)

Será suposto agora que a definição e o teorema abaixo são aplicáveis à energia cinética.

Definição 1.11 (Função homogênea). Uma função F = F (x1, . . . , xm) : Rm 7−→ R é dita homo-gênea de grau p se existe o número p ∈ R \ 0 tal que

F (λx1, . . . , λxm) = λpF (x1, . . . , xm) ,

para qualquer λ ∈ R e λ ∈ R+.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 70: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

64 1.9. Propriedades de simetria das equações de Euler-Lagrange e leis de conservação

Teorema 1.9 (Teorema de Euler das funções homogêneas). Se F : Rm 7−→ R é uma funçãodiferenciável e homogênea de grau p, então

m∑k=1

xk∂F

∂xk= pF. (1.71)

De forma recíproca, se F satisfaz (1.71), então esta é uma função homogênea de grau p.

Demonstração. Assumindo que F é função homogênea de grau p, define-se u1 = λx1, u2 = λx2,. . . , um = λxm. Então,

F (u1, . . . , um) = λpF (x1, . . . , xm) .

Derivando-se a expressão acima em relação a λ, resulta

m∑k=1

xk∂F

∂uk= pλp−1F.

Fazendo-se agora λ = 1, resulta (1.71):

m∑k=1

xk∂F

∂xk= pF.

A condição recíproca é demonstrada assumindo-se que F satisfaz (1.71). Seja então a função

g (λ) = λ−pF (u1, . . . , um) .

Derivando-se g em relação a λ,

g′ (λ) = −pλ−p−1F + λ−pm∑k=1

xk∂F

∂uk= λ−p−1

(−pF +

m∑k=1

uk∂F

∂uk

)= 0,

devido a (1.71). Portanto, g (λ) = constante. Porém, de sua definição, necessariamente g (1) =F (x1, . . . , xm), o que implica que g (λ) = g (1) = F (x1, . . . , xm). Segue então que

λ−pF (u1, . . . , um) = λ−pF (λx1, . . . , λxm) = F (x1, . . . , xm) ,

mostrando que F é homogênea de grau p.

Agora, se as leis de transformação (1.40a) não dependerem explicitamente do tempo, i. e., se∂rα/∂t = 0 ∀α, então M0 = Mj = 0 e

T (q, q) =1

2

n∑j,k=1

Mjkqj qk.

Observando que os elementos de matriz são Mjk = Mjk (q), verifica-se que a energia cinética éuma função homogênea de grau 2 nas velocidades generalizadas, pois

T (λq1, . . . , λqn) =λ2

2

n∑j,k=1

Mjkqj qk = λ2T (q1, . . . , qn) .

Retornando-se então à função h em (1.69), de (1.71) observa-se que

n∑j=1

qj∂T

∂qj= 2T,

e, portanto,h (q, q, t) = 2T − (T − U) = T + U = E.

Ou seja, se (i) a energia potencial não depender das velocidades generalizadas e (ii) a leide transformação de coordenadas não depender explicitamente do tempo, então a função h éigual à energia mecânica total do sistema. Adicionalmente, se (iii) a função h não depender

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 71: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 1. A Formulação Lagrangiana da Mecânica Clássica 65

explicitamente do tempo (U não depende de t), então a energia é uma constante de movimentodo sistema, ou seja, é conservada.

Deve-se ressaltar que a condição para que h seja conservada é independente das condiçõespara que h = E. Por conseguinte, h pode ser conservada sem ser a energia mecânica, ouh = E, sem que estas quantidades sejam conservadas. Em geral, se os vínculos dependemexplicitamente do tempo, a energia total não é conservada. Isso porque as forças de vínculopodem realizar trabalho sobre o sistema de uma forma tal que mesmo quando a trajetória dosistema é fechada sob a ação dos vínculos o trabalho total não se anula, como ocorre, porexemplo, com forças dissipativas ou motrizes.

Aproveitando o ensejo, suponha que existam forças dissipativas e/ou motrizes atuando nosistema. Neste caso, o teorema 1.8 não é mais válido. Ao invés do cancelamento que ocorre em(1.68), deve-se usar (1.50) para se obter

dh

dt=

n∑j=1

qjQ′j −

∂L

∂t,

lembrando que Q′j é a força generalizada obtida justamente a partir das forças não potenciais.O resultado recém obtido passará agora por uma série de particularizações. Primeiro, se as

condições (i) e (ii) acima forem também satisfeitas, então h = E e

dE

dt=

n∑j=1

qjQ′j −

∂L

∂t

mostra como a energia mecânica do sistema varia devido às ações tanto das forças não potenciais(dissipativas e/ou motrizes) quanto das forças potenciais com dependência explícita no tempo.Se adicionalmente a condição (iii) for satisfeita, então o potencial não depende do tempo e daí

dE

dt=

n∑j=1

qjQ′j .

O sinal de dE/dt depende somente da prevalência ou das forças dissipativas (dE/dt < 0) ou dasforças motrizes (dE/dt > 0).

Retornando agora em algumas suposições, se as forças não potenciais forem somente dissi-pativas e essas dependerem apenas das velocidades das partículas, Q′j pode ser expressa pelafunção dissipativa F através de (1.52), quando então resulta

dh

dt= −

n∑j=1

qj∂F∂qj− ∂L

∂t.

No caso particular em que F é a função de Rayleigh (expressão 1.54), é fácil perceber que estatambém é uma função homogênea de grau 2 nas velocidades generalizadas. Portanto, nestecaso,

dh

dt= −2F − ∂L

∂t.

Se as condições (i) e (ii) acima forem também satisfeitas, então h = E e

dE

dt= −2F − ∂L

∂t.

Finalmente, se a energia potencial não depender do tempo,

dE

dt= −2F ,

o que descreve a taxa de perda de energia do sistema.A função h é semelhante à Hamiltoniana do sistema, porém não é exatamente esta. A formu-

lação Hamiltoniana da mecânica clássica será discutida a partir do capítulo 2.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 72: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

66 1.9. Propriedades de simetria das equações de Euler-Lagrange e leis de conservação

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 73: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

2A FORMULAÇÃO HAMILTONIANA DA

MECÂNICA CLÁSSICA

N A FORMUÇÃO LAGRANGIANA o movimento de um sistema de partículas com n grausde liberdade é determinado por n equações diferenciais ordinárias (EDO’s) de

segunda ordem. Do ponto de vista prático, essa forma para as equações de movimentopode ser um empecilho na descrição final da evolução do sistema, uma vez que em geral asequações não são solúveis analiticamente e métodos numéricos se fazem então necessários.Como a maior parte dos métodos computacionais de solução de EDO’s se aplica a equações deprimeira ordem, as equações oriundas da Lagrangiana devem ser reduzidas em ordem para aimplementação dos algoritmos. Contudo, para tanto não é mais adequado manter a descriçãoLagrangiana; neste ponto é mais adequado alterar a descrição para a formulação Hamiltoniana.Sob um ponto de vista mais fundamental, o formalismo Hamiltoniano forneceu o embasamentoformal para o desenvolvimento de outras áreas importantes da física moderna, como a mecânicaestatística e a mecânica quântica.

A Hamiltoniana do sistema é obtida a partir de sua Lagrangiana. As equações de movimentoresultantes, denominadas equações de Hamilton, consistem agora em um conjunto de 2n EDO’sde primeira ordem, já adequadas para a implementação de algoritmos numéricos. Do ponto devista formal, as equações de Hamilton não são mais fáceis de serem resolvidas do que as equa-ções de Euler-Lagrange. Contudo, a Hamiltoniana do sistema fornece informações importantesa respeito da estrutura formal do sistema e, por esta razão, serviu de fundamento teórico para aposterior desenvolvimento das mecânicas estatística e quântica, ambas baseadas no Hamiltoni-ano do sistema.

A partir deste capítulo o formalismo Hamiltoniano da mecânica clássica de um sistema departículas passa a ser apresentado e discutido.

2.1 AS EQUAÇÕES CANÔNICAS DE HAMILTON

As equações de Euler-Lagrange para um sistema com n graus de liberdade formam um con-junto de n equações diferenciais ordinárias de segunda ordem para cada coordenada generali-zada q1 (t), . . . , qn (t). Supondo que essas EDO’s possam ser resolvidas (analitica ou numerica-mente), a dinâmica do sistema é completamente determinada então a partir das 2n condiçõesiniciais (em t = t0) impostas ao mesmo: q1 (t0), . . . , qn (t0), q1 (t0), . . . , qn (t0).

A evolução do sistema pode ser visualizada através de sistemas Cartesianos n-dimensionaisque mostram os valores das coordenadas ou das velocidades generalizadas. Esses sistemas sãodenominados respectivamente de espaços de configuração e de velocidades. Os painéis (a) e (b)da figura 2.1 ilustram a evolução de um sistema com n = 3 graus de liberdade obtido a partirda solução das equações de Euler-Lagrange. Sendo q0

.= q (t0) e q0

.= q (t0) respectivamente

as coordenadas e velocidades iniciais, a evolução é ilustrada até o instante t = tf quando ascoordenadas e velocidades assumem respectivamente os valores qf

.= q (tf ) e qf

.= q (tf ). Nestes

espaços, as curvas que conectam os pontos iniciais e finais são parametrizadas pela variação dotempo no intervalo t0 6 t 6 tf .

Por sua vez, as equações de Hamilton irão fornecer as evoluções das coordenadas genera-lizadas q (t) e dos momentos canônicos conjugados p (t) e a visualização agora é usualmenterealizada através de espaços de fase, os quais consistem em sistemas Cartesianos de 2n di-

67

Page 74: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

68 2.1. As equações canônicas de Hamilton

q3

q2

q1

q0

qf

q(t)

(a)

2q

3q

0q

fq

1q

q (t)

(b)

P0

P f

p(c)q( (t), (t))p

q

Figura 2.1: (a) Espaço de configuração mostrando aevolução de um sistema com n = 3 graus de liberdadeentre q0 = q (t = t0) e qf = q (t = tf ). (b) Espaço develocidades do mesmo sistema. (c) Espaço de fasedo mesmo sistema, sendo que q ≡ (q1, q2, q3) e p ≡(p1, p2, p3).

mensões, sendo que cada ponto deste sistema é determinado pela 2n-upla (q (t) ,p (t)). A visu-alização do mesmo sistema com n = 3 graus de liberdade é ilustrada no painel (c) da figura2.1. Neste, o eixo q na verdade consiste em eixos q1, q2 e q3 mutuamente ortogonais, sendoque o mesmo se aplica ao eixo p. A evolução do sistema entre os pontos inicial (P0) e final(Pf ) é ilustrada pela curva, sendo que cada ponto da mesma representa os valores da 6-upla(q1 (t) , q2 (t) , q3 (t) , p1 (t) , p2 (t) , p3 (t)).

Para a derivação da função Hamiltoniana e das equações de Hamilton para um sistema comn graus de liberdade, cuja dinâmica é descrita pela Lagrangiana L q, q; t, retorna-se à definição1.9 do momento canônico conjugado (equação 1.61),

pj =∂L

∂qj, (j = 1, . . . , n) .

O cálculo desses momentos conjugados fornece fornece um conjunto de n equações do tipo

pj = pj (q, q, t) . (2.1a)

A cada instante de tempo, as coordenadas e velocidades generalizadas localizam-se em um pontoem cada espaço representados nas figuras 2.1a,b. Seja Ω

.= (q, q) a 2n-upla que localiza esses

pontos. Para cada pj, deseja-se agora inverter essas relações e escrever

qj = qj (q,p, t) . (2.1b)

O teorema das funções implícitas de muitas variáveis mostra que para a inversão das relações(2.1a) para as relações (2.1b) ser possível, é necessário e suficiente que (i) tanto as relaçõesoriginais (2.1a) quanto suas primeiras derivadas

∂pj∂qk

=∂2L

∂qk∂qj

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 75: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 69

sejam contínuas na vizinhança do ponto Ω, e que (ii) a matriz hessiana W, onde

Wij =∂2L

∂qi∂qj

∣∣∣∣Ω

,

seja não singular, i. e., se det (W) 6= 0 em Ω.Cumpridas as condições acima, é possivel, pelo menos em princípio, efetuar-se a inversão

(2.1b). Com as relações inversas, retorna-se à Lagrangiana e realiza-se uma transformação deLegendre, do mesmo tipo comumente realizada em termodinâmica, para alterar as variáveisdinâmicas do sistema do conjunto q, q para o conjunto q,p. Ou seja, abandona-se as velo-cidades generalizadas e passa-se a descrever a dinâmica em termos dos momentos conjugados.Essa transformação é levada a cabo introduzindo-se a função de Hamilton H (q,p, t), ou, sim-plesmente, Hamiltoniana, definida por

H (q,p, t).=

n∑j=1

qjpj − L q, q; t . (2.2)

Ressalta-se que durante a transformação acima, deve-se introduzir as relações inversas (2.1b).A partir da definição (2.2), as equações de movimento são obtidas da seguinte maneira.

Tomando-se a diferencial de H da sua definição,

dH =n∑j=1

(qjdpj + pjdqj)−n∑j=1

(∂L

∂qjdqj +

∂L

∂qjdqj

)− ∂L

∂tdt

=

n∑j=1

[qjdpj −

∂L

∂qjdqj +

(pj −

∂L

∂qj

)dqj

]− ∂L

∂tdt.

Introduzindo a definição (1.61) e assumindo que os vínculos são holônomos e/ou que as forçassejam potenciais, a equação de Euler-Lagrange implica em

∂L

∂qj=d

dt

∂L

∂qj=⇒ pj =

∂L

∂qj, (j = 1, . . . , n) .

Com isso, resulta

dH =

n∑j=1

(qjdpj − pjdqj)−∂L

∂tdt.

Por outro lado, como H = H (q,p, t),

dH =

n∑j=1

(∂H

∂pjdpj +

∂H

∂qjdqj

)+∂H

∂t.

Obviamente, ambas as expressões para dH devem ser idênticas, o que fornece as equaçõescanônicas de Hamilton, ou, simplesmente, equações de Hamilton:

qj =∂H

∂pj(2.3a)

pj = −∂H∂qj

, (2.3b)

com a identidade adicional∂H

∂t= −∂L

∂t. (2.3c)

Na formulação Hamiltoniana, as variáveis q e p são ditas canônicas conjugadas e o espaçode todas as 2n-uplas (q,p) é denominado o espaço de fase do sistema, como já mencionado.Um ponto no espaço de fase localiza o estado do sistema (posições e momentos) em um dadoinstante de tempo t.

Um teorema de existência e unicidade garante que, especificando-se as condições iniciaisdo sistema no instante t0, ou seja, para dados (q (t0) ,p (t0)), as soluções das equações 2.3a,b)para t > t0 sempre existem e são únicas. O conjunto de todas as 2n-uplas obtidas a partir dascondições iniciais traçam uma curva no espaço de fase do sistema, como representado na figura

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 76: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

70 2.1. As equações canônicas de Hamilton

2.1c. Além disso, como a solução é sempre única, as trajetórias no espaço de fase oriundasde dois conjuntos distintos de condições iniciais nunca irão se cruzar. O que não é verdadenos espaços parciais representados nos painéis a e b da figura 2.1. Duas curvas no espaço deconfiguração ou no espaço de velocidades podem se cruzar, dependendo das condições iniciais,mas nunca em ambos.

Deve ser ressaltado também que na formulação Hamiltoniana as variáveis dinâmicas qj e pjdevem ser consideradas independentes entre si. O mesmo não é verdade quanto as as variáveisqj e qj = dqj/dt na formulação Lagrangiana. Isto porque não existe uma relação direta entre qj epj a partir de H (q,p, t).

Os exemplos e exercícios a seguir ilustram a derivação da Hamiltoniana e das equações deHamilton para uma série de diferentes sistemas.

Exemplo 2.1 (Partícula submetida a força central. Formulação Hamiltoniana). Retor-nando à Lagrangiana (1.63) para uma partícula em um campo de força central,

Lr, θ, r, θ, ϕ

=

1

2m(r2 + r2θ2 + r2 sen2 θϕ2

)− U (r) ,

primeiramente calculam-se os momentos canônicos conjugados a r, θ e ϕ:

pr =∂L

∂r= mr pθ =

∂L

∂θ= mr2θ pϕ =

∂L

∂ϕ= mr2 sen2 θϕ.

As relações obtidas são facilmente invertidas:

r =prm

θ =pθmr2

ϕ =pϕ

mr2 sen2 θ.

Deriva-se então a Hamiltoniana, substituindo-se as últimas relações:

H (r, θ, ϕ, pr, pθ, pϕ) = rpr + θpθ + ϕpϕ − L

=p2r

m+

p2θ

mr2+

p2ϕ

mr2 sen2 θ− 1

2

(p2r

m+

p2θ

mr2+

p2ϕ

mr2 sen2 θ

)+ U (r) ,

resultando em

H (r, θ, ϕ, pr, pθ, pϕ) =1

2m

(p2r +

p2θ

r2+

p2ϕ

r2 sen2 θ

)+ U (r) .

Finalmente, as equações de Hamilton são:

r =∂H

∂pr=prm

θ =∂H

∂pθ=

pθmr2

ϕ =∂H

∂pϕ=

pϕmr2 sen2 θ

pr = −∂H∂r

=p2θ

mr3+

p2ϕ

mr3 sen2 θ− dU

drpθ = −∂H

∂θ=

˙p2ϕ cos θ

mr2 sen3 θpϕ = −∂H

∂ϕ= 0.

Exercício 2.1. Obtenha a Hamiltoniana e as equações de Hamilton para uma partícula demassa m e carga q em um campo eletromagnético.Solução: Para a derivação da Hamiltoniana, remete-se ao exemplo 1.17, no qual obteve-se aLagrangiana

L r, r; t =1

2mr2 − qφ (r, t) +

q

cr ·A (r, t) .

Então, os momentos conjugados são:

px =∂L

∂x= mx+

q

cAx py =

∂L

∂y= my +

q

cAy pz =

∂L

∂z= mz +

q

cAz,

as quais são facilmente inversíveis para fornecer

r =1

m

(p− q

cA).

Dessa forma, a Hamiltoniana é obtida de

H (r,p, t) = r · p− L = r · p−[

1

2mr · r +

q

cr ·A−qφ

],

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 77: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 71

H (r,p, t) =1

2m

(p− q

cA)2

+ qφ.

E as equações de Hamilton ficam

r =∂H

∂p=

1

m

(p− q

cA)

p =q

mc

[(p− q

cA)·∇]A− q

c

(p− q

cA)× (∇×A)

− q∇φ,

onde foi empregada a identidade

1

2∇(c2)

= (c · ∇) c+ c× (∇× c) .

Exercício 2.2. Use a formulação Hamiltoniana para obter as equações de movimento de umapartícula de massa m restrita a se mover sobre a superfície interna de um cilindro de raio R esujeita a uma força orientada para a origem do tipo F = −kr (k = cte.).

ρ

Figura 2.2: Uma partícula se movimenta sob aação de uma força F = −kr sobre a superfícieinterna de um cilindro de raio R.

Solução: A situação está representada na figura 2.2. Serão empregadas coordenadas cilíndricas(ρ, θ, z), nas quais o vínculo fica escrito

x2 + y2 = R2.

A força F é restauradora, com o potencial dado por

U =1

2k(ρ2 + z2

)=

1

2k(R2 + z2

).

Já a energia cinética fica

T =1

2m(ρ2 + ρ2θ2 + z2

)=

1

2m(R2θ2 + z2

).

Assim, a Lagrangiana do sistema fica

Lz, z, θ

=

1

2m(R2θ2 + z2

)− 1

2k(R2 + z2

).

Os momentos conjugados e as relações inversas são

pz =∂L

∂z= mz pθ =

∂L

∂θ= mR2θ

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 78: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

72 2.2. Simetrias e leis de conservação

z =pzm

θ =pθmR2

.

Dessa forma, a Hamiltoniana fica

H (z, pz, pθ) = zpz + θpθ − Lz, z, θ

,

H (z, pz, pθ) =1

2m

(p2z +

p2θ

R2

)+

1

2kz2,

sendo que na expressão final o termo constante kR2/2 foi excluído, por não afetar as equaçõesde movimento.

Portanto, as equações canônicas de movimento ficam

z =∂H

∂pz=pzm

pz = −∂H∂z

= −kz

θ =∂H

∂pθ=

pθmR2

pθ = −∂H∂θ

= 0.

Observa-se que pθ = mR2θ = constante. Portanto,

θ (t) = θ0 +pθt

mR2.

Por outro lado, combinando-se as duas primeiras,

z =pzm

= − kmz =⇒ z + ω2

0z = 0,

(ω2

0 =k

m

),

a qual é a equação do oscilador harmônico. O movimento ao longo do eixo z é puramenteharmônico.

2.2 SIMETRIAS E LEIS DE CONSERVAÇÃO

As propriedades de simetria do sistema físico e as decorrentes leis de conservação já foramestudadas na seção 1.9, dentro do contexto da formulação Lagrangiana. Algumas das mesmaspropriedades serão agora estudadas, porém empregando-se agora a formulação Hamiltoniana.

2.2.1 COORDENADAS CÍCLICAS

De acordo com a definição, a coordenada qk, por exemplo, é cíclica se a Lagrangiana dosistema não depende explicitamente da mesma. Segue então da definição (1.61) do momentoconjugado a essa coordenada, que

se∂L

∂qk= 0, então pk =

d

dt

∂L

∂qk= −∂H

∂qk= 0,

ou seja, a Hamiltoniana do sistema também não irá depender de qk e pk = constante.

2.2.2 CONSERVAÇÃO DOS momenta LINEAR E ANGULAR TOTAIS

Aplicando-se à Hamiltoniana as mesmas transformações virtuais aplicadas na seção 1.9.2.2à Lagrangiana, é possível mostrar-se que resultam as mesmas leis de conservação dos momentalinear e angular do sistema.

2.2.3 CONSERVAÇÃO DA HAMILTONIANA E DA ENERGIA TOTAL

A definição da Hamiltoniana (2.2) mostra que esta possui, em um dado instante de tempo,o mesmo valor da função h definida em (1.67). Portanto, deve existir também um teorema deconservação de H, o qual é apresentado a seguir.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 79: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 73

Teorema 2.1 (Conservação da Hamiltoniana do sistema). Se a Hamiltoniana H (q,p, t) nãodepende explicitamente do tempo, i. e., se ∂H/∂t = 0, entãoH (q,p) é uma constante de movimento.

Demonstração. Dada a Hamiltoniana H (q,p, t), a partir das equações de Hamilton (2.3),

dH

dt=

n∑j=1

(∂H

∂qjqj +

∂H

∂pjpj

)+∂H

∂t

=

n∑j=1

(∂H

∂qj

∂H

∂pj− ∂H

∂pj

∂H

∂qj

)+∂H

∂t,

ou seja,dH

dt=∂H

∂t.

Portanto, H = constante se não possuir dependência explícita no tempo.

Da mesma forma, assim como a função h é idêntica à energia total do sistema, assim o seráa Hamiltoniana. Se (i) a energia cinética for uma função puramente quadráticas das velocidadesgeneralizadas, ou seja, se

T (q, q) =1

2

n∑j,k=1

Mjk (q) qj qk,

então T é uma função homogênea de grau 2 nas velocidades. Além disso, se (ii) a energiapotencial não depender de velocidades, ou seja, se

U = U (q, t) ,

entãoL q, q, t = T (q, q)− U (q, t)

e, como consequência,

p =∂L

∂q=∂T

∂q,

o que implica, pelo teorema 1.9, que

n∑j=1

qjpj =

n∑j=1

qj∂T

∂qj= 2T

e assim a Hamiltoniana fica

H = 2T − (T − U) = T + U =⇒ H (q,p, t) = E.

Deve ser ressaltado aqui também que as eventuais propriedades H = cte. e H = E são in-dependentes, no sentido de que um dado sistema físico pode apresentar somente uma daspropriedades. Contudo, como as condições (i) e (ii) são facilmente satisfeitas para a maior partedos sistemas físicos, em geral H = E, embora a energia não seja, necessariamente, uma cons-tante de movimento. Além disso essas condições são suficientes, mas não necessárias; ou seja,é possível que H coincida com a energia total mesmo que as condições não sejam satisfeitas.

É interessante comentar neste ponto uma importante diferença entre as formulações Lagran-giana e Hamiltoniana referente à escolha das coordenadas generalizadas e leis de conservação.Diferentes escolhas de coordenadas generalizadas alteram a forma funcional da Lagrangiana,mas, como foi demonstrado na seção 1.9.1, as equações de movimento de Euler-Lagrange sãoinvariantes frente a essa escolha. Costuma-se dizer que o valor da Lagrangiana permanece inva-riante frente a uma transformação de coordenadas. O mesmo não ocorre necessariamente coma Hamiltoniana. Tanto a sua forma funcional quanto o seu valor dependem da escolha das co-ordenadas generalizadas. Assim, a Hamiltoniana pode ser conservada em um dado conjunto decoordenadas, mas não ser conservada em outro. Essa mutabilidade de H, que à primeira vistaé inconveniente, na verdade é fortuita e consiste na base do formalismo de Hamilton-Jacobi,um poderoso método de integração das equações de movimento que se vale da descoberta dasconstantes de movimento oriundas de uma escolha adequada das coordenadas generalizadas.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 80: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

74 2.2. Simetrias e leis de conservação

Exercício 2.3. Retornando ao exemplo 2.1 e aos exercícios 2.1 e 2.2, discuta a relação entreHamiltonianas e energia e suas possíveis conservações.Solução: Exemplo 2.1. A energia cinética é

T =1

2m(r2 + r2θ2 + r2 sen2 θϕ2

),

sendo, portanto, quadrática nas velocidades. Além disso, a energia potencial U (r) não dependedas velocidades. Portanto, as condições (i) e (ii) são satisfeitas e a Hamiltoniana

H (r, θ, ϕ, pr, pθ, pϕ) =1

2m

(p2r +

p2θ

r2+

p2ϕ

r2 sen2 θ

)+ U (r) = E.

Além disso, como ∂H/∂t = 0,H = E = constante.

As mesmas conclusões são obtidas para a Hamiltoniana do exercício 2.2.Contudo, para o exercício 2.1, verifica-se que

T (r) =1

2mr2 U (r, r, t) = qφ (r, t)− q

cr ·A (r, t) ,

ou seja, a condição (i) é satisfeita, mas a condição (ii) não. Portanto, em princípio H 6= E, masisto deve ser verificado, pois as condições são suficientes mas não necessárias. Observa-se que

E = T + U =1

2mr2 + qφ (r, t)− q

cr ·A (r, t)

=1

2m

(p− q

cA)2

+ qφ (r, t)− q

mc

(p− q

cA)·A,

enquanto que

H (r,p, t) =1

2m

(p− q

cA)2

+ qφ.

Portanto, de fato H 6= E. Além disso, como ∂H/∂t 6= 0 em geral, H não é conservado.As propriedades H = E = cte. somente serão apresentadas no caso A = 0 e φ = φ (r), ou seja,

quando somente há campo elétrico gerado por uma distribuição estacionária de cargas.

Exercício 2.4. (a) Use o formalismo Hamiltoniano para encontrar as equações de movimento deum pêndulo esférico de massa m e comprimento `. (b) Encontre a condição de equilíbrio θ = 0.(c) Discuta a conservação da Hamiltoniana. (d) Obtenha a solução das equações de movimentopara o caso pφ0 = pφ (t = 0) = 0.Solução: O pêndulo esférico está representado na figura 2.3. Trata-se de um pêndulo cujomovimento não está restrito a um plano.

` Figura 2.3: Um pêndulo esférico com coordenadasgeneralizadas θ e φ.

(a) Empregando o vínculo r = ` e coordenadas esféricas, a Lagrangiana é escrita

Lθ, θ, φ

=

1

2m`2

(θ2 + φ2 sen2 θ

)+mg` cos θ.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 81: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 75

Então,

pθ =∂L

∂θ= m`2θ pφ =

∂L

∂φ= m`2φ sen2 θ,

resultando na Hamiltoniana

H = θpθ + φpφ − L,

H (θ, pθ, pφ) =1

2m`2

(p2θ +

p2φ

sen2 θ

)−mg` cos θ.

Assim, as equações de movimento são:

θ =pθm`2

φ =pφ

m`2 sen2 θ

pθ = −∂H∂θ

=p2φ cotan θ

m`2 sen2 θ−mg` sen θ pφ = −∂H

∂φ= 0.

Como φ é cíclico, pφ = cte.(b) Deseja-se descobrir se as equações de movimento permitem o movimento θ = θ0 = cte.

Neste caso, necessariamente pθ = 0, o que implica que

p2φ cotan θ0

m`2 sen2 θ0−mg` sen θ0 = 0 =⇒ pφ = m

√g`3 sen2 θ0

√sec θ0.

Neste caso,

φ =

√g

`sec θ0 =⇒ φ (t) = φ0 +

√g

`sec θ0t.

(c) Como ∂H/∂t = 0, a Hamiltoniana é conservada. Verifica-se facilmente que as demaiscondições para que H = E também são satisfeitas.

(d) Se pφ0 = 0, então como φ é cíclica, resulta que pφ (t > 0) = 0. Neste caso, a Hamiltonianase reduz a

H = E =p2θ

2m`2−mg` cos θ =⇒ E =

1

2m`2θ2 −mg` cos θ,

onde já foram utilizados os resultados dos itens (c) e (d).Impondo agora as condições iniciais θ (t = 0) = θ0 > 0 e θ (t = 0) = 0, obtém-se

E = −mg` cos θ0.

Observa-se também que θ = 0 sempre que θ = ±θ0. Este resultado estabelece a amplitude daoscilação.

Escreve-se então a equação de movimento como

θ = ±√

2ω20 (cos θ − cos θ0),

(ω2

0 =g

`

),

onde o sinal “±” indica o sentido de variação do ângulo θ. A maneira mais prática de resolveresta equação é por quadratura, tomando como condição inicial θ (t = 0) = 0 e θ > 0. Então,

ω0t =

ˆ θ

0

dθ′√2 (cos θ′ − cos θ0)

é o instante em que o pêndulo está no ângulo θ (|θ| 6 θ0).Empregando a identidade cos θ = 1− 2 sen2 θ

2 , e definindo χ = θ′/2, resulta

ω0t = c0

ˆ θ/2

0

dχ√1− c20 sen2 χ

= c0F

2, c0

), sendo c0 = csc

θ0

2

e F (φ, k) a integral elíptica incompleta do primeiro tipo1

F (φ, k) =

ˆ φ

0

dχ√1− k2 sen2 χ

.

1Ver, por exemplo, <http://dlmf.nist.gov/19.2.E4> ou <http://functions.wolfram.com/08.05.02.0001.01>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 82: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

76 2.2. Simetrias e leis de conservação

π

T/T

1

1.5

2

2.5

3

3.5

4

θ00 0.5 1 1.5 2 2.5 3 3.5

Figura 2.4: Período T do pêndulo duplo em funçãodo ângulo inicial θ0.

θ/θ 0

−1

−0.5

0

0.5

1

t / T0 0.5 1 1.5 2

θ0 = 5

= 45

= 90

= 170

Figura 2.5: Soluções do pêndulo plano para diversos valoresde θ0.

Uma solução equivalente é obtida partindo-se da identidade2

F (φ, k1) = kF (β, k) , sendo k1 =1

ke senβ = k1 senφ.

Ou seja,

ω0t = F(β, c−1

0

), sendo senβ = c0 sen

2

).

A partir desta solução, pode-se obter o período T do pêndulo plano. Já se concluiu que aamplitude da oscilação é θ0. O tempo necessário para o pêndulo percorrer a variação angular0 6 θ 6 θ0 é, pela simetria de seu movimento, igual a T/4. Portanto,

1

4ω0T = F

(π2, c−1

0

)= K

(c−10

)=⇒ T (θ0) =

4

ω0K

(sen

θ0

2

),

sendo K (k) = F(π2 , k)

a integral elíptica completa. Ou seja, o período de oscilação do pênduloplano depende do ângulo inicial θ0.

Consideram-se agora oscilações de pequena amplitude (|θ0| 1). Neste caso, a integral elíp-tica completa K (x) é aproximada pelos primeiros termos da série de Taylor

K (x) =π

2+π

8x+

128x2 + · · · .

Então, na expressão para o período T , toma-se o primeiro termo da série, de onde resulta

T ≈ 2π

ω0

(1 +

θ0

8

)≈ T =

ω0= 2π

√`

g,

a qual é a expressão conhecida para o período de pequenas oscilações(T)

do pêndulo. A figura2.4 mostra a variação de T (θ0) em comparação com T .

Por sua vez, a série de potências da integral elíptica incompleta F (φ, k) é

F (φ, k) = φ+k

6φ3 +

9k2 − 4k

120φ5 + · · · .

2<http://dlmf.nist.gov/19.7.E4>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 83: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 77

Mantendo somente o primeiro termo da série, a solução aproximada para pequenas oscilaçõespode ser escrita

ω0t ≈ β = sen−1

(sen (θ/2)

sen (θ0/2)

)⇒ θ (t) ≈ θ0 sen (ω0t) ,

a qual é a solução conhecida quando o pêndulo se comporta aproximadamente como um oscila-dor harmônico.

Por outro lado, a solução completa acima obtida ainda não está na forma desejada, poisobteve-se t = t (θ), quando na verdade o que se quer é a forma invertida θ = θ (t). A formainvertida pode ser escrita em termos de funções especiais da seguinte maneira. Dada a funçãoelíptica de Jacobi sn (x, k),3 a sua correspondente função inversa sn−1 (x, k) pode ser escrita como4

F (φ, k) = sn−1 (senφ, k) .

Ou seja,ω0t = sn−1

(senβ, c−1

0

).

Comosn(sn−1 (z, k) , k

)= z,

identifica-se z = senβ e k = c−10 , de onde conclui-se que

senβ = sn(sn−1

(senβ, c−1

0

), c−1

0

)= sn

(ω0t, c

−10

).

Desta maneira, obteve-se a solução formal

θ (θ0, t) = 2 sen−1

[sen

(θ0

2

)sn

(ω0t, sen

(θ0

2

))].

A figura 2.5 mostra soluções de θ (t) /θ0 em função de t/T para diversos ângulos iniciais θ0.Pode-se verificar que já para θ0 = 5 a solução lentamente diverge do período T de um osciladorharmônico, embora a forma da solução ainda é bastante próxima de uma função harmônica.Essa divergência se acentua com o aumento de θ0 e está bem evidente para θ0 = 170, quandoentão a forma da solução, embora periódica, é claramente distinta de uma função harmônica.

2.3 APLICAÇÕES IMPORTANTES DO FORMALISMO HA-MILTONIANO

A discussão a respeito da formulação Hamiltoniana será encerrada com algumas aplicaçõesimportantes em diversas áreas da física (não necessariamente a mecânica), as quais empregamesta formulação.

2.3.1 TEOREMA DO VIRIAL

Seja f uma função de uma variável real t, tal que f : R 7−→ R. O valor médio de f (t) ao longodo intervalo total de variação 0 6 t <∞ de seu argumento é obtido, pelo teorema do valor médio,por

〈f〉 = limτ→∞

1

τ

ˆ τ

0

f (t) dt,

desde que a integral exista. Caso a função f seja periódica de período τ0, o seu valor médio édado simplesmente por

〈f〉 =1

τ0

ˆ τ0

0

f (t) dt,

desde que a integral exista.

3<http://dlmf.nist.gov/22.2.E4>.4<http://functions.wolfram.com/09.48.27.0015.02>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 84: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

78 2.3. Aplicações importantes do formalismo Hamiltoniano

Considera-se agora um sistema físico com n graus de liberdade. A função

V (q,p, t).= −

n∑j=1

qj∂H

∂qj

é uma definição generalizada do virial

V =

N∑α=1

rα · F α

introduzido por Clausius5 no contexto da teoria cinética dos gases. Sob certas condições o valormédio de V pode ser relacionado ao valor médio de outras grandezas dinâmicas do sistema.

Definição 2.1 (Função limitada). Seja D ⊆ R um domínio, a função f : D 7−→ R, é dita limitadase existe um número real positivo M tal que

|f (t)| 6M, para qualquer t ∈ D.

Teorema 2.2 (Teorema do Virial). Dado um sistema físico com n graus de liberdade descritopelas coordenadas e momentos generalizados qj e pj (j = 1, . . . , n), respectivamente. Se qj (t)e pj (t), para qualquer j = 1, . . . , n, forem funções limitadas do tempo e se os valores médios de∑j qj∂H/∂qj e

∑j pj∂H/∂pj existirem separadamente, então ambas as médias são iguais, i. e.,⟨

n∑j=1

qj∂H

∂qj

⟩=

⟨n∑j=1

pj∂H

∂pj

⟩.

Demonstração. Seja a função

G (t) =

n∑j=1

pj (t) qj (t) .

Se qj e pj são funções limitadas no tempo, então G também o é. Diferenciando a mesma,

dG

dt=

n∑j=1

pj qj +

n∑j=1

pjqj =

n∑j=1

pj∂H

∂pj−

n∑j=1

qj∂H

∂qj.

Tomando o valor médio em ambos os lados,⟨dG

dt

⟩=

⟨n∑j=1

pj∂H

∂pj−

n∑j=1

qj∂H

∂qj

⟩.

Entretanto,⟨dG

dt

⟩= limτ→∞

1

τ

ˆ τ

0

dG

dtdt = lim

τ→∞

G (τ)−G (0)

τ6 limτ→∞

|G (τ)−G (0)|τ

6 limτ→∞

M

τ= 0.

Portanto, ⟨n∑j=1

pj∂H

∂pj−

n∑j=1

qj∂H

∂qj

⟩= 0.

Se ambos os valores médios existem separadamente, então⟨n∑j=1

pj∂H

∂pj

⟩=

⟨n∑j=1

qj∂H

∂qj

⟩.

O teorema do Virial possui versões e aplicações em diversas áreas da física como nas mecâ-nicas quântica e estatística, bem como em astrofísica e cosmologia. Algumas das versões maisconhecidas são apresentadas agora.

5Rudolf Julius Emanuel Clausius (1822 - 1888), físico e matemático alemão. O termo “virial” deriva de vis, palavralatina que significa “força.”

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 85: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 79

PARTÍCULA EM UM POTENCIAL CENTRAL

Uma partícula movendo-se sob a ação de uma força central F = F (r) tem a sua Hamiltonianadada por

H = T + U =p2

2m+ U (r) ,

a qual foi derivada no exemplo 2.1. Consideram-se as órbitas fechadas seguidas pela partícula.O seu Virial é dado por

V (r) = −r dUdr.

Pelo teorema do Virial, o valor médio de V vale

〈V〉 = −⟨rdU

dr

⟩= − 1

m

⟨p2⟩

= −2 〈T 〉 .

Para o caso de um potencial central do tipo

U (r) =A

rn, (A = cte., n ∈ Z) ,

⟨rdU

dr

⟩= −n

⟨A

rn

⟩= −n 〈U〉 .

Portanto,〈V〉 = n 〈U〉 = −2 〈T 〉 ,

o que leva à relação entre as médias das energias cinética e potencial

〈T 〉 = −n2〈U〉 .

Os tipos de potenciais centrais mais importantes são o gravitacional e o eletrostático, em quepara ambos n = 1. Ou seja, para estes sistemas,

〈U〉 = −2 〈T 〉 .

Ou seja, a energia potencial média é, em valor absoluto, o dobro da energia cinética média.Em geral, se a energia total for constante de movimento, então

〈E〉 = E = 〈T 〉+ 〈U〉 =n− 2

n〈T 〉 .

Para os potenciais gravitacional e eletrostático,

E = −〈T 〉 ,

mostrando que os estados ligados (órbitas limitadas) têm energia total negativa para n = 1. Poroutro lado, para n < 0 ou n > 2 a energia total é sempre maior ou igual a zero.

EQUAÇÃO DE ESTADO DE UM GÁS IDEAL

A outra aplicação importante do teorema do Virial ocorre na mecânica estatística clássica.Quando o sistema está em equilíbrio termodinâmico, os valores das grandezas termodinâmicasmacroscópicas são obtidas a partir de médias de ensemble, as quais são obtidas pelo cálculodos valores médios das grandezas microscópicas correspondentes a todos os estados microscó-picos possíveis que levam ao mesmo valor macroscópico da grandeza. Na mecânica estatísticaclássica, normalmente emprega-se o Princípio ergódico, segundo o qual a média de ensemble deuma grandeza macroscópica quando o sistema está em equilíbrio é igual à sua média temporal.

De acordo com o teorema de equipartição de energia, dado um sistema em equilíbrio termo-dinâmico e descrito pela Hamiltoniana H (q,p), as seguintes médias de ensemble resultam:

qj∂H

∂qj= pj

∂H

∂pj= kBΘ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 86: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

80 2.3. Aplicações importantes do formalismo Hamiltoniano

onde f denota a média de ensemble da quantidade f , kB é a constante de Boltzmann e Θ é atemperatura do sistema em equilíbrio termodinâmico. Se o sistema possui n graus de liberdade,então

n∑j=1

qj∂H

∂qj=

n∑j=1

pj∂H

∂pj= nkBΘ.

Um número grande de sistemas físicos satisfazem as condições: (i) a energia cinética é qua-drática nos momentos conjugados e (ii) a energia potencial não depende dos momentos e équadrática nas coordenadas. Ou seja,

H (q,p) =

n∑j,k=1

(Ajkpjpk +Bjkqjqk) , (Ajk, Bjk constantes) .

Então, pelo teorema 1.9,

n∑j=1

pj∂H

∂pj= 2T,

n∑j=1

qj∂H

∂qj= 2U =⇒

n∑j=1

(pj∂H

∂pj+ qj

∂H

∂qj

)= 2H.

Neste caso, o teorema da equipartição de energia implica em

n∑j=1

pj∂H

∂pj= 2T ⇒ T =

1

2nkBΘ

n∑j=1

qj∂H

∂qj= 2U ⇒ U =

1

2nkBΘ

=⇒

n∑j=1

(pj∂H

∂pj+ pj

∂H

∂pj

)= 2

(T + U

)= 2H =⇒ H =

1

2nkBΘ.

Ou seja, a média de ensemble da Hamiltoniana por grau de liberdade do sistema é igual a(1/2) kBΘ. Este é o teor do teorema da equipartição de energia.

Porém, nos sistemas considerados, H = E, sendo E a energia interna do sistema. Supondoagora que o Princípio ergódico é válido para esses sistemas, assume-se também que

〈H〉 = H,

ou seja, que a média de ensemble coincide com a média temporal.Considera-se agora um gás ideal composto por N moléculas não interagentes confinadas em

um recipiente de volume V . Supõe-se que V seja suficientemente pequeno para que a interaçãogravitacional seja a mesma para todas as moléculas e estas não interagem entre si. Neste caso,pode-se colocar U = 0 no interior do recipiente e daí

H =

N∑α=1

p2α

2mα.

Ressalta-se que o gás não necessita ser monomolecular. As moléculas do gás ideal somentesofrem a ação de uma força quando colidem com as paredes internas do recipiente. Nesta situ-ação, costuma-se tratar o recipiente como uma superfície Gaussiana e se define o elemento deforça média submetida a uma determinada molécula que colide com um elemento de superfíciedS do recipiente por

dF = −P endS,

para qualquer tipo de molécula, onde P é a pressão do gás, suposta uniforme sobre o recipientee en o vetor unitário normal à superfície. Como é convencionado para superfícies Gaussianas,o sentido de en é exterior ao volume confinado pela mesma. Neste caso, pode-se adotar aHamiltoniana

H =

N∑α=1

p2α

2mα+ U (r1, . . . , rN ) ,

onde U (· · · ) é o potencial oriundo das forças que atuam sobre as moléculas nas paredes dorecipiente. Então, de acordo com o teorema do Virial, vale a identidade

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 87: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 81⟨N∑α=1

3∑i=1

pα,i∂H

∂pα,i

⟩=

⟨∑α

pα ·pαmα

=

⟨∑α

3∑i=1

xα,i∂H

∂xα,i

⟩= −

⟨∑α

rα · pα

⟩= −

⟨∑α

rα · F α

⟩.

O valor médio expresso no último termo acima pode ser calculado pela soma de todos os ele-mentos de força dF α sobre a superfície S do recipiente, ou seja,⟨∑

α

rα · F α

⟩=

˛S

r · dF = −˛S

Pr · endSP=cte.−−−−→ −P

˛S

r · endS.

Pelo teorema da divergência,⟨∑α

rα · F α

⟩= −P

ˆV

∇ · rdV ∇·r=3−−−−→ −3PV.

Portanto, ⟨N∑α=1

3∑i=1

pα,i∂H

∂pα,i

⟩= 3PV.

Invocando-se novamente o teorema 1.9 e o Princípio ergódico, o resultado acima leva a⟨N∑α=1

3∑i=1

pα,i∂H

∂pα,i

⟩= 2 〈H〉 = 2H = 3NkBΘ = 3PV.

Ou seja,PV = NkBΘ,

a qual é a equação de estado de um gás ideal.

2.3.2 TEOREMA DE LIOUVILLE

O teorema de Liouville é outro resultado derivado da formulação Hamiltoniana que possuiimportantes aplicações em diversas áreas da física. Este teorema resulta da dinâmica dos siste-mas físicos em seus espaços de fase, os quais foram caracterizados na página 67 (ver tambémfigura 2.1c).

A evolução dinâmica de um sistema com n graus de liberdade é representada por uma curvano espaço de fase do mesmo. Em geral, seria necessário empregar-se um sistema Cartesianocom 2n eixos ortogonais para representar os pontos neste espaço de fase. Contudo, se o sistemafor de baixa dimensionalidade e possuir, adicionalmente, uma ou mais variáveis ciclicas, entãoé possível a visualização de sua trajetória. O exemplo a seguir ilustra tal situação.

Exemplo 2.2. Retornando ao sistema estudado no exercício 2.2, obteve-se a Hamiltoniana

H (z, θ, pz, pθ) =1

2m

(p2z +

p2θ

R2

)+

1

2kz2.

O espaço de fase deste sistema tem dimensão 4, mas, como θ é variável cíclica, o sistemaevolui sobre a hipersuperfície pθ = constante, ou seja, no espaço 3-D (z, θ, pz). Além disso,como θ também é constante, θ (t) = θ0 + ωt, ou seja, a coordenada θ evolui linearmente notempo. Adicionalmente, foi mostrado no exercício 2.3 que H = E = cte. também. Portanto, aHamiltoniana acima pode ser colocada na forma

p2z

P 2+z2

Z2= 1,

onde

P 2 .= 2mH − p2

θ

R2Z2 .

=2

k

(H − 1

2m

p2θ

R2

).

Ou seja, a evolução do sistema nas coordenadas z e pz ocorre ao longo da elipse de semieixosZ e P , respectivamente. Este movimento está representado na figura 2.6.

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 88: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

82 2.3. Aplicações importantes do formalismo Hamiltoniano

z

Superfície H = constante

Figura 2.6: A trajetória percorrida pela partí-cula do exercício 2.2 sobre a hipersuperfíciepθ = cte. do espaço de fase.

Retornando à discussão geral, a cada instante de tempo, a posição ocupada pelo sistemano seu espaço de fase é denominada ponto representativo. Como esse ponto representativocorresponde a estados específicos assumidos pelo sistema em todas as suas coordenadas emomentos, cada ponto é composto por um número grande (igual a 2n) de estados ocupados.Devido a isso, em mecânica estatística diz-se que cada ponto representativo corresponde a ummicroestado do sistema.

Adicionalmente, o ponto representativo em particular no qual o sistema se situa no instantet (ponto P ) é determinado de forma unívoca pelas soluções das equações de movimento e peloconjunto de condições iniciais (q1 (t0) , . . . , qn (t0) , p1 (t0) , . . . , pn (t0)) adotado para as coordena-das e momentos das partículas. Portanto, se ao invés do conjunto acima fossem adotadas ascondições iniciais (q′ (t0) ,p′ (t0)), o sistema ocuparia, no instante t, o ponto representativo P ′ 6= Pno seu espaço de fase.

Em sistemas clássicos de baixa dimensionalidade, a característica recém mencionada nãogera maiores dificuldades na descrição de sua dinâmica. Porém, quando o número de partículase de graus de liberdade do sistema é vasto, a situação é distinta. Em cada instante de tempoas coordenadas e componentes do momento de cada partícula do sistema são unívocamentedeterminados pela solução das equações de movimento. Contudo, sistemas físicos realísticos emgeral apresentam fenômenos complexos associados à sua dinâmica, devidos à não linearidadedas equações de movimento. Além disso, não é possível determinar todas as condições iniciaispara todas as partículas do sistema, a partir das quais sua dinâmica evoluirá de forma unívocae determinada.

Portanto, faz-se necessário, neste momento, empregar a terminologia da mecânica estatística,quer seja o sistema composto por partículas com carga e massa, quer seja composto por átomosou moléculas ou por estrelas em uma galáxia. Independente da natureza dos individuais consti-tuintes do sistema em estudo, estes serão denominados partículas. No formalismo da mecânicaestatística, um sistema composto por um número grande de partículas que podem ocupar umavasta quantidade de microestados físicos possíveis pode ser caracterizado, quando em equilíbrioou, pelo menos, em um estado (quase-)estacionário, por um número pequeno de quantidadesmacroscópicas, como energia interna, entropia, temperatura, pressão, etc. Imagina-se entãoum número grande (idealmente infinito) de sistemas físicos, cada um composto pelas mesmaspartículas, porém com estas se distribuindo de diferentes maneiras sobre os possíveis microes-tados, sempre de forma consistente com os vínculos impostos, que são sempre os mesmos emcada um desses sistemas. A esta coleção de sistemas equivalentes, porém ocupando diferentesmicroestados, atribui-se o nome ensemble.

Como quaisquer dois constituintes do ensemble são compostos pelas mesmas partículasdistribuídas por diferentes microestados, cada um ocupará um ponto representativo próprio noespaço de fase (q,p), no instante t. Então, insere-se no espaço de fase, em um dado instantet, todos os pontos representativos possíveis. Como em geral há um número vasto de maneirasdistintas de se preparar os constituintes de um ensemble, sempre de forma consistente com osvínculos impostos, i. e., diferentes valores possíveis para suas condições iniciais, o espaço defase passa a ser desenhado então com um conjunto enorme de pontos representativos, os quais,se a dinâmica das partículas for limitada, podem ocupar um hipervolume finito no mesmo.

À medida que o tempo evolui, cada ponto representativo irá se deslocar ao longo de curvas

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 89: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 83

t1

t2

Figura 2.7: Evolução dos pontos representativos de um ensemble, entre os instantes t1 e t2, em um espaço defase de dimensão 3. Os pontos representativos encontram-se sempre sobre superfícies no E3. As trajetórias deum conjunto finito de pontos são também ilustradas.

no espaço de fase, semelhantes à ilustrada na figura 2.1c. Devido ao teorema de unicidade dassoluções das equações de movimento, as trajetórias de dois pontos representativos quaisquer,por mais próximos que se encontrem inicialmente, nunca poderão se interceptar. Dessa ma-neira, independente da particular evolução dos pontos representativos, o volume ocupado pelosmesmos no espaço de fase se manterá sempre constante. A figura 2.7 ilustra a evolução dospontos representativos em um sistema de baixa dimensionalidade.

Assume-se agora que a quantidade total de pontos representativos no espaço de fase sejagrande o suficiente para que se possa definir uma função ρ (q,p, t) : R2n+1 7−→ R, denominada adensidade no espaço de fase, a qual é contínua e diferenciável no R2n+1. Esta função é tal que

ρ (q,p, t) dnqdnp

fornece o número de pontos representativos, no instante t, contidos dentro do hipercubo dnqdnp(sendo dnq = dq1 · · · dqn e dnp = dp1 · · · dpn), centrado no ponto (q,p) do espaço de fase. Com essadefinição, a função densidade possui a dimensão física [ρ] = M−nL−2nTn. O fato da função ρvariar sobre o espaço de fase reflete a probabilidade de ocupação dos microestados acessíveisao sistema, com os estados mais prováveis refletindo em valores maiores de ρ, enquanto queestados menos prováveis conduzem a valores menores da densidade. Duas outras propriedadesimportantes que ρ deve apresentar são: (i) ρ > 0 em qualquer ponto (q,p) e em qualquer instantet, e (ii) chamando-se Ω um hipervolume qualquer do espaço de fase,

ˆΩ

ρ dnqdnp = N, (2.4)

sendo N o número total de pontos representativos contidos em Ω.Após esta apresentação, o teorema de Liouville pode ser finalmente estabelecido.

Teorema 2.3 (Teorema de Liouville). Seja um sistema físico com n graus de liberdade, cujadinâmica é descrita pela função Hamiltoniana H (q1, . . . , qn, p1, . . . , pn, t). Seja um ensemble depontos representativos no espaço de fase do sistema, determinados a partir do conjunto de to-das as condições iniciais consistentes com os vínculos impostos e pelas equações de movimento.Se ρ (q,p, t) determina a densidade de estados no espaço de fase, então ρ é uma constante demovimento do sistema.

Demonstração. Para demonstrar o teorema de Liouville será empregado o teorema de divergênciapara um espaço de dimensão arbitrária. Seja Γ uma hipersuperfície Gaussiana de dimensão

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 90: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

84 2.3. Aplicações importantes do formalismo Hamiltoniano

m − 1, a qual delimita o hipervolume Ω, de dimensão m. Dado então o campo vetorial J =J (x1, . . . , xm)

.= (J1, J2, . . . , Jm), pertencente a um espaço vetorial V m, sobre o volume Ω,

ˆΩ

(m∑k=1

∂Jk∂xk

)dΩ =

˛Γ

(m∑k=1

Jknk

)dΓ,

onde n = (n1, . . . , nm) ∈ V m é unitário(∑

k n2k = 1

)e orientado sempre para o “exterior” de Γ.

Estas convenções permitem usar a integral de superfície no lado direito para calcular o fluxo dovetor J através de Γ. A figura 2.8 representa o fluxo de J sobre Γ.

Γ

J Figura 2.8: Representação do fluxo do vetor J sobrea hipersuperfície Γ que contém o hipervolume Ω.

Procedendo então com a demonstração, a expressão (2.4) fornece o número total N de pontosrepresentativos contidos dentro do hipervolume Ω em um dado instante de tempo. Mantendo-seΩ fixo em relação à origem do espaço de fase, devido à dinâmica do sistema, pontos representa-tivos irão cruzar a superfície Γ em ambos os sentidos e N poderá então variar no tempo. Essavariação está necessariamente contida na dependência temporal da densidade do espaço de fase,i. e.,

dN

dt=

ˆΩ

∂ρ

∂tdnqdnp.

Porém, o teorema da unicidade das soluções das equações de movimento garante que pontosrepresentativos não se interceptam, ou seja, dois ou mais pontos em momento algum poderãose aglutinar e se tornar somente um ponto. Da mesma forma, não podem ocorrer bifurcações,isto é, a trajetória de um ponto representativo nuncar irá se dividir em duas ou mais trajetórias.Por isso, não podem existir fontes ou sumidouros de pontos representativos no espaço de faseem nenhum instante de tempo. Isto implica em que a variação do número de pontos no interiorde Ω somente será devida ao fluxo líquido de pontos através da superfície Γ.

Para calcular o fluxo de pontos representativos através de Γ, define-se o vetor densidade decorrente sobre o espaço como

J = ρ (q,p, t) (q1, q2, . . . , qn, p1, p2, . . . , pn) .

A definição do vetor J é equivalente à definição da densidade de corrente elétrica em um materialcondutor ou do fluxo de um fluido. Introduzindo-se este vetor na integral de fluxo do teoremada divergência, conclui-se então que

dN

dt=

ˆΩ

∂ρ

∂tdnqdnp = −

˛Γ

(2n∑r=1

Jrnr

)dΓ = −

ˆΩ

[n∑r=1

(∂Jr∂qr

+∂Jr∂pr

)]dnqdnp,

sendo que o sinal se deve à escolha do sentido do vetor n, tal que um fluxo positivo de Jcorresponde ao movimento de pontos representativos para o exterior de Γ, ocasionando umaredução de N . Portanto, ˆ

Ω

[∂ρ

∂t+

n∑r=1

(∂Jr∂qr

+∂Jr∂pr

)]dnqdnp = 0.

Como o volume Ω é arbitrário, a identidade somente pode ser satisfeita para qualquer hipervo-lume se

∂ρ

∂t+

n∑r=1

(∂Jr∂qr

+∂Jr∂pr

)=∂ρ

∂t+

n∑r=1

(∂ (ρqr)

∂qr+∂ (ρpr)

∂pr

)= 0,

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 91: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 2. A Formulação Hamiltoniana da Mecânica Clássica 85

∂ρ

∂t+

n∑r=1

(∂ρ

∂qrqr +

∂ρ

∂prpr

)+ ρ

n∑r=1

(∂qr∂qr

+∂pr∂pr

)= 0.

Em princípio, o último termo no resultado acima não é nulo, porque as quantidades qr e pr sãodeterminadas a partir da Hamiltoniana do sistema pelas equações de movimento (2.3). Porém,devido às próprias equações de Hamilton,

∂ρ

∂t+

n∑r=1

(∂ρ

∂qrqr +

∂ρ

∂prpr

)+ ρ

n∑r=1

:0(

∂qr

∂H

∂pr− ∂

∂pr

∂H

∂qr

)= 0,

ou seja, o último termo de fato é nulo, resultando então que

dt=∂ρ

∂t+

n∑r=1

(∂ρ

∂qrqr +

∂ρ

∂prpr

)= 0,

mostrando que ρ = ρ (q,p, t) é, de fato, constante ao longo da evolução dinâmica do sistema.

Deve-se ressaltar que a demonstração acima é válida mesmo quando a energia ou a hamil-toniana do sistema não se conserva. O teorema de Liouville vale mesmo quando ∂H/∂t 6= 0. Aúnica restrição está na exigência de que os vínculos que agem sobre o sistema são holônomose/ou que as forças generalizadas são potenciais. Além disso, o teorema não é válido se o en-semble contém um número finito (pequeno) de partículas. Durante a sua derivação, foi feita ahipótese de que o número de partículas é (idealmente) infinito e tal que a distância relativa entredois pontos representativos tende a zero, permitindo que a densidade seja uma função contínuae diferenciável em (q,p).

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 92: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

86 2.3. Aplicações importantes do formalismo Hamiltoniano

Autor: Rudi Gaelzer – IF/UFRGS Início: 02/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 93: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

3A DINÂMICA DOS CORPOS RÍGIDOS

UM CORPO RÍGIDO é um sistema de partículas cujas distâncias relativas permaneceminalteradas, independente das forças e vínculos que atuam sobre o sistema. É claroque tais corpos não existem na natureza, uma vez que todos os objetos são compostos

por partículas que estão ligadas entre si por forças internas restauradoras que permitem a exis-tência de movimentos relativos, como vibrações em torno do equilíbrio, por exemplo. Contudo,tais movimentos são microscópicos e podem, em algumas situações, ser desprezados quando sedeseja realizar a descrição do movimento macroscópico do corpo. Casos onde esta suposiçãoé inválida compreendem colisões inelásticas entre corpos ou a atuação de forças tais que pro-vocam uma deformação macroscópica visível dos mesmos. Tais situações extremas não serãoconsideradas neste capítulo e o corpo será considerado indeformável.

O conceito de um corpo rígido empregado neste capítulo será tanto de uma coleção de par-tículas discretas quanto de uma distribuição contínua de matéria. Neste caso, quando a somasobre partículas for envolvida, esta será substituída por integrações sobre distribuições contí-nuas de massas. As equações de movimento resultantes serão válidas em qualquer um doscasos considerados.

3.1 REFERENCIAIS PARA A DINÂMICA DO CORPO RÍ-GIDO

Apesar de um corpo rígido ser, em geral, composto por um grande número de partículas, asforças internas que mantêm as distâncias entre as mesmas fixas introduzem um conjunto devínculos tal que o corpo possui, no máximo, 06 (seis) graus de liberdade. Três desses grausde liberdade correspondem à translação do corpo, enquanto que os demais correspondem àspossíveis rotações do mesmo.

Uma maneira simples de compreender a relação entre o número de partículas de um corporígido e o número de graus de liberdade é a seguinte. Imagina-se que o corpo é composto porum certo número N > 2 de partículas discretas conectadas entre si por barras rígidas de massasnulas. Essas barras rígidas fazem o papel das forças internas que mantêm a estrutura do corpo.Se N = 2 (partículas 1 e 2), há um total de 06 (seis) coordenadas, mas como a distância entre aspartículas é fixa, isto introduz o vínculo holônomo r12 = |r2 − r1| = cte. Portanto, há um total de05 (cinco) graus de liberdade. Se N = 3, desde que as partículas não sejam colineares, há umtotal de 09 (nove) coordenadas com 03 (três) vínculos, resultando em 06 (seis) graus de liberdade.Esta situação é ilustrada na figura 3.1. Introduzindo-se uma quarta partícula ao sistema, sãointroduzidas mais três coordenadas e mais três vínculos, mantendo-se n = 6. Qualquer novapartícula introduzida no sistema introduz três novas coordenadas, mas terá necessáriamentetrês novos vínculos para manter sua posição fixa em relação às demais. Portanto, um corporígido com N > 3 partículas sempre terá um total de m = 3N − 6 vínculos holônomos, resultando

Figura 3.1: Corpos rígidos simples.Para N > 3, um total de m = 3N − 6vínculos são necessários para garantira rigidez do corpo.

87

Page 94: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

88 3.1. Referenciais para a dinâmica do corpo rígido

O′

x′1

x′2

x′3

S ′

x3

x1

x2O

S

S′′

r′

r

rO

P

Figura 3.2: Referenciais empregados na descrição da dinâmica de um corpo rígido.

em n = 6 graus de liberdade.O procedimento usual para a descrição da dinâmica de um corpo rígido emprega um conjunto

de até três referenciais, os quais estão representados na figura 3.2. Nesta figura, o contornofechado representa uma região confinada no espaço, a qual pode representar a superfície deuma distribuição contínua de matéria ou um contorno imaginário que delimita o conjunto departículas que compõe o corpo rígido.

Na figura 3.2 estão representadas as seguintes definições:

S′: Referencial inercial, denominado também como referencial fixo ou referencial do es-paço, o qual possui coordenadas Cartesianas (x′1, x

′2, x′3), com os correspondentes vetores

ortonormaise′1, e

′2, e

′3

e com origem no ponto O′. Este referencial pode ser também con-

siderado como o referencial de laboratório.

S: Referencial preso ao corpo rígido, denominado referencial do corpo. Este referencial pos-sui coordenadas Cartesianas (x1, x2, x3) com os correspondentes vetores unitários e1, e2, e3e com origem no ponto O. Por se mover junto com o corpo, S é em geral um referencial nãoinercial.

S′′: Referencial inercial com eixos paralelos a S′. Este referencial é sempre tal que sua origemcoincide com a origem de S em um dado instante de tempo.

P : Um ponto qualquer do espaço. Pode representar a posição instantânea de uma das partí-culas do corpo rígido ou do seu centro de massa.

rO: Posição instantânea de O em relação à origem do referencial S′ (ponto O′).

r′: Posição instantânea do ponto P em relação a O′.

r: Posição instantânea do ponto P em relação à origem do referencial S (ponto O).

3.1.1 ROTAÇÕES DE EIXOS E TRANSFORMAÇÕES ORTOGONAIS

Como o movimento geral do corpo irá envolver tanto translações quanto rotações, o referen-cial S estará sempre em movimento em relação a S′. É importante estudar-se primeiro como

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 95: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 89

r

(a)

x1

x′′1

x′′2

x2

SS′′

eixo x1

eixo x2

eixo x′′2

eixo x′′1

r

(b)

x1

x′′3

eixo x′′2

eixo x′′3

eixo x1

eixo x2

eixo x3

eixo x′′1

x′′2

x2

x′′1

x3

S ′′S

Figura 3.3: (a) Rotação sobre o plano (x′′1 , x′′2 ) (em torno do eixo x′′3 = x3) por um ângulo θ. (b) Rotação

arbitrária de eixos do referencial S em torno da origem do referencial S′′. Pode-se observar que em ambos oscasos as rotações mantêm a norma do vetor r invariante.

as quantidades dinâmicas (posições, velocidades, acelerações, etc) observadas em um dessesreferenciais estão relacionadas com as mesmas quantidades observadas em relação ao outro.Estas relações são importantes principalmente quando houver rotações envolvidas. Por estarazão, serão consideradas inicialmente as rotações dos eixos de S em relação a S′. Como astranslações não serão consideradas neste momento, um procedimento equivalente consiste emconsiderar rotações arbitrárias de S em relação a S′′, uma vez que este último é inercial e temseus eixos sempre paralelos a S′.

A figura 3.3 ilustra rotações arbitrárias do referencial S (do corpo) em relação ao referencialS′′ (inercial). Considera-se primeiro o caso mais simples onde os referenciais possuem um eixoem comum e uma rotação arbitrária é estabelecida em torno do mesmo, como é observado nafigura 3.3(a). Esta figura mostra que os eixos (x1, x2) de S estão rotados por um ângulo θ emrelação aos correspondentes eixos de S′′.

A mesma figura mostra também um ponto P qualquer do espaço (com x3 = x′′3 = 0), o qual élocalizado em relação às origens de ambos os referenciais pelo vetor posição r. Em um determi-nado referencial, este vetor pode ser expresso em termos de suas componentes (suas coordena-das Cartesianas) nas diferentes direções do espaço como

r =

2∑i=1

xi ei (em S), ou r′′ =

2∑i=1

x′′i e′′i (em S′′). (3.1a)

Atribuindo-se uma realidade física ao vetor r (por se tratar da posição instantânea de umapartícula do sistema, por exemplo) e assumindo-se que o espaço é isotrópico (i. e., não há dire-ções preferenciais no espaço), então a posição instantânea de P não pode depender da orientaçãodo sistema de referências. Em outras palavras,

r′′ = r =⇒2∑i=1

x′′i e′′i =

2∑i=1

xi ei. (3.1b)

A equação acima permite obter-se a relação entre as coordenadas de P em um dos referenci-ais em relação ao outro. Para se obter essa relação, parte-se da seguinte relação entre os vetoresunitários de S e S′′:

e1 = cos θ e′′1 + sen θ e′′2

e2 = − sen θ e′′1 + cos θ e′′2 .(3.1c)

Esta relação pode ser verificada pela inspeção visual da figura 3.3(a).Neste ponto, é conveniente introduzir-se uma notação matricial, a qual tem a vantagem de

compactar a notação e as expressões. Isto é realizado pela definição da matriz K,

K.=

(cos θ − sen θsen θ cos θ

),

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 96: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

90 3.1. Referenciais para a dinâmica do corpo rígido

com a qual pode-se escrever (3.1c) como

ei =

2∑j=1

Kji e′′j , (i = 1, 2) .

A notação torna-se ainda mais compacta se os vetores unitários também forem organizadosna forma matricial através das matrizes coluna e linha

e.=

(e1

e2

), ˜e ≡ eT =

(e1 e2

),

sendo A ≡ AT a transposta da matriz A. Com esta notação, as relações (3.1c) podem ser escritas

e = K e′′, e′′ = K−1 e, (3.1d)

sendo A−1 a inversa da matriz A. Condições para a existência dessa matriz inversa serão discu-tidas mais adiante.

Seguindo-se esta notação matricial, as coordenadas Cartesianas de r em (3.1a) podem serorganizadas agora como

r.=

(x1

x2

)e r′′

.=

(x′′1x′′2

),

de modo que (3.1b) fica escrita

r = re = r′′e′′.

Introduzindo agora a relação entre os vetores de base (3.1d), resulta então

r′′e′′ = rK e′′ =⇒ r′′ = rK(AB)=BA=====⇒ r′′ = Kr⇐⇒ r = K−1r′′

;

x′′1 = x1 cos θ − x2 sen θ

x′′2 = x1 sen θ + x2 cos θ.

(3.1e)

A última expressão em (3.1e) mostra como as coordenadas Cartesianas no referencial S′′ serelacionam com as coordenadas em S. Por outro lado, as coordenadas em S se relacionam coma coordenadas em S′′ através da inversa da matriz K.

Considera-se agora o caso mais geral de uma rotação arbitrária de S em relação a S′′, con-forme representado na figura 3.3(b). Para uma rotação em torno de um eixo, somente umângulo se faz necessário. Já no caso geral, dois ou mais ângulos são necessários, mas sempreé possível expressar-se as coordenadas de r em um referencial em relação ao outro por meiode uma matriz, exatamente como foi realizado no caso particular acima. Nota-se que comoe′′i ‖ e

′i (i = 1, 2, 3), pois S′′ e S′ têm seus eixos sempre paralelos entre si, as transformações

de referenciais podem ser discutidas diretamente entre S e S′ quando somente rotações estãoenvolvidas. Esta suposição será adotada nos desenvolvimentos realizados a seguir, até o pontoem que translações serão incluídas.

A generalização da relação (3.1d) entre os vetores de base de S e os correspondentes vetoresde S′ também pode ser escrita como e = K e′ e e′ = K−1 e, sendo que agora K é uma matriz (3× 3)e

e.=

e1

e2

e3

, ˜e ≡ eT =(e1 e2 e3

).

Da mesma forma como se estabeleceram as relações (3.1c e 3.1d), se

e = Ke′ ⇔ ei =

3∑j=1

Kji e′j , (i = 1, 2, 3) , então (3.2a)

ei · e′j =

3∑k=1

Kki e′k · e

′j = Kji.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 97: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 91

Ou seja,Kij = ej · e′i

.= cos θij , (i, j = 1, 2, 3) . (3.2b)

A quantidade Kij é denominada o cosseno diretor do eixo xj em relação ao eixo x′i e consistena projeção de ej na direção de e′i.

A relação (3.2a) descreve a mudança de bases na transformação S′ −→ S: passou-se dabase

e′i

para a base ei. A transformação inversa S −→ S′ é realizada pela mudança debases ei −→

e′i. Esta transformação é operacionalizada por

e′ = K−1 e.

Com a mesma imposição de equivalência na determinação do vetor posição r em ambos osreferenciais, a generalização de (3.1e) resulta novamente em

r = K−1r′, onde agora r =

x1

x2

x3

. (3.2c)

Definindo-se por fim a matriz

R.= K−1 =⇒ Rij =

(K−1

)ij, (i, j = 1, 2, 3) ,

denominada de matriz de rotação, pode-se então escrever

r = Rr′ =⇒ xi =

3∑j=1

Rijx′j , (i = 1, 2, 3) .

Observa-se que este último resultado pode ser interpretado como uma lei de transformaçãode coordenadas do tipo xi = xi

(x′j)

, a qual é uma transformação linear, pois os elementos damatriz R são constantes nesta transformação. De acordo com esta interpretação, os elementosde R também podem ser escritos como

xi =

3∑k=1

Rikx′k =⇒ ∂xi

∂x′j=

3∑k=1

Rik∂x′k∂x′j

=⇒ Rij =∂xi∂x′j

.

Pode-se finalmente escrever as relações obtidas na transformação de referenciais S′ −→ Scomo

e = Ke′

e′ = K−1e⇐⇒

r = Rr′

r′ = R−1r,(3.2d)

ou, de forma explícita, ei =

3∑j=1

Kji e′j

e′i =

3∑j=1

(K−1

)jiej

⇐⇒

xi =

3∑j=1

Rijx′j

x′i =

3∑j=1

(R−1

)ijxj ,

(3.2e)

uma vez que(A)−1

=(A−1

).

3.1.2 PROPRIEDADES DA MATRIZ DE ROTAÇÃO

Embora a matriz de rotação R (ou K) tenha um total de 09 (nove) componentes, somente trêsdestes são realmente independentes, sendo os demais dependentes dos mesmos. Isto pode serprontamente verificado a partir da condição de isotropia do espaço (rem S′ = rem S), já empregadaanteriormente, em conjunto com a exigência adicional de invariância da norma do espaço; istoé,

‖r‖ = ‖r′‖ , onde ‖r‖ .=

√√√√ 3∑i=1

x2i .

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 98: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

92 3.1. Referenciais para a dinâmica do corpo rígido

Esta medida de ‖r‖ coincide com a interpretação geométrica e com a noção intuitiva de distânciaentre dois pontos no espaço Euclideano, a qual corresponde à distância do ponto P à origemdo referencial. Na linguagem da geometria e da topologia, a invariância da norma mostra que amétrica do espaço não muda frente a transformação S′ −→ S.

Impondo-se esta condição à relação (3.2e) entre os componentes Cartesianos de ambos osreferenciais, resulta

3∑i=1

x′2i =

3∑i=1

x2i =⇒

3∑i=1

x′2i =

3∑i,j,k=1

RijRikx′jx′k.

Esta identidade somente pode ser satisfeita em geral se a seguinte condição de ortogonalidadefor satisfeita:

3∑k=1

RkiRkj = δij ou3∑k=1

RikRjk = δij , (i, j = 1, 2, 3) , (3.3a)

a qual também pode ser escrita em termos da matriz transposta como

RR = RR = I3,

sendo I3 matriz identidade de ordem 3

I3 =

1 0 00 1 00 0 1

⇒ (I3)ij = δij .

Comparando esta condição com a definição da matriz inversa de R,

R−1R = RR−1 = I3,

conclui-se então queR−1 = R. (3.3b)

Ou seja, a inversa da matriz de rotação é a sua transposta. Uma matriz que satisfaz estacondição é denominada matriz ortogonal.

Este resultado permite escrever as relações de transformação (3.2e) somente em termos damatriz R como

ei =

3∑j=1

Rij e′j

e′i =

3∑j=1

Rji e′j

⇐⇒

xi =

3∑j=1

Rijx′j

x′i =

3∑j=1

Rjixj ,

ou

e = Re′

e′ = Re⇐⇒

r = Rr′

r′ = Rr,(3.4a)

sendo que os elementos da matriz R são dados por

Rij = ei · e′j = cos θji =∂xi∂x′j

Rji = e′i · ej =∂x′i∂xj

.

(3.4b)

A condição de ortogonalidade (3.3) leva a uma classificação quanto a dois tipos possíveis derotações. Empregando-se as identidades

det (AB) = det (A) det (B) , det(A)

= det (A) ,

sendo det (A) o determinante da matriz A, a condição de ortogonalidade de R implica em

RR = I3 =⇒ det(RR)

= det (R) det(R)

= [det (R)]2

= det (I3) = 1.

Ou seja, det (R) = ±1.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 99: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 93

Classificam-se então os dois tipos possíveis de rotações:

det (R) = +1 : Rotações própriasdet (R) = −1 : Rotações impróprias.

(3.5)

Uma rotação própria é aquela na qual a transformação S′ −→ S pode ser executada por umasequência de rotações infinitesimais. Já uma rotação imprópria corresponde a uma reflexão ouinversão dos eixos do referencial (também denominada transformação de paridade), seguida poruma rotação própria.

Ainda sobre a condição de ortogonalidade (3.3), observa-se que a mesma estabelece um totalde 06 (seis) relações distintas entre os elementos da matriz R, o que implica em que dos nove ele-mentos da matriz, somente 03 (três) são realmente independentes entre si. Em outras palavras,uma rotação qualquer no espaço pode ser executada empregando-se, no máximo, três angulosdistintos em torno de três eixos de rotação, os quais correspondem aos três graus de liberdadedo corpo rígido frente a rotações. Há infinitas maneiras de se definir esses ângulos. Uma dasdefinições mais empregadas são os ângulos de Euler, os quais serão discutidos mais adiante, naseção 3.9.

Seja agora uma quantidade vetorial g = g (t) qualquer, a qual corresponde a alguma quan-tidade dinâmica do corpo (tal como velocidade, aceleração, etc) e que varia com o tempo. Aimposição de isotropia e equivalência dos referenciais também é imposta às medidas realizadasdo valor instantâneo da quantidade g; ou seja, se gS′ for a medida do valor instantâneo de g doponto de vista de um observador em S′ e gS sua medida em S,

gS′ = gS =⇒3∑i=1

g′i e′i =

3∑i=1

gi ei, (3.6)

sendo (g1, g2, g3) as componentes de g no referencial S.Em consequência, na transformação S′ −→ S as componentes de g seguem a mesma lei de

transformação (3.4) do vetor posição; ou seja,

gi =

3∑i=1

Rijg′j , sendo Rij =

∂xi∂x′j

g′i =

3∑i=1

Rjigj , sendo Rji =∂x′i∂xj

.

(3.7)

Estas relações, de fato, consistem na própria definição do que é um vetor, como aquele objetomatemático composto por uma terna (n-upla para o caso com n dimensões) de números, cujoscomponentes transformam-se entre sistemas de coordenadas de acordo com (3.7).1

Uma outra importante propriedade das matrizes ortogonais merece ser mencionada. Denota-se por O (3) o conjunto de todas as matrizes ortogonais de ordem 3 e, por conseguinte, o conjuntoO (n) é composto por todas as matrizes ortogonais de ordem n. Considere agora as matrizes doO (n). Estas satisfazem as seguintes propriedades:

1. Dadas R1,R2 ∈ O (n), a matriz resultante do produto matricial R1R2 também pertence aO (n). Isto pode ser prontamente demonstrado, pois

(R1R2)−1

= R−12 R−1

1 = R2R1 = (R1R2).

Ou seja, a inversa de R1R2 também é a sua transposta.

2. Dadas R1,R2,R3 ∈ O (n), a seguinte propriedade, denominada associatividade,

(R1R2)R3 = R1 (R2R3)

é satisfeita pois o produto matricial é associativo.

3. Existe uma única matriz identidade In ∈ O (n) tal que, para qualquer R ∈ O (n),

RIn = InR = R.

Isto segue da própria definição de matriz identidade.1Para uma discussão mais detalhada a respeito de vetores e tensores, ver, por exemplo, Apostila de Física-

Matemática, capítulo 6.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 100: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

94 3.2. Cinemática dos corpos rígidos

4. Dada uma matriz R ∈ O (n), existe uma única matriz R−1 ∈ O (n), denominada elementoinverso, tal que

RR−1 = R−1R = In.

Esta propriedade vem da própria definição de uma matriz ortogonal, pois R−1 = R.

O cumprimento das condições 1 – 4 acima mostram que o conjunto O (n) com a multiplicaçãomatricial compõe uma estrutura algébrica denominada de grupo. A existência e as propriedadesde grupos são importantes para o desenvolvimento das teorias física modernas, tais como aseletrodinâmica e cromodinâmica quânticas e a teoria quântica de campos.2

Uma propriedade importante do grupo O (n), que será relevante na próxima seção, diz res-peito à comutatividade das transformações geradas pelas suas matrizes. Se forem realizadassomente rotações em torno de um eixo fixo, então essas transformações podem ser implemen-tadas por matrizes pertencentes ao grupo O (2) (composto por matrizes 2 × 2). Neste caso, seR1, R2 ∈ O (2) são duas matrizes de rotação aplicadas consecutivamente um determinado sis-tema de coordenadas, então R1R2 ≡ R2R1, isto é, a orientação final do sistema independe daordem de aplicação das rotações. Grupos que satisfazem esta condição de comutatividade sãodenominados Abelianos. Por outro lado, se n > 3 esta condição em geral não é válida; ou seja,se agora R1, R2 ∈ O (3), por exemplo, em cuja situação essas matrizes realizam rotações genéri-cas no espaço, então, em geral, R1R2 6≡ R2R1. Grupos não comutativos são denominados nãoAbelianos.

Por fim, retornando à classificação das rotações próprias ou impróprias em (3.5), é inte-ressante mencionar que o subconjunto das matrizes R ∈ O (n) que possuem a propriedadedet (R) = +1, isto é, que executam rotações próprias, forma um grupo por si próprio (um subgrupodo O (n)), denominado grupo ortogonal especial SO(n).

3.2 CINEMÁTICA DOS CORPOS RÍGIDOS

Retornando aos referenciais definidos na figura 3.2, como o sistema de coordenadas S estáfixo ao corpo, este referencial é, em geral, não inercial, devido ao movimento resultante do corporígido. Por esta razão, é necessário estudar-se antes como as variações das grandezas físicaobservadas por S se relacionam com o referencial inercial S′, onde as leis da mecânica sãorealmente válidas.

3.2.1 TAXA DE VARIAÇÃO TEMPORAL DE VETORES DINÂMICOS

Será estudado agora como a variação de um vetor dinâmico qualquer g (t) é observada nosreferenciais definidos na figura 3.2. Para o estudo inicial, será considerada a relação entre S eS′′ novamente, para mais adiante a relação S ↔ S′ ser estabelecida.

Os referenciais S e S′′ compartilham sempre a mesma origem. Por esta razão e pela condiçõesde isotropia e equivalência dos referenciais expressa em (3.6), o valor instantâneo de g (t) é omesmo em S e S′′. Porém, como S′′ é inercial, enquanto que S não o é, a variação de g (t) seráobservada de maneira distinta em cada referencial. Isto ocorre pela seguinte razão. Dada aidentidade (3.6) no instante t, a taxa de variação de g, observada a partir do referencial inercialS′′ e usando as coordenadas do vetor no mesmo referencial, será calculada por

g =

3∑i=1

g′′i e′′i =⇒ dg

dt

∣∣∣∣S′′≡ dg

dt

∣∣∣∣inercial

=

3∑i=1

dg′′idte′′i ,

uma vez que os vetorese′′1 , e

′′2 , e

′′3

são fixos em um referencial inercial com coordenadas Car-

tesianas.Por outro lado, os vetores e1, e2, e3 sofrem rotações e/ou translações em conjunto com o

corpo. Devido a isto, a taxa de variação de g, observada também a partir do referencial inercialS′′, mas empregando as coordenadas do referencial do corpo S, será agora calculada por

g =

3∑i=1

gi ei =⇒ dg

dt

∣∣∣∣S′′

=

3∑i=1

dgidtei +

3∑i=1

gid eidt

.

2Para uma discussão mais detalhada a respeito de grupos e suas propriedades, ver, por exemplo, Apostila de Física-Matemática, capítulos 3 e 5.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 101: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 95

O primeiro termo do lado direito corresponde à taxa de variação de g medida por um obser-vador na origem de S e em repouso com o mesmo. Por esta razão, este termo será identificadocomo

dg

dt

∣∣∣∣corpo

=

3∑i=1

dgidtei.

Portanto, resulta que

dg

dt

∣∣∣∣inercial

=dg

dt

∣∣∣∣corpo

+

3∑i=1

gid eidt

. (3.8)

É necessário agora obter-se a taxa de variação dos vetores de base de S.

3.2.2 A MATRIZ DE ROTAÇÕES INFINITESIMAIS

Ainda considerando rotações do referencial S em relação a S′′, esta situação descreverá omovimento completo do corpo rígido se este possuir um ponto fixo no espaço (como um pêndulofísico ou um pião, por exemplo) e as origens O e O′′ coincidirem com o mesmo. Neste caso, o seumovimento mais geral é determinado pelo teorema de Euler abaixo.

Teorema 3.1 (Euler). O deslocamento mais geral de um corpo rígido com um ponto fixo é umarotação em torno de algum eixo.

A demonstração deste teorema pode ser vista em (LEMOS, 2007).A rotação mencionada pelo teorema de Euler consiste justamente nas transformações reali-

zadas pelas matrizes de rotação discutidas nas seções 3.1.1 e 3.1.2. Em particular, concluiu-seque qualquer matriz do O (3) possui no máximo três cossenos diretores independentes. Ou seja,uma rotação genérica no espaço sempre pode ser realizada com, no máximo, três ângulos derotação. É necessário, portanto, verificar como uma rotação genérica destes ângulos promove avariação das matrizes de rotação.

Uma rotação genérica no espaço sempre pode ser realizada com até três ângulos de rotação,cada um destes correspondendo a uma rotação em torno de um eixo. Visualiza-se esta rota-ção genérica na figura 3.3(b). Suponha que o referencial S encontra-se inicialmente coincidentecom S′′ e após esta rotação genérica a sua orientação muda para a situação ilustrada na figura.Há infinitas escolhas de eixos e ângulos de rotação que levam o referencial S a sua orienta-ção final. Usualmente, esta transformação é operacionalizada por rotações em torno dos eixoscoordenados, com a possível definição de referenciais intermediários.

As rotações em torno dos eixos coordenados são implementadas por matrizes bem conheci-das. Uma destas matrizes já foi apresentada na seção 3.1.1. Sendo R(1), R(2) e R(3) as matrizesde rotação em torno dos eixos x1, x2 e x3, respectivamente, então

R(1) (θ1) =

1 0 00 cos θ1 sen θ1

0− sen θ1 cos θ1

, R(2) (θ2) =

cos θ2 0− sen θ2

0 1 0sen θ2 0 cos θ2

, R(3) (θ3) =

cos θ3 sen θ3 0− sen θ3 cos θ3 0

0 0 1

,

(3.9)

sendo θ1, θ2, θ3 os ângulos de rotação em torno dos respectivos eixos.Nas definições acima, as escolhas dos sinais nos elementos das matrizes se devem à con-

venção de que rotações realizadas por ângulos positivos são realizadas no sentido anti-horário.Com esta convenção, considera-se o intervalo de variação dos ângulos como sendo 0 6 θi < 2π,embora também possa ser considerado o intervalo −π < θi 6 π.

Além disso, nota-se que as matrizes são realmente ortogonais e pertencem ao grupo SO (3),por possuirem determinante unitário. Ou seja, elas realizam rotações próprias dos referenciais.Uma das propriedades das rotações próprias é a conservação da quiralidade do referencial.Se o referencial for dextrógiro,3 uma rotação própria realizada sobre o mesmo conserva esta

3Uma orientação dextrógira é determinada pela mão direita. Um referencial dextrógiro é aquele cujos vetores de basesatisfazem a relação

ei × ej =3∑k=1

εijk ek, (i, j = 1, 2, 3) ,

sendo εijk o símbolo de Levi-Civita. Ver Apostila de Física-Matemática, capítulo 6.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 102: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

96 3.2. Cinemática dos corpos rígidos

orientação, ao contrário de uma rotação imprópria, que leva um referencial dextrógiro a umreferencial levógiro.4

As matrizes R(1), R(2) e R(3), embora pertençam ao SO (3), possuem a seguinte propriedade.Sejam R(i) (θi) e R(i) (φi) duas matrizes que realizam duas rotações distintas (θi e φi) em torno doeixo xi (i = 1, 2, 3). Então,

R(i) (θi)R(i) (φi) = R(i) (φi)R

(i) (θi) = R(i) (θi + φi) . (3.10)

Isto é consistente com a discussão realizada ao final da seção 3.1.2. As matrizes acima, eliminando-se as linhas e colunas compostas por “0” e “1”, podem ser interpretadas como pertencentes aoSO (2), o qual forma um grupo Abeliano.

Contudo, em geralR(i) (θi)R

(j) (θj) 6= R(j) (θj)R(i) (θi) , para i 6= j,

se os ângulos θi e θj forem finitos. Porém, uma determinada rotação por um ângulo finito semprepode ser composta, de acordo com (3.10), por duas ou mais rotações em torno do mesmo eixo.Assim, pode-se escrever

R(i) (θi) =

N∏j=1

R(i) (∆θj) , ondeN∑j=1

∆θj = θi.

Se |δθj | 1, pode-se aproximar cos δθj ≈ 1 e sen δθj ≈ δθj, de tal maneira que

R(i) ' I3 + δR(i),

onde I3 é a matriz unitária e

δR(1) =

0 0 00 0 δθ1

0−δθ1 0

, δR(2) =

0 0−δθ2

0 0 0δθ2 0 0

, δR(3) =

0 δθ3 0−δθ3 0 0

0 0 0

.

Nesta situação, as rotações são infinitesimais se os ângulos δθi satisfazem

limδθi→0N→∞

N∑j=1

δθi = θi.

Observa-se que os elementos das matrizes de rotação infinitesimal podem ser agora escritasde uma maneira compacta da seguinte maneira. Se R

(k)ij (i, j, k = 1, 2, 3) identifica os elementos

da matriz R(k), entãoR

(k)ij = δij + εijkδθk.

No limite de rotações infinitesimais, a comutatividade das rotações é satisfeita, mesmo entrematrizes do SO (3), pois

[R(k) (δθk)R(`) (δθ`)

]ij

=

3∑m=1

(δim + εimkδθk) (δmj + εmj`δθ`)

=

3∑m=1

(δimδmj + δimεmj`δθ` + εimkδmjδθk)

= δij + εij`δθ` + εijkδθk = δij + εijkδθk + εij`δθ`,

ou seja,[R(k) (δθk)R(`) (δθ`)

]ij

=[R(`) (δθ`)R

(k) (δθk)]ij

=⇒ R(k) (δθk)R(`) (δθ`) = R(`) (δθ`)R(k) (δθk) .

Pode-se construir então uma matriz que executa uma rotação infinitesimal genérica pelacomposição de rotações infinitesimais consecutivas em torno de cada eixo. Esta matriz é obtidapor

R (δθ).= R(1) (δθ1)R(2) (δθ2)R(3) (δθ3) = I3 + δR (δθ) , (3.11a)

4Orientação determinada pela mão esquerda.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 103: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 97

ou por qualquer outra permutação na ordem das rotações. Os elementos da matriz R (δθ) sãoescritos de forma compacta como

Rij (δθ) = δij +

3∑k=1

εijkδθk, sendo δθ .= (δθ1, δθ2, δθ3) , (3.11b)

enquanto que a matriz δR (δθ) é dada por

δR (δθ) =

0 δθ3 −δθ2

−δθ3 0 δθ1

δθ2 −δθ1 0

. (3.11c)

Dadas duas matrizes R1 (δθ1) e R2 (δθ2) que executam rotações infinitesimais, as seguintespropriedades são satisfeitas:

1. As rotações infinitesimais são comutativas, uma vez que

R1 (δθ1)R2 (δθ2) = R2 (δθ2)R1 (δθ1) ,

[I3 + δR1 (δθ1)] [I3 + δR2 (δθ2)] = [I3 + δR2 (δθ2)] [I3 + δR1 (δθ1)]

; δR1 (δθ1) + δR2 (δθ2) = δR2 (δθ2) + δR1 (δθ1) .

Esta propriedade é garantida devido à comutatividade da soma matricial.

2. As matrizes de rotação são ortogonais; portanto,

R (δθ) R (δθ) = I3 =⇒ δR (δθ) + δR (δθ) = δR (δθ) + δR (δθ) = 0.

Ou seja,δR (δθ) = −δR (δθ) =⇒ (δR)ji = − (δR)ij , (i, j = 1, 2, 3) .

Uma matriz que satisfaz esta propriedade é dita antissimétrica. Esta propriedade é clara-mente verificada em (3.11).

3.2.3 A LEI DE TRANSFORMAÇÃO DA TAXA DE VARIAÇÃO TEMPO-RAL DE UM VETOR E A VELOCIDADE ANGULAR

Com o desenvolvimento realizado na seção anterior, é possível agora determinar a forma quedeve ser assumida pelo último termo na relação (3.8).

Assumindo que o referencial S tem seus eixos concordantes com S′′ no instante t, em uminstante t + dt posterior os eixos de S sofrem uma rotação infinitesimal resultante da dinâmicado corpo rígido ao qual S é afixado. De acordo com a discussão realizada na seção 3.2.2, essarotação genérica sempre pode ser descrita pela composição de até três rotações infinitesimaisdθ = (dθ1, dθ2, dθ3), cada uma em torno de um eixo coordenado. Assim, de acordo com a lei detransformação (3.4) e a definição da matriz de rotação infinitesimal (3.11), os vetores de base deS transformam-se de acordo com

e (t+ dt) = R (dθ) e (t) = e (t) + dR (dθ) e (t) ,

onde foi empregada novamente a representação matricial e =(e1 e2 e3

)T. Dessa forma, devido

ao movimento do corpo rígido, os vetores de base sofrem uma variação infinitesimal de definidapor

de.= e (t+ dt)− e (t) = dR (dθ) e (t) .

Escrevendo-se explicitamente esta relação para cada vetor de base, com o uso de (3.11), obtém-se

d ei =

3∑j=1

[dR (dθ)]ij ej =

3∑j=1

3∑k=1

εijkdθk ej . (3.12)

Retornando agora à relação (3.8), esta pode ser escrita na forma diferencial como

dg|inercial = dg|corpo + dg|rot ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 104: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

98 3.2. Cinemática dos corpos rígidos

sendo que o último termo é definido como

dg|rot.=

3∑i=1

gid ei,

correspondendo à variação do vetor g devida à rotação do corpo (e de S, por consequência). Mas,de acordo com (3.12),

dg|rot =

3∑i,j,k=1

giεijkdθk ej =

3∑i,j,k=1

εijkdθjgk ei = dθ× g.

Portanto,dg|inercial = dg|corpo + dθ× g.

Dividindo-se ambos os lados por dt, obtém-se finalmente a lei de transformação da taxa devariação temporal do vetor g entre os referenciais S e S′′,

dg

dt

∣∣∣∣inercial

=dg

dt

∣∣∣∣corpo

+ ω× g, onde ω .=dθ

dt. (3.13a)

A quantidade ω é denominada velocidade angular e suas propriedades serão discutidas aseguir. Esta relação pode ser escrita na forma de um operador diferencial como

d

dt

∣∣∣∣inercial

=d

dt

∣∣∣∣corpo

+ ω× . (3.13b)

3.2.3.1 VETORES POLARES, AXIAIS E A VELOCIDADE ANGULAR

β

r′

en

r

δr

δθ

Figura 3.4: Rotação infinitesimal ativado vetor r produzida pela rotação nosentido anti-horário em torno do eixoen.

É importante discutir-se agora a interpretação físicada velocidade angular ω = dθ/dt. A quantidade δθ =(δθ1, δθ2, δθ3) foi introduzida em (3.11) para indicar uma com-posição arbitrária de rotações infinitesimais em torno de trêseixos mutuamente ortogonais.

Se for atribuído livremente um caráter vetorial a δθ, entãoo mesmo pode ser escrito como

δθ =

3∑i=1

δθi ei,

em termos dos vetores de base de um determinado referen-cial. Contudo, é necessário deduzir-se as propriedades ma-temáticas deste novo vetor.

O vetor δθ está relacionado com a rotação ativa de umponto P , localizado pelo vetor posição r, em torno de umeixo no espaço. Esta situação já foi discutida no contextodas leis de conservação no formalismo Lagrangiano e estávisualizada na figura 1.22, a qual é repetida aqui na figura3.4 por conveniência.

O vetor δθ é escrito agora em termos de seu módulo e dovetor unitário en, o qual indica sua direção e sentido, como

δθ = δθ en.

O vetor en é definido da seguinte maneira. Ao sofrer umarotação infinitesimal ativa, no sentido anti-horário, por umângulo δθ em torno de um eixo no espaço, conforme é vistona figura 3.4, o vetor r sofre a transformação r → r′ = r+δr.Se o vetor en (e, por conseguinte, o vetor δθ) for orientado ao

longo do eixo de rotação, conforme está na figura, então a seguinte relação é válida:

δr = δθ× r.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 105: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 99

É fácil mostrar que o vetor δθ satisfaz as condições de adição vetorial e multiplicação porescalar, como exigido para pertencer a um espaço vetorial (i. e., para ser um vetor).

Deste ponto de vista, a velocidade angular ω, introduzida em (3.13), passa a possuir tambémum caráter vetorial. Dividindo-se a relação acima por dt, observa-se então que

ω =dθ

dt=dθ

dten = ω en. (3.14)

Ou seja, a velocidade angular consiste na taxa de variação temporal do vetor δθ. A definição(3.14) mostra também que ω ‖ δθ. Da mesma forma, todos os vetores obtidos pela derivação deω também serão paralelos ao mesmo.

Os vetores δθ, ω e todos os outros obtidos a partir deste último, pertencem a um tipo es-pecial de objeto matemático denominado um vetor axial ou pseudovetor. Estes distinguem-sedos vetores “verdadeiros”, denominados vetores polares, por se transformarem de forma dis-tinta aos mesmos. Um vetor polar é invertido frente a um tipo especial de transformação ativa,denominada inversão espacial, e que consiste em realizar a operação

r −→ −r.

Ao se realizar esta inversão nos vetores r, r′ e δr da figura 3.4, estes se transformam comor → −r, r′ → −r′ e δr → −δr. O mesmo ocorrerá com outros vetores obtidos a partir destespor derivação, tais como velocidade e aceleração. Todos os vetores que se transformam destamaneira são vetores polares ou “vetores verdadeiros.”

Já o vetor δθ, frente à transformação r → −r transforma-se como

δθ −→ δθ,

ou seja, não sofre inversão. O mesmo ocorre com ω e todos os demais vetores axiais derivados.Isto pode ser verificado diretamente a partir da relação δr = δθ× r. Para que esta reproduza asinversões de r e δr, é necessário que δθ permaneça invariante.5

3.2.3.2 A UNICIDADE DA VELOCIDADE ANGULAR

O vetor velocidade angular possui algumas propriedades que o tornam único dentre as quan-tidades dinâmicas de um corpo rígido. Em primeiro lugar, a sua taxa instantânea de variação, aaceleração angular, é a mesma, quer seja do ponto de vista do referencial fixo ou em relaçãoao referencial do corpo. Isto é prontamente verificado aplicando-se o operador (3.13) ao vetor ω:

dt

∣∣∣∣inercial

=dω

dt

∣∣∣∣corpo

+:0

ω× ω =⇒ dω

dt

∣∣∣∣inercial

=dω

dt

∣∣∣∣corpo

. (3.15)

Uma outra característica própria do vetor velocidade angular é a sua unicidade frente adiferentes referenciais, posicionados em distintos locais do corpo rígido. Isto pode ser verificadoa partir da figura 3.5. Nesta figura, o ponto P é um ponto qualquer do corpo rígido. O ponto O′

é a origem de um referencial S′ inercial e O1 e O2 são as origens de dois referenciais distintos (S1

e S2) fixos ao corpo. Os demais vetores são identificáveis na figura.

O’

Figura 3.5: O Ponto P é localizado pelo re-ferencial inercial com origem em O′ e pordois referenciais do corpo, com origens O1

e O2.

5Uma discussão mais aprofundada a respeito de vetores e pseudovetores, no contexto da análise tensorial, é realizadaem Apostila de Física-Matemática, capítulo 6.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 106: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

100 3.2. Cinemática dos corpos rígidos

A relação entre as taxas de variação de qualquer vetor dinâmico g entre os referenciais S′ eS1 ou entre S′e S2 são dadas pela relação (3.13). Em particular, para o vetor r, dado por

r = R1 + r1 = R2 + r2,

tem sua taxa temporal de variação dada por

dr

dt

∣∣∣∣S′

=dR1

dt

∣∣∣∣S′

+dr1

dt

∣∣∣∣S′

=dR2

dt

∣∣∣∣S′

+dr2

dt

∣∣∣∣S′.

Mas,dr1

dt

∣∣∣∣S′

=dr1

dt

∣∣∣∣S′′

edr2

dt

∣∣∣∣S′

=dr2

dt

∣∣∣∣S′′,

lembrando que o referencial S′′ (ver figura 3.2) também é inercial e pode, sem perda de genera-lidade, ser considerado em repouso em relação a S′.

Porém, de acordo com (3.13), a relação entre as taxas de variação do vetor posição para osdistintos referenciais fica escrita

(S′′ ↔ S1) :dr1

dt

∣∣∣∣S′′

=

0

dr1

dt

∣∣∣∣S1

+ ω1 × r1 = ω1 × r1,

onde ω1 é a velocidade angular de rotação do ponto P em relação a O1. O termo cancelado narelação acima corresponderia à taxa de variação de r1 em relação ao referencial S1. Como ospontos O1 e P são ambos mantidos fixos ao corpo, então o termo em questão é nulo, pois, doponto de vista de um observador em O1, o ponto P permanece em repouso.

Da mesma forma,

(S′′ ↔ S2) :dr2

dt

∣∣∣∣S′′

=

>

0

dr2

dt

∣∣∣∣corpo

+ ω2 × r2 = ω2 × r2,

sendo ω2 a velocidade angular de rotação do ponto P em relação a O2.Sendo agora R = R2 −R1, observa-se que

dR

dt

∣∣∣∣S′

=dr1

dt

∣∣∣∣S′− dr2

dt

∣∣∣∣S′

= ω1 × r1 − ω2 × r2.

Mas, do ponto de vista da relação S′′ ↔ S1,

dR

dt

∣∣∣∣S′

=

0

dR

dt

∣∣∣∣S1

+ ω1 ×R = ω1 ×R,

pois o ponto O2 também está em repouso em relação a S1. Como as duas últimas relações sãoidênticas, resulta que, necessariamente,

ω1 × r1 − ω2 × r2 = ω1 ×R.

Mas, como R = r1 − r2, resulta que

ω1 × r1 − ω2 × r2 = ω1 × (r1 − r2) = ω1 × r1 − ω1 × r2 =⇒ (ω2 − ω1)× r2 = 0.

Como os pontos P , O1 e O2 são arbitrários, então o vetor r2 também o é. Portanto, conclui-seque para o resultado acima ser satisfeito para qualquer escolha destes pontos particulares, énecessário e suficiente que

ω2 = ω1.

A conclusão é que a velocidade angular ω será sempre a mesma, independente da escolhapara a origem do referencial do corpo.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 107: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 101

3.3 A DINÂMICA EM REFERENCIAIS NÃO INERCIAIS

Será deduzida aqui a forma correspondente à segunda lei de Newton em um referencial nãoinercial. As expressões aqui obtidas são gerais, descrevendo o movimento de uma única partí-cula sob a ação de uma força resultante; por conseguinte, estas serão posteriormente particula-rizadas para o movimento de um corpo rígido.

Retornando à figura 3.2, supõe-se agora que o ponto P corresponde à posição instantâneade uma partícula de massa m, sendo esta a única partícula do sistema. Assumindo-se que suamassa não varia, então a dinâmica da partícula é descrita pela segunda lei de Newton, a qual éválida no referencial inercial S′; ou seja,

md2r

dt2

∣∣∣∣S′≡ md2r′

dt2= F ,

sendo F a força resultante sobre a partícula.A relação entre a posição instantânea da partícula, observada em relação ao referencial fixo

S′, e a mesma quantidade em relação ao referencial do corpo S é, simplesmente,

r′ = rO + r.

Por outro lado, a relação entre o vetor velocidade instantânea, visto dos referenciais S′ ou S,depende do fato de que S é não inercial e, por isso, a taxa instantânea de variação da posição,vista em ambos os referenciais, estará relacionada através do operador (3.13); ou seja,

v′.=dr

dt

∣∣∣∣S′

=drOdt

∣∣∣∣S′

+dr

dt

∣∣∣∣S′

=drOdt

∣∣∣∣S′

+dr

dt

∣∣∣∣S

+ ω× r .= v′O + v + ω× r,

sendo v′O a velocidade do ponto O em relação a S′ e v a velocidade da partícula vista do pontode vista do referencial não inercial S.

Derivando-se mais uma vez a expressão acima em relação ao tempo, obtém-se a aceleração,

a′.=dv′

dt

∣∣∣∣S′

=dv′Odt

∣∣∣∣S′︸ ︷︷ ︸

a′O

+dv

dt

∣∣∣∣S′

+d

dt(ω× r)

∣∣∣∣S′.

O primeiro termo (a′O) é a aceleração do ponto O em relação a S′. Já nos dois outros termos, énecessário aplicar-se novamente o operador (3.13), de onde resulta

dv

dt

∣∣∣∣S′

=dv

dt

∣∣∣∣S

+ ω× v .= a+ ω× v

d

dt(ω× r)

∣∣∣∣S′

=d (ω× r)

dt

∣∣∣∣S

+ ω× (ω× r) =dω

dt

∣∣∣∣S

× r + ω× v + ω× (ω× r) ,

sendo agora a a aceleração da partícula, vista do referencial S. Lembrando finalmente da unici-dade da aceleração angular (propriedade 3.15), resulta então

a′ = a′O + a+dω

dt× r + 2ω× v + ω× (ω× r) .

Sabendo-se que ma′ = F , pode-se escrever a expressão equivalente ma = F S, sendo F S a“força” total aplicada à partícula, conforme observada a partir do referencial S. Esta “força” éexpressa por

ma = F S.= F −ma′O + 2mv× ω︸ ︷︷ ︸

FCor

+mω× (r× ω)︸ ︷︷ ︸Fcent

+mr× dω

dt︸ ︷︷ ︸FEuler

. (3.16)

A expressão (3.16) mostra que um observador em repouso com o ponto O (observador emS) registra o movimento da partícula como se esta fosse submetida a um conjunto de até cincoforças distintas. A primeira força (F ) é a única força “verdadeira,” no sentido de que estaé realmente a força no sentido Newtoniano, observada a partir de um referencial inercial. Osegundo termo surge devido à aceleração do ponto O em relação a S′. Esta aceleração pode ser

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 108: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

102 3.4. Dinâmica de um corpo rígido. Equações fundamentais

causada, por exemplo, por outras forças que atuam sobre o referencial S, caso este esteja presoa algum objeto material (como um corpo rígido).

Os três termos restantes em (3.16) correspondem a efeitos resultantes da rotação do referen-cial S em relação a S′. Estes objetos são denominados forças fictícias, pois embora tenham adimensão física de forças, estes não correspondem à definição Newtoniana de uma força, por setratarem de efeitos observados em um referencial não inercial. O termo FCor é denominado forçade Coriolis. A visualização mais comum do efeito da força de Coriolis consiste na observação domovimento de um projétil. Em um referencial inercial, a trajetória do projétil é planar, mas seo referencial está girando em torno de um eixo de rotação, a força de Coriolis faz surgir uma“força” perpendicular que acaba removendo o corpo desse plano.

O termo F cent é a conhecida força centrífuga, a qual atua no sentido oposto à força centrípeta,sendo que esta última de fato é uma força no sentido Newtoniano. Finalmente, o termo FEuler

é denominado força de Euler, a qual surge quando o referencial gira também com aceleraçãoangular.

Os efeitos dessas forças fictícias sobre o movimento de um corpo rígido serão estudados napróxima seção.

3.4 DINÂMICA DE UM CORPO RÍGIDO. EQUAÇÕES FUN-DAMENTAIS

A partir dos desenvolvimentos realizados nas seções anteriores, relacionados à cinemática deum corpo rígido, será desenvolvida nesta seção a dinâmica deste corpo. Grandezas essenciaispara a compreensão dessa dinâmica são o momentum angular do corpo e sua energia cinéticarotacional, ambas as grandezas relacionadas com o conceito de momento de inércia do corpo, oqual também será abordado.

A maior parte dos exemplos e casos estudados neste capítulo o serão feitos empregando-se oformalismo Lagrangiano, desenvolvido no capítulo 1.

3.4.1 O MOMENTUM ANGULAR DE UM CORPO RÍGIDO E O SEU TEN-SOR DE INÉRCIA

Dado um corpo rígido, pensado como um conjunto de N partículas com 06 (seis) graus deliberdade, as suas equações de movimento, no formalismo Newtoniano, são:

1. A equação (1.6a), que descreve a taxa de variação do momentum linear total do sistema,

dP

dt= F (e),

sendo F (e) a força resultante devida às forças externas ao sistema.

2. A equação que descreve a taxa de variação do momentum angular total do sistema. Con-forme discutido na seção 1.1.2.2, a equação de movimento propriamente dita depende dacinética do ponto P em relação ao qual está se calculando o momentum angular. Se esteponto coincide com centro de massa do sistema, ou se o mesmo se movimenta sem acele-ração, então (1.7b) é a equação para a evolução do momentum angular,

dLPdt

= N(e)P , (3.17)

sendo N (e)P o torque total submetido ao sistema, em relação a P . Se estas condições não se

cumprirem, então dL/dt será dada pela equação (1.7a), a qual contém o efeito da cinéticado ponto P .

Como (3.17) descreve, como um importante caso particular, a dinâmica do corpo que possui umponto fixo, esta será a situação a ser inicialmente abordada.

Considera-se então a situação representada na figura 3.6. Nesta, S′ é o referencial inercialfixo e O é um determinado ponto do corpo rígido, o qual ou está em repouso em relação a S′

(ponto fixo) ou é o centro de massa do corpo. Na mesma figura, rk é a posição instantânea de

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 109: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 103

S’

rk Figura 3.6: Ilustração do momentum angular de

uma partícula de massa mk em relação ao pontoO, o qual é um ponto fixo em relação ao refe-rencial inercial S′ ou é o centro de massa docorpo rígido.

uma partícula do corpo com massa mk, a qual pode ser pensada como uma massa infinitesimal,caso o corpo seja extenso.

Nas condições de validade da figura 3.6, a variação do momentum angular da massa mk emrelação ao ponto O será descrito pela equação (3.17). Supondo inicialmente que o corpo rígidoseja composto por um conjunto de N partículas discretas, então o momentum angular total sobreO será

L =

N∑k=1

rk × p′k =

N∑k=1

mkrk × v′k, (3.18a)

onde v′k (p′k) é a velocidade (momentum linear) da k-ésima partícula em relação ao ponto O, doponto de vista do referencial fixo S′; ou seja,

v′k =drkdt

∣∣∣∣S′.

O ponto O, por sua vez, pode ser pensado como a origem do referencial do corpo S. Neste caso,para se encontrar vk, a velocidade de mk em relação a O, é necessário empregar-se novamente(3.13), de onde resulta

v′k =drkdt

∣∣∣∣S′

=

0

drkdt

∣∣∣∣S

+ ω× rk =⇒ v′k = ω× rk, (3.18b)

uma vez que rk é um vetor fixo em relação a O. Portanto,

L =

N∑k=1

mkrk × (ω× rk) =

N∑k=1

mk

[r2kω − (rk · ω) rk

],

onde foi empregada a identidade a× (b× c) = (a · c) b − (a · b) c. Escrevendo-se esta expressãoem termos de componentes de um sistema Cartesiano, resulta

Li =

N∑k=1

mk

r2kωi −

3∑j=1

xk,ixk,jωj

=

3∑j=1

[N∑k=1

mk

(r2kδij − xk,ixk,j

)]ωj , (i = 1, 2, 3) .

A partir desta última expressão, define-se uma matriz (3× 3) I, matriz de inércia, cujoselementos são dados por

Iij.=

N∑k=1

mk

(r2kδij − xk,ixk,j

), (i, j = 1, 2, 3) . (3.19a)

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 110: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

104 3.4. Dinâmica de um corpo rígido. Equações fundamentais

Se o corpo rígido em estudo é formado por uma distribuição contínua de massa, então o processode limite xk,i → xi, mk → dm = ρ (r) d3r, N →∞ e

N∑k=1

mk −→ˆV

ρ (r) d3r,

sendo ρ = ρ (r) a densidade de massa (ou massa específica) do corpo rígido, então os elementosda matriz I passam a ser dados por

Iij =

ˆV

d3r(r2δij − xixj

)ρ (r) . (3.19b)

Os elementos da matriz I são os componentes do tensor de inércia do corpo rígido. Esta de-signação será empregada a partir de agora, deixando-se a demonstração de que esta quantidadeé de fato um tensor para a seção 3.4.3.

Pode-se escrever a relação entre as componentes Cartesianas de L em termos do tensor deinércia como

Li =

3∑j=1

Iijωj , (i = 1, 2, 3) . (3.20a)

Ou, usando a mesma notação matricial já empregada para as componentes do vetor posição (em3.2c), como

L = Iω, sendo L =

L1

L2

L3

e ω =

ω1

ω2

ω3

. (3.20b)

Finalmente, uma notação vetorial também é possível:

L =↔I ·ω, (3.20c)

sendo↔I propriamente o tensor de inércia, o qual é um tensor de posto 2.

3.4.2 MOMENTOS E PRODUTOS DE INÉRCIA

As seguintes características da matriz de inércia, definida em (3.19), merecem ser ressalta-das:

1. A matriz de inércia é real, uma vez que todos os seus elementos, tanto para sistemasdiscretos quanto para contínuos, são reais.

2. A matriz de inércia é simétrica, uma vez que ela é real e

Iij = Iji,

como pode ser trivialmente verificado.

3. Momentos de inércia. Tratam-se dos elementos da diagonal da matriz de inércia: I11, I22, I33.Observa-se que os momentos de inércia sempre existem e são positivos, independente daforma da distribuição de massa, pois

Iii =

ˆV

d3r(r2 − x2

i

)ρ (r) =

ˆV

d3r(x2j + x2

k

)ρ (r) > 0,

i = 1, 2, 3

j 6= i 6= k = 1, 2, 3.

Como o integrando é positivo-definido, a integral também é positiva. Esta propriedade foiverificada empregando-se a forma contínua, mas ela pode ser facilmente corroborada naforma discreta.

4. Produtos de inércia. Tratam-se dos elementos fora da diagonal principal. Neste caso,

Iij = −ˆV

d3r xixjρ (r) , (i 6= j = 1, 2, 3) .

Os produtos de inércia não são necessariamente positivos e podem não existir.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 111: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 105

Uma observação importante é que os valores que os momentos e produtos de inércia tomam,para uma dada distribuição de massa, dependem da posição da origem do referencial do corpoe da orientação de seus eixos coordenados.

Mais adiante, será demonstrado como é sempre possível (em teoria) diagonalizar a matriz deinércia através de uma rotação dos eixos do sistema. Nesta nova orientação, os produtos deinércia são nulos e a matriz se torna diagonal.

Exercício 3.1 (Matriz de inércia de um cubo homogêneo). Obtenha a matriz de inércia de umcubo homogêneo de densidade ρ, massa M e lado b. Considere a origem do referencial em umdos vértices do cubo e seus eixos alinhados ao longo de suas arestas, conforme está ilustradona figura 3.7.

Figura 3.7: Um cubo homogêneo de lado b com aorigem do referencial em um de seus vértices.

Solução. Os elementos da matriz de inércia neste caso são dados por (3.19b). Calculando-seinicialmente os momentos de inércia,

Iii(j 6=k 6=i)

= ρ

ˆV

d3r(x2j + x2

k

)= 2ρ

ˆV

d3r x2j

= 2ρ

ˆ b

0

dxi

ˆ b

0

dxk

ˆ b

0

dxj x2j ,

Iii = 2ρ(b2)(1

3b3)

=2

3ρb5 =

2

3Mb2, (i = 1, 2, 3) .

Ou seja, todos os momentos de inércia têm o mesmo valor.Calculando agora os produtos de inércia,

Iijj 6=i= −ρ

ˆV

d3r xixj = −ρˆ b

0

dxi xi

ˆ b

0

dxj xj

ˆ b

0

dxk,

Iij = −ρ(

1

2b2)2

b = −1

4ρb5 = −1

4Mb2, (i 6= j = 1, 2, 3) .

Portanto, a matriz de inércia do cubo, com o referencial posicionado conforme está na figura3.7, fica

Icubo = Mb2

2/3−1/4−1/4−1/4 2/3−1/4−1/4−1/4 2/3

.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 112: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

106 3.4. Dinâmica de um corpo rígido. Equações fundamentais

3.4.3 O TENSOR DE INÉRCIA E SUA LEI DE TRANSFORMAÇÃO

Um tensor é um objeto matemático ao qual é atribuído certas propriedades algébricas egeométricas que o tornam singularmente importante na física-matemática.6

Um tensor usualmente forma uma coleção de objetos matemáticos, denominados as coor-denadas do tensor, que são distintos, mas que se relacionam entre si por meio de certas pro-priedades (físicas e/ou matemáticas). Entretanto, para que esta coleção de objetos possa serdenominada um tensor, é necessário que as suas coordenadas obedeçam uma lei de transfor-mação bem determinada, a qual será apresentada em breve. A distinção entre as distintascoordenadas do tensor é realizada através de um conjunto de índices inteiros (usualmente nãonegativos), o que leva à definição do posto do tensor, como sendo o número de diferentes índicesnecessários para a identificação das componentes do tensor. Os tensores mais comuns na físicasão:

Tensores de posto zero: os quais são as quantidades usualmente denominadas escalares, taiscomo massa, carga elétrica ou potencial elétrico. Um tensor de posto zero pode ser clas-sificado como um escalar propriamente dito se este não muda frente a uma determinadatransformação de coordenadas. Neste caso se enquadram os princípios de invariância damassa (de repouso) ou da carga elétrica. Por outro lado, tensores de posto zero que mudamfrente a certas transformações (como rotações impróprias, por exemplo), são denominadospseudoescalares. Certos objetos formados a partir de vetores axiais são assim classifica-dos.

Tensores de posto um: os quais são comumente conhecidos como vetores. Para a distinçãoentre as diferentes componentes de um vetor é necessário apenas um único índice. Naseção 3.2.3.1 mostrou-se que há dois tipos de vetores: polares (ou vetores “verdadeiros”) eaxiais (ou pseudovetores). Seja

A =

3∑j=1

Ai ei

um vetor polar. Seja também xi −→ x′i (xj) (i, j = 1, 2, 3) uma determinada lei de transfor-mação de coordenadas, a qual possui a transformação inversa x′i → xi. Coletando-se asderivadas

Lij.=∂x′i∂xj

em uma matriz (3× 3) L, como a matriz de rotação (3.4), então as coordenadas de A devemse transformar de acordo com a lei

Aixi→x′i−−−−→ A′i =

3∑j=1

LijAj =

3∑j=1

∂x′i∂xj

Aj , (i = 1, 2, 3) ,

onde A′i é a i-ésima coordenada de A no referencial transformado. Já na transformaçãoinversa é dada pelos elementos de matrizes Lji = ∂xi/∂x

′j tais que

A′ix′i→xi−−−−→ Ai =

3∑j=1

LjiA′j =

3∑j=1

∂xi∂x′j

A′j , (i = 1, 2, 3) .

Posição, velocidade, aceleração, força e campo elétrico são todos exemplos de vetores pola-res.

Por outro lado, se B for um vetor axial (um pseudovetor), este irá se transformar como

Bixi→x′i−−−−→ B′i =

3∑j=1

det (L)LijBj , (i = 1, 2, 3) .

Se L = R for uma rotação imprópria, então det (L) = det (R) = −1. Exemplos de pseudovetorescom significado físico são: velocidade e aceleração angulares, momentum angular e campomagnético.

6Novamente, uma discussão mais aprofundada a respeito de tensores é realizada em Apostila de Física-Matemática,capítulo 6.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 113: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 107

Tensores de posto dois: objetos que necessitam de dois índices para distinguir suas compo-nentes. Este tipo de tensor surge em todas as áreas da física, mas somente será aqui

abordado o tensor de inércia. Se↔T representa um tensor de posto dois, então o conjunto

Tij (i, j = 1, 2, 3) coleta os seus nove componentes. Assim como os vetores, um tensor de

posto dois pode ser um tensor “verdadeiro” ou um pseudotensor. No primeiro caso, se↔T

é um tensor, então suas componentes se transformam conforme

Tijxi→x′i−−−−→ T ′ij =

3∑k,`=1

LikLj`Tk` =

3∑k,`=1

∂x′i∂xk

∂x′j∂x`

Tk`, (i, j = 1, 2, 3) . (3.21)

Por outro lado se↔U for um pseudotensor de posto dois, então

Uijxi→x′i−−−−→ U ′ij =

3∑k,`=1

det (L)LikLj`Uk`, (i, j = 1, 2, 3) .

Nota-se que a lei de transformação para cada posto também foi explicitada. Tensores de postomais alto (três, quatro, etc) são possíveis e alguns exemplos existem na física, os quais nãoserão discutidos aqui. As leis de transformação de suas componentes são as extensões lógicasdos casos apresentados.

Para demonstrar que o tensor de inércia (3.19) é de fato um tensor (de posto dois) bastamostrar que suas componentes se transformam de acordo com (3.21) frente a uma rotaçãoarbitrária dos eixos coordenados. Para tanto, dada a matriz I, cujos elementos são dados pelascoordenadas das partículas do corpo rígido em um sistema Cartesiano S, define-se uma novamatriz I′ ( 6= I) cujos elementos são dados por

I ′ij.=

N∑k=1

mk

(r′2k δij − x′k,ix′k,j

), (i, j = 1, 2, 3) ,

sendo x′i as coordenadas em um sistema rotado S′ (conforme ilustrado na figura 3.3b). Mas,se as relações entre as coordenadas de S e S′ são dadas por (3.4), então

x′i =

3∑j=1

Rijxj .

Com isso, pode-se escrever

r′2k =

3∑`=1

x′2k,` =

3∑m=1

3∑n=1

3∑`=1

R`mR`n︸ ︷︷ ︸(3.3a)→δmn

xk,mxk,n =

3∑m=1

x2k,m = r2

k, e

I ′ij =

N∑k=1

mk

(r2kδij −

3∑m,n=1

RimRjnxk,mxk,n

).

Mas, também devido à propriedade (3.3a),7

δij =

3∑m,n=1

RimRjnδmn.

Portanto,

I ′ij =

3∑m,n=1

RimRjn

[N∑k=1

mk

(r2kδmn − xk,mxk,n

)]=

3∑m,n=1

RimRjnImn, (3.22)

e os elementos da matriz I transformam-se como um tensor de posto dois, o que demonstra que

a mesma compõe as componentes do tensor de inércia↔I .

7De fato, a delta de Kronecker também é um elemento de um tensor de posto dois.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 114: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

108 3.4. Dinâmica de um corpo rígido. Equações fundamentais

Se os nove componentes do tensor de posto 2↔T forem organizados como os elementos da

matriz T.= [Tij ] (i, j = 1, 2, 3), a lei de transformação (3.21), pode ser escrita como

T ′ij =

3∑k,`=1

LikTk`Lj`Lj`=

(L)`j−−−−−−−→

3∑k,`=1

LikTk`(L)`j

=(LTL

)ij,

sendo L = [Lij ] a matriz de transformação. Ou seja,

T′ = LTL,

sendo T′ =[T ′ij]

a matriz que contém os componentes de↔T no novo referencial. Da mesma forma,

se for realizada a rotação SR−→ S′ por intermédio da matriz de rotação R, então a transformação

dos componentes do tensor de inércia↔I , dada por (3.22), pode ser escrita na forma matricial

comoI′ = RIR.

Uma representação útil e frequentemente empregada do tensor de inércia é na forma deuma diádica, a qual consiste na justaposição, ou no produto externo8 de dois vetores. Nesta

representação, o tensor↔I fica escrito

↔I=

3∑i,j=1

Iij ei ej = I11 e1 e1 + I12 e1 e2 + I13 e1 e3 + · · ·+ I32 e3 e2 + I33 e3 e3,

sendo os elementos de matriz Iij dados por (3.19).Representado na forma de uma diádica, o tensor de inércia definido em (3.19) pode ser escrito

↔I =

N∑k=1

mk

(r2k

↔1 −rkrk

)(caso discreto), ou (3.23a)

↔I =

ˆV

d3r(r2↔1 −rr

)ρ (r) (caso contínuo), (3.23b)

onde↔1=

∑i,j δij ei ej é a diádica unitária. Esta notação tem a vantagem de ser independente do

sistema de coordenadas empregado.

O TENSOR DE INÉRCIA E O VETOR momentum ANGULAR

Com a representação do tensor de inércia na forma de uma diádica, fica claro o significadoda notação vetorial em (3.20c); trata-se do produto escalar (ou produto interno) pela direita

L =↔I ·ω =

3∑i,j=1

Iij ei ej

·( 3∑`=1

ω` e`

)=

3∑i,j,`=1

Iijω` ( ei ej) · e`

=

3∑i,j,`=1

Iijω` ei ( ej · e`)︸ ︷︷ ︸δj`

=

3∑i,j=1

Iijωj ei,

o qual se reduz à notação por componentes dada por (3.20a).

A notação diádica ilustra o fato de que o produto escalar de um tensor de posto dois(↔I)

comum vetor (ω) tem como resultado um novo vetor (L).

Nota-se também que

Iij = ei·↔I · ej =

3∑m,n=1

Imn ( ei · em) ( en · ej) ,

ou seja, as componentes de↔I são obtidas pelos produtos internos deste pela esquerda e pela

direita por vetores de base.8Ver Apostila de Física-Matemática, seção 6.4.4.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 115: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 109

Eixo de rotação

Figura 3.8: Um haltere formadopelas massas m1 e m2 conectadaspor um cabo rígido e leve. Nota-se que ω não está ao longo docabo e que L não é colinear a ω.

Por outro lado, a notação por componentes mostra que, emgeral, o vetor resultante (L) não é colinear ao vetor-pai (ω). Porexemplo, lembrando da expressão (3.14) que relaciona ω com adireção do eixo de rotação, dada por en, se o corpo sofre umarotação instantânea em torno de um certo eixo e o referencial Sestá orientado de tal forma que e3 ‖ en, então, pelo menos nesteinstante, ω = (0, 0, ω). Porém, se a distribuição de massa do corpofor tal que sua matriz de inércia (para S) possuir pelo menos umproduto de inércia, então, de (3.20a), o momentum angular docorpo irá possuir pelo menos um componente Li = Ii3ω3, comi 6= 3; em consequência, L não é colinear a ω.

Isto fica evidenciado pelo exemplo simples mostrado na figura3.8. Um corpo rígido é composto por um haltere, formado porduas massas (m1 e m2) conectadas por uma barra rígida commassa desprezível. Este corpo sofre uma rotação a uma taxaconstante em torno do eixo vertical mostrado na figura, com aconsequente orientação da velocidade angular. A figura mostratambém as velocidades instantâneas de cada partícula. O pontoO (origem de S) é um ponto fixo e, por isso, o desenvolvimentorealizado nesta seção pode ser aplicado neste caso.

Assim, usando (3.18a,b),

L =

2∑k=1

mkrk × v′k, sendo v′k = ω× rk.

Destas expressões, observa-se claramente que L ⊥ rk,v′k, sendosempre perpendicular ao eixo do haltere e não colinear a ω.

Observa-se também que à medida que o haltere gira em tornodo eixo de rotação, o momentum angular muda de orientação, i.e., L 6= 0, o que implica (de 3.17) que existe um torque sendocontinuamente aplicado ao sistema para manter o seu movimento rotacional.

3.5 ENERGIA CINÉTICA ROTACIONAL E O MOMENTO DE

INÉRCIA DO CORPO RÍGIDO

A energia cinética total de um sistema de partículas foi definida em (1.5d). Para se deduzir aexpressão da energia cinética total de um corpo rígido que se movimenta com um ponto fixo, éútil realizar primeiro o seguinte exercício.

Partindo da expressão (3.20a), que relaciona os componentes do momentum angular do corpocom os componentes do tensor de inércia, multiplica-se ambos os lados por 1

2ωi e soma-se sobreo índice i, resultando assim

3∑i=1

1

2ωiLi =

1

2

3∑i,j=1

Iijωiωj.= Trot.

Uma análise dimensional da quantidade definida acima (Trot) mostra que esta tem a dimensãode energia. Esta quantidade é denominada a energia cinética rotacional do corpo, pois está

relacionada com a sua inércia rotacional (via↔I ) e a sua velocidade angular ω.

A dedução rigorosa desta expressão pode ser realizada da seguinte maneira. Retornando a(1.5d), a energia cinética total de um sistema com N partículas (sistema discreto), do ponto devista do referencial fixo S′, é

T =1

2

N∑k=1

mkv′2k .

Porém, nas condições no momento consideradas, o vetor v′k é dado por (3.18b). Lembrandoagora de toda a discussão realizada nas seções 3.1 – 3.3, o vetor v′k pode ser considerado de duasmaneiras equivalentes: como o valor instantâneo do vetor velocidade ou como a taxa temporal

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 116: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

110 3.5. Energia cinética rotacional e o momento de inércia do corpo rígido

de variação da posição da i-ésima partícula do sistema. Sendo assim, é possível escrever

v′2k = v′k · v′k(3.18b)

= v′k · (ω× rk) .

Empregando-se a identidade vetorial a· (b× c) = b· (c× a), resulta para a energia cinética

T =1

2

N∑k=1

mk [ω · (rk × v′k)] =1

2ω ·[N∑k=1

(rk × p′k)

](3.18a)−−−−→ T ≡ Trot =

1

2ω · L.

Finalmente, de (3.20c) conclui-se que

Trot =1

2ω · L =

1

2ω·↔I ·ω =

1

2

3∑i,j=1

Iijωiωj , (3.24a)

como se havia previsto.Outras relações equivalentes são obtidas de (3.24a). Retornando à expressão (3.14) para ω,

escreve-seTrot =

1

2Iω2, sendo

I.= en·

↔I · en.

(3.24b)

A quantidade I é denominada o momento de inércia em relação ao eixo de rotação.Inserindo a expressão (3.23) em I, escreve-se

I =

N∑k=1

mk

[r2k en·

↔1 · en − ( en · rk) (rk · en)

]=

N∑k=1

mk

[r2k − ( en · rk)

2],

uma vez que

en·↔1 · en =

3∑i,j=1

δij ( en · ei) ( ej · en) =

3∑i=1

( en · ei)2= | en|2 = 1.

Observando a figura 3.9, constata-se claramente que

d2k.= r2

k − ( en · rk)2

= r2k

(1− cos2 θk

)

Figura 3.9: Relação entre os vetores en e rk e a dis-tância perpendicular dk.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 117: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 111

Tabela 3.1: Momentos de inércia de alguns sólidos de revolução. Uma lista mais completa pode ser encontradaem https://pt.wikipedia.org/wiki/Lista_de_momentos_de_inércia.

Eixo

Anel fino emtorno de umeixo central

Eixo

Cilindro oco(ou anel grosso)em torno de um

eixo central

R

I = MR 2 (b) (a) I = M(R 12 + R 2

2)

R 2

R 1

Barra fina em tornode um eixo central

perpendicular àmaior dimensão

(e) I = ML 2

L

Eixo

EixoEixo

Anel fino emtorno de um

diâmetro

Placa fina emtorno de um eixo

perpendicularpassando pelo

centro

(i) (h) I = MR 2 I = M(a 2 + b 2)

R

b a

Eixo

Cilindro(ou disco)

maciço em tornodo eixo central

(c) I = MR 2

R L

Eixo

Cilindro(ou disco)

maciço em tornode um diâmetro

central

(d) I = MR 2 + ML 2

R L

Eixo

Casca esféricafina em torno

de um diâmetro

(g) I = MR 2

2R

Esfera maciçaem torno deum diâmetro

(f) I = MR 2

2R

Eixo

1 __ 2 1 __

2

2 __ 5

1 __ 4

2 __ 3

1 __ 2

1 __ 12

1 __ 12

1 __ 12

= r2k sen2 θk = ( en × rk)

2,

sendo dk a distância perpendicular do eixo de rotação da k-ésima partícula do corpo. Portanto,pode-se escrever

I =

N∑k=1

mkd2k. (3.25a)

Repetindo os passos acima, porém agora para uma distribuição contínua de massa, realiza-seprimeiro as transformações

mk → dmk = ρ (r) d3r,

N∑k=1

mkmk→dmk−−−−−−→N→∞

ˆd3r ρ (r) ,

de onde se obtém

Trot =1

2

ˆd3r ρ (r)

(dr

dt

∣∣∣∣S′

)2

=1

2

ˆd3r ρ (r)

(dr

dt

∣∣∣∣S′

)· (ω × r) =

1

2Iω2

I = en·↔I · en =

ˆV

d3r ρ (r)[r2 − ( en · r)

2]. (3.25b)

A expressão (3.24b) para a energia cinética rotacional é a forma comumente encontrada paraesta quantidade nos textos de física básica. Da mesma maneira, a expressão (3.25) é a formacomumente encontrada nos mesmos textos para o momento de inércia dos corpos rígidos. Atabela 3.1 apresenta uma breve lista com momentos de inércia de alguns sólidos de revolução.Observa-se que os eixos de rotação nos exemplos ilustrados sempre passam pelo centro demassa dos corpos e com uma orientação tal que a distribuição de massa em torno do eixo ésimétrica.

Finalmente, é importante ressaltar que I contém somente parte da informação contida no

tensor↔I . Além disso, no movimento mais geral do corpo, o eixo de rotação pode variar no tempo;

em consequência, o momento de inércia em relação ao eixo de rotação não será constante. Por

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 118: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

112 3.5. Energia cinética rotacional e o momento de inércia do corpo rígido

x1

x2

Perpendicular

ao plano

S

S’

Figura 3.10: Uma barra rígida e leve que fixaas massas m1 e m2 nos pontos ilustrados oscilacomo um pêndulo físico.

outro lado, se o movimento do corpo rígido envolver pelo menos um ponto fixo, sempre é possívelencontrar um eixo de rotação que permanece constante no tempo.

Exercício 3.2. Considere o pêndulo ilustrado na figura 3.10, o qual é composto por uma barrarígida e leve de extensão b e com as massas m1 e m2 afixadas nos pontos mostrados. Encontre afrequência de pequenas oscilações se a oscilação do pêndulo é planar.

Solução. Na figura estão ilustrados os referenciais do espaço (S′) e do corpo (S), os quais com-partilham suas origens que é também o ponto fixo no movimento do sistema. O eixo de rotaçãoestá orientado ao longo de x′3 = x3

(e′3 = e3

). Então, a velocidade angular fica

ω = ω3 e3 = θ e3.

De acordo com (3.19a), a matriz de inércia do corpo é dada por

Iij = m1

(r21δij − x1,ix1,j

)+m2

(r22δij − x2,ix2,j

), (i, j = 1, 2, 3) .

Como xk,2 = xk,3 = 0 (k = 1, 2), resulta que todos os produtos de inércia são nulos, bem como oelemento I11. Mas,

I22 = I33 = m1x21,1 +m2x

22,1 =

(m1 +

1

4m2

)b2.

Ou seja,

I =

0 0 00 1 00 0 1

(m1 +1

4m2

)b2.

Como o movimento do corpo tem um ponto fixo, então o seu momentum angular é dado por(3.20a),

L = Iω =

(m1 +

1

4m2

)b2

0 0 00 1 00 0 1

00ω3

=⇒

L1 = L2 = 0

L3 =

(m1 +

1

4m2

)b2θ.

A taxa de variação de L é dada por (3.17), em termos do torque total atuando sobre o corpo.Do ponto de vista de S′, este torque é N (e) =

∑2k=1 rk × (mkg). Escrevendo g em termos de S,

g = g cos θ e1 − g sen θ e2.

Então,

r1 × (m1g) = m1b e1 × (g cos θ e1 − g sen θ e2) = −m1bg sen θ e3

r2 × (m2g) =1

2m2b e1 × (g cos θ e1 − g sen θ e2) = −1

2m2bg sen θ e3.

Portanto, de (3.17) resulta que L1 = L2 = 0 e

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 119: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 113

L3 =

(m1 +

1

4m2

)b2θ = −

(m1 +

1

2m2

)bg sen θ

⇒(m1 +

1

4m2

)bθ +

(m1 +

1

2m2

)g sen θ = 0.

Realizando a aproximação de oscilações de pequena amplitude, obtém-se a equação de osci-lador harmônico

θ + Ω2θ = 0,

cuja frequência (angular) de oscilação é

Ω2 =m1 + 1

2m2

m1 + 14m2

g

b.

3.6 O TEOREMA DOS EIXOS PARALELOS

Este importante teorema mostra como a matriz de inércia, calculada a partir de um eixo derotação que passa por um ponto qualquer do corpo rígido se relaciona à mesma matriz de inérciaobtida em relação a um outro eixo que passa pelo centro de massa do corpo e que é paralelo aoeixo inicial. Este teorema é também conhecido como teorema de Steiner.

Teorema 3.2 (de Steiner ou dos eixos paralelos). O momento de inércia em relação a um dadoeixo de rotação é igual ao momento de inércia relativo a um eixo paralelo passando pelo centro demassa do corpo, acrescido do momento de inércia em relação ao eixo original, calculado como se ocorpo estivesse inteiramente concentrado no centro de massa.

ên Figura 3.11: Figura empregada na demonstração

do teorema de Steiner.

Demonstração. Fazendo-se referência à figura 3.11, o eixo a é um eixo instantâneo de rotação,orientado na direção e sentido do vetor en, e que passa pelo ponto O. O centro de massa docorpo está no ponto CM, sendo R o vetor posição em relação a O. Se mk é a massa da k-ésimapartícula do corpo, então rk = R + r′k. Denominando Ia o momento de inércia do corpo emrelação ao eixo a, este é dado por (3.25a),

Ia =

N∑k=1

mkd2k =

N∑k=1

mk ( en × rk)2

=

N∑k=1

mk ( en ×R+ en × r′k)2

=

(N∑k=1

mk

)︸ ︷︷ ︸

M

( en ×R)2

+

N∑k=1

mk ( en × r′k)2

︸ ︷︷ ︸ICM

+2 ( en ×R) ·(en ×

>

0N∑k=1

mkr′k

),

sendo que o último termo é nulo pelas mesma razão já discutida em (1.8b).

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 120: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

114 3.6. O teorema dos eixos paralelos

Portanto,Ia = ICM +M ( en ×R)

2. (3.26a)

Comparando os termos do lado direito com (3.25a), constata-se que ICM nada mais é senão omomento de inércia em relação ao ponto CM, enquanto que o último termo é simplesmente omomento de inércia (em relação ao eixo a) de uma partícula com massa M posicionada no centrode massa. Assim, este resultado prova o teorema de Steiner.

Pode-se facilmente provar também a generalização do teorema de Steiner para o tensor deinércia. Substituindo-se rk = R+ r′k em (3.23a), resulta

↔IO =

N∑k=1

mk

[(R+ r′k)

2 ↔1 − (R+ r′k) (R+ r′k)

]=

N∑k=1

mk

[(R2 + r′2k + 2R · r′k

) ↔1 −RR−Rr′k − r′kR− r′kr′k

]=

N∑k=1

mk

(r′2k↔1 −r′kr′k

)+M

(R2↔1 −RR

)

+ 2R ·(>

0N∑k=1

mkr′k

)↔1 −R

(>

0N∑k=1

mkr′k

)−(>

0N∑k=1

mkr′k

)R,

resultando então

↔IO =

↔I CM +M

(R2↔1 −RR

), sendo

↔I CM=

N∑k=1

mk

(r′2k↔1 −r′kr′k

), ou

(IO)ij = (ICM)ij +M(R2δij −RiRj

), sendo (ICM)ij =

N∑k=1

mk

(r′2k δij − x′k,ix′k,j

).

(3.26b)

A quantidade↔I CM nada mais é senão o tensor de inércia em relação ao centro de massa,

enquanto que o segundo termo é o tensor de inércia em relação a O, de uma partícula commassa M localizada no centro de massa. Nesta expressão, o teorema de Steiner assume umaforma independente do sistema de coordenadas particular adotado.

Exercício 3.3. Encontre o tensor de inércia do cubo do exercício 3.1, porém agora em relação aum sistema de coordenada com origem no centro de massa do cubo.

Figura 3.12: O referencial com eixos X1, X2, X3 pos-sui origem no vértice do cubo (ponto Q), enquantoque o referencial x1, x2, x3 tem origem no centro demassa (ponto O).

Solução. A situação está ilustrada na figura 3.12. O vetor a = (b/2, b/2, b/2) localiza o centro demassa do cubo, o qual é também o seu centro geométrico. Então, de acordo com (3.26b),

(IO)ij = (IQ)ij −M(a2δij − aiaj

)= (IQ)ij −

1

4Mb2 (3δij − 1) ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 121: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 115

sendo IQ a matriz de inércia obtida na solução do exercício 3.1. Daí resulta que

(IO)11 = (IO)22 = (IO)33 =2

3Mb2 − 1

2Mb2 =

1

6Mb2

(IO)12 = (IO)13 = (IO)21 = · · · = −1

4Mb2 − 1

4Mb2 (−1) = 0.

Portanto,

IO =1

6Mb2

1 0 00 1 00 0 1

.

Observa-se que em relação ao centro de massa, a matriz de inércia é diagonal.

Será apresentado agora um teorema adicional, envolvendo os elementos da matriz de inércia.

Teorema 3.3 (Teorema do eixo perpendicular). Dada uma placa plana de formato e distribuiçãode massa arbitrários, a soma de seus momentos de inércia em relação a quaisquer dois eixosperpendiculares contidos no plano da placa é igual ao momento de inércia em relação ao eixoperpendicular à placa e que parte da intersecção dos eixos no plano.

3.7 DIAGONALIZAÇÃO DO TENSOR DE INÉRCIA

As componentes do tensor de inércia dependem da origem e da orientação do referencialdo corpo. Nos exemplos já apresentados, mostrou-se que uma orientação generalizada destereferencial resulta em uma matriz de inércia que possui tanto momentos quanto produtos deinércia não nulos. Uma das consequências disto está no fato de que o momentum angular não éparalelo à velocidade angular do corpo.

Caso existisse uma orientação do referencial no qual a matriz de inércia fosse diagonal (em-bora com elementos distintos, em geral), então tanto o momentum angular quanto a energiacinética rotacional assumiriam as formas relativamente mais simples

Iij = Iiδij =⇒ Li = Iiωi e Trot =1

2

3∑i=1

Iiω2i . (3.27)

Felizmente, sempre é possível realizar-se uma rotação dos eixos do referencial S tal que nonovo referencial a matriz I é diagonal. Isto porque é sempre possível diagonalizar uma matrizreal e simétrica. Este procedimento será agora apresentado.

Fazendo referência à figura 3.3(b), o referencial azul agora representa a orientação originalde S e o referencial vermelho representa a nova orientação, em relação à qual o tensor de inérciaé diagonal. O tensor de inércia é o mesmo objeto matemático, independente do referencialadotado, mas suas componentes (os elementos da matriz I) mudam conforme o referencial. Ouseja,

↔I=

3∑i,j=1

Iij ei ej =

3∑i=1

Iiξiξi,

sendo Iij as componentes do tensor na orientação original de S (com a base e1, e2, e3) e Iias suas componentes no referencial rotado (com a base

ξ1, ξ2, ξ3

). Os elementos I1, I2, I3 da

matriz de inércia diagonal são chamados os momentos principais de inércia, enquanto queos eixos ao longo dos vetores da base

ξ1, ξ2, ξ3

são chamados eixos principais de inércia.

Caso os momentos e eixos principais fossem conhecidos, então

↔I · ξk =

3∑i=1

Iiξi ξi · ξk︸ ︷︷ ︸δik

= Ikξk, (k = 1, 2, 3) .

Mas, do ponto de vista do referencial original,

↔I · ξk =

3∑i,j=1

Iij ei

(ej · ξk

)︸ ︷︷ ︸

ξkj

=

3∑i,j=1

Iijξkj ei,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 122: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

116 3.7. Diagonalização do tensor de inércia

sendo ξkj a componente do k-ésimo vetor da nova base ao longo do j-ésimo vetor da base original.Como ambos os resultados acima são os mesmos, então, necessariamente,

3∑i,j=1

Iijξkj ei = Ikξk =⇒3∑

i,j=1

Iijξkj ei =

3∑i=1

Ikξki ei =⇒3∑i=1

3∑j=1

Iijξkj − Ikξki

ei = 0.

A última relação corresponde a um vetor nulo. Portanto, ignorando-se o índice k,

3∑j=1

Iijξj = Iξi, (i = 1, 2, 3) .

O resultado acima corresponde a um sistema de três equações lineares para I, o qual podeser escrito na forma matricial comoI11 − I I12 I13

I21 I22 − I I23

I31 I32 I33 − I

ξ1ξ2ξ3

= 0. (3.28a)

Para que este sistema tenha uma solução não trivial, é necessário que

det

I11 − I I12 I13

I21 I22 − I I23

I31 I32 I33 − I

= 0. (3.28b)

Esta condição resulta em uma equação cúbica para I, denominada equação característica ousecular e cujas soluções corresponderão aos momentos principais de inércia procurados.

Uma vez encontrados os momentos principais de inércia como as soluções de (3.28b), retorna-se a (3.28a) e insere-se na mesma cada momento por vez. Para cada momento, resulta umsistema superdeterminado de equações que fornece as projeções do vetor ξ do correspondenteeixo principal ao longo dos eixos originais. Cada equação fornecerá então duas dessas compo-nentes em termos de uma terceira, a qual pode finalmente ser determinada pela condição denormalização de ξ.

O processo descrito acima nada mais é que o processo usual de determinação dos autovalorese autovetores de uma matriz quadrada não singular. Em geral esses autovalores são complexos,mas como a matriz de inércia é real e simétrica,9 os autovalores são necessariamente reais epositivos (porque os momentos de inércia são sempre positivos).

Exemplo 3.1 (Momentos e eixos principais de inércia de uma placa homogênea). Dada aplaca triangular homogênea com massa M mostrada na figura 3.13(a), a qual mostra também aorientação inicial do referencial S, a densidade (constante) da placa pode ser escrita como

ρ = σδ (z) , sendo σ =2M

a2.

A quantidade σ é a densidade superficial de massa e δ (z) é a “função” delta de Dirac.10

Então, os elemento da matriz de inércia ficam

Ixx =

ˆV

ρ(y2 + z2

)dxdydz = σ

ˆV

δ (z)(y2 + z2

)dxdydz

= σ

ˆ a

0

dy y2

ˆ a−y

0

dx

ˆdz δ (z)︸ ︷︷ ︸

1

+

ˆ a

0

dy y2

ˆ a−y

0

dx

*

0ˆdz δ (z) z2

= σ

ˆ a

0

dy y2 (a− y) =1

12σa4 =

1

6Ma2.

Mostra-se que Iyy = Ixx e

Izz =

ˆV

ρ(x2 + y2

)dxdydz = Ixx + Iyy =

1

6σa4 =

1

3Ma2.

9Diz-se então que I é auto-adjunta ou Hermitiana.10Para propriedades da delta de Dirac, inclusive para integrais múltiplas em qualquer sistema de coordenadas, ver

Apostila de Física-Matemática, apêndice A.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 123: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 117

Figura 3.13: Tensor de inércia de uma placa triangular homogênea. (a) Referencial S original. (b) Referencialrotado contendo os eixos principais de inércia.

Já os produtos de inércia ficam

Ixy = Iyx = −ˆV

ρxydxdydz = −σˆ a

0

dy y

ˆ a−y

0

dxx = −σa4

24= −Ma2

12

Iiz = Izi = −ˆV

ρxizdxdydz = −σˆA

d2r xi

*

0ˆdz zδ (z) = 0, (i = 1, 2) .

Portanto,

Ia =Ma2

12

2 −1 0−1 2 00 0 4

.

Observa-se que, de acordo com (3.20a), o momentum angular da placa somente será paralelo àvelocidade angular se ω = ωz, ou seja, se o eixo de rotação for z.

Para obter-se agora os momentos e eixos principais de inércia, primeiro aplica-se (3.28b), aqual resulta na equação

det

2− λ −1 0−1 2− λ 00 0 4− λ

= 0 =⇒ (4− λ)[(2− λ)

2 − 1]

= 0, onde λ =12

Ma2I,

λ = 2± 1

λ = 4=⇒

I1 =

Ma2

12

I2 =1

4Ma2

I3 =1

3Ma2.

Portanto,

Ib =Ma2

12

1 0 00 3 00 0 4

mostra os momentos principais de inércia.

Para determinar os eixos principais, retorna-se a (3.28a) e emprega-se cada momento suces-sivamente:

1. Para I1 = 112Ma2, sendo λ1 = 1:

(2− λ1) ξx − ξy = 0

−ξx + (2− λ1) ξy = 0

(4− λ1) ξz = 0

ξ1,z=0−−−−→ ξ1,x − ξ1,y = 0⇒ ξ1,x = ξ1,y.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 124: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

118 3.7. Diagonalização do tensor de inércia

Ou seja,

ξ1 = ξ1,x (x+ y)|ξ|=1−−−→ 2ξ2

1,x = 1 =⇒ ξ1 =1√2

(x+ y) .

2. Para I2 = 14Ma2, sendo λ2 = 3,

−ξ2,x − ξ2,y = 0

−ξ2,x − ξ2,y = 0

ξ2,z = 0

=⇒ ξ2,x = −ξ2,y =⇒ ξ2 =1√2

(−x+ y) .

3. Para I3 = 13Ma2, sendo λ3 = 4,

−2ξ3,x − ξ3,y = 0

−ξ3,x − 2ξ3,y = 0

(4− λ3) ξz = 0

ξ3,x=ξ3,y=0=======⇒ ξ3,z 6= 0 =⇒ ξ3 = z.

Os eixos principais, correspondendo a uma rotação de S por 45 em torno de z, são mostradosna figura 3.13(b). Nota-se que a escolha de sinais em ξ2 foi feita para que o novo sistema continuedextrógiro. Observa-se que agora L ‖ ω, caso ω = ωiξi.

SIMETRIAS E EIXOS PRINCIPAIS DE INÉRCIA

A identificação dos eixos principais de inércia de um corpo rígido é simplificada caso o corpopossua algum tipo de simetria espacial. Essa simetria pode ser de diversos tipos; neste textosomente serão consideradas as simetrias planar ou axial.

Definição 3.1 (Simetria planar). Seja um corpo com uma distribuição de massa ρ = ρ (r).Empregando-se um sistema de coordenadas Cartesianas, diz-se que o corpo possui simetriaplanar se existir uma orientação do sistema tal que

ρ (x1, x2, x3) = ρ (x1, x2,−x3) .

Neste caso, diz-se que o plano (x1 − x2) é o plano de simetria do corpo.

Para um corpo que possui simetria planar, vale o seguinte lema.

Lema 3.1 (Plano de simetria). Se um corpo rígido possui um plano de simetria que contém aorigem do referencial do corpo, então um eixo principal de inércia é perpendicular a esse plano.

A outra simetria importante refere-se a uma simetria axial.

Definição 3.2 (Simetria axial). Seja um corpo com uma distribuição de massa ρ = ρ (r).Empregando-se um sistema de coordenadas cilíndricas r, φ, z, diz-se que o corpo possui si-metria axial se existir uma orientação do sistema tal que

ρ (r, φ, z) = ρ (r, z) .

Neste caso, diz-se que o eixo z é o eixo de simetria do corpo.

Para corpos com simetria axial, vale o seguinte lema.

Lema 3.2 (Eixo de simetria). Se um corpo rígido possui um eixo de simetria passando pelaorigem do referencial do corpo, então este eixo é um eixo principal de inércia. Quaisquer dois eixosmutuamente ortogonais contidos no plano perpendicular ao eixo de simetria são também eixosprincipais de inércia e os momentos de inércia correspondentes são iguais entre si.

O exemplo a seguir aplica os lemas acima.

Problema 3.1 (Momentos e eixos principais de inércia de um cubo homogêneo). Fazendo-sereferência novamente ao cubo abordado no exercício 3.1, verifica-se que o mesmo possui maisde um plano de simetria, para os quais valem o lema 3.1. Os planos determinados pelos pontos

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 125: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 119

Figura 3.14: Planos de simetria de um cubo ho-mogêneo em relação a um referencial cuja ori-gem está no vértice e com eixos ao longo dasarestas.

OABC ou ODBE, vistos na figura 3.14, são dois desses planos de simetria. Assim um eixoperpendicular a qualquer um desses planos será um eixo principal de inércia do cubo.

Para obter-se fórmulas genéricas que fornecerão os momentos e eixos principais de inércia,parte-se da matriz obtida no exercício 3.1 para obter-se a equação característica a partir de(3.28b). Então, sendo λ = I/Mb2,

det

2/3− λ −1/4 −1/4−1/4 2/3− λ −1/4−1/4 −1/4 2/3− λ

= 0.

O valor de um determinante não é alterado pela adição (ou subtração) de quaisquer pares delinhas (ou colunas) da matriz. Então, subtraindo a primeira linha da segunda, resulta

det

2/3− λ −1/4 −1/4−11/12 + λ 11/12− λ 0−1/4 −1/4 2/3− λ

= 0 =⇒(

11

12− λ)

det

2/3− λ−1/4 −1/4−1 1 0−1/4 −1/4 2/3− λ

= 0,

sendo que este último resultado é outra propriedade de determinantes. Calculando-se estedeterminante agora, resulta(

11

12− λ)

1

4

(1

4+

1

4

)−(

2

3− λ)[(

2

3− λ)− 1

4

]= 0,(

11

12− λ)[(

2

3− λ)2

− 1

4

(2

3− λ)− 1

8

]= 0,

(11

12− λ)2(

1

6− λ)

= 0.

Portanto, os momentos principais de inércia são:

I1 = I2 =11

12Mb2, I3 =

1

6Mb2.

Para a obtenção dos eixos principais, retorna-se a (3.28a), escrevendo-se esta como o sistema(2/3− λ) ξ1 − (1/4) ξ2 − (1/4) ξ3 = 0

− (1/4) ξ1 + (2/3− λ) ξ2 − (1/4) ξ3 = 0

− (1/4) ξ1 − (1/4) ξ2 + (2/3− λ) ξ3 = 0,

sendo que uma destas equações sempre pode ser obtida a partir de alguma combinação dasoutras duas. Substituindo primeiro o momento I3 nas duas primeiras equações do sistema,resultam

(1/2) ξ3,1 − (1/4) ξ3,2 − (1/4) ξ3,3 = 0

− (1/4) ξ3,1 + (1/2) ξ3,2 − (1/4) ξ3,3 = 0=⇒

2ξ3,1 − ξ3,2 − ξ3,3 = 0

−ξ3,1 + 2ξ3,2 − ξ3,3 = 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 126: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

120 3.8. A Lagrangiana de um corpo rígido

Subtraindo agora as duas equações, resulta ξ3,1 = ξ3,2. Substituindo este resultado na primeira,resulta finalmente

ξ3,1 = ξ3,2 = ξ3,3|ξ3|=1====⇒ ξ3 =

1√3

( e1 + e2 + e3) .

Substituindo agora I1 = I2, nas equações originais, resulta em qualquer uma ξ1 + ξ2 + ξ3 = 0,onde agora ξi = ξ1,i ou ξ2,i. Ou seja, pode-se escrever ξ = ξ1 e1 + ξ2 e2 − (ξ1 + ξ2) e3. Usando acondição de normalização, ∣∣∣ξ∣∣∣ = 1⇒ ξ2

1 + ξ22 + (ξ1 + ξ2)

2= 1.

Este resultado mostra que ainda há um parâmetro livre (ξ1 ou ξ2), cujo valor irá determinara orientação de um dos eixos principais restantes. Escolhendo-se arbitrariamente ξ2,1 = ξ2,2,resulta então

ξ2 =1√6

( e1 + e2 − 2 e3) .

O vetor de base restante(ξ1

)será finalmente obtido pela regra dextrógira

ξ1 = ξ2 × ξ3 =1√2

( e1 − e2) .

Na figura 3.14, observa-se que ξ1 é perpendicular ao plano de simetria formado por OABC,enquanto que ξ2 e ξ3 estão contidos neste plano. Uma outra escolha de parâmetros resultaem um novo conjunto de eixos principais, sendo um destes perpendicular ao plano de simetriaODBE.

3.8 A LAGRANGIANA DE UM CORPO RÍGIDO

Será agora construída a Lagrangiana de um corpo rígido a partir das definições e proprieda-des anteriormente apresentadas. A descrição da evolução dinâmica do corpo rígido, como umsistema de muitas partículas, irá levar agora em consideração tanto a rotação instantânea emtorno de um determinado eixo quanto a translação do objeto como um todo.

Neste caso, o número total de graus de liberdade do corpo aumenta para 06 (seis), trêsdestes correspondentes à rotação do corpo em torno de um eixo instantâneo e os outros trêscorrespondentes à translação do centro de massa do sistema. Isto é garantido pelo teorema deChasles, o qual é apresentado sem demonstração.

Teorema 3.4 (Chasles). O deslocamento mais geral possível de um corpo rígido é uma translaçãoacompanhada de uma rotação. O eixo de rotação pode ser escolhido de tal modo que a tranlaçãoseja paralela e este eixo.

Para a descrição da dinâmica do corpo, será escolhido o formalismo Lagrangiano como opreferencial. Em seguida, será feita então a dedução da Lagrangiana “genérica” de um corporígido, levando em conta tanto a rotação quanto a translação deste.

Neste ponto é necessário enfatizar novamente que as equações de Euler-Lagrange, da mesmaforma que as Leis de Newton, descrevem corretamente a evolução dinâmica do sistema somentese as quantidades forem medidas com relação a referenciais inerciais. Por esta razão, um cui-dado especial deve ser tomada para cada termo da Lagrangiana.

3.8.1 A ENERGIA CINÉTICA

Para a derivação da energia cinética total (translacional e rotacional) de um corpo rígido, énecessário retomar-se a discussão envolvendo os referenciais S′ (inercial ou fixo) e S (corpo).A figura 3.15 ilustra o corpo rígido, os referenciais S′ e S e o centro de massa (CM) do corpo.Ilustra-se também o eixo instantâneo de rotação (curva tracejada), cuja direção e sentido sãodeterminados pelo vetor unitário n.

Sendo r′k a posição instantânea da k-ésima partícula do sistema, a sua energia cinética total,medida a partir do referencial fixo S′ é

T =1

2

∑k

mkr′2k =

1

2

∑k

mkv′2k ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 127: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 121

O′

x′1

x′2

x′3

S ′

× CM

x1

x2

x3

S

O

r′k

rO

R′

R

k

rk

n

Figura 3.15: Representação de um corpo rígido com os referenciais S′ (fixo) e S (corpo). Ilustram-se tambéma posição do centro de massa (CM) do corpo e o eixo instantâneo de rotação (n) sobre O.

onde v′k = dr′k/dt. Na figura 3.15, observam-se as seguintes identidades vetoriais:

r′k = rO + rk

R′ = rO +R

MR′.=∑k

mkr′k

MR.=∑k

mkrk

M : massa total do sistema.

r′k : posição da k-ésima partícula em relação a S′.

rk : posição da k-ésima partícula em relação a S.

rO : posição da origem de S em relação a S′.

R′ : posição do centro de massa em relação a S′ .

R : posição do centro de massa em relação a S.

Derivando r′k em relação ao tempo,

v′k = vO|S′ + rk|S′ V ′ = vO|S′ + R∣∣∣S′,

sendo ressaltado que as derivadas são realizadas em relação a S′. Substituindo as taxa tem-porais rk e R conforme medidas em relação ao referencial S, o qual é não inercial, torna-senovamente necessário o emprego da identidade (3.13), de acordo com a discussão realizada naseção 3.2.3. Por consequência, estas quantidades são dadas por

rk = ω× rk, R = ω ×R.

Desta maneira, a energia total do corpo rígido pode ser escrita

T =1

2

∑k

mk (vO + rk)2

=1

2

∑k

mkv2O +

1

2

∑k

mkr2k +

∑k

mkvO · (ω× rk) ,

T =1

2Mv2

O +1

2

∑k

mkr2k +MvO · (ω×R) .

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 128: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

122 3.8. A Lagrangiana de um corpo rígido

O segundo termo na expressão acima pode ser manipulado, lembrando da relação (3.20c) entreo momentum angular e o tensor de inércia do corpo rígido:

∑k

mkr2k =

∑k

mkrk · rk =∑k

mkrk · (ω× rk) = ω ·(∑

k

mk (rk × rk)

)= ω ·L = ω·

↔I ·ω.

Ou seja, como já havia sido obtido anteriormente, este termo é justamente a energia cinéticarotacional sobre o ponto O.

Portanto,

T =1

2Mv2

O +1

2ω·↔IO ·ω +MvO · (ω×R) , (3.29a)

onde↔IO enfatiza que o tensor de inércia é obtido em relação ao ponto O.

Uma expressão mais conveniente para a energia cinética é obtida introduzindo-se a posiçãodo centro de massa do corpo através das identidades

rO = R′ −R vO = V ′ − R = V ′ − ω ×R.

Substituindo as mesmas em (3.29a) resulta

T =1

2M(V ′ − ω ×R

)2+

1

2ω·↔IO ·ω +M

(V ′ − ω ×R

)· (ω×R) ,

T =1

2MV ′2 +

1

2ω·↔IO ·ω −

1

2M (ω ×R)

2. (3.29b)

Se agora a origem do referencial do corpo for posicionada sobre o seu centro de massa(O = CM), observa-se que R = 0 e, neste caso, a energia cinética toma a sua expressão maissimples

T =1

2MV ′2 +

1

2ω·↔I CM ·ω, (3.29c)

onde agora↔I CM salienta que o tensor de inércia é obtido em relação ao centro de massa.

O resultado (3.29c) mostra que quando a origem do referencial do corpo situa-se sobre ocentro de massa do mesmo, a energia cinética total é dividida em um termo translacional, queleva em conta o movimento do centro de massa em relação a S′, mais um termo rotacional, queleva em conta a rotação instantânea do corpo sobre o eixo n, o qual passa pelo centro de massa.Este resultado é um caso particular da expressão (1.9), específica para um corpo rígido.

Cada uma das expressões (3.29a-c) pode ser empregada, dependendo do corpo, das forçasexternas aplicadas, bem como dos vínculos impostos ao mesmo.

3.8.2 A ENERGIA POTENCIAL

De acordo com o resultado (1.14), a energia potencial total de um sistema de partículas podeser escrito como

U (rk , rk) = U (ext) (rk , rk) +∑k,`k<`

U (rk`).= U (ext) + U (int),

onde U (ext) é a energia potencial externa, devida ao movimento das partículas do sistema emum campo de forças externas ao mesmo, e U (int) é a energia potencial interna, i. e., devida àsinterações entre as partículas do sistema. Como em um corpo rígido as posições relativas daspartículas são sempre constantes por hipótese, a energia potencial interna também permanececonstante durante a evolução dinâmica do corpo e é, por conseguinte, usualmente ignorada naconstrução da Lagrangiana.

Assim, somente a energia potencial U (ext), devida às forças externas potenciais, que sãocomputadas nas equações de Euler-Lagrange de um corpo rígido. Para esta, é usualmenteassumido ser possível expressá-la como a soma de dois termos:

U (ext) = UCM

(R′)

+ Urot (R) , (3.30a)

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 129: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 123

sendo UCM

(R′)

a parte que depende da posição do centro de massa do corpo e Urot (R) a parteque depende da orientação instantânea do mesmo (determinada pela matriz de rotação R) emrelação ao campo de forças externas.

Uma situação bastante comum onde somente o termo UCM

(R′)

existe ocorre quando se de-seja descrever o movimento de um corpo rígido devido ao seu peso. Neste caso é fácil verificarque a expressão (3.30a) realmente fornece a energia potencial total do corpo. De acordo com afigura 3.15, se o eixo x′3 está orientado verticalmente e se é tomado Ug (x′3 = 0) = 0,

Ug =∑k

mkgx′k,3 =

(∑k

mkx′k,3

)g =⇒ Ug = UCM (R′3) = MgR′3. (3.30b)

Ou seja, a energia potencial gravitacional do corpo rígido é idêntica ao potencial de uma partículacom a massa total do corpo, situada na posição do seu centro de massa.

Em certas situações, além dos termos de energias cinética e potencial discutidos nesta seção,pode ser também necessário incluir na Lagrangiana do corpo rígido termos adicionais. Essestermos podem se referir, por exemplo, às ações de forças generalizadas dissipativas e/ou mo-trizes que também atuam sobre o corpo. Isto pode ser imprescindível se o corpo rígido estiverse deslocando no interior de um fluido viscoso, por exemplo, em cuja situação surgirão diversasforças relacionadas com a geometria do corpo e seu movimento de rotação. Nestes casos, asequações de Euler-Lagrange devem ser modificadas conforme a discussão realizada na seção1.7.2.

Usualmente, a construção da Lagrangiana de um corpo rígido deve levar em conta também osvínculos impostos sobre o mesmo. A natureza desses vínculos depende do problema em estudo,mas existe um tipo de vínculo muito comum que ocorre quando o movimento do corpo envolveo contato com uma superfície. Este vínculo será discutido na seção 3.8.3.

3.8.3 A CONDIÇÃO DE ROLAMENTO

Sempre que um corpo rígido se desloca em contato com alguma superfície (também rígida), orolamento do corpo pode ocorrer devido às forças de atrito entre os objetos. Esta situação estáilustrada na figura 3.16.

Superfície de

contato

C

O′

x′1

x′2

x′3

S ′ × CM

x1

x3

S

O

rO

R′

n

x2rC

rCM,Cr′C

Figura 3.16: Representação de um corpo rígido que se desloca em contato com uma superfície. O ponto C estáinstantaneamente em repouso em relação à superfície e ao referencial fixo S′.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 130: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

124 3.8. A Lagrangiana de um corpo rígido

A dinâmica de um corpo rígido que está em contato com uma superfície áspera será discutidaa partir das seguintes suposições:

1. Não ocorrem deformações nem do corpo nem da superfície, mesmo que existam forças decontato.

2. A superfície de contato está em repouso em relação ao referencial inercial S′.

3. Existe pelo menos um ponto do corpo rígido que está sempre em contato com a superfície.

4. No ponto de contato (C) ocorre a condição de rolamento sem deslizamento, isto é, o ponto Cestá instantaneamente em repouso sobre a superfície e, portanto, também em relação a S′.A razão física para o rolamento está na força de atrito estático entre o corpo e a superfície.

Com base nas condições acima impostas e na inspeção das quantidades definidas na figura3.16, as seguintes relações podem ser estabelecidas,

r′C = rO + rC = R′ + rCM,C .

A taxa de variação temporal de r′C , medida a partir de S′, fica então

r′C = vO + rC = V ′ + rCM,C .

Substituindo as expressões para rC e rCM,C que resultam a partir da aplicação do operador(3.13), i. e., rC = ω × rC e rCM,C = ω × rCM,C , sendo que esta última se deve ao fato de que oponto C está em repouso também em relação a CM, resulta

r′C = vO + ω× rC = V ′ + ω× rCM,C .

Porém, como o ponto C está em repouso em relação a S′, impõe-se r′C = 0, resultando entãoduas condições equivalentes

vO + ω× rC = 0, ou V ′ + ω× rCM,C = 0. (3.31)

Em certos casos simples, a condição de rolamento (3.31) resulta em um vínculo holônomo.Este é o caso, por exemplo, do cilindro rolando sobre um plano inclinado, abordado no exercício1.3. Porém, geralmente a condição de rolamento resulta em um vínculo não holônomo. Feliz-mente, os vínculos são lineares nas velocidades, o que permite o uso do método desenvolvido naseção 1.8.4.

Serão apresentados agora alguns exemplos de aplicação do formalismo desenvolvido nestaseção.

Exemplo 3.2 (O “iô-iô”). Uma corda é presa ao teto e enrolada em torno de um cilindro homo-gêneo de raio R e massa M . No instante t = 0 o cilindro é liberado e passa a cair sob a açãoda força da gravidade e da tensão da corda, a qual provoca a rotação do disco do cilindro. Estasituação está representada na figura 3.17.

A resolução da dinâmica deste corpo inicia pelo cálculo da sua matriz de inércia. O referencialde corpo mais adequado para este sistema está representado na figura 3.17. O referencial S temsua origem no centro geométrico do cilindro (o centro de massa), com o eixo z orientado ao longodo eixo do cilindro. Neste caso, z é um eixo de simetria e, de acordo com o Lema 3.2, o eixoz é um dos eixos principais de inércia. Além disso, os eixos x e y também são eixos principaise os seus momentos de inércia são os mesmos. Portanto, a matriz de inércia em relação a S édiagonal e para o cálculo de seus momentos principais é conveniente o emprego de um sistemade coordenadas cilíndrico (r, φ, z). Neste caso, assumindo que a espessura do cilindro é h, suadensidade é ρ = M/πR2h, e de (3.19b) resulta

Ix = Iy =

ˆV

d3r(y2 + z2

)ρ = ρ

ˆ R

0

dr r

ˆ 2π

0

ˆ h/2

−h/2dz(r2 sen2 φ+ z2

)=

1

4M

(R2 +

h2

3

)≈ 1

4MR2

Iz =

ˆV

d3r(x2 + y2

)ρ (r) = ρ

ˆ R

0

dr r

ˆ 2π

0

ˆ h/2

−h/2dz r2 =

1

2MR2,

sendo que o valor aproximado para Ix é adotado porque h R. Portanto, a matriz de inércia é

I =1

4MR2

1 0 00 1 00 0 2

.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 131: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 125

x

y

S

C

y’

φ

Figura 3.17: Uma corda presa ao teto e enrolada emtorno do cilindro cria uma força de tensão que pro-voca a rotação do disco do cilindro à medida que omesmo cai sob a ação da gravidade.

Para a construção da Lagrangiana deste sistema, parte-se da expressão (3.29c) para a suaenergia cinética total. Para a determinação da parte rotacional, observa-se que enquanto o iô-iôestá caindo, o eixo de rotação do disco está sempre na direção e sentido en = −z (com z′ = z);ou seja, ω = −φz. Portanto,

ω·↔I ·ω =

3∑i,j=1

Iijωiωj = φ23∑

i,j=1

Iijδi3δj3 = Izφ2 =⇒ Trot =

1

2Izφ

2.

Além disso, a velocidade do centro de massa do disco é V ′ = y′y′. Assim, a energia cinéticatotal do sistema é

T =1

2My′2 +

1

2Izφ

2.

Já para a energia potencial, esta será somente a energia potencial gravitacional, que pode serescrita como

U = −Mgy′.

Contudo, existe um vínculo holônomo entre y′ e φ. Este vínculo pode ser construído de duasmaneiras equivalentes. Primeiro, como a corda está sempre em repouso em relação a S′, entãoo ponto C ilustrado na figura 3.17 também está momentaneamente em repouso, o que permiteo emprego da condição de rolamento (3.31), a qual fornece

V ′ + ω× rCM,C = 0⇒ y′y′ +(−φz

)× (−Rx)

y=−y′−−−−→ y′ −Rφ = 0⇒ y′ −Rφ = 0,

sendo que a última expressão foi obtida após uma integração. A segunda dedução parte do fatode que quando o disco gira por um ângulo ∆φ, a extensão do arco compreendido na sua bordaé simplesmente a distância percorrida durante a sua queda; ou seja, R∆φ = ∆y′, o que leva àmesma expressão para o vínculo.

Assim, a Lagrangiana do sistema pode ser escrita como

L y′, y′ =1

2

(M +

IzR2

)y′2 +Mgy′ =

3

4My′2 +Mgy′.

A equação de Euler-Lagrange e a equação de movimento são:

∂L

∂y′− d

dt

∂L

∂y′= 0 =⇒Mg − 3

2My′ = 0⇒ y′ =

2

3g.

Ou seja, o centro de massa do disco cai com 2/3 da aceleração da gravidade.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 132: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

126 3.8. A Lagrangiana de um corpo rígido

De acordo com (3.20c), o vetor momentum angular do disco é

L =↔I ·ω = −φ

3∑i,j=1

Iij ei ( ej · e3) = −φ3∑i=1

Iiz ei = −Izφz.

Usando o vínculo, resulta que

φ =2

3

g

R.

Portanto, de acordo com (3.17), uma vez que o torque sobre o disco é provocado pela força detensão da corda,

N (e) = rCM,C × T = −RT x× y = −RT z.

Então, a tensão da corda resulta

dL

dt= N (e) =⇒ −Izφz = −RT z =⇒ T =

1

3Mg.

Exemplo 3.3 (O pêndulo físico). Um pêndulo físico é um corpo rígido que oscila devido ao seupróprio peso em torno de um eixo horizontal que não passa pelo centro de massa do corpo, comoilustrado na figura 3.18.

Figura 3.18: Um pêndulo físico. O corpo rí-gido oscila em torno de um eixo que passapor O devido à força gravitacional que atuasobre o seu centro de massa.

A Lagrangiana deste problema é construída da seguinte maneira. Colocando-se a origem doreferencial do corpo em O e orientando o eixo z, por exemplo, ao longo da reta OCM, o mesmoponto O é a origem do referencial fixo e o eixo z′ está orientado ao longo da reta vertical. Nestecaso, a energia cinética do corpo é dada por (3.29a),

T =1

2ω·↔I ·ω,

um vez que vO = 0; ou seja, a energia cinética é puramente rotacional, como esperado de umcorpo rígido que gira com um ponto fixo. Se os referenciais forem orientados de tal forma queen = x = x′, então ω = θx e

T =1

2Ixxθ

2.

Portanto, basta conhecer um componente do tensor de inércia do corpo.A energia potencial gravitacional pode ser escrita, de acordo com (3.30b), como

Ug = −MgZ ′.

Mas existe um vínculo evidente:Z ′ = L cos θ.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 133: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 127

Portanto, a Lagrangiana do pêndulo físico é simplesmente

Lθ, θ

=1

2Ixxθ

2 +MgL cos θ,

a qual é muito semelhante à Lagrangiana de um pêndulo físico (exemplo 1.15).A equação de Euler-Lagrange e a equação de movimento ficam então

∂L

∂θ− d

dt

∂L

∂θ= 0 =⇒ θ +

MgL

Ixxsen θ = 0.

A frequência angular para oscilações de pequena amplitude é, portanto,

Ω2 =MgL

Ixx.

Exemplo 3.4 (Pêndulo duplo semifísico). Um corpo rígido é preso em um ponto de sua super-fície a uma barra fina, leve e rígida, de tal forma que o corpo pode oscilar em torno deste pontocomo um pêndulo. A outra extremidade da barra é então presa a um ponto fixo, de tal formaque a mesma também pode oscilar como um pêndulo. Esta situação está ilustrada na figura3.19.

x

y

ω

`R′

y′

x′

Figura 3.19: Um pêndulo duplo semifísico. Ocorpo rígido oscila em torno de um eixo queo conecta a uma barra leve e rígida. A ou-tra extremidade da barra é conectada a umponto fixo e também pode oscilar como umpêndulo.

Na figura estão representados o referencial do corpo (eixos x e y) e o referencial fixo (eixosx′ e y′). Por conveniência, é assumido que o vetor R está no plano x − y, i. e., R = (x, y), e asoscilações ocorrem sempre nos planos ilustrados; ou seja,

ω = φz.

De acordo com os referenciais adotados, a expressão mais conveniente para a energia cinéticatotal do corpo é (3.29b),

T =1

2MV ′2 +

1

2ω·↔IO ·ω −

1

2M (ω ×R)

2,

sendo V ′ =(X ′, Y ′

)a velocidade do centro de massa.

Para a determinação dos vínculos, observa-se na figura quex′ = cosφx− senφy

y′ = senφx+ cosφy=⇒

x = cosφx′ + senφy′

y = − senφx′ + cosφy′.

Então,

R = xx+ yy = (x cosφ− y senφ) x′ + (x senφ+ y cosφ) y′ = R[cos (α+ φ) x′ + sen (α+ φ) y′

].

Dado tambémrO = x′Ox

′ + y′Oy′ = ` cos θx′ + ` sen θy′,

observa-se que

R′ = rO +R = (` cos θ + x cosφ− y senφ) x′ + (` sen θ + x senφ+ y cosφ) y′.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 134: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

128 3.9. Os ângulos de Euler

Portanto, X ′ = ` cos θ +R cos (φ+ α)

Y ′ = ` sen θ +R sen (φ+ α)=⇒

X ′ = −` sen θθ −R sen (φ+ α) φ

Y ′ = ` cos θθ +R cos (φ+ α) φ,

V ′2 = X2 + Y 2 = `2θ2 +R2φ2 + 2`R cos (θ − φ− α) θφ.

Finalmente,ω ×R = φz× (xx+ yy) = φ (xy − yx) =⇒ (ω ×R)

2= R2φ2,

eω·↔IO ·ω = Iφ2,

onde I = (IO)zz.Portanto,

T =1

2M`2θ2 +

*R2φ2 + 2` [x cos (θ − φ) + y sen (θ − φ)] θφ

+

1

2Iφ2 −

*1

2MR2φ2,

T =1

2M`2θ2 +

1

2Iφ2 +M`R cos (θ − φ− α) θφ.

Já para a energia potencial, a expressão (3.30b) resulta em

Ug = −MgX ′ =⇒ Ug = −Mg [` cos θ +R cos (φ+ α)] .

Portanto, a Lagrangiana do sistema é

L =1

2M`2θ2 +

1

2Iφ2 +M`R cos (θ − φ− α) θφ+Mg [` cos θ +R cos (φ+ α)] ,

e as equações de movimento ficam ∂L

∂θ− d

dt

∂L

∂θ= 0

∂L

∂φ− d

dt

∂L

∂φ= 0,

`θ +R cos (θ − φ− α) φ+R sen (θ − φ− α) φ2 + g sen θ = 0

Iφ+M`R cos (θ − φ− α) θ −M`R sen (θ − φ− α) θ2 +MgR sen (φ+ α) = 0.

Dentre os casos particulares, ressaltam-se:

1. Condição de equilíbrio: θ = φ = 0, resultando em

θ0 = 0, φ0 = −α.

2. Caso ` = α = 0, resultando emIφ+MgR senφ = 0,

a qual é a equação de movimento de um pêndulo físico.

3.9 OS ÂNGULOS DE EULER

Ao longo da seção 3.1 discutiu-se longamente a respeito da matriz de rotação que relacionaas observações feitas em um determinado instante de tempo entre o referencial do corpo S e oreferencial inercial S′′. Dentre as propriedades desta matriz, destacou-se que existem somentetrês parâmetros (três angulos) livres que determinam todos os seus elementos. Embora existaminfinitas maneiras de se definir esses ângulos, uma construção que é com frequência empregadano tratamento da dinâmica de corpos rígidos são os ângulos de Euler, os quais serão agoradiscutidos.

Os ângulos de Euler são definidos a partir de uma rotação genérica do sistema de coorde-nadas que parte de uma orientação inicial (correspondente ao referencial S′′) e resulta em umaorientação final (o referencial S), envolvendo um referencial intermediário. Essa transformaçãoserá, portanto, construída em três etapas, as quais estão ilustradas na figura 3.20.

Partindo-se de um sistema de coordenadas inicial, o qual corresponde ao referencial S′ dafigura 3.20(a), as rotações envolvidas são as seguintes.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 135: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 129

Linha nodal

ωφ

ωθ

ωφ

ωφ

ωθ

ωψ

Figura 3.20: Os ângulos de Euler, empregados para implementar uma rotação do referencial S′ ao referencialS. (a) Primeira rotação: sentido anti-horário por um ângulo φ em torno do eixo x′3. (b) Segunda rotação:sentido anti-horário por um ângulo θ em torno do eixo x′′1 . (c) Terceira rotação: sentido anti-horário por umângulo ψ em torno de x′′′3 . Observam-se também as velocidades angulares ωφ, ωθ e ωψ.

1. ROTAÇÃO EM TORNO DO EIXO x′3. Empregando-se a notação matricial introduzida naseção 3.1.1, dados os vetores de base de S′:

e′1, e

′2, e

′3

e as coordenadas x′1, x′2, x′3, a primeira

rotação irá promover a transformação S′ −→ S′′, a qual consiste na rotação por um ângulo φ, nosentido anti-horário, em torno do eixo x′3. Ou seja, de (3.4a),

e′′ = Rφe′, r′′ = Rφr

′,

ondee′′1 , e

′′2 , e

′′3

são os vetores da base de S′′ e x′′1 , x′′2 , x′′3 suas coordenadas. A matriz Rφ é

dada por (3.9),

Rφ =

cosφ senφ 0− senφ cosφ 0

0 0 1

, (0 6 φ < 2π) .

Esta rotação está representada na figura 3.20(a).

2. ROTAÇÃO EM TORNO DO EIXO x′′1 . Realiza-se agora a transformação S′′ −→ S′′′ porintermédio de uma rotação, no sentido anti-horário, por um ângulo θ em torno do eixo x′′1 . Ouseja, de (3.4a) e (3.9),

e′′′ = Rθe′′, r′′′ = Rθr

′′, sendo

Rθ =

1 0 00 cos θ sen θ0− sen θ cos θ

, (0 6 θ 6 π) ,

ondee′′′1 , e

′′′2 , e

′′′3

são os vetores da base de S′′′ e x′′′1 , x′′′2 , x′′′3 suas coordenadas. Esta rotação

está representada na figura 3.20(b).

3. ROTAÇÃO EM TORNO DO EIXO x′′′3 . Por fim, realiza-se a transformação S′′′ −→ S,implementada por uma rotação, no sentido anti-horário, por um ângulo ψ em torno do eixo x′′′3 .De (3.4a) e (3.9), resulta então

e = Rψe′′′, r = Rψr

′′′, sendo

Rψ =

cosψ senψ 0− senψ cosψ 0

0 0 1

, (0 6 ψ < 2π) ,

ondee1, e2, e3

são os vetores da base de S e x1, x2, x3 suas coordenadas. Esta rotação está

representada na figura 3.20(c).

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 136: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

130 3.9. Os ângulos de Euler

Nas figuras 3.20(b) e (c) observa-se também a linha nodal, ou linha dos nodos, a qual corres-ponde a uma reta comum aos planos x′1 − x′2 e x1 − x2.

A construção dos ângulos de Euler pode ser interpretada como uma rotação genérica na qualum dos ângulos (φ) pertence ao referencial inercial (S′), outro ângulo (ψ) pertence ao referencialdo corpo (S), enquanto que o terceiro ângulo (θ) varia entre ambos os referenciais.

A transformação completa S′ −→ S é realizada, portanto, por

e = REulere′, r = REulerr

′, (3.32a)

sendo queREuler = RψRθRφ.

Os elementos da matriz REuler são:

R11 = cosψ cosφ− cos θ senφ senψ R21 = − senψ cosφ− cos θ senφ cosψ

R12 = cosψ senφ+ cos θ cosφ senψ R22 = − senψ senφ+ cos θ cosφ cosψ

R13 = senψ sen θ R23 = cosψ sen θ

R31 = sen θ senφ

R32 = − sen θ cosφ

R33 = cos θ.

(3.32b)

A transformação inversa S −→ S′ é dada então por

e′ = REulere, r′ = REulerr, sendo REuler = RφRθRψ. (3.32c)

Exercício 3.4. (a) Dados os ângulos de Euler definidos acima, encontre a nova orientação dosistema de coordenadas após serem realizadas as rotações φ = 0, θ = 45 e ψ = 90.

(b) Encontre a nova orientação invertendo as rotações, i. e., θ ↔ ψ.

Solução. (a) Neste caso, Rφ = I3 e

Rθ =

1 0 00 1/

√2 1/

√2

0−1/√

2 1/√

2

, Rψ =

0 1 0−1 0 00 0 1

.

Então, os novos vetores de base são:

e = RψRθe′, e1

e2

e3

= Rψ

1 0 00 1/

√2 1/

√2

0−1/√

2 1/√

2

e′1e′2e′3

=

0 1 0−1 0 00 0 1

e′11/√

2 e′2 + 1/√

2 e′3−1/√

2 e′2 + 1/√

2 e′3

=

1/√

2 e′2 + 1/√

2 e′3− e′1

−1/√

2 e′2 + 1/√

2 e′3

.

Ou seja,

e1 =1√2

(e′2 + e′3

), e2 = − e′1, e3 =

1√2

(− e′2 + e′3

).

Os referenciais S′ (inicial) e S (final) estão representados na figura 3.21.(b) Invertendo a ordem das rotações, resulta e1

e2

e3

= Rθ

0 1 0−1 0 00 0 1

e′1e′2e′3

=

1 0 00 1/

√2 1/

√2

0−1/√

2 1/√

2

e′2− e′1e′3

=

e′2−1/√

2 e′1 + 1/√

2 e′31/√

2 e′1 + 1/√

2 e′3

.

A nova orientação é bastante distinta da rotação anterior.

3.9.1 VELOCIDADE ANGULAR EM TERMOS DOS ÂNGULOS DE EU-LER

Uma quantidade adicional, cuja dedução se faz necessária, é a expressão do vetor velocidadeangular em termos dos ângulos de Euler. Esta quantidade é necessária quando a Lagrangianado corpo é construída empregando-se os ângulos de Euler.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 137: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 131

S’

S

Figura 3.21: Referencial inicial (S′) e refe-rencial final (S) após realizadas as rotaçõespelos ângulos de Euler θ = 45 e ψ = 90.

Conforme foi definido em (3.14), a direção e o sentido de ω são determinados pela orientaçãodo eixo de rotação instantânea (vetor en) do corpo. Na construção dos ângulos de Euler, essarotação instantânea é composta por três rotações simultâneas, como ilustrado na figura 3.20.Isto implica que a velocidade angular total é a resultante da combinação de três vetores, ωφ, ωθe ωψ, definidos de tal forma que:

ωφ : taxa de variação temporal de φ em torno de x′3,

ωθ : taxa de variação temporal de θ em torno de x′′1 ,

ωψ : taxa de variação temporal de ψ em torno de x′′′3 .

Portanto,

ωφ = φ e′3, ωθ = θ e′′1 , ωψ = ψ e′′′3 .

Mas,

e′′ = Rφe′ =⇒ e′′1 =

3∑j=1

(Rφ)1j e′j = cosφ e′1 + senφ e′2

e′′′ = Rθe

′′

e′′ = Rφe′,

=⇒e′′′3 =

3∑j=1

(Rθ)3j e′′j = − sen θ e′′2 + cos θ e′′3

= sen θ senφ e′1 − sen θ cosφ e′2 + cos θ e′3.

Ou seja,

ωφ = φ e′3, ωθ = cosφθ e′1 + senφθ e′2, ωψ = sen θ senφψ e′1 − sen θ cosφψ e′2 + cos θψ e′3.

Como a velocidade angular total é a composição destes vetores,

ω = ωφ + ωθ + ωψ,

resulta então que

ω =(θ cosφ+ ψ sen θ senφ

)e′1 +

(θ senφ− ψ sen θ cosφ

)e′2 +

(φ+ ψ cos θ

)e′3 (3.33a)

é o vetor velocidade angular com componentes medidos pelo referencial fixo S′.Realizando a transformação inversa S −→ S′, obtém-se

ω =(φ sen θ senψ + θ cosψ

)e1 +

(φ sen θ cosψ − θ senψ

)e2 +

(ψ + φ cos θ

)e3, (3.33b)

a qual é a velocidade angular com componentes medidos no referencial S.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 138: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

132 3.10. O pião simétrico com um ponto fixo

3.9.2 INTEGRABILIDADE DA VELOCIDADE ANGULAR

No caso do movimento genérico de um corpo rígido, quando mais de um ângulo de Eulerestiver variando em consequência das equações de movimento, o vetor velocidade angular não éintegrável, ou seja, a velocidade angular não pode ser escrita em termos da derivada temporalde uma função destes ângulos.

Para demonstrar este fato, assume-se inicialmente que

ω =d

dtΛ (φ, θ, ψ) ,

sendo Λ (φ, θ, ψ) uma função dos ângulos de Euler. Então, se ω for integrável, pode-se empregaras suas coordenadas, por exemplo, no referencial do espaço, dadas por (3.33a), e escrever

ω′i =d

dtΛ′i (φ, θ, ψ) =

∂Λ′i∂φ

φ+∂Λ′i∂θ

θ +∂Λ′i∂ψ

ψ, (i = 1, 2.3) .

Considerando ω′1, resulta então que

∂Λ′1∂φ

φ+∂Λ′1∂θ

θ +∂Λ′1∂ψ

ψ = θ cosφ+ ψ sen θ senφ, ou seja,

∂Λ′1∂φ

= 0,∂Λ′1∂θ

= cosφ,∂Λ′1∂ψ

= sen θ senφ.

Porém, como Λ′1 (φ, θ, ψ) deve ser uma função suave em seus argumentos, necessariamente

∂2Λ′1∂ψ∂θ

=∂2Λ′1∂θ∂ψ

. Mas,(∂2Λ′1∂ψ∂θ

= 0

)6=(∂2Λ′1∂θ∂ψ

= cos θ senφ

).

Portanto, em geral a velocidade angular não é integrável. Como uma consequência impor-tante, os vínculos envolvendo componentes de ω serão, em geral, não holônomos.

3.10 O PIÃO SIMÉTRICO COM UM PONTO FIXO

O pião simétrico é um dos problemas mais tradicionais na dinâmica dos corpos rígidos, o qualfoi resolvido pela primeira vez por Joseph-Louis Lagrange em seu tratado Mécanique Analytique.

Um pião simétrico é um corpo rígido qualquer para o qual I1 = I2, sendo essas quantidadesos seus momentos principais de inércia. Se esse corpo possuir um ponto O, o qual pode ser umponto fixo na sua dinâmica, então um eixo que passa tanto por este ponto quanto pelo centrode massa será um eixo principal de inércia, bem como dois os dois eixos perpendiculares. Adinâmica do corpo ao girar em torno deste eixo é semelhante ao movimento de um pião com umponto fixo ou de um giroscópio.

O movimento do pião simétrico será discutido empregando-se o formalismo Lagrangiano. Asrotações serão descritas em termos dos ângulos de Euler φ, θ, ψ e suas respectivas velocidadesangulares. Para tanto, o referencial fixo (S′) e o referencial do corpo (S) terão a mesma origem,ambas no ponto fixo O. O eixo x3 do corpo é orientado de tal forma que passa pelo centro demassa, ao passo que o eixo x′3 é orientado verticalmente, conforme pode ser visto na figura 3.22.

Como se observa na figura, com as orientações adotadas para os referenciais, o ângulo θmede a inclinação do eixo de simetria (eixo x3) do pião com a vertical (eixo x′3), enquanto que oângulo φ mede a precessão do eixo x3 em torno de x′3. Finalmente, o ângulo ψ mede a rotação dopião em torno de seu eixo de simetria.

A LAGRANGIANA E AS CONSTANTES DE MOVIMENTO

Dadas então as expressões (3.29a), (3.30b) e (3.27), a Lagrangiana do pião simétrico é escrita

L =1

2I1(ω2

1 + ω22

)+

1

2I3ω

23 −Mgh cos θ,

uma vez que I2 = I1. As componentes da velocidade angular no referencial do corpo são dadaspor (3.33b); assim,

Lφ, θ, θ, ψ

=

1

2I1

(φ2 sen2 θ + θ2

)+

1

2I3

(ψ + φ cos θ

)2

−Mgh cos θ.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 139: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 133

Linha nodal

S’S

O

Figura 3.22: Um pião simétrico com massa M ecom sua ponta inferior fixa gira em um campogravitacional. Os ângulos de Euler φ, θ, ψ re-lacionam os eixos do referencial fixo (S′) com oreferencial do corpo (S).

As variáveis φ e ψ são cíclicas (∂L/∂φ = ∂L/∂ψ = 0); portanto, seus momentos conjugados sãoconstantes de movimento, i. e.,

pψ =∂L

∂ψ= I3

(ψ + φ cos θ

)= I3ω3 = cte., (3.34a)

pφ =∂L

∂φ= I1φ sen2 θ + I3

(ψ + φ cos θ

)cos θ = I1φ sen2 θ + pψ cos θ = cte. (3.34b)

Observa-se também que, de acordo com a discussão realizada na seção 1.9.2.3, a função deJacobi que pode ser obtida desta Lagrangiana é conservada e corresponde à energia total. Ouseja, uma terceira constante de movimento para o pião simétrico é

E = T + U =1

2I1

(φ2 sen2 θ + θ2

)+p2ψ

2I3+Mgh cos θ = cte. (3.34c)

A dinâmica do pião simétrico será resolvida abaixo fazendo-se uso destas constantes de mo-vimento. Alternativamente, o problema poderia ser resolvido a partir da equação de Euler-Lagrange para a variável dinâmica restante:

∂L

∂θ− d

dt

∂L

∂θ= 0,

I1θ − I1φ2 sen θ cos θ + I3

(ψ + φ cos θ

)φ sen θ −Mgh sen θ = 0,

I1θ − I1φ2 sen θ cos θ + pψφ sen θ −Mgh sen θ = 0.

SOLUÇÃO POR QUADRATURA

Ao invés de se resolver o problema do pião a partir da equação de Euler-Lagrange, a qual éde segunda ordem, a solução será buscada a partir da constante de movimento (3.34c), a qual éde primeira ordem.

Em primeiro lugar, escreve-se (3.34b) como

φ =pφ − pψ cos θ

I1 sen2 θ, (3.35)

a qual relaciona φ com o ângulo θ e é válida para θ 6= 0. Usando esta relação e definindo a novaconstante

E′ = E −p2ψ

2I3,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 140: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

134 3.10. O pião simétrico com um ponto fixo

escreve-se (3.34c) como

E′ =1

2I1θ

2 + Uef (θ) , onde

Uef (θ).=

(pφ − pψ cos θ)2

2I1 sen2 θ+Mgh cos θ.

(3.36a)

A função Uef (θ) tem dimensão de energia e é denominada potencial efetivo. A equação recémobtida é em primeira ordem em θ, como mencionado.

Dessa maneira, se for imposta a condição inicial θi = θ (t = 0) e for assumido que θ (0) > 0, aequação tem como solução formal a quadratura(

dt

)2

=2

I1[E′ − Uef (θ)] =⇒

ˆ θ

θi

dθ′√E′ − Uef (θ′)

=

√2

I1t. (3.36b)

A integral em (3.36b) pode ser formalmente resolvida, o que irá então fornecer t = t (θ). Ainversão desta relação11 fornece então θ = θ (t). Inserindo-se esta solução em (3.35) e realizandouma nova quadratura, obtém-se então φ = φ (t). Finalmente, inserindo ambas as soluções em(3.34a) e realizando mais uma quadratura, obtém-se a última solução ψ = ψ (t). Infelizmente, asolução analítica de (3.36b) é díficl de ser obtida, de forma que a análise do movimento do piãoserá realizada de uma maneira qualitativa abaixo.

ANÁLISE DO POTENCIAL EFETIVO

O comportamento de θ (t) pode ser analisado a partir das propriedades do potencial efetivoUef (θ). Em primeiro lugar, o intervalo de variação para θ é 0 6 θ 6 π. Observa-se claramente em(3.36a) que

limθ→0,π

Uef (θ) −→ +∞.

O menor valor possível para Uef (θ) é obtido a partir de

dUef

∣∣∣∣θ0

=(pφ − pψ cos θ0) (pψ − pφ cos θ0)

I1 sen3 θ0−Mgh sen θ0 = 0. (3.37)

Definindo u0 = cos θ0, esta equação pode ser escrita como

I1Mgh(1− u2

0

)2︸ ︷︷ ︸f(u)

= (pφ − pψu0) (pψ − pφuo)︸ ︷︷ ︸g(u)

,

sendo que gráficos das funções f (u) e g (u) são apresentados na figura 3.23(a). As raízes de f (u)são u = ±1 e f (u) > 0 sempre. Por outro lado, as raízes de g (u) são

u1 =pφpψ

e u2 =pψpφ

=1

u1.

Portanto, se −1 6 u1 6 1, a raiz u2 não pertence a este intervalo e vice-versa. No caso pφpψ >0 a concavidade de g (u) está para cima e, portanto, as curvas f (u) e g (u) definidas acimagarantidamente têm somente uma intersecção em −1 6 u 6 1, o que fornece o valor de θ0.

A figura 3.23(b) mostra o gráfico do potencial efetivo em função de θ. Estão ressaltadostambém os ângulos θ0 (mínimo de Uef ) e os valores extremos θ1 e θ2 onde Uef = E′ (ou seja, θ = 0).

CARACTERÍSTICAS DO MOVIMENTO DO PIÃO SIMÉTRICO

A equação (3.36a) mostra que θ = 0 quando Uef = E′. Isto ocorre nos ângulos θ1 < θ0 < θ2

mostrados na figura 3.23(b). Se para algum θ < θ2, θ > 0, a inclinação do eixo do pião com avertical aumenta até chegar a θ = θ2. A partir deste momento, o movimento do eixo é invertido(θ < 0 ) e o ângulo diminui até θ1, quando então o movimento novamente se repete. Estemovimento é denominado uma nutação em relação à vertical.

11A inversão ou é analiticamente possível ou pode ser realizada na forma de série de potências

θ (t) = θ0 + θ1t+ θ2t2 + · · · ,

onde θ1, θ2, . . . , são os coeficientes da expansão em série.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 141: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 135

(a)f(x)g(x)

uu0−1 1

(b)

0

E'

θ1 θ0 πθ2

Uef (θ)

Figura 3.23: (a) Intersecção das curvas f (u) e g (u) para o caso pφpψ > 0. O ponto u = u0 corresponde aomínimo de Uef (θ). (b) Gráfico do potencial efetivo Uef (θ).

Simultaneamente à nutação, o eixo de rotação do pião executa uma precessão em torno doeixo vertical. Esta precessão consiste no movimento da linha nodal mostrada na figura 3.22, oqual ocorre com a velocidade angular dada por (3.35), ou seja,

φ = pψpφ/pψ − cos θ

I1 sen2 θ.

Desta expressão, resultam as seguintes possibilidades:

|pφ| > |pψ|: Neste caso, pφ/pψ − cos θ > 0 sempre e φ terá sempre o mesmo sinal, igual ao si-nal de pψ. Nesta situação, pode-se visualizar o movimento do pião da seguinte maneira.Imagina-se que a ponta do eixo de rotação mostrado na figura 3.22 traça uma curva sobrea superfície de um esfera centrada no ponto O à medida que ocorrem os movimentos si-multâneos de precessão e nutação do pião para θ1 6 θ 6 θ2. No caso |pφ| > |pψ|, a ponta doeixo de rotação traça a curva mostrada na figura 3.24(a).

|pφ| < |pψ|: Neste caso, definindo-se o ângulo auxiliar θ′ = cos−1 (pφ/pψ), resulta que

φ = pψcos θ′ − cos θ

I1 sen2 θ.

Nota-se que em (3.37), U ′ef (θ′) = −Mgh sen θ′ < 0. De acordo com o gráfico de Uef (θ) na figura3.23(b), isto significa que θ′ < θ0. Há então duas possibilidades:

(i) θ′ < θ1: Neste caso, φ também terá sempre o mesmo sinal e o movimento do eixo do piãoserá novamente a curva mostrada na figura 3.24(a).

(ii) θ′ > θ1: Neste caso, φ irá mudar de sinal quando θ = θ′. O movimento do eixo do piãoneste caso está representado na figura 3.24(b).

(iii) θ′ = θ1: Neste caso, o ângulo onde φ = 0 é exatamente θ = θ1. O movimento que ocorrenesta situação está representado na figura 3.24(c).

Uma situação comum onde fatalmente irá ocorrer o tipo de movimento mostrado na figura3.24(c) ocorre quando as condições iniciais do problema são: θ (t = 0) = φ (t = 0) = 0 e ψ (t = 0) =ψi. Neste caso, de (3.34a e 3.34b),

ω3i = ψi, pψ = I3ω3i, pφ = pψ cos θi.

Mas, (3.36a) mostra que, necessariamente, θ1 = θi. Portanto, como pφ = pψ cos θ′, resulta que

θi = θ1 = θ′.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 142: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

136 3.10. O pião simétrico com um ponto fixo

Figura 3.24: Combinações dos movimentos de precessão e nutação. (a) Casos em que φ não muda de sinal epψ > 0. (b) Casos em que φ muda de sinal para θ1 < θ′ < θ2. (c) Caso em que θ′ = θ1.

PRECESSÃO REGULAR. A figura 3.23(b) mostra que se E′ > Uef (θ0), então o pião sempre irárealizar o movimento de nutação com θ1 6 θ 6 θ2. Por outro lado, no caso extremo E′ = Uef (θ0)não irá ocorrer nutação e o pião irá executar uma precessão regular em torno na vertical comângulo θ = θ0. Neste caso, a expressão (3.35) mostra que a precessão ocorre com a velocidadeangular constante dada por

φ =pφ − pψ cos θ0

I1 sen2 θ0. (3.38)

Contudo, há uma condição que deve ser satisfeita para que a precessão regular possa ocorrer.Retornando à equação (3.37) e escrevendo β = pφ − pψ cos θ0, resulta que

pψ − pφ cos θ0 = pψ sen2 θ0 − β cos θ0

e a equação fica escrita

(cos θ0)β2 −(pψ sen2 θ0

)β +MghI1 sen4 θ0 = 0.

Resolvendo esta equação para β, resulta

β =I3ω3 sen2 θ0

2 cos θ0

(1±

√1− 4MghI1

I23ω

23

cos θ0

),

onde foi usada (3.34a) para se escrever pψ = I3ω3.Observando em (3.38) que φ = β/I1 sen2 θ0, o resultado acima mostra que há dois valores

possíveis para φ. Se θ0 > π/2 (de modo que cos θ0 < 0),12 então a precessão regular é semprepossível. Porém, se θ0 < π/2 (cos θ0 > 0), então a precessão regular somente será possível se

1− 4MghI1I23ω

23

cos θ0 > 0 =⇒ |ω3| > ωmin, onde ωmin.=

√4MghI1I23

cos θ0.

Quando ω3 > ωmin há duas soluções possíveis para β = pφ − pψ cos θ0. Escrevendo-se

β =I3ω3 sen2 θ0

2 cos θ0

(1±

√1− ω2

min

ω23

),

e assumindo ω3 ωmin, pode-se fazer as aproximações:

φ =β

I1 sen2 θ0=

I3ω3

2I1 cos θ0

(1±

√1− ω2

min

ω23

)≈ I3ω3

2I1 cos θ0

(1± 1∓ ω2

min

2ω23

).

Ou seja, ocorrem as velocidades angulares φrápida ou φlenta, onde

φrápida ≈I3ω3

I1 cos θ0, φrápida ≈

Mgh

I3ω3.

12Ângulos θ > π/2 são possíveis para giroscópios cujos pontos fixos estão suspensos acima do nível do solo.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 143: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 137

ESTABILIDADE DO PIÃO VERTICAL

Um último caso importante digno de nota consiste na estabilidade do movimento de um piãoposto a girar na posição vertical.13

As condições iniciais

θi = 0, ψi = ω3

implicam em (3.34b) quepφ = pψ.

Este é o caso que não havia ainda sido considerado. Nesta situação, o potencial efetivo em(3.36a) fica escrito

Uef (θ) =p2ψ

2I1

(1− cos θ)2

sen2 θ+Mgh cos θ =

p2ψ

2I1tan2 θ

2+Mgh cos θ.

Partindo da condição inicial θi = 0, o pião passará a executar nutações em torno da vertical.Enquanto o ângulo de nutação for suficientemente pequeno, pode-se aproximar tan θ/2 ≈ θ/2 ecos θ ≈ 1− θ2/2 e escrever

Uef (θ) ≈p2ψ

2I1

θ2

4+Mgh

(1− θ2

2

)= Mgh+

1

2kθ2, onde

k.=

p2ψ

4I1−Mgh =

I23ω

23

4I1−Mgh.

Ou seja, o gráfico de Uef (θ) é uma parábola em θ.Com esta aproximação para Uef (θ), a solução por quadratura em (3.36b) pode ser escrita

ˆ θ

0

dθ′√2E′′ − kθ′2

= I−1/21 t, onde agora E′′

.= E′ −Mgh = E −

(Mgh+

1

2I3ω

23

).

Há duas soluções possíveis para esta quadratura:

(i) k > 0: Neste caso, a integração e inversão da expressão acima resulta em

1√k

tan−1

( √kθ√

2E′′ − kθ2

)= I−1/21 t =⇒ θ (t) =

√2E′′

ksen

(√k

I1t

).

Ou seja, o movimento do pião é estável em torno da vertical.

(ii) k < 0: Neste caso, a integração leva à solução

senh−1

(√|k|

2E′′θ

)=

√|k|I1t =⇒ θ (t) =

√2E′′

|k|senh

√ |k|I1t

.

Ou seja, neste caso o movimento do pião não é estável.

Portanto, a condição de estabilidade do pião dormente é

k > 0 =⇒ ω3 > ωc, sendo ωc.=

√4I1Mgh

I23

.

Se o pião for lançado na vertical com velocidade angular ω3 > ωc, ele irá permanecer rodopiandocom, no máximo, pequenas oscilações em torno da vertical. Contudo, se for lançado com ω < ωc,o pião começara a oscilar com amplitudes cada vez maiores até tombar.

Um vídeo contendo uma análise matemática semelhante à realizada nesta seção e o movi-mento correspondente de um giroscópio pode ser visualizado em <https://www.youtube.com/watch?v=5Sn2J1Vn4zU>.14

13Esta situação também é denominada um pião dormente.14Um vídeo contendo uma demonstração mais “lúdica” pode ser visualizado em <https://www.youtube.com/watch?

v=GeyDf4ooPdo>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 144: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

138 3.11. Equações de Euler para um corpo rígido

3.11 EQUAÇÕES DE EULER PARA UM CORPO RÍGIDO

Nesta seção serão abordadas a derivação e algumas consequências das equações de Eulerpara um corpo rígido, as quais descrevem a dinâmica rotacional deste sistema a partir da for-mulação Newtoniana.

Considera-se o torque aplicado a uma corpo rígido em relação a um ponto O, o qual é assu-mido ser ou um ponto fixo ou o centro de massa do sistema. Nesta situação, a equação (3.17)continua sendo válida, sendo aqui escrita como

dLOdt

∣∣∣∣inercial

= N(e)O , (3.39)

onde foi novamente enfatizado que esta equação descreve corretamente a dinâmica do corpo,observado do ponto de vista de um referencial inercial.

Para relacionar a equação acima com as observações realizadas a partir do referencial docorpo, emprega-se novamente a equação (3.13), o que leva a

dLOdt

∣∣∣∣corpo

+ ω×LO = N(e)O .

Esta transformação é conveniente porque no referencial do corpo o seu tensor de inércia éconstante, ao passo que para o referencial inercial isto não é verdade.

Uma vez que o momentum angular do corpo, medido no seu referencial, é dado simplesmente

por LO =↔I ·ω (equação 3.20c), resulta então

↔I ·ω + ω×

(↔I ·ω

)= N

(e)O . (3.40a)

Porém, se o referencial S for orientado ao longo dos eixos principais de inércia, empregando-se a

técnica apresentada na seção 3.7, então↔I= I1 e1 e1 + I2 e2 e2 + I3 e3 e3 e a equação acima resulta

3∑i=1

Iiωi ei +

3∑i,j=1

Iiωiωj ej × ei = N(e)O

ej× ei=−∑3k=1 εijk ek−−−−−−−−−−−−−−−→

N(e)O =

∑3i=1Ni ei

3∑i=1

Iiωi +

3∑j,k=1

εijkIkωjωk

ei =

3∑i=1

Ni ei,

a qual pode ser escrita em termos de seus componentes como

Iiωi −3∑

j,k=1

εijkIjωjωk = Ni, (i = 1, 2, 3) , ou

I1ω1 − (I2 − I3)ω2ω3 = N1

I2ω2 − (I3 − I1)ω1ω3 = N2

I3ω3 − (I1 − I2)ω1ω2 = N3.

(3.40b)

As equações (3.40b) são as equações de Euler para o corpo rígido, as quais descrevem adinâmica rotacional deste corpo em torno de um eixo instantâneo de rotação relativamente aoreferencial do corpo. Caso suas soluções possam ser obtidas, é ainda necessário relacionar asmesmas com as observações feitas a partir do referencial inercial para que o movimento do corpopossa ser visualizado.

O movimento de um corpo rígido, conforme descrito pelas equações de Euler, somente de-pende da estrutura do corpo (a sua distribuição de massa) através de seus momentos principaisde inércia I1, I2, I3. Ou seja, quaisquer dois corpos distintos, com diferentes composições egeometrias, mas que possuam os mesmos momentos de inércia, serão indistinguíveis do pontode vista das equações (3.40b) e por consequência terão a mesma dinâmica. Por outro lado, se ocorpo for submetido a certos tipos de interações, tais como forças viscosas ou resistivas, a suadinâmica resultante pode vir a depender de sua forma específica. Neste caso, as equações deEuler devem ser complementadas de acordo com o problema abordado.

Nas situações onde as equações (3.40b) são válidas, o movimento do corpo pode ser analisadoatravés da dinâmica de um elisóide equivalente, conforme será abordado mais adiante

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 145: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 139

Exemplo 3.5 (Rotação uniforme de um haltere). Considerando novamente o movimento derotação do haltere ilustrado na figura 3.8, a qual é repetida na figura 3.25 com um referencialde corpo S adequadamente orientado.

Figura 3.25: O haltere com um referencialS adequadamente escolhido. O sistema rotaem torno do eixo vertical com velocidade an-gular ω constante.

O haltere rota com velocidade angular constante em torno do eixo vertical. De acordo com aorientação escolhida para os eixos de S,

ω = ω senα e2 + ω cosα e3.

Como r1 = b e3 e r2 = −b e3, sendo b as distâncias das massas ao ponto O, a sua matriz deinércia, de acordo com (3.19a), resulta

I = (m1 +m2) b2

1 0 00 1 00 0 0

.

Ou seja, x1 e x2 são eixos principais de inércia (x3 é eixo de simetria). Observa-se também queas componentes do momentum angular do haltere são

L = Iω = (m1 +m2) b2

1 0 00 1 00 0 0

0ω2

ω3

=

0(m1 +m2) b2ω senα

0

,

de acordo com (3.20b).Portanto, como ω = 0, as equações de Euler (3.40b) fornecem

N1 = − (m1 +m2) b2ω2ω3 = − (m1 +m2) b2ω2 senα cosα, N2 = N3 = 0,

o qual é o torque que deve ser aplicado ao haltere para manter a sua rotação uniforme em tornodo eixo vertical. Observa-se que o torque é constante, mas é importante ressaltar que estas sãoas componentes do torque no referencial do corpo.

Para encontrar as componentes de NO no referencial inercial, as quais não são constantes,pode-se empregar novamente a relação (3.13),

NO

∣∣∣S′

= ω×NO ⇒ NO

∣∣∣S′

= ω× (ω×NO) =:0

(ω ·NO)ω − ω2NO,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 146: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

140 3.11. Equações de Euler para um corpo rígido

sendo que o cancelamento acima foi realizado por que a equação (3.40a) mostra que, quandoω = 0, resulta que ω ⊥ N . Portanto, escrevendo NO =

∑iN′i e′i para as componentes do torque

no referencial inercial, obtém-se

NO + ω2NO = 0 =⇒ N ′i (t) = Ai cosωt+Bi senωt, (i = 1, 2, 3) ,

sendo que as constantes Ai e Bi (i = 1, 2, 3) devem ser determinadas pelas condições iniciais.Orientando-se os eixos de S′ de tal forma que ω = ω e′3 e que em t = 0, e1 = e′

1, obtém-se

N ′1 (0) = N1 e N ′2 (0) = N ′3 (0) = 0. Ou seja, A1 = N1 e A2 = A3 = 0.

Para se obter N (0), retorna-se a

NO

∣∣∣S′

= ω×NO =⇒ N (0) = (ω senα e2 + ω cosα e3)× (N1 e1) = N1ω (− senα e3 + cosα e2) ,

sendo que na relação acima, deve-se tomar as orientações dos vetores e2 e e3 em relação a S′

no instante t = 0. As relações entre os vetores de base são obtidas a partir da matriz de rotaçãoR(1) (α) dada por (3.9); ou seja, em t = 0,

e2 = cosα e′2 + senα e′3, e3 = − senα e′2 + cosα e′3.

Portanto,N (0) = N1ω e

′2 =⇒ N ′2 (0) = N1ω, N ′1 (0) = N ′3 (0) = 0.

Com estas condições iniciais, obtém-se finalmente

NO|S′ = N1

[cos (ωt) e′1 + sen (ωt) e′2

].

3.11.1 MOVIMENTO LIVRE DE UM PIÃO SIMÉTRICO

As soluções das equações de Euler serão agora obtidas para o caso de um pião simétrico,caracterizado como um corpo rígido com dois momentos principais de inércia iguais e distintosdo terceiro. Este tipo de corpo já foi analisado na seção 3.10 quando o mesmo possui um pontofixo e é submetido à força gravitacional. Agora, o seu movimento será analisado na ausência detorques.

Sem perda de generalidade, assume-se que I2 = I1 e NO = 0. Assim, as equações (3.40b)reduzem-se a

I1ω1 − (I1 − I3)ω2ω3 = 0, I1ω2 − (I3 − I1)ω1ω3 = 0, I3ω3 = 0. (3.41)

Do sistema de equações resultante, imediatamente percebe-se que ω3 = cte; ou seja, a compo-nente da velocidade angular na direção perpendicular ao plano formado pelos eixos principaisx1 e x2 é uma constante de movimento.

Para a análise das equações restantes, define-se a seguinte constante:

Ω =I3 − I1I1

ω3, (3.42)

com a qual escreve-se

ω1 + Ωω2 = 0, ω2 − Ωω1 = 0.

Derivando a primeira equação e inserindo a segunda, obtém-se então

ω1 + Ω2ω1 = 0.

Com uma escolha apropriada para o instante inicial, as soluções para estas equações podemser escritas

ω1 (t) = ω⊥ cos Ωt, ω2 (t) = ω⊥ sen Ωt,

sendo ω⊥ =√ω2

1 + ω22 constante. Uma vez que ω3 é constante,

ω = |ω| =√ω2

1 + ω22 + ω2

3 =√ω2⊥ + ω2

3

também o é. O movimento do vetor ω está ilustrado na figura 3.26, a qual mostra que ωprecessiona em torno do eixo de simetria x3 com uma velocidade angular Ω constante, de talforma que o corpo de vetor descreve um cone em torno de x3, denominado cone do corpo.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 147: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 141

αc

Figura 3.26: A velocidade angular ω de umpião simétrico livre sofre precessão com velo-cidade angular Ω constante em torno do eixode simetria x3 do corpo. O vetor ω percorrea superfície lateral de um cone em torno dex3.

É importante ressaltar aqui que o movimento recém-descrito ocorre no referencial do corpo. Observado doreferencial inercial, o movimento é mais complicado,uma vez que o referencial S rota em torno de ω. Umamaneira de se visualizar o movimento completo de umcorpo rígido sem torque aplicado é através da constru-ção de Poinsot, a qual será abordada na seção 3.11.2.

Exercício 3.5. Um disco fino é arremessado quase ho-rizontalmente para o ar, de tal maneira que o disco giraem torno de um eixo perpendicular ao seu plano, en-quanto que ao mesmo tempo este eixo perpendicularsofre uma precessão. Descreva o movimento do disco emostre que a precessão do eixo de rotação ocorre a umataxa aproximadamente duas vezes maior que a veloci-dade angular de rotação em torno deste eixo.

Solução. Escolhe-se os eixos principais de inércia dodisco de tal forma que x3 é o eixo perpendicular aoseu plano, enquanto que x1 e x2 são quaisquer dois ei-xos mutuamente perpendiculares contidos neste plano.Para a solução deste exercício, é conveniente adotar-seos ângulos de Euler introduzidos na seção 3.9. Tam-bém é conveniente orientar-se o referencial do espaçode tal maneira que no instante t = 0, o eixo x′1 (do es-paço) coincide com o eixo x1 (do corpo). Dessa maneira, em t = 0, ψ = 0 (ver figura 3.20). Alémdisso, como o movimento do disco ocorre sem torque, o seu momentum angular é uma constantede movimento. Toma-se então L = L e′3.

Assim, de acordo com (3.33b), os componentes da velocidade angular no referencial do corpoem t = 0 ficam

ω1 = θ, ω2 = φ sen θ, ω3 = ψ + φ cos θ.

Além disso, com a expressão da matriz de rotação REu (3.32b) para ψ = 0, os componentes domomentum angular do disco, no referecial do corpo, são

L1 = 0, L2 = L sen θ, L3 = L cos θ.

Portanto, de (3.27) resulta

L1 = I1ω1 ⇒ θ =L1

I1= 0, L2 = I1ω2 ⇒ φ =

ω2

sen θ=L

I1, L3 = I3ω3 ⇒ ω3 =

L3

I3=L cos θ

I3.

Como θ = 0, o ângulo θ (o ângulo de inclinação do eixo de simetria do disco em relação aL) permanece constante. Se o prato é lançado quase horizontalmente, o momentum angular équase vertical e θ é um ângulo pequeno. Além disso, devido ao teorema do eixo perpendicular(teorema 3.3), I3 = 2I1. Assim,

ω3 =L3

I3≈ L

2I1e φ =

L

I1=⇒ φ ≈ 2ω3.

3.11.2 A CONSTRUÇÃO DE POINSOT

A construção de Poinsot consiste em uma visualização do movimento de rotação livre de umcorpo rígido a partir de um referencial inercial. Nesta situação, as equações de Euler (3.40b) sereduzem a

I1ω1 − (I2 − I3)ω2ω3 = 0,

I2ω2 − (I3 − I1)ω1ω3 = 0,

I3ω3 − (I1 − I2)ω1ω2 = 0,

(3.43)

as quais descrevem a evolução temporal das componentes da velocidade angular no referencialdo corpo.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 148: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

142 3.11. Equações de Euler para um corpo rígido

Além disso, pela ausência de torque, o momentum angular e a energia cinética rotacional docorpo são constantes de movimento; ou seja, das equações (3.20c) e (3.24a),

L =↔I ·ω = cte., (3.44a)

Trot =1

2ω·↔I ·ω = cte. (3.44b)

Com base nestas constantes, o matemático e físico francês Louis Poinsot (1777 – 1859) concebeuuma representação geométrica do movimento livre de um corpo rígido.

Elipsoide de inércia

Plano invariável

herpolodia

polodia

Figura 3.27: A construção de Poinsot: um elipsoide derevolução com os vetores r e L, o plano invariável e ascurvas polodia e herpolodia.

Definindo o vetor

r.=

ω√2T

,

a equação (3.44b) toma a forma

r·↔I ·r = 1.

Escrevendo r = (r1, r2, r3), e usando o fato de

que↔I= I1 e1 e1 + I2 e2 e2 + I3 e3 e3, a equação

acima fica escrita

I1r21 + I2r

22 + I3r

33 = 1,

a qual é a equação de um elipsoide com se-mieixos I−1/2

1 , I−1/22 e I−1/2

3 , denominado elip-soide de inércia ou elipsoide equivalente.Neste caso, o vetor r fornece a posição de umponto qualquer sobre a superfície deste elip-soide. Uma ilustração de um elipsoide de re-volução pode ser vista na figura 3.27.

O vetor normal à superfície do elipsoide de inércia no ponto localizado pelo vetor r é propor-cional a

∇r(r·↔I ·r

)=

(3∑i=1

ei∂

∂ri

) 3∑j=1

Ijr2j

= 2

3∑i=1

Iiri ei =

√2

T

↔I ·ω =

√2

TL.

Ou seja, o momentum angular do corpo é normal à superfície do elipsoide no ponto dado por r;em outras palavras, o vetor L é perpendicular ao plano tangente ao elipsoide no ponto r.

A distância do centro do elipsoide a este plano tangente em r é

d = r · LL

=ω·↔I ·ω√2TL

=

√2T

L= cte.

Como L e d são constantes, o plano tangente é completamente fixo no espaço. Por esta razãoeste é denominado plano invariável. A figura 3.27 ilustra os vetores r (do elipsoide), L e oplano invariável.

À medida que o corpo rígido executa sua trajetória no espaço, sua velocidade angular variano tempo. Como ω ‖ r e o plano invariável permanece fixo no espaço, a variação temporal deω faz com que o elipsoide role sem deslizar sobre o plano, sempre mantendo seu ponto de con-tato tangencial ao plano e com seu ponto central à mesma distância do plano. A curva traçadapelo vetor r sobre a superfície do elipsoide devido à sua dinâmica é denominada polodia,15

enquanto que a curva traçada por r sobre o plano invariável é denominada herpolodia.16 Estevídeo: <https://www.youtube.com/watch?v=BwYFT3T5uIw> mostra as curvas polodia e herpo-lodia traçadas pela rotação livre de um elipsoide de inércia.

Quando o corpo é um pião simétrico (I1 = I2), as equações (3.41) mostram que ω3 = cte. eque a velocidade angular ω precessiona em torno do eixo de simetria, formando assim o cone docorpo (ver figura 3.26). Conforme se observa na figura, o cone do corpo possui um semiângulode abertura αc dado por

tanαc =

√ω2

1 + ω22

ω3=ω⊥ω3

.

15Do grego: caminho do polo.16Do grego: caminho serpentino do polo.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 149: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 143

Por outro lado, o ângulo αe entre ω e L também é constante, porque

cosαe =ω · LωL

=ω·↔I ·ωωL

=2T

ωL= cte.

Portanto, o eixo de rotação também traça um cone no espaço com semiângulo αe.O vetor ω define as superfícies laterais de ambos os cones, do corpo e do espaço e, por isso,

ambos os cones sempre se tocam ao longo de ω. Como o cone do espaço é fixo (porque L = cte.),à medida que o tempo passa e ω varia, o cone do corpo rola sobre a superfície do cone do espaço.Como o vetor r do elipsoide de inércia é proporcional a ω, tanto a polodia quanto a herpolodiasão circunferências.

Para o caso de um pião simétrico, escreve-se o seu tensor de inércia como

↔I= I1 e1 e1 + I2 e2 e2 + I3 e3 e3 = I1

↔1 + (I3 − I1) e3 e3

e a velocidade angular como ω = ωn, de onde resulta o vetor s, definido como

s.=

L

ωI1=

↔I ·ωωI1

=

↔I ·nI1

= n+ β cosαc e3, onde

β =I3 − I1I1

, cosαc = e3 · n.

Os vetores e3, s e n estão representados na figura 3.28. Observa-se que há duas possibili-dades: (i) β > 0 (I3 > I1), ou (ii) β < 0 (I3 < I1). Na primeira possibilidade (β > 0), o vetor s estáentre e3 e n; ou seja, L está entre e3 e ω. Neste caso, o cone do espaço encontra-se no interiordo cone do corpo, situação ilustrada no painel direito da figura 3.29. Um corpo simétrico comI3 > I1 assemelha-se a um disco achatado e é denominado um corpo oblato.

Figura 3.28: Os vetores e3, s e n envolvidos no mo-vimento livre de um corpo simétrico.

Por outro lado, na segunda possibilidade (β < 0), a figura 3.28 mostra que n está entre e3 e s(ou seja, ω entre e3 e L). Neste caso, o cone do espaço encontra-se em contato com a superfícieexterior do cone do corpo, como se pode ver no painel da esquerda da figura 3.29. Um corpocom I3 < I1 assemelha-se a um bastão alongado e é denominado um corpo prolato.

3.11.3 ESTABILIDADE DAS ROTAÇÕES LIVRES

Na ausência de torques, as equações de Euler se reduzem ao sistema (3.43), o qual admiteuma solução tal como ω3 = cte., ω1 = ω2 = 0, por exemplo. Ou seja, a rotação uniforme emtorno de um dos eixos principais de inércia consiste em uma situação de equilíbrio para umcorpo rígido livre. Esta possibilidade é importante para aplicações mecânicas: um eixo somentepermanecerá girando de maneira uniforme na ausência de torques (e sem amortecimento) se oeixo em questão for um eixo principal de inércia.

Um problema de interesse prático nesta situação é a estabilidade da rotação uniforme de umcorpo rígido livre. Supondo que o corpo inicie uma rotação livre com ω3 6= 0, ω1 = ω2 = 0 e venhaa sofrer perturbações momentaneas que desviem ligeiramente o eixo de rotação. O movimentoresultante irá consistir em uma leve oscilação em torno do regime estável, ou irá se afastardevido a instabilidades excitadas pela perturbação?

Para estudar os efeitos dessa perturbação, considera-se um corpo rígido genérico, para o qualos três momentos principais de inércia são distintos. Orientando-se o referencial do corpo com

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 150: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

144 3.11. Equações de Euler para um corpo rígido

cone do

corpo

cone do

espaço

cone do

corpo

cone do

espaço

e3 e3LL

ω

ω

(a) (b)

β > 0 β < 0

Figura 3.29: Os cones do corpo e do espaço associados ao movimento de rotação livre de um pião simétrico.(a) Caso oblato: I3 > I1 (β > 0). (b) Caso prolato: I3 < I1 (β < 0).

seus eixos ao longo dos eixos principais, parte-se do estado estacionário ω3 = cte., ω1 = ω2 = 0.Supõe-se agora que uma perturbação é aplicada sobre o corpo de tal forma que a sua velocidadeangular passa a ser escrita como

ω = δω1 e1 + δω2 e2 + ω3 e3, sendo |δω1| ∼ |δω2| ω3.

Ou seja, δω1 e δω1 são novas componentes de ω, criadas pela perturbação aplicada sobre o corpo.Neste caso, as equações (3.43) ficam escritas

I1d

dt(δω1)− (I2 − I3) (δω2)ω3 = 0,

I2d

dt(δω2)− (I3 − I1) (δω1)ω3 = 0,

I3d

dtω3 − (I1 − I2) (δω1) (δω2) = 0,

=⇒

I1d

dt(δω1)− (I2 − I3) (δω2)ω3 = 0,

I2d

dt(δω2)− (I3 − I1) (δω1)ω3 = 0,

I3d

dtω3 ≈ 0,

(3.45)

sendo que na terceira equação desprezou-se o termo perturbado (de segunda ordem) frente àcomponente estacionária ω3. Assim, ω3 ≈ cte. ainda é tratada como uma constante de movi-mento.

As equações restantes são resolvidas da seguinte maneira:d

dt(δω1) =

(I2 − I3I1

ω3

)(δω2)

d

dt(δω2) =

(I3 − I1I2

ω3

)(δω1)

=⇒

d2

dt2(δω1) =

(I2 − I3I1

ω3

)d

dt(δω2)

= − (I3 − I2) (I3 − I1)

I1I2ω2

3 (δω1) .

A solução para δω1 (t) pode ser escrita

δω1 (t) = AeiΩ1t +Be−iΩ1t, sendo Ω1 =

√(I3 − I2) (I3 − I1)

I1I2ω3.

Por sua vez, a solução para δω2 (t) resulta

δω2 (t) =

(I2 − I3I1

ω3

)−1d

dt(δω1) = −i

√I1 (I3 − I1)

I2 (I3 − I2)δω1 (t) .

Observa-se que há duas possibilidades para a forma da solução para δω1 (t):

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 151: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 145

(i) I3 é o maior ou o menor momento principal de inércia (I3 > I1 e I3 > I2, ou I3 < I1 e I3 < I2):neste caso, Ω1 é real e δω1 (t) e δω2 (t) podem sempre ser escritos como

δωi (t) = Ai sen Ω1t+Bi cos Ω1t, (i = 1, 2) ,

com Ai, Bi ∈ R, dependendo das condições iniciais. Como

max |δωi| =√A2i +B2

i ω3,

o movimento resultante será uma oscilação de pequena amplitude do eixo de rotação emtorno do estado de equilíbrio.

(ii) I3 é um momento intermediário (I3 > I1 e I3 < I2, ou I3 < I1 e I3 > I2): neste caso, Ω1 éimaginário (Ω1 = i |Ω1|) e as componentes perturbadas ficam escritas como

δωi (t) = Ai senh |Ω1| t+Bi cosh |Ω1| t, (i = 1, 2) .

Nesta situação, a oscilação resultante irá provocar um afastamento exponencial do eixo derotação do estado estacionário. O que ocorre neste caso é o afastamento rápido do eixoinstantâneo de rotação do eixo principal intermediário para um dos outros eixos: o de menorou o de maior momento principal de inércia.

As mesmas conclusões são obtidas caso a rotação estacionária ocorra ao longo de qualquerum dos outros eixos principais. A demonstração realizada acima acerca da estabilidade dasrotações em torno dos eixos principais com o maior/menor momento de inércia e a instabilidadedas rotações em torno do eixo com o momento de inércia intermediário é às vezes denominadoo teorema do eixo intermediário.

Este vídeo: <https://www.youtube.com/watch?v=GgVpOorcKqc> mostra um paralelepípedo(no caso, um livro), o qual possui os três momentos principais de inércia distintos, executandorotação livre em torno destes eixos. Observa-se como as rotações em torno dos eixos com o maiorou o menor momentos são estáveis, enquanto que a rotação em torno do eixo intermediário éinstável. Por sua vez, este outro vídeo: <https://www.youtube.com/watch?v=PY7fRozbrtk>,além de fornecer uma visualização lúdica do teorema do eixo intermediário, também apresentauma explicação detalhada e uma simulação computacional.

Caso o corpo possua um eixo de simetria, possuindo então dois momentos principais de inér-cia idênticos, as equações de Euler perturbadas (3.45) se reduzem às seguintes possibilidades:

(i) I1 = I2: Neste caso, a solução acima para δω1 (t) é a mesma, mas com

Ω1 =|I3 − I1|

I1ω3, e δω2 (t) = −iδω1 (t) .

Ou seja, as oscilações são sempre estáveis.

(ii) I3 = I1 ou I3 = I2: Neste caso, basta analisar uma das possibilidades (I3 = I1, por exemplo).Agora as equações (3.45) ficam

I1d

dt(δω1)− (I2 − I3)ω3 (δω2) = 0

I2d

dt(δω2) = 0

δω1 (t) = A+I2 − I3I3

ω3 (δω2) t,

δω2 = cte.

Ou seja, a amplitude da rotação em torno do eixo x1 cresce de forma secular e o movimentodo corpo é sempre instável. Conclusão semelhante é obtida se I3 = I2 6= I1.

Finalmente, se os três momentos forem iguais, as equações (3.45) se reduzem a

δω1 = cte., δω2 = cte., ω3 = cte.

e a rotação livre é sempre estável.Em 1992, os astronautas a bordo do ônibus espacial Endeavour, em sua primeira missão,

tentaram resgatar o satélite Intelsat 6, o qual estava em uma órbita baixa devido a uma falhano seu lançamento. Durante a missão, diversas dificuldades ocorreram no procedimento deresgate, as quais foram devidas às condições de estabilidade/instabilidade na rotação livre deum corpo rígido discutidas nesta seção. Um vídeo contendo a descrição das dificuldades e aestratégia adotada para finalmente resgatar o satélite pode ser visualizado em <https://www.youtube.com/watch?v=YJbB7MTvFAI>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 152: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

146 3.12. Dinâmica de corpos rígidos sem pontos fixos

3.12 DINÂMICA DE CORPOS RÍGIDOS SEM PONTOS FI-XOS

Esta seção consiste, basicamente, em uma série de estudos de casos envolvendo a dinâmicade corpos rígidos que não possuem pontos fixos. Aqui serão aplicados todos os desenvolvimentosapresentados nas seções anteriores.

3.12.1 PRECESSÕES E OSCILAÇÕES DO EIXO DE ROTAÇÃO DA

TERRA

Com o transcorrer do tempo, a Terra executa diversos movimentos, os quais são caracteri-zados e determinados por diversos fatores tais como o processo de formação do Sistema Solar,a forma e composição da Terra e dos demais orbes no sistema e suas distâncias e movimentosrelativos. A maior parte desses movimentos são periódicos.

Do ponto de vista astronômico, o movimento de menor período consiste na rotação da Terraem torno do eixo que passa pelos polos Norte e Sul geográficos, denominado o eixo rotacional. Operíodo rotacional da Terra, dura Trot = 23, 9345 h = 8, 61642× 104 s. O eixo de rotação é perpendi-cular ao plano do Equador, o qual consiste no circulo de maior raio sobre a superfície da Terra.O prolongamento do plano equatorial para o espaço é denominado o equador terrestre.

A Terra orbita em torno do Sol em uma órbita aproximadamente circular em um períodoorbital médio de Torb = 365, 25 dias = 3, 14715 × 107 s, representado na figura 3.30. Visto da Terra,o Sol percorre um caminho aparente no ceu ao longo do ano; este caminho é denominado aeclíptica. O termo eclíptica é também empregado para o plano no espaço que contém a órbitaque o centro da Terra realiza em torno do centro do Sol. O eixo orbital da Terra é aquele eixoperpendicular à eclíptica e que passa pela posição instantânea do centro da Terra.

Figura 3.30: Movimento orbitalda Terra em torno do Sol. Es-tão representados os eixos rota-cional (linha contínua) e orbi-tal (linha tracejada) e os movi-mentos de rotação, precessão dosequinocios e a variação da obli-quidade do eixo rotacional.

Ao longo de um ano, observa-se a passagem das estações e o movimento aparente das cons-telações no ceu noturno. Atualmente, sabe-se que que a origem destes fenômenos se deve àinclinação do eixo de rotação da Terra em relação à eclíptica, i. e., o equador celeste e a eclíp-tica não são coplanares. A inclinação axial ou obliquidade do eixo da Terra é o ângulo entreo seus eixos rotacional e orbital. De forma equivalente, a obliquidade pode ser definida comoo ângulo entre o equador celeste e a eclíptica. A obliquidade da Terra em 2014 foi medida emθobl = 23, 4392811 = 2326′21.41′′ e está representada na figura 3.30 pelo ângulo θ. Por sua vez, arotação da Terra em torno do eixo rotacional está representado por ψ. A figura 3.31 apresentaem maior detalhe os planos e eixos siderais da Terra e suas inclinações.

A orientação do eixo rotacional da Terra varia lentamente com o tempo. Nos dias atuais, oPolo Norte celestial está próximo da estrela Polaris, na constelação da Ursa Maior. Contudo,durante o longo período de tempo compreendido entre a construção de Stonehenge (cerca de3.800 AEC) e das pirâmides do Egito (em cerca de 2.500 AEC), uma estrela denominada Thuban,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 153: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 147

da constalação do Dragão, era identificada como a estrela polar. A figura 3.32 ilustra a trajetóriado Polo Norte em relação a algumas estrelas e constelações próximas.

Figura 3.31: Diversas características celestiais da Terra.

Figura 3.32: Trajetória do Polo Norte ce-lestial durante um ciclo completo de pre-cessão.

A mudança da estrela polar com o tempo ocorreu devido à precessão do eixo rotacional daTerra em torno do eixo orbital, movimento este denominado de precessão dos equinocios. Estemovimento de precessão é retrógrado em relação ao movimento orbital da Terra e está repre-sentado por φ na figura 3.30. Dentre as diversas medidas atuais da precessão dos equinocios,um valor médio aceitável para o período de precessão é de Tprec = 25.771, 4 anos ou cerca de50, 288 arcosegundos/ano.

Finalmente, a obliquidade também não é constante no tempo, mas varia entre 22, 1 e 24, 5

durante um período de aproximadamente 41.000 anos. A variação da obliquidade é semelhante auma nutação do eixo rotacional da Terra e está representada por θ na figura 3.30.

Os movimentos de precessão e variação da obliquidade do eixo rotacional da Terra têm con-sequências no clima do planeta ao longo do tempo e são causados pela forma e distribuição demassa da Terra e o seu movimento relativo com os demais orbes do Sistema Solar, principal-mente o Sol e a Lua. Será desenvolvido aqui um modelo simples que irá fornecer uma estimativapara esses períodos.

3.12.1.1 PRECESSÃO DO EIXO ROTACIONAL

Embora aparente ser uma esfera perfeita, a Terra na verdade é, aproximadamente, um elip-soide oblato (ver figura 3.29) em relação ao eixo rotacional. O seu raio equatorial é de cerca deRTmax = 6.378, 1 km enquanto que o raio polar é RTmin = 6.356, 8 km (o raio médio do planeta éRT = 6.371, 0 km). Esta diferença é atribuída ao efeito centrífugo que ocorreu na nuvem primor-dial enquanto esta condensava e resfriava já com o movimento de rotação. Medidas recentes dosmomentos principais de inércia da Terra fornecem o valor relativo

ε.=I3 − I1I3

= 0, 003 273 763 4 ≈ 1

305, 5. (3.46)

Será mostrado agora que graças à elipcidade na sua forma, a interação gravitacional entrea Terra e o Sol e entre a Terra a Lua gera um torque líquido, o qual será o responsável pelomovimento do seu eixo rotacional. O cálculo será realizado aos pares: Terra-Lua e Terra-Sol.

A figura 3.33 ilustra a órbita da Lua, assumida como centrada no núcleo da Terra e a diversasquantidades envolvidas no modelo. Embora possua uma excentricidade igual a 0, 0549, a órbitaserá assumida circular, com raio igual a RTL = 384.399 km. Também na figura 3.33, o sistema decoordenadas XY Z está centrado na Terra, com o eixo Z orientado na direção perpendicular aoplano orbital da Lua. Embora este plano possua uma inclinação de 5, 145 em relação à eclíptica,ambos serão posteriormente considerados coplanares.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 154: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

148 3.12. Dinâmica de corpos rígidos sem pontos fixos

Figura 3.33: Ilustração da órbitada Lua em torno da Terra, mos-trando as quantidades relevan-tes no cálculo de Ug.

Outras quantidades importantes para o modelo são:

MTerra = 5, 97237× 1024 kg, MLua = 7, 342× 1022 kg, MSol = 1, 98855× 1030 kg.

A Lua e o Sol serão considerados massas puntiformes, mas para a Terra assume-se uma densi-dade variável ρ = ρ (r), mas com o centro de massa em seu centro geométrico.

Iniciando o cálculo pelo sistema Terra-Lua e tomando as quantidades definidas na figura3.33, a energia potencial gravitacional entre uma massa puntiforme M = MLua e a Terra, sendoque a distância entre o centro da Terra e a massa puntiforme é R = RTL, é dada por

Ug = −GMˆV

ρ (r) d3r

|R− r|,

sendo G = 6, 67408(31)× 10−11 m3kg−1s−2 (NIST, 2014) a constante gravitacional.Para o cálculo desta integral, é necessário realizar uma aproximação adequada para o deno-

minador. Como RTL RTmax, pode-se escrever17

1

|R− r|=

1

R

∞∑n=0

( rR

)nPn

(R · rRr

)=

1

R

1 +

r

R

(R · rRr

)+

1

2

( rR

)2[

3

(R · rRr

)2

− 1

]+ · · ·

,

onde Pn (x) é o polinômio de Legendre de grau n. Para os presentes propósitos, basta tomar ostrês primeiros termos da série, escrevendo-se então

Ug ≈ −GM

R

MTerra +

R

R2·

:0ˆ

V

d3r ρ (r) r +1

2R2

ˆV

d3r ρ (r) r2

[3

(R · rRr

)2

− 1

],

sendo que o segundo termo é nulo porque é justamente a massa da Terra multiplicada pelaposição de seu centro de massa. Já quanto ao terceiro termo, se forem definidas as matrizes

H =

3R2x −R2 3RxRy 3RxRy

3RxRy 3R2y −R2 3RyRz

3RxRy 3RyRz 3R2z −R2

, r =

xyz

,

pode-se mostrar, após alguma álgebra, que

3

(R · rRr

)2

− 1 =rHr

R2r2.

Ou seja,

Ug ≈ −GMMTerra

R− GM

2R5

ˆV

d3r ρ (r) rHr.

Introduzindo-se a matriz de inércia (3.19b), e assumindo que a mesma é calculada para umreferencial coaxial com os eixos principais de inércia, com o eixo z paralelo ao eixo rotacional,resulta então

Ug ≈ −GMMTerra

R+GM

2R5

3∑i=1

HiiIiI1=I2===⇒ Ug ≈ −

GMMTerra

R+GM

2R5(I3 − I1)

(3R2

z −R2)

(3.47)

17Ver, por exemplo, <https://en.wikipedia.org/wiki/Legendre_polynomials>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 155: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 149

A última expressão acima foi obtida com a suposição de que a Terra é um elipsoide oblato.A expressão para a energia potencial gravitacional dada por (3.47) foi obtida em um refe-

rencial em repouso com a Terra e, portanto, a quantidade Rz varia no tempo tanto devido aomovimento de rotação da Terra quanto aos demais movimentos do eixo rotacional devidos aopotencial, de forma semelhante ao que ocorre no caso do pião simétrico analisado na seção3.10.

Se o referencial XY Z ilustrado na figura 3.33 for um referencial inercial, com os eixos X e Ysobre o plano orbital e Z perpendicular a esse plano, então R = (RX , RY , 0) e Rz pode ser escritoa partir de (3.32a) como

Rz = R31 (φ, θ, ψ)RX +R32 (φ, θ, ψ)RY ,

sendo R31 e R32 elementos da matriz de Euler (3.32b). Como a órbita é suposta circular, pode-seescrever, mediante uma escolha adequada do instante inicial, RX = R cosα e RY = R senα, sendoα um ângulo que varia com a órbita da Lua em torno da Terra. Resulta então

Rz (t) = R sen θ sen (φ− α) .

Na expressão acima para Rz, os três angulos (θ, φ e α) variam no tempo, mas em esca-las distintas. As variações de θ e φ correspondem respectivamente à nutação e precessão doeixo rotacional, as quais ocorrem em períodos de tempo da ordem de milhares de anos, en-quanto que a variação de α se deve à órbita lunar, que ocorre no período TLua = 27, 321661 dias =27 d 7 h 43 min 11.5 s, o qual é muito mais curto que o período de φ. Portanto, em (3.47) é conveni-ente substituir R2

z pela sua média temporal no período TLua, a qual é

R2z =

1

TLua

ˆ TLua

0

dtR2z (t) ≈ 1

2R2 sen2 θ,

tendo sido assumido que φ (t) , θ (t) ≈ cte. neste período.Desta forma, obtém-se finalmente

Ug ≈ −GMMTerra

R+GM

4R3(I3 − I1)

(1− 3 cos2 θ

). (3.48)

Fazendo-se referência à expressão (3.30a), o potencial (3.48) possui duas partes: a primeiradepende somente da distância entre a Lua e o centro da Terra, a qual é constante em umaórbita circular. O segundo termo, por outro lado, depende da orientação do eixo rotacional daTerra em relação ao plano da órbita. Este segundo termo é responsável pelo torque atuandosobre a Terra, o qual irá gerar os movimentos de precessão e nutação deste eixo. Observa-seclaramente que este torque somente existe porque a Terra é um sólido oblato, ao invés de seruma esfera perfeita.

Para se obter a energia potencial total do sistema Lua-Terra-Sol, deve-se somar agora àexpressão (3.48) os termos correspondentes à interação Terra-Sol. A mesma expressão podeser empregada para tanto, bastando substituir-se M = MSol e R = RTS. A órbita da Terrapossui uma excentricidade igual a 0, 0167086, ainda menor que a excentricidade da órbita lunar.Portanto, assume-se novamente uma órbita circular de raio RTS = 1, 495978707× 108 km = 1 UA.

Portanto, a energia potencial total do sistema Lua-Terra-Sol pode ser escrita

Ug,tot ≈ −Θ +1

4Ω2 (I3 − I1)

(1− 3 cos2 θ

), onde

Θ = GMTerra

(MLua

RTL+MSol

RTS

), Ω2 = G

(MLua

R3TL

+MSol

R3TS

).

(3.49)

Observa-se que(MLua

RTL

)÷(MSol

RTS

)≈ 1, 44× 10−5, mas

(MLua

R3TL

)÷(MSol

R3TS

)≈ 2, 09.

Ou seja, a ação da Lua é desprezível frente à ação do Sol sobre o centro de massa da Terra,mas a sua contribuição para o torque exercido sobre o eixo rotacional é duas vezes maior que acontribuição do Sol.

Com o potencial (3.49) e a energia cinética (3.29c), a Lagrangiana total pode ser separadaem parte translacional e parte rotacional, L = Ltrans + Lrot, as quais resultam em equaçõesde movimento desacopladas, uma vez que não há vínculos entre os termos translacionais e

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 156: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

150 3.12. Dinâmica de corpos rígidos sem pontos fixos

rotacionais. Assim, para os própositos deste problema, é suficiente considerar-se Lrot, a qualpode ser escrita, a partir de (3.27), (3.29c), (3.33b) e (3.49), como

Lrot =1

2I1

(θ2 + φ2 sen2 θ

)+

1

2I3

(ψ + φ cos θ

)2

− 1

4Ω2 (I3 − I1)

(1− 3 cos2 θ

),

a qual possui uma forma semelhante à Lagrangiana do pião com um ponto fixo, analisado naseção 3.10.

Da mesma forma como no problema do pião, as coordenadas φ e ψ são cíclicas, com osmomentos conjugados

pψ = I3

(ψ + φ cos θ

)= I3ω3 = cte., pφ = I1φ sen2 θ + pψ cos θ = cte.

A energia mecânica total pode ser escrita na forma (3.36a),

E′ =1

2I1θ

2 + Uef (θ) , onde E′ = E − 1

2

p2ψ

I3e

Uef (θ) =(pφ − pψ cos θ)

2

2I1 sen2 θ+

1

4Ω2 (I3 − I1)

(1− 3 cos2 θ

).

Desta maneira, a solução por quadratura para θ = θ (t) é dada por (3.36b), a qual é novamentedemasiado complicada para ser resolvida analiticamente.

Ao invés de empregar a solução por quadratura, escreve-se a equação de Euler-Lagrangepara θ, a qual fica

θ +

(φ2 +

3

2Ω2

)cos θ + (1 + ε) ψφ

]sen θ = 0,

lembrando que ε = (I3 − I1) /I1 ≈ 0, 00327. Obviamente, a equação para θ (t) acima é tão difícil deser resolvida quanto a solução por quadratura. Busca-se então uma solução aproximada.

Para se obter a solução aproximada, considera-se o caso em que não há nutação, i. e.,θ = θ = 0. Neste caso,

ε

(φ2 +

3

2Ω2

)cos θ + (1 + ε) ψφ ≈ 3

2εΩ2 cos θ + (1 + ε) ψφ ≈ 0,

onde foi empregado o fato que φ2 ∣∣ψφ∣∣. Com isto, obtém-se a estimativa para a taxa de

precessão

φ ≈ −3

2

1 + ε

)Ω2 cos θ

ψ.

O sinal negativo para φ indica que o sentido de rotação da linha dos nodos em torno de Z ocorreno sentido oposto de rotação em torno do eixo rotacional, o que também está indicado na figura3.30.

Tomando-se ψ ' 2πT−1rot , θ = θobl e Ω2 ≈ 1, 29511 × 10−13 s−2, obtém-se a seguinte estimativa

para a taxa de precessão do eixo rotacional:∣∣∣φ∣∣∣ ≈ 7, 96659× 10−12 rad/sPeríodo de precessão estimado−−−−−−−−−−−−−−−−−−−→ Test =

2π∣∣∣φ∣∣∣ ≈ 7, 88692× 1011 s ≈ 25.060, 51 anos.

Comparando com o período medido Tprec = 25.771, 4 anos, observa-se que a estimativa realizadadifere em apenas 2, 8% do valor medido. Cálculos mais precisos fornecem resultados muito maispróximos ao valor medido.

Por outro lado, a variação da obliquidade do eixo rotacional não pode ser explicada pelanutação resultante da ação combinada da Lua e do Sol. O período de 41.000 anos é causado pelalenta mudança no plano da eclíptica, causada pelas perturbações introduzidas pelos demaisplanetas do Sistema Solar, principalmente de Júpiter.

Em adição à precessão retrógrada do eixo rotacional e da variabilidade na sua obliquidade,existem também mudanças periódicas na excentricidade da órbita da Terra que também sãocausadas pelos outros planetas, principalmente por Júpiter. A excentricidade pode variar de 0 a0, 06 em um período de cerca de 105.000 anos e esta variabilidade está associada com a ocorrênciade eras glaciais no planeta.

3.12.1.2 A OSCILAÇÃO DE CHANDLER

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 157: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 151

Figura 3.34: Ilustração da oscilação deChandler.

Um outro fenômeno que ocorre devido ao fato de a Terraser um sólido oblato é a chamada oscilação de Chandler, aqual consiste na precessão livre o eixo rotacional, que ocorreem um período pouco maior que um ano. Esta oscilação,representada na figura 3.34, foi descoberta em 1891 peloastrônomo norte-americano Seth Carlo Chandler.

Em um período tão curto de tempo, o efeito do torqueanalisado na seção anterior é desprezível e o planeta se com-porta aproximadamente como um sólido oblato livre. Nestasituação, de acordo com a discussão realizada na seção3.11.1, se o vetor ω na figura 3.34 é a velocidade angulartotal da Terra, com ω3 = 2πT−1

rot associada com o período rota-cional, então a precessão em torno do eixo rotacional ocorrecom a frequência angular (3.42), isto é,

Ωest =I3 − I1I1

ω3 ≈2πε

Trot≈ 2, 385× 10−7 rad/s,

o que corresponde ao período estimado

Test =2π

Ωest= 26, 35 Ms ≈ 305, 8 dias.

O valor correto do período da oscilação de Chandler é difícil de ser medido e vale TChandler =433 dias. A discrepância vem do fato de que Terra não é realmente um corpo rígido, sendo,na verdade, quinzenalmente deformada pelo efeito de maré com a Lua. Este efeito, emborapequeno para o raio da Terra, é suficiente para explicar a diferença em cerca de 100 dias entre ovalor estimado e o valor medido.

Outro ponto ainda não esclarecido a respeito da oscilação de Chandler está no fato de quea mesma já deveria há muito ter sido amortecida, justamente pelos processos irreversíveis en-volvidos na deformação da crosta terrestre pelas marés. A manutenção desta oscilação é emparte atribuída a terremotos no interior da crosta e ao movimento diferencial do núcleo sólido.Recentemente ,18 constatou-se que a oscilação de Chandler sofreu uma alteração em 180 emsua fase em 1920 e, mais recentemente, em 2005. As causas destas mudanças de fase aindasão desconhecidas.

3.12.1.3 DETERMINAÇÃO DO TERCEIRO MOMENTO PRINCIPAL DE INÉRCIA

A principal suposição realizada ao longo desta seção é que a Terra é um sólido oblato, ouseja, os momentos principais de inércia relativos aos dois eixos principais perpendiculares aoeixo rotacional são iguais entre si. Na verdade, estes dois momentos são ligeiramente distintosentre si, mas a determinação da diferença é extremamente difícil de ser realizada.

Em um trabalho recente (VÎLCU, 2011), modelos do potencial geogravitacional foram atuali-zados com novas medidas de satélite. De acordo com os resultados deste trabalho, os valoresmédios dos momentos principais de inércia da Terra são

I1 = 8, 010935639× 1037 kg.m2, I2 = 8, 011108377× 1037 kg.m2, I3 = 8, 037333747× 1037 kg.m2.

Observa-se que a diferença relativa entre I1 e I2 é de apenas∣∣∣∣1− I2I1

∣∣∣∣ = 2, 15× 10−5 = 0, 00215%.

Com estes valores, o coeficiente de achatamento ε, dado originalmente por (3.46), passa a sercalculado como

ε′ =2I3 − (I1 + I2)

2I3= 0, 003 273 690.

As orientações dos eixos principais de inércia são as seguintes. O eixo x3 permanece orientadoao longo do eixo rotacional da Terra. O eixo x1 corta o Equador na longitude λ1 ' −15, 2 deGreenwich (Oceano Atlântico), enquanto que o eixo x2 corta o Equador na longitude λ2 ' +74, 8

(Oceano Índico).18Ver https://www.technologyreview.com/s/415093/earths-chandler-wobble-changed-dramatically-in-2005/ ou

(MALKIN; MILLER, 2010).

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 158: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

152 3.12. Dinâmica de corpos rígidos sem pontos fixos

3.12.2 ESFERAS ROLANDO SOBRE SUPERFÍCIES

Figura 3.35: Uma esfera homogênea com massa M eraio a rolando sem deslizar sobre uma superfície hori-zontal.

Será discutido aqui o problema básico deuma esfera homogênea com massa M e raioR rolando sem deslizar sobre uma superfíciehorizontal.

Usando as quantidades definidas na figura3.35, as quais seguem as convenções reali-zadas nas figuras 3.15 e 3.16, é convenienteusar a expressão (3.29c) para a energia ci-nética total quando a origem do referencialdo corpo está no centro de massa (o cen-tro geométrico) da esfera. Desta forma, seR′ = (X ′1, X

′2, a), então

T =1

2M(X ′21 + X ′22

)+

1

2Iω2,

onde I é momento de inércia em relação aoeixo de rotação. Como a esfera é homogê-nea, qualquer eixo passando pelo seu centrode massa é um eixo principal e o momento deinércia é dado pela expressão no item (f) databela 3.1,

I =2

5Ma2.

Serão empregadas as componentes da velocidade angular no referencial inercial S′ em termosdos ângulos de Euler, dadas por (3.33a). Neste caso,

ω2 =(θ cosφ+ ψ sen θ senφ

)2

+(θ senφ− ψ sen θ cosφ

)2

+(φ+ ψ cos θ

)2

= θ2 + φ2 + ψ2 + 2φψ cos θ.

Portanto, como a energia potencial é constante, a Lagrangiana fica escrita

LX ′1, X

′2, φ, θ, θ, ψ

=

1

2M(X ′21 + X ′22

)+

1

2I(θ2 + φ2 + ψ2 + 2φψ cos θ

). (3.50a)

Como a esfera está rolando sobre a superfície, é necessário empregar-se a condição de rola-mento sem deslizamento (3.31), a qual fica

V ′ + ω× rC = 0.

No referencial S′ a posição do ponto de contato (C) em relação ao centro de massa (O) é dadasimplesmente por rC = (0, 0,−a). Assim,

ω× rC =

∣∣∣∣∣∣e′1 e

′2 e′3

ω′1 ω′2 ω′3

0 0 −a

∣∣∣∣∣∣ = −a(ω′2 e

′1 − ω′1 e

′2

)= −a

[(θ senφ− ψ sen θ cosφ

)e′1 −

(θ cosφ+ ψ sen θ senφ

)e′2

].

Portanto, resultam as duas equações de vínculos (não holônomos)

f1 = −ψ sen θ cosφ+ θ senφ− X ′1a

= 0, f2 = ψ sen θ senφ+ θ cosφ+X ′2a

= 0. (3.50b)

As equações de Euler-Lagrange para a Lagrangiana (3.50a) em conjunto com os vínculos nãoholônomos (3.50b) são dadas pela expressão (1.60b). Resultam então as equações

(X ′1) :∂L

∂X ′1− d

dt

∂L

∂X ′1+ λ1

∂f1

∂X ′1+ λ2

∂f2

∂X ′1= 0

(X ′2) :∂L

∂X ′2− d

dt

∂L

∂X ′2+ λ1

∂f1

∂X ′2+ λ2

∂f2

∂X ′2= 0

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 159: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 153

(φ) :∂L

∂φ− d

dt

∂L

∂φ+ λ1

∂f1

∂φ+ λ2

∂f2

∂φ= 0

(θ) :∂L

∂θ− d

dt

∂L

∂θ+ λ1

∂f1

∂θ+ λ2

∂f2

∂θ= 0

(ψ) :∂L

∂ψ− d

dt

∂L

∂ψ+ λ1

∂f1

∂ψ+ λ2

∂f2

∂ψ= 0,

(X ′1) : MX ′1 = −λ1

a(3.51a)

(X ′2) : MX ′2 =λ2

a(3.51b)

(φ) : Id

dt

(φ+ ψ cos θ

)= Iω′3 = 0 (3.51c)

(θ) : I(θ + φψ sen θ

)= λ1 senφ+ λ2 cosφ (3.51d)

(ψ) : Id

dt

(ψ + φ cos θ

)= − (λ1 cosφ− λ2 senφ) sen θ. (3.51e)

Estas equações, em conjunto com os vínculos, formam um sistema de 07 equações para 07incógnitas (X ′1, X

′2, φ, θ, ψ, λ1 e λ2).

Até o momento, já se conhecem duas constantes de movimento: ω3 (de 3.51c) e a energiacinética. Para se obter mais informações das equações de movimento, realizam-se as seguintesoperações:

(3.51d)× cosφ+ (3.51e)× senφ

sen θ:

λ2 = I(θ + φψ sen θ

)cosφ+ I

d

dt

(ψ + φ cos θ

) senφ

sen θ

= I

(θ cosφ− θφ senφ+ ψ

senφ

sen θ+ φ senφ

cos θ

sen θ+ φψ sen θ cosφ

).

Mas, de ( 3.51c) conclui-se queφ = −ψ cos θ + θψ sen θ.

Então,

λ2

I= θ cosφ− θφ senφ+ ψ sen θ senφ+ θψ senφ cos θ + φψ sen θ cosφ

=d

dt

(θ cosφ+ ψ sen θ senφ

)= ω′1.

Ou seja, do resultado acima e de (3.51b), conclui-se que

λ2 = Iω′1 = MaX ′2.

Mas, o vínculo f2 em (3.50b) mostra também que

X ′2 + aω′1 = 0 =⇒ X ′2 = −aω′1.

Ou seja,λ2 = Iω′1 = −Ma2ω′1.

Como I, M e a2 são todas quantidades positivas, conclui-se portanto que

λ2 = 0.

Isto implica então que X ′2 = cte. e ω′1 = cte.

Uma análise semelhante mostra que λ1 = 0 e, portanto, X ′1 = cte. e ω′2 = cte. Ou seja, sobreuma superfície horizontal, uma esfera rola com velocidade angular constante e com seu centrode massa se deslocando com velocidade constante ao longo de uma linha reta.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 160: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

154 3.12. Dinâmica de corpos rígidos sem pontos fixos

3.12.3 O DISCO DE EULER

Um disco de Euler é um disco rígido que rola sem deslizar sobre uma superfície plana. Essedisco pode apresentar, em geral, rotações em três eixos perpendiculares: rotação, precessão etombamento. Este é um problema tradicional de dinâmica de corpos rígidos sem pontos fixos,em relação ao qual muitos vídeos e simulações podem ser encontrados. Alguns exemplos são:19

MATLAB simulation of a rolling thin disk undergoing a steady motion, MATLAB simulation ofa thin disk undergoing a typical rolling motion, Simulation of Classical Rolling Coin Dynamicsby MATLAB, 3D Dynamic Simulation Rolling Disc, Dance of the Wedding Rings (Rolling Disk orEuler’s Disk) e The Maths of Spinning Coins and Euler’s Disk.

Nesta seção, alguns casos de movimentos de discos de Euler serão analisados e discutidos.

Exemplo 3.6 (Disco rolando sobre superfície horizontal). Retornando ao problema do discohomogêneo com massa M e raio a que rola sobre uma superfície horizontal sem tombar, discu-tido no exercício 1.4, o seu movimento será agora deduzido.

As quantidades relevantes para este problema estão definidas na figura 3.36. Essas quanti-dades seguem as convenções realizadas nas figuras 3.15 e 3.16, enquanto que os ângulos φ e ψsão os ângulos de Euler definidos na figura 3.20. Dessa forma, o ponto O é o centro de massado disco e será também a origem do referencial do corpo.

trajetória

linha nodal

R′

S′

ψ

rC

O x′2

x′1

x′3

C

φ

Figura 3.36: Disco rolando sem tombar sobre uma superfície horizontal.

Orientando o eixo x3 na direção perpendicular ao plano do disco e os eixos x1 e x2 sobre oplano do mesmo, todos serão eixos principais de inércia, com I1 = I2 e I3 = 2I1, de acordo com olema 3.2 e o teorema 3.3. Assim, basta calcular

I3 =

ˆd3r ρ (r)

(x2

1 + x22

), com ρ = σδ (x3) e σ =

M

πa2,

I3 = 2πσ

ˆ a

0

dr r3 =π

2σa4 =

1

2Ma2.

Portanto, a matriz de inércia do disco é

I = I

1 0 00 1 00 0 2

, sendo I =1

4Ma2.

O movimento do disco será agora descrito empregando-se o formalismo lagrangiano e osângulos de Euler. Neste caso, definem-se as seguintes condições iniciais para a posição inicial

19Ver hyperlinks no arquivo PDF.

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 161: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 155

do centro de massa e os ângulos de Euler:

X ′10 = 0, X ′20 = 0, X ′30 = a = cte., φ0 = π, θ0 =π

2, ψ0 = 0.

Neste caso, a matriz de rotação (3.32b) assume a forma

R =

−1 0 00 0 10 1 0

,

resultando

x1 = −x′1 x2 = x′3 x3 = x′2.

Para o cálculo da energia cinética total do disco, é conveniente usar a expressão (3.29c),válida quando a origem do referencial do corpo está no centro de massa (o centro geométrico) dodisco. Desta forma, se R′ = (X ′1, X

′2, a), a energia cinética fica

T =1

2MV ′2 +

1

2

[I1(ω2

1 + ω22

)+ I3ω

23

],

onde foram empregadas as componentes da velocidade angular no referencial do corpo.Neste momento, uma observação importante deve ser feita. Em função da condição inicial

adotada para o ângulo φ, a ilustração para o valor instantâneo deste ângulo na figura 3.36 narealidade corresponde ao ângulo inicial φ0 = π adicionado ao valor ilustrado. Este fato seráimportante para as componentes da velocidade angular no referencial fixo, pois nas mesmasdeve ser realizada a transformação φ −→ φ+π. Dessa maneira, a partir de (3.33), as componentesda velocidade angular em ambos os referenciais (S′ e S) são

ω1 = φ sen θ senψ + θ cosψ ω′1 = −θ cosφ− ψ senφ sen θ

ω2 = φ sen θ cosψ − θ senψ ω′2 = −θ senφ+ ψ cosφ sen θ

ω3 = φ cos θ + ψ ω′3 = φ+ ψ cos θ.

(3.52)

Com isso, a Lagrangiana fica

LX ′1, X

′2, φ, θ, θ, ψ

=

1

2M(X ′21 + X ′22

)+

1

2I

[θ2 + φ2 sen2 θ + 2

(ψ + φ cos θ

)2],

uma vez que a energia potencial é constante.Como ocorre rolamento, a condição (3.31) deve ser empregada. De acordo com a figura 3.36,

rC = (0, 0,−a), de onde se obtém

ω× rC =

∣∣∣∣∣∣e′1 e

′2 e′3

ω′1 ω′2 ω′3

0 0 −a

∣∣∣∣∣∣ = −a(ω′2 e

′1 − ω′1 e

′2

). Ou seja,

X ′1 − aω′2 = 0, X ′2 + aω′1 = 0.

Nota-se que foram empregadas as componentes de ω no referencial S′, as quais são dadasagora por (3.52). Estas condições fornecem dois vínculos não holônomos para o problema. Umterceiro vínculo (holônomo) vem da condição de não tombamento. Esta imposição faz com queθ (o ângulo entre os eixos x3 e x′3) permaneça sempre constante. Portanto, os vínculos impostossobre o movimento do disco são

f1 = X ′1 − aψ cosφ = 0, f2 = X ′2 − aψ senφ = 0, f3 = θ − θ0 = 0,

sendo que a imposição θ = π/2 já foi aplicada sobre f1 e f2.Como o vínculo f3 é holônomo, este também pode ser diretamente substituído na Lagrangi-

ana, a qual se reduz então a

LX ′1, X

′2, φ, ψ

=

1

2M(X ′21 + X ′22

)+

1

2I(φ2 + 2ψ2

).

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 162: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

156 3.12. Dinâmica de corpos rígidos sem pontos fixos

As equações de Euler-Lagrange são dadas por (1.60b), resultando

∂L

∂X ′1− d

dt

∂L

∂X ′1+ λ1

∂f1

∂X ′1+ λ2

∂f2

∂X ′1= 0

∂L

∂X ′2− d

dt

∂L

∂X ′2+ λ1

∂f1

∂X ′2+ λ2

∂f2

∂X ′2= 0

∂L

∂φ− d

dt

∂L

∂φ+ λ1

∂f1

∂φ+ λ2

∂f2

∂φj= 0

∂L

∂ψ− d

dt

∂L

∂ψ+ λ1

∂f1

∂ψ+ λ2

∂f2

∂ψ= 0

=⇒

−MX ′1 + λ1 = 0

−MX ′2 + λ2 = 0

Iφ = 0

2Iψ + λ1a cosφ+ λ2a senφ = 0.

A solução para φ (t) é

φ (t) = φ0t.

Como os vínculos f1 e f2 impõe

X ′1 = aψ cosφ− aφψ senφ, X ′2 = aψ senφ+ aφψ cosφ,

os vínculos são dados por

λ1 = MX ′1= Ma(ψ cosφ− ψφ senφ

)= Ma

(ψ cosφ− φ0ψ senφ

)λ2 = MX ′2= Ma

(ψ senφ+ ψφ cosφ

)= Ma

(ψ senφ+ φ0ψ cosφ

).

Da última equação resulta

2Iψ +Ma2(ψ cosφ− φ0ψ senφ

)cosφ+Ma2

(ψ senφ+ φ0ψ cosφ

)senφ = 0,

2Iψ +Ma2ψ = 0 =⇒ ψ = 0.

Ou seja,

ψ (t) = ψ0t+ ψ0 = ψ0t.

Finalmente,

X ′1 = aψ cosφ = aψ0 cos(φ0t)

X ′2 = aψ senφ = aψ0 sen(φ0t) =⇒

X ′1 (t) = aψ0

φ0

sen(φ0t)

X ′2 (t) = aψ0

φ0

[1− cos

(φ0t)].

Observa-se que a trajetória do centro de massa é uma circunferência:

X ′21 +

(X ′2 − a

ψ0

φ0

)2

=

(aψ0

φ0

)2

.

Exemplo 3.7 (Disco rolando (sem tombar) sobre um plano inclinado). Considera-se agoraa dinâmica de um disco uniforme rolando sobre um plano de inclinação α, como ilustrado nafigura 3.37.

Orientando agora os eixos x′1 e x′2 sobre o plano inclinado e definindo U = 0 no ponto superiorda inclinação, a energia potencial é dada em termos da posição do centro de massa como

U (x′1) = −MgX ′1 senα.

Usando as mesmas condições iniciais do problema anterior,

X ′10 = 0 X ′20 = 0 φ0 = π θ0 =π

2ψ0 = 0,

e as equações de vínculos, obtidas a partir de (3.31) e (3.52),

f1 = X ′1 − aψ cosφ = 0, f2 = X ′2 − aψ senφ = 0,

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 163: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 3. A Dinâmica dos Corpos Rígidos 157

linha nodal

φ

x′2

α

ψ

x1

x2x3

x′1

Figura 3.37: Um disco rola sem deslizar e sem tombar sobre um plano inclinado fixo.

onde novamente é imposta a proibição de tombamento sobre o disco.Assim, a Lagrangiana fica agora

L =1

2M(X ′21 + X ′2

)+

1

2I(φ2 + 2ψ2

)+MgX ′1 senα.

De (1.60b), as equações de Euler-Lagrange ficam

∂L

∂X ′1− d

dt

∂L

∂X ′1+ λ1

∂f1

∂X ′1+ λ2

∂f2

∂X ′1= 0

∂L

∂X ′2− d

dt

∂L

∂X ′2+ λ1

∂f1

∂X ′2+ λ2

∂f2

∂X ′2= 0

∂L

∂φ− d

dt

∂L

∂φ+ λ1

∂f1

∂φ+ λ2

∂f2

∂φ= 0

∂L

∂ψ− d

dt

∂L

∂ψ+ λ1

∂f1

∂ψ+ λ2

∂f2

∂ψ= 0

Mg senα−MX ′1 + λ1 = 0

−MX ′2 + λ2 = 0

−Iφ = 0

2Iψ + λ1a cosφ+ λ2a senφ = 0.

Novamente,

φ (t) = φ0t.

Empregando-se os vínculos, resulta para os multiplicadores de Lagrange

λ1 = MX ′1 −Mg senα = Ma(ψ cosφ− φ0ψ senφ

)−Mg senα

λ2 = MX ′2 = Ma(ψ senφ+ φ0ψ cosφ

).

E a última equação fornece

2Iψ + λ1a cosφ+ λ2a senφ = 0,

ψ =2g

3asenα cos

(φ0t).

A solução da EDO para ψ (t) é

ψ (t) = ψ0t+2g senα

3aφ20

[1− cos

(φ0t)].

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 164: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

158 3.12. Dinâmica de corpos rígidos sem pontos fixos

Finalmente,

X ′1 = aψ cosφ = a

[ψ0 +

2g senα

3aφ0

sen(φ0t)]

cos(φ0t)

X ′2 = aψ senφ = a

[ψ0 +

2g senα

3aφ0

sen(φ0t)]

sen(φ0t),

cujas soluções são, surpreendentemente,

X ′1 (t) =

[aψ0

φ0

+g senα

3φ20

sen(φ0t)]

sen(φ0t)

X ′2 (t) =aψ0

φ0

+g senα

3φ0

t−

[aψ0

φ0

+g senα

3φ20

sen(φ0t)]

cos(φ0t)

=aψ0

φ0

[1− cos

(φ0t)]

+g senα

3φ0

[t− 1

2φ0

sen(

2φ0t)].

Chamando

β =aψ0

φ0

, γ =g senα

3φ20

,

pode-se escrever

X ′1 (t) =[β + γ sen

(φ0t)]

sen(φ0t)

X ′2 (t) = β[1− cos

(φ0t)]

+ γ[φ0t− sen

(2φ0t

)].

Se ψ0 = 0, então β = 0 e a solução se reduz a

X ′1 (t) =g senα

6φ20

[1− cos

(2φ0t

)]X ′2 (t) =

g senα

6φ20

[2φ0t− sen

(2φ0t

)].

Ou seja, (X ′1 −

g senα

6φ20

)2

+

(X ′2 −

g senα

3φ0

t

)2

=

(g senα

6φ20

)2

,

isto é, o centro de massa percorre uma circunferência de raio g senα/6φ20 centrada no ponto

r′c (t) =g senα

6φ20

(e′1 + 2φ0t e

′2

).

Autor: Rudi Gaelzer – IF/UFRGS Início: 04/2014 Impresso: 26 DE NOVEMBRO DE 2018

Page 165: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

4OSCILAÇÕES ACOPLADAS

Q UANDO UM SISTEMA DE PARTÍCULAS é submetido a um agente externo cuja ação varia deforma harmônica tanto no espaço quanto no tempo, o movimento resultante das par-tículas é, na maior parte das situações, também um movimento harmônico. Quandoa ordem de grandeza típica das forças internas do sistema for maior ou equivalente à

ordem de grandeza das forças externas, a oscilação induzida em uma determinada partícula iráinfluenciar o movimento de suas vizinhas imediatas e, possivelmente, também o agente externo.As oscilações resultantes desta interação coletiva entre o sistema com o agente externo e entreas próprias partículas do sistema são denominadas oscilações acopladas.

Quando as oscilações acopladas do sistema são descritas em termos de coordenadas nor-mais, as quais são definidas de tal forma que cada coordenada oscila com uma frequênciaúnica e característica, a oscilação do sistema pode ser descrita em termos de modos normaisde oscilação, os quais consistem em frequências características de oscilação do sistema. Se asperturbações que agem sobre as partículas do sistema são tais que estas se deslocam ao longode oscilações de pequena amplitude, em comparação com escalas típicas de distâncias entreas mesmas, então o movimento do sistema pode ser descrito como aquele resultante de umacoleção de osciladores harmônicos acoplados.

Os conceitos de oscilações acopladas e modos normais de oscilação são importantes emdiversas áreas da física, tais como matéria condensada, teoria quântica de campos e o eletro-magnetismo de fluidos ionizados.

4.1 OSCILAÇÕES DE PEQUENA AMPLITUDE EM SISTE-MAS COM UM GRAU DE LIBERDADE

Para iniciar a discussão, considera-se um sistema conservativo com um único grau de liber-dade na coordenada q, cuja dinâmica é determinada pela Lagrangiana

L q, q =1

2α (q) q2 − U (q) , (4.1)

sendo α (q) > 0 uma função arbitrária de q e U (q) a função energia potencial do sistema. EstaLagrangiana gera, de acordo com (1.41), a equação de movimento

αq +1

2α′q2 +

∂U

∂q= 0,

(α′ =

dq

). (4.2)

4.1.1 CONFIGURAÇÕES DE EQUILÍBRIO E CRITÉRIO DE ESTABILI-DADE

Para que o movimento do sistema descrito pela Lagrangiana (4.1) constitua-se em um movi-mento oscilatório, é necessário que exista pelo menos uma configuração de equilíbrio determi-nada pelo valor particular q = q(0), definido por

dU

dq

∣∣∣∣q=q(0)

= 0. (4.3a)

159

Page 166: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

160 4.1. Oscilações de pequena amplitude em sistemas com um grau de liberdade

Neste caso, no instante em que o sistema se encontra no ponto de equilíbrio a equação demovimento se reduz a (

αq +1

2α′q2

)∣∣∣∣q=q(0)

= 0.

Se, adicionalmente, q = 0 em q = q(0), então q = 0 e o sistema irá se encontrar sempre emrepouso.

Se a condição de existência da configuração de equilíbrio for satisfeita, então é possível queexista uma classe de soluções de (4.2) que consistem em oscilações com amplitudes finitas emtorno de q(0). Contudo, para tanto existe uma condição adicional: o equilíbrio em q = q(0) deveser estável.

A figura 4.1 ilustra distintas configurações de equilíbrio para o sistema unidimensional des-crito pela Lagrangiana (4.1). Somente no caso (a) o equilíbrio será estável, porque então peque-nas perturbações em torno de q = q(0) irão resultar em forças restauradoras que irão estabeleceroscilações de pequena amplitude em torno de q(0). Nos casos (b) e (c), uma perturbação, pormenor que seja, irá resultar em uma divergência exponencial do sistema a partir do estado deequilíbrio.

Figura 4.1: Diferentes configurações de equilíbrio. Em (a) o equilíbrio é estável, mas em (b) e (c) o equilíbrioé instável.

Portanto, de acordo com a discussão acima, deve ser imposta a condição adicional

d2U

dq2

∣∣∣∣q=q(0)

> 0 (4.3b)

para garantir a existência de oscilações de pequena amplitude para o sistema.

4.1.2 OSCILAÇÕES DE PEQUENA AMPLITUDE EM TORNO DO PONTO

DE EQUILÍBRIO

Será assumido que o potencial do sistema satisfaz as condições (4.3a) e (4.3b). Deve existirentão uma solução da equação de movimento (4.2) que corresponda a oscilações de pequenaamplitude em torno de q = q(0). Escrevendo

q (t) = q(0) + η (t) , q (t) = η (t) ,

sendo η = η (t) a parte da solução de (4.2) flutuante em torno de q(0), desenvolve-se tanto U (q)quanto α (q) em séries de Taylor em torno de q = q(0), resultando

U (q) = U(q(0))

+

*

0dU

dq

∣∣∣∣q=q(0)︸ ︷︷ ︸

(4.3a)

(q − q(0)

)+

1

2

d2U

dq2

∣∣∣∣q=q(0)

(q − q(0)

)2

+ · · ·

= U(q(0))

+1

2

d2U

dq2

∣∣∣∣q=q(0)

η2 + · · · ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 167: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 161

α (q) = α(q(0))

+dα

dq

∣∣∣∣q=q(0)

(q − q(0)

)+ · · · = α

(q(0))

+dα

dq

∣∣∣∣q=q(0)

η + · · · .

Como se deseja uma solução correspondente a oscilações de pequena amplitude, assume-se que |η (t)| seja sempre pequeno o suficiente para justificar o truncamento das séries acima,mantendo-se somente os primeiros termos. Este procedimento visa a linearização da equação(4.2), o que permite uma solução analítica simples. Com este intuito, serão mantidos somenteos dois primeiros termos na série de U (q) e somente o primeiro termo na série de α (q), as quaisficam escritas

U (q) ≈ U0 +1

2k(0)η2, α (q) ≈ α(0), sendo

U0.= U

(q(0)), k(0) .

=d2U

dq2

∣∣∣∣q=q(0)

> 0, α(0) .= α

(q(0)).

Com as aproximações acima, a Lagrangiana (4.1) se reduz à Lagrangiana equivalente

L q, q =1

2α(0)η2 − 1

2k(0)η2,

a qual leva à equação de movimento de um oscilador harmônico

η + ω2η = 0, sendo ω =

√k(0)

α(0). (4.4)

Nesta equação, ω é a frequência angular de oscilação, sendo que k(0) corresponde a uma cons-tante elástica, enquanto que α(0) desempenha um papel semelhante a uma “massa” do sistema.

Exercício 4.1. Uma conta de massa m desliza sem atrito ao longo de uma barra horizontal fixa.A conta está presa a uma mola com constante elástica k e comprimento natural ` e sua outraextremidade está presa a uma distância vertical a do centro da barra. Esta situação é ilustradana figura 4.2. Determine as posições de equilíbrio e determine a estabilidade das mesmas noscasos ` > a e ` < a.

Figura 4.2: Sistema mecânico do exemplo4.1.

Solução: de acordo com o sistema de coordenadas ilustrado na figura, a Lagrangiana do sistemaé

L =1

2mx2 − 1

2k(√

a2 + x2 − `)2

.

As posições de equilíbrio são determinadas pelas soluções de:

U (x) =1

2k(√

a2 + x2 − `)2

=⇒ dU

dx

∣∣∣∣x0

= k

(√a2 + x2

0 − `)

x0√a2 + x2

0

= 0.

Portanto, há três posições de equilíbrio:

x00 = 0, x0± = ±√`2 − a2.

Nota-se que as posições x0± correspondem a pontos equidistantes do centro da barra e que estasolução somente existe se a < `.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 168: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

162 4.2. Oscilações em sistemas com vários graus de liberdade

Para determinar a estabilidade dos pontos de equilíbrio, calcula-se o sinal de (4.3b) nosmesmos. Como

d2U

dx2= k

[1− `a2

(a2 + x2)3/2

],

temos as situações: (i) a > `. Neste caso somente x = x00 = 0 é ponto de equilíbrio e o mesmo éestável, pois

d2U

dx2

∣∣∣∣x=0

= k

(1− `

a

)> 0.

De acordo com (4.4), a conta realiza oscilações de frequência

ω =

√k

m

(1− `

a

)em torno de x00.(ii) a < `. Neste caso, os três pontos de equilíbrio (x00, x0±) existem. Contudo, agora x = x00 éponto de equilíbrio instável, ao passo que

d2U

dx2

∣∣∣∣x0±

= k

(1− a2

`2

)> 0.

Ou seja, x = x0± são pontos de equilíbrio estáveis. A frequência das oscilações em torno destespontos é

ω =

√k

m

(1− a2

`2

).

Por fim, é importante mencionar que se a = `, resulta x00 = x0±, mas k(0) = 0. Ou seja, adinâmica do sistema não pode ser reproduzida por uma aproximação linear.

4.2 OSCILAÇÕES EM SISTEMAS COM VÁRIOS GRAUS DE

LIBERDADE

Agora serão considerados sistemas cuja dinâmica é tal que a Lagrangiana pode ser escrita emtermos de seus n graus de liberdade. Por exemplo, uma partícula se movimentando sob vínculosno espaço, ou um sistema com poucas partículas realizando o mesmo tipo de movimento. Poste-riormente será considerado de forma explícita um sistema composto por um número arbitráriode partículas autointeragentes.

Com um número n > 1 de graus de liberdade, o conceito de configuração de equilíbrio discu-tido na seção 4.1.1 nem sempre é o mais adequado. Em seu lugar, será introduzido o conceitode movimento estacionário, o qual ocorre quando o sistema de coordenadas adotado é tal queexiste pelo menos uma coordenada não cíclica constante. O conceito de movimento estacionárioserá caracterizado com os exemplos a seguir.

Exemplo 4.1 (Movimento planar sob força central). Retornando aos exemplos 1.19 e 2.1,onde foram derivadas a Lagrangiana e a Hamiltoniana de uma partícula submetida a uma forçaconservativa central, sabe-se que a coordenada azimutal ϕ é cíclica, sendo sua equação deEuler-Lagrange

ϕ =pϕ

mr2 sen2 θ, (pϕ = cte.)

e que a equação de movimento para a coordenada polar θ admite uma solução constante θ (t) =12π = cte., isto é, o movimento da partícula ocorre sempre sobre este plano. Neste caso, aLagrangiana (1.63) se reduz a

L r, r, ϕ =1

2m(r2 + r2ϕ2

)− U (r) .

Neste caso, a equação para a coordenada radial fica

mr −mrϕ2 +dU

dr= 0 =⇒ mr −

p2ϕ

mr3+dU

dr= 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 169: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 163

Esta equação de movimento admite uma solução estacionária r = r0 (órbita circular), desde que

dU

dr

∣∣∣∣r=r0

=p2ϕ

mr30

.

Este é um exemplo de movimento estacionário. No caso do potencial gravitacional, U = Ug =−A/r, sendo A = cte. > 0, temos r0 = p2

ϕ/mA.

Exemplo 4.2 (Pêndulo esférico). No exercício 2.4 foi obtida a Lagrangiana de um pênduloesférico,

Lθ, θ, ϕ

=

1

2m`2

(θ2 + ϕ2 sen2 θ

)+mg` cos θ.

A coordenada ϕ é cíclica, com equação de movimento ϕ = pϕ/m`2 sen2 θ (pϕ = cte.). Com isso, a

equação para θ fica escritaθ − ϕ2 sen θ cos θ +

g

`sen θ = 0.

Esta equação admite uma solução estacionária θ = θ0, onde

cos θ0 =g

`ϕ2, desde que |ϕ| >

√g

`; |pϕ| >

√m2`3g sen2 θ0.

Em ambos os exemplos acima, os sistemas físicos são conservativos e as condições esta-belecidas na seção 1.9.2.3 para que a função de Jacobi corresponda à energia mecânica sãosatisfeitas. Ou seja, energia mecânica pode ser identificada a partir da função h (q, q, t).

Os exemplos são também simples o suficiente para que exista somente um grau de liberdadeassociado à variável não cíclica e, neste caso, a energia mecânica pode ser escrita de umamaneira genérica como

E =1

2α (q) q2 + Uef (q) ,

sendo q a coordenada não cíclica e a função Uef (q), denominada potencial efetivo, é umaquantidade que tem dimensão de energia, contém a energia potencial do sistema, mas contémtambém termos adicionais que dependem da coordenada q. O potencial efetivo é obtido após aeliminação das coordenadas cíclicas em prol das demais. Para os exemplos discutidos,

Uef (r) =p2ϕ

2mr2+ U (r) (força central)

Uef (θ) =p2ϕ

2m`2 sen2 θ−mg` cos θ (pêndulo esférico).

Nestes casos, os movimentos estacionários obtidos consistem nas configurações de equilíbrioobtidas por

d

dqUef (q)

∣∣∣∣q(0)

= 0,

sendo que essas configurações de equilíbrio novamente novamente serão estáveis se U ′′ef

(q(0))>

0.

Exercício 4.2. Investigue a existência e a estabilidade do movimento estacionário planar de umsistema planetário.

Solução. Dada a Lagrangiana obtida no exemplo 4.1, para um sistema planetário U (r) = −A/r,sendo A = GmM > 0 (G: constante gravitacional, m: massa do planeta, M : massa da estrela).Então, o potencial efetivo e a configuração de equilíbrio resultante são:

Uef (r) =p2ϕ

2mr2− A

r=⇒ d

drUef (r)

∣∣∣∣r0

= −p2ϕ

mr30

+A

r20

= 0 =⇒ r0 =p2ϕ

mA,

o qual é justamente a órbita circular obtida no exemplo.Por sua vez, o critério de estabilidade permite concluir:

U ′′ef (r0) =3p2ϕ

mr40

− 2A

r30

=A

r30

> 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 170: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

164 4.3. Oscilações acopladas de pequena amplitude

Ou seja, uma órbita circular é estável frente a pequenas oscilações. De acordo com (4.4), qual-quer pequena perturbação aplicada a uma órbita circular irá gerar um movimento harmônicoem torno da mesma com frequência angular

ω =

√A

mr30

=

√GM

r30

.

Nota-se como essa frequência se reduz com o raio da órbita por um fator ω ∝ r−3/20 .

Exercício 4.3. Investigue a existência e a estabilidade do movimento estacionário de um pên-dulo esférico.

Solução. Agora, a Lagrangiana do exemplo 4.2 e o potencial efetivo associado resultam em:

d

dθUef (θ)

∣∣∣∣θ0

= −p2ϕ cos θ0

m`2 sen3 θ0+mg` sen θ0 = 0

pϕ=ϕm`2 sen2 θ==========⇒ cos θ0 =

g

`ϕ2, (4.5)

como já havia sido obtido e a estabilidade desse ângulo frente a pequenas perturbações resulta

U ′′ef (θ0) =p2ϕ

m`2 sen2 θ0+

3p2ϕ cos2 θ0

m`2 sen4 θ0+mg` cos θ0 =

mg`

cos θ0

(1 + 3 cos2 θ0

)> 0,

onde foi empregado (4.5). Ou seja, o movimento é estável. Pequenas perturbações em torno deθ0 terão a frequência angular

ω =

√1 + 3 cos2 θ0

cos θ0

g

`.

4.3 OSCILAÇÕES ACOPLADAS DE PEQUENA AMPLITUDE

Considera-se agora um sistema conservativo de partículas interagentes em uma situaçãoonde há n graus de liberdade, com todos os demais vínculos holônomos. Generalizando a dis-cussão realizada nas seções anteriores, supõe-se que a Lagrangiana para esse sistema possa serescrita na forma

L q, q =1

2

n∑k,`=1

Mk` (q) qkq` − U (q) , (4.6)

onde o potencial U (q) pode ser um potencial efetivo, obtido após a eliminação das coordenadascíclicas, e as funções Mk` (q) são supostas ser exatamente as expressões obtidas em (1.70),segundo as quais a matriz M = [Mk`] é simétrica (Mk` = M`k). Nesta hipótese, a energia cinéticanão possui contribuições de ordem zero ou de primeira ordem nas velocidades generalizadas.

Supõe-se que esta Lagrangiana admite configurações de equilíbrio, determinadas pelas solu-ções das equações

∂U

∂qk

∣∣∣∣q(0)

= 0, (k = 1, . . . , n) .

Assumindo então que uma pequena perturbação é aplicada ao sistema inicialmente na configu-ração de equilíbrio, escreve-se

qk = q(0)k + ηk, (k = 1, . . . , n) ,

onde os |ηk| são supostos “suficientemente pequenos” para que o desenvolvimento em sérieabaixo,

U (q) = U(q(0)

)+

n∑k=1

*0(

∂U

∂qk

∣∣∣∣q(0)

)ηk +

1

2

n∑k,`=1

(∂2U

∂qk∂q`

∣∣∣∣q(0)

)ηkη` + · · · ≈ U0 +

1

2

n∑k,`=1

Uk`ηkη`

possa ser aproximado conforme ilustrado, sendo U0.= U

(q(0)

)e

Uk`.=

∂2U

∂qk∂q`

∣∣∣∣q(0)

, (k, ` = 1, . . . , n) , (4.7a)

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 171: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 165

sendo que U = [Uk`] (a matriz potencial) é suposta não nula e simétrica (Uk` = U`k).Neste ponto, será também suposto que existe pelo menos um subconjunto das possíveis

configurações de equilíbrio que são estáveis frente a essas perturbações. A condição necessáriae suficiente para tanto pode ser obtida considerando-se o fato do sistema ser conservativo. Comisso, a integral de Jacobi (1.67) fica dada por

h (q, q) = E = U0 +1

2

n∑k,`=1

Mk`ηkη` +1

2

n∑k,`=1

Uk`ηkη`.

Para que a perturbação produza oscilações de pequena amplitude em torno da configuração deequilíbrio, é necessário que tanto o termo cinético quanto o potencial permaneçam limitados.Como a energia cinética é sempre positivo-definida e a energia mecânica deve ser conservada,isto implica que o termo potencial também deve ser positivo-definido, de tal forma que possaexistir uma configuração instantânea onde a energia potencial é máxima e a energia cinética émínima, com todas as velocidades generalizadas sendo nulas em algum instante de tempo. Emoutras palavras, o último termo na integral de Jacobi deve gerar uma barreira de potencial emum espaço de configuração n-dimensional. Assim, a condição necessária e suficiente para queuma configuração de equilíbrio seja estável é

n∑k,`=1

Uk`ηk (t) η` (t) > 0, para todo t > 0.

Desenvolvendo-se também a matriz M em torno de q(0) e realizando a aproximação na energiacinética

T =1

2

n∑k,`=1

Mk` (q) qkq` =1

2

n∑k,`=1

Tk` +

n∑j=1

(∂Mk`

∂qj

∣∣∣∣q(0)

)ηj + · · ·

ηkη` ≈ 1

2

n∑k,`=1

Tk`ηkη`,

comTk`

.= Mk`

(q(0)

), (k, ` = 1, . . . , n) , (4.7b)

sendo T = [Tk`] a matriz cinética, obtém-se a forma aproximada da Lagrangiana (4.6), escritacomo

L η, η =1

2

n∑k,`=1

Tk`ηkη` −1

2

n∑k,`=1

Uk`ηkη`, (4.8a)

ou, na forma matricial, como

L =1

2˜ηTη − 1

2ηUη, (4.8b)

sendo η =(η1 η2 · · · ηn

)Ta matriz coluna que contém os valores instantâneos das coordenadas

generalizadas.As equações de Euler-Lagrange para esta Lagrangiana são

d

dt

∂L

∂ηj− ∂L

∂ηj= 0, (j = 1, . . . , n) .

Mas,

− ∂L∂ηj

=1

2

n∑k,`=1

Uk` ∂ηk∂ηj︸︷︷︸δkj

η` + Uk`ηk∂η`∂ηj︸︷︷︸δ`j

=1

2

(n∑k=1

Ukjηk +

n∑`=1

Uj`η`

)2ª eq: `→k−−−−−−−→Ujk=Ukj

n∑k=1

Ukjηk

∂L

∂ηj=

1

2

n∑k,`=1

(Tk`

∂ηk∂ηj

η` + Tk`ηk∂η`∂ηj

)=

n∑k=1

Tkj ηk,

de onde resultam as equações de movimenton∑k=1

Tjkηk +

n∑k=1

Ujkηk = 0, (j = 1, . . . , n) . (4.9)

Este sistema de equações descreve as oscilações de n osciladores acoplados. Na próximaseção será realizada uma solução deste sistema de equações de movimento.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 172: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

166 4.3. Oscilações acopladas de pequena amplitude

4.3.1 OSCILAÇÕES ACOPLADAS: MODOS NORMAIS DE VIBRAÇÃO

Será descrito agora um método geral de soluções das equações de movimento (4.9). Outrosmétodos de solução, relacionados a este, serão descritos em seções posteriores.

Como as soluções esperadas de (4.9) são do tipo oscilador harmônico, as funções ηk = ηk (t)(k = 1, . . . , n) devem ser funções periódicas no tempo. Com base nesta hipótese, é convenienteentão representar as soluções de (4.9) em termos de séries de Fourier; ou seja, supõe-se que

ηk (t) =

∞∑s→−∞

ηkseiωst, (4.10a)

onde as quantidades ηks (k = 1, . . . , n; −∞ < s < ∞) e ωs podem ser complexas, mas que estãosujeitas à condição de realidade

η∗k (t) = ηk (t) , (4.10b)

onde z∗ = Re z − i Im z é a operação de conjugação complexa.Se as soluções do sistema (4.9) podem ser expressas pelas séries (4.10a), então, primeiro

derivando,

ηk (t) = −∞∑

s→−∞ω2s ηkse

iωst

e depois introduzindo estas séries em (4.9), as mesmas podem ser escritas,

∞∑s→−∞

[n∑k=1

(Ujk − ω2

sTjk)ηks

]eiωst = 0,

sendo que as somas podem ser permutadas porque as equações são lineares.Como as equações resultantes devem ser satisfeitas em qualquer instante de tempo, dado um

conjunto de frequências angulares ωs ainda não determinado, resulta que, necessariamente,

n∑k=1

(Ujk − ω2

sTjk)ηks = 0, (j = 1, . . . , n; −∞ < s <∞) . (4.11a)

Além disso, o conjunto das amplitudes ηks também é indeterminado, mas não pode ser vazio;caso contrário a solução seria trivial. Por isso, interpretando-se as expressões acima como umconjunto linear de equações para as amplitudes, as suas soluções somente serão não triviais se

det(U− ω2T

)= 0, (4.11b)

sendo U e T respectivamente as matrizes potencial e simétrica, dadas por (4.7a) e (4.7b).Como U e T são ambas matrizes n×n, o desenvolvimento do determinante em (4.11b) resulta

em uma equação característica do tipo

αn(ω2)n

+ αn−1

(ω2)n−1

+ · · ·+ α1

(ω2)

+ α0 = 0, (4.11c)

a qual é um polinômio de grau n para ω2. Em consequência, existem, no máximo, n valorespossíveis para ω2

s em (4.10a), o que implica no trucamento da série de Fourier para |s| > n. Alémdisso, como as raízes de (4.11c) são

ω2 = ω2s , resulta então que ω = ±ωs;

ou seja, as quantidades ωs, denominadas frequências características ou autofrequências,ocorrem sempre aos pares. Por isso, o termo n = 0 em (4.10a) também é nulo.1

Portanto, as soluções das equações de movimento (4.9) devem ser escritas como

ηk (t) =

n∑s=−n(n 6=0)

ηkseiωst, (k = 1, . . . , n) ,

1Na verdade, é possível que exista um sistema para o qual ω0 6= 0, mas, neste caso, o termo n = 0 não estaráassociado a um modo de oscilação do sistema.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 173: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 167

onde, necessariamente, ω−s = −ωs. Impondo-se agora a condição de realidade (4.10b) a essassoluções, resulta

ηk (t) = η∗k (t) =⇒n∑

s=−nηkse

iωst =

n∑s=−n

η∗kse−iω∗s t s→−s−−−−→

n∑s=−n

η∗k(−s)e−iω∗−st,

o que permite estabelecer as seguintes relações,

ηks = η∗k(−s), ωs = −ω∗−s.

Como ω−s = −ωs, a condição de realidade sobre as autofrequências implica que −ω∗−s = ω∗s = ωs;ou seja, as autofrequências são reais.

Com as relações acima, pode-se manipular ηk (t) da seguinte maneira,

ηk (t) =

n∑s=1

ηkseiωst +

−n∑s=−1

ηkseiωst

︸ ︷︷ ︸s→−s

=

n∑s=1

(ηkse

iωst + ηk(−s)eiω−st

),

ηk (t) =

n∑s=1

(ηkse

iωst + η∗kse−iωst

).

Como as amplitudes ηks ainda estão indeterminadas, pode-se escrever, sem perda de genera-lidade,

ηks =1

2csρks, (k, s = −n, . . . , n) , onde

cs = cseiφs , (ρks, cs, φs ∈ R) ,

sendo as quantidades cs e φs determinadas pelas condições iniciais do sistema. Já as quan-tidades ρks são organizadas na forma de matrizes-coluna

ρs.=

ρ1s

ρ2s

...ρks

, (s = 1, . . . , n) , (4.12a)

denominadas de vetores característicos ou autovetores. Os vetores característicos são deter-minados quando as expressões das amplitudes ηks em termos dos mesmos são introduzidas devolta nas equações (4.11a), as quais se tornam

n∑k=1

(Ujk − ω2

sTjk)ρks = 0, (j, s = 1, . . . , n) ; ou,(

U− ω2sT)ρs = 0, (s = 1, . . . , n) .

(4.12b)

Ou seja, uma vez determinadas as autofrequências como as soluções da equação característica(4.11c), para cada ωs resulta um vetor característico ρs. Em outras palavras, o problema dadeterminação das frequências e vetores característicos é equivalente à solução de um problemade autovalores envolvendo as matrizes U e T. Como as soluções ainda dependem das condiçõesiniciais, os vetores característicos são, por convenção, obtidos normalizados.

Com as definições recém realizadas, as soluções das equações de movimento podem serescritas como

ηk (t) =1

2

n∑s=1

cs(ρkse

iωsteiφs + ρkse−iωste−iφs

)=

1

2

n∑s=1

csρkseiωsteiφs + C.C.,

onde C.C. significa “complexo conjugado.” Organizando-se as soluções ηk (t) também na formade uma matriz coluna η (t)

.=(η1 η2 · · · ηk

)T, pode-se escrever

η (t) =

n∑s=1

(1

2cse

iφs

)ρse

iωst =

n∑s=1

(1

2cse

iφs

)ηs (t) ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 174: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

168 4.3. Oscilações acopladas de pequena amplitude

onde o termo complexo conjugado não foi escrito. Esta expressão é interpretada da seguintemaneira. Em um determinado instante t, o vetor η (t) com as soluções de (4.9) é sempre de-terminado por uma combinação linear (dependente das condições iniciais) dos diversos modosnormais de oscilação ou vibração do sistema, dados por

ηs (t).= ρse

iωst, (s = 1, . . . , n) .

Finalmente, com os desenvolvimentos realizados acima, as soluções de (4.9) podem ser escri-tas como

ηk (t) =

n∑s=1

csρks cos (ωst+ φs) , (k = 1, . . . , n) , (4.13)

sendo que as frequências características ωs (s = 1, . . . , n) são determinadas pelas raízes de(4.11c), enquanto que os vetores característicos ρs são determinados por (4.12b). Finalmente,as quantidades cs e φs são determinadas pelas condições iniciais impostas ao sistema.

Alguns exemplos de aplicação deste formalismo serão agora discutidos.

Exercício 4.4. A figura 4.3 mostra dois pêndulos idênticos acoplados por uma mola com cons-tante elástica κ. Assumindo oscilações de pequena amplitude, determine os modos normaisde vibração e as soluções das equações de movimento se, no instante t = 0, ambos os pêndu-los partem do repouso, com um destes deslocado da posição de equilíbrio por uma quantidade0 < a 1.

Figura 4.3: Dois pêndulos idênticos acopla-dos por uma mola com constante elástica κ.

Solução. A configuração de equilíbrio para este sistema obviamente corresponde a θ1 = θ2 = 0.Como as oscilações são supostas de pequena amplitude, pode-se desprezar o movimento verticaldos mesmos para o termo cinético, considerando-se somente o movimento horizontal. Se noequilíbrio a separação entre os pêndulos é d0, então,

x1 (t) = η1 (t) = ` sen θ1 (t) ≈ `θ1 (t) , x2 (t) = d0 + η2 (t) , η2 (t) = ` sen θ2 (t) ≈ `θ2 (t) .

Com isso, a energia cinética do sistema fica

T =1

2m(x2

1 + x22

)≈ 1

2m(η2

1 + η22

).

Já para a energia potencial, é necessário considerar-se o deslocamento vertical dos pêndulospara o cômputo da energia potencial gravitacional. Já para a energia potencial elástica, quedepende do deslocamento relativo dos pêndulos em relação à distância d0, pode-se considerarsomente o deslocamento horizontal. Escreve-se então

U = mg` [(1− cos θ1) + (1− cos θ2)] +1

2κ (x2 − x1 − d0)

2

≈ mg

2`

(η2

1 + η22

)+

1

2κ (η2 − η1)

2.

Desta maneira, a Lagrangiana do sistema fica

L =1

2m(η2

1 + η22

)−[mg

2`

(η2

1 + η22

)+

1

2κ (η2 − η1)

2

].

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 175: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 169

Comparando a mesma com a forma genérica (4.8a), identificam-se as matrizes cinética e poten-cial como

T =

(m 00 m

), U =

(mg` + κ −κ−κ mg

` + κ

).

Com estas matrizes, a equação característica (4.11b) fornece as autofrequências

det

(mg` + κ−mω2 −κ−κ mg

` + κ−mω2

)= 0 =⇒

(mg`

+ κ−mω2)2

− κ2 = 0 =⇒ ω2± =

g

`+κ± κm

.

Ou seja, as autofrequências são

ω1 =

√g

`, ω2 =

√g

`+

m.

Para cada autofrequência, os vetores característicos são dados por (4.12b). Ou seja,

(U− ω2

1T)ρ1 = 0 =⇒

(mg` + κ−mω2

1 −κ−κ mg

` + κ−mω21

)(ρ11

ρ12

)=

(κ −κ−κ κ

)(ρ11

ρ12

)= 0

=⇒ ρ11 = ρ12 =⇒ ρ1 = α

(11

)α→c1===⇒ ρ1 =

(11

)(U− ω2

2T)ρ2 = 0 =⇒

(mg` + κ−mω2

2 −κ−κ mg

` + κ−mω22

)(ρ21

ρ22

)=

(−κ−κ−κ−κ

)(ρ21

ρ22

)= 0

=⇒ ρ21 = −ρ22 =⇒ ρ2 = β

(1−1

)β→c2===⇒ ρ2 =

(1−1

).

De acordo com as autofrequências obtidas (ω1,2) e os vetores característicos associados (ρ1,2),os modos normais de vibração do sistema são

η1 (t) = ρ1eiω1t, η2 (t) = ρ2e

iω2t.

O modo normal com frequência ω1 =√g/` corresponde à oscilação em fase dos dois pêndulos,

separados sempre pela distância de equilíbrio da mola d0, conforme é ilustrado na figura 4.4(es-querda). Já o modo com frequência ω2 =

√g/`+ 2κ/m corresponde a uma oscilação em oposição

de fase, com um dos pêndulos se deslocando sempre o oposto do outro. Este comportamento édevido aos valores dos componentes do vetor característico: ρ21 = −ρ22 e está ilustrado na figura4.4(direita). O movimento geral do sistema será, portanto, uma combinação linear de ambos osmodos normais, dependente das condições iniciais.

Figura 4.4: Modos normais de vibração para dois pêndulos acoplados por uma mola.

Com os resultados obtidos, de (4.13) conclui-se as soluções gerais são:

η1 (t) = c1ρ11 cos (ω1t+ φ1) + c2ρ12 cos (ω2t+ φ2)

η2 (t) = c1ρ21 cos (ω1t+ φ1) + c2ρ22 cos (ω2t+ φ2) .

Dadas as condições iniciais

η1 (0) = 0, η2 (0) = a, η1 (0) = η2 (0) = 0,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 176: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

170 4.3. Oscilações acopladas de pequena amplitude

resulta o sistema

η1 (0) = c1 cosφ1 + c2 cosφ2 = 0

η2 (0) = c1 cosφ1 − c2 cosφ2 = a

η1 (0) = −ω1c1 senφ1 − ω2c2 senφ2 = 0

η2 (0) = −ω1c1 senφ1 + ω2c2 senφ2 = 0.

Somando-se as duas primeiras e as duas últimas, resultam

c1 cosφ1 = −c2 cosφ2 =a

2, c1 senφ1 = c2 senφ2 = 0.

Estas equações são satisfeitas se

φ1 = φ2 = 0, c1 = −c2 =a

2.

Portanto, resulta finalmente

η1 (t) =a

2(cosω1t− cosω2t) = a sen

(ω1 + ω2

2t

)sen

(ω2 − ω1

2t

)η2 (t) =

a

2(cosω1t+ cosω2t) = a cos

(ω1 + ω2

2t

)cos

(ω2 − ω1

2t

).

...

[EM CONSTRUÇÃO]...

4.3.2 COORDENADAS NORMAIS

Como os exemplos discutidos sugerem, a dinâmica de qualquer oscilador acoplado a umconjunto de n osciladores, conforme descrita pelas equações (4.9), pode ser decomposta em umacombinação linear de n modos normais de vibração.

A ideia subjacente à definição das coordenadas normais está em definir um novo sistema decoordenadas no qual cada modo normal vibra como um oscilador harmônico independente aolongo de uma das coordenadas normais. Em outras palavras, a transformação do sistema decoordenadas η = (η1, η2, . . . , ηn) para o novo sistema de coordenadas normais desacopla os grausde liberdade e o sistema passa a evoluir como um sistema de n osciladores independentes.

Dada a notação matricial η (t).=(η1 η2 · · · ηn

)T, a Lagrangiana (4.8a) pode ser escrita

L =1

2˜ηTη − 1

2ηUη,

em termos das matrizes potencial U (4.7a) e cinética T (4.7b). Definem-se agora as coordenadasnormais ζ = (ζ1, ζ2, . . . , ζn), as quais estão relacionadas com as coordenadas originais ηk (t)pela transformação ζ 7−→ η dada por

η (t) = Aζ (t) , (4.14)

onde A é uma matriz n×n a ser determinada. Substituindo esta transformação na Lagrangiana,resulta

L =1

2˜ζ(ATA

)ζ − 1

2ζ(AUA

)ζ. (4.15)

Para que a Lagrangiana, escrita em termos das coordenadas normais, descreva um sistema den osciladores desacoplados, é necessário que as matrizes ATA e AUA sejam diagonais. Ou seja, amatriz A deve ser tal que a mesma irá provocar a diagonalização tanto da matriz cinética quantoda potencial.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 177: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 171

Para determinar a forma da matriz A, considera-se um espaço vetorial cujos vetores são asmatrizes n × 1 do tipo ξ =

(ξ1 ξ2 · · · ξn

)Tsobre o corpo dos reais.2 Dados dois vetores ξ e ϑ deste

espaço, define-se o produto interno dos mesmos como

〈ξ, ϑ〉 = ξTϑ. (4.16a)

Seja agora o conjunto Υ = ρs (s = 1, . . . , n), formado pelos vetores característicos defini-dos por (4.12a) e determinados por (4.12b). Estes vetores claramente pertencem a este espaçovetorial, mas na sua determinação um de seus elementos sempre permanece indeterminado.Supondo que o problema de cálculo das frequências e vetores característicos seja não degene-rado, impõe-se então sobre Υ a condição de formar um conjunto ortonormal frente ao produtointerno (4.16a); ou seja,

〈ρr, ρs〉 = ρrTρs = δrs, (r, s = 1, . . . , n) . (4.16b)

Definindo-se então a matriz A como a matriz modal

A =

ρ1 ρ2 · · · ρnyy · · ·

y =

ρ11 ρ12 · · · ρ1n

ρ21 ρ22 · · · ρ2n

......

. . ....

ρn1 ρn2 · · · ρnn

, (4.17a)

ou seja, Ars = ρrs, se (4.16b) for satisfeita, então

〈ρr, ρs〉 = ρrTρs =

n∑k,`=1

ρkrTk`ρ`s =

n∑k,`=1

AkrTk`A`s =

n∑k,`=1

(A)rkTk`A`s =

(ATA

)rs

= δrs.

Ou seja, a matriz modal é tal queATA = In. (4.17b)

Como os vetores característicos devem satisfazer ao mesmo tempo (4.16b) e (4.12b), então

ρrUρs = ω2s ρrTρs = ω2

sδrs.

Definindo-se a matriz diagonal

W =

ω2

1 0 · · · 00 ω2

2 · · · 0...

.... . .

...0 0 · · · ω2

n

⇐⇒Wrs = ω2rδrs (r, s = 1, . . . , n) ,

e introduzindo a definição (4.17a), conclui-se então que

ρrUρs = Wrs =⇒ AUA = W. (4.17c)

Portanto, introduzindo-se os resultados (4.17b) e (4.17c) na Lagrangiana (4.15), resulta

L =1

2

n∑k=1

(ζ2k − ω2

kζ2k

). (4.18a)

Aplicando-se à mesma as equações de Euler-Lagrange

d

dt

∂L

∂ζk− ∂L

∂ζk= 0, (k = 1, . . . , n) ,

resultam as equações de movimento de n osciladores desacoplados,

ζk + ω2kζk = 0, (k = 1, . . . , n) , (4.18b)

cujas soluções gerais podem ser escritas

ζk (t) = ck cos (ωkt+ φk) , (k = 1, . . . , n) , (4.18c)

2Ver, por exemplo, Apostila de Física-Matemática, capítulo 4.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 178: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

172 4.3. Oscilações acopladas de pequena amplitude

com ck e φk determinados pelas condições iniciais. Esta solução mostra que o k-ésimo osciladorharmônico vibra com a frequência angular ωk.

A determinação das coordenadas normais possibilita então transformar um problema den osciladores acoplados que vibram nas coordenadas η1 (t), η2 (t), . . . , ηn (t) em um problemade n osciladores independentes que vibram nas coordenadas ζ1 (t), ζ2 (t), . . . , ζn (t). Uma vezdeterminadas as soluções (4.18c), as soluções para as coordenadas originais são obtidas a partirde (4.14).

Finalmente, a transformação inversa η 7−→ ζ é realizada partindo-se de (4.14), multiplicandoambos os lados pela esquerda por AT e usando (4.17b), de onde resulta

ATη = ATAζ =⇒ ζ (t) = ATη (t) . (4.19)

Sempre é possível escolher-se um conjunto de condições iniciais de modo a excitar umaoscilação acoplada “pura” ao longo de uma dada coordenada normal. Isto corresponderia a umaoscilação pura em um único modo normal. Contudo, para uma condição inicial arbitrária, emgeral a oscilação resultante será uma justaposição linear de modos normais de oscilação.

Exercício 4.5. Determine as coordenadas normais para o sistema com dois pêndulos acopladosestudado no exercício 4.4.

Solução. Dados: a matriz cinética e os vetores característicos (escritos em termos das constantesarbitrárias) obtidos no exercício,

T =

(m 00 m

), ρ1 = α

(11

), ρ2 = β

(1−1

),

a aplicação da condição (4.16b) resulta:

〈ρ1, ρ1〉 = α2(1 1)(m 0

0 m

)(11

)= 1 =⇒ α = (2m)

−1/2

〈ρ2, ρ2〉 = β2(1−1

)(m 00 m

)(1−1

)= 1 =⇒ β = (2m)

−1/2.

Observa-se também que

〈ρ1, ρ2〉 = αβ(1 1)(m 0

0 m

)(1−1

)= 0.

Ou seja, a condição de ortogonalidade entre ρ1 e ρ2 é cumprida.Assim, de (4.17a), a matriz modal para este sistema fica

A =

(ρ11 ρ12

ρ21 ρ22

)=

1√2m

(1 11−1

).

Com isso, de (4.19) as coordenadas normais resultam

(ζ1ζ2

)=

1√2m

(1 11−1

)(m 00 m

)(η1

η2

)=

√m

2

(1 11−1

)(η1

η2

)=⇒

ζ1 =

√m

2(η1 + η2)

ζ2 =

√m

2(η1 − η2) ,

enquanto que as relações inversas são dadas por (4.14),

(η1

η2

)=

1√2m

(1 11−1

)(ζ1ζ2

)=⇒

η1 =

1√2m

(ζ1 + ζ2)

η2 =1√2m

(ζ1 − ζ2) .

Dadas as soluções (4.18c), observa-se que, de fato, as expressões para η1 (t) e η2 (t) concordamcom as soluções gerais obtidas no exercício 4.4. De acordo com as soluções (4.18c), o modonormal 1, que oscila ao longo da coordenada normal ζ1, o faz na frequência ω1. Mas, de acordocom o exercício 4.4, este modo normal oscila sempre com η1 = η2, isto é, com ζ1 6= 0 e ζ2 = 0. Poroutro lado, o modo normal 2 oscila com frequência ω2 ao longo da coordenada normal ζ2. Mas,nesta situação, η1 = −η2; ou seja, de fato ζ1 = 0 e ζ2 6= 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 179: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 173

...

[EM CONSTRUÇÃO]...

4.4 OSCILAÇÕES LONGITUDINAIS EM UMA REDE PE-RIÓDICA UNIDIMENSIONAL

Nesta seção será desenvolvido um método capaz de descrever oscilações longitudinais depequenas amplitudes em uma rede periódica unidimensional.

SUPOSIÇÕES

O sistema físico em estudo está representado na figura 4.5.

1. Rede periódica unidimensional composta por n+2 (n > 1) partículas idênticas (com a mesmamassa m).

2. Interações somente entre vizinhos imediatos.

3. Forças internas restauradoras lineares, todas com a mesma constante elástica κ.

4. Forças externas: conservativas e atuando somente sobre as partículas extremas da rede(em z0 e/ou zn+1).

5. Perturbações que excitam oscilações de pequena amplitude em torno da configuração deequilíbrio.

De acordo com as suposições, a configuração de equilíbrio deste sistema é:

z0j = d1 + ja, (j = 0, 1, . . . , n+ 1) ,

onde a é a distância de equilíbrio, denominada parâmetro de rede, entre qualquer par de partí-culas do sistema.

Dada então uma perturbação sobre esta rede periódica, a qual excita oscilações longitudi-nais (ao longo do eixo z) em torno da configuração de equilíbrio, as posições instantâneas daspartículas passam a ser escritas como

zj (t) = z0j + ηj (t) , (j = 0, 1, . . . , n+ 1) ,

sendo que pela suposição de pequena amplitude das oscilações, |ηj (t)| a para qualquer j.

z0 z1 z2 z3

zz z

nzn+1n−1

Em Equilibrio

Perturbado

κ κ κ κ κ

η0 η1 η2 η3ηn−1

ηn

ηn+1

d1

O

Figura 4.5: Rede periódica unidimensional.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 180: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

174 4.4. Oscilações longitudinais em uma rede periódica unidimensional

ENERGIA CINÉTICA

A energia cinética total deste sistema é dada simplesmente por

T =1

2m

n+1∑j=0

z2j =

1

2m

n+1∑j=0

η2j .

A matriz cinética T fica então

T = m

1 0 0 · · · 0 00 1 0 · · · 0 0...

......

. . ....

...0 0 0 · · · 1 00 0 0 · · · 0 1

= mIn+2,

sendo que agora, por conveniência, o elemento Tij é

Tij = mδij , (i, j = 0, 1, . . . , n+ 1) .

ENERGIA POTENCIAL

Divide-se novamente a energia potencial total do sistema em parte externa mais parte interna.

ENERGIA POTENCIAL EXTERNA

De acordo com as suposições iniciais, este termo origina-se de forças externas (conservativas)ao sistema que atuam somente sobre as partículas nas extremidades do mesmo. Escreve-seentão

U ext = U0 (z0) + Un+1 (zn+1) ,

mantendo-se estes potenciais arbitrários.

ENERGIA POTENCIAL INTERNA

De acordo com a suposição de forças internas restauradoras lineares, com constantes elásti-cas todas iguais a κ, atuando sobre uma rede periódica em equilíbrio, a energia potencial internado sistema é

U int =1

n∑j=0

(ηj+1 − ηj)2.

Para a construção da matriz potencial, é útil escrever a expressão acima em extenso:

U int =1

2κ(η2

0 − 2η1η0 + 2η21 − 2η2η1 + 2η2

2 + · · ·+ 2η2n−1 − 2ηnηn−1 + 2η2

n − 2ηn+1ηn + η2n+1

). (4.20)

Identifica-se a matriz potencial U a partir de (4.8a) ou (4.8b),

U int =1

2ηUη =

1

2

n+1∑j,k=0

Ujkηjηk

= U00η20 + (U01 + U10) η1η0 + (U02 + U20) η2η0 + · · ·+ (U0n + Un0) ηnη0 + (U0,n+1 + Un+1,0) ηn+1η0

+ U11η21 + (U12 + U21) η2η1 + · · ·+ (U1n + Un1) ηnη1 + (U1,n+1 + Un+1,1) ηn+1η1

+ U22η22 + (U23 + U32) η3η2 + · · ·+ (U2n + Un2) ηnη2 + (U2,n+1 + Un+1,2) ηn+1η2

+ · · ·+ Un−1,n−1η

2n−1 + (Un−1,n + Un,n−1) ηnηn−1 + (Un−1,n+1 + Un+1,n−1) ηn+1ηn−1

+ Unnη2n + (Un,n+1 + Un+1,n) ηn+1,n + Un+1,n+1η

2n+1.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 181: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 175

Comparando-se o resultado deste produto matricial com (4.20), conclui-se que a matriz potencialdeve ser

U = κ

1−1 0 0 · · · 0 0 0−1 2−1 0 · · · 0 0 0

0−1 2−1 · · · 0 0 0...

......

.... . .

......

...0 0 0 0 · · · 2−1 00 0 0 0 · · · −1 2−10 0 0 0 · · · 0−1 1

, (4.21)

isto é, U é uma matriz tridiagonal.

A LAGRANGIANA E AS EQUAÇÕES DE MOVIMENTO

A Lagrangiana deste sistema de osciladores acoplados fica escrita então

L = T − U =⇒

L =1

2˜ηTη − 1

2ηUη − U0 (z0)− Un+1 (zn+1) ,

L =1

2m

n+1∑j=0

η2j −

1

2

n+1∑j,k=0

Ujkηjηk − U0 (z0)− Un+1 (zn+1) ,

L =1

2m

n+1∑j=0

η2j −

1

n∑j=0

(ηj+1 − ηj)2 − U0 (z0)− Un+1 (zn+1) .

(4.22)

As equações de Euler-Lagrange para este sistema são

d

dt

∂L

∂ηj− ∂L

∂ηj= 0, (j = 0, . . . , n+ 1) .

As equações de movimento resultantes são agora obtidas. Presta-se particular importância àaplicação das derivadas sobre o termo de energia potencial interna. Estas ficam:

∂U int

∂ηj= 0,

∂U int

∂η0= κ (η0 − η1) ,

∂U int

∂ηn+1= κ (−ηn + ηn+1) ,

∂U int

∂ηj=

1

n∑k=0

∂ηj(ηk+1 − ηk)

2= κ

n∑k=0

(ηk+1 − ηk) (δj,k+1 − δjk) , (j = 1, . . . , n)

= −κ (ηj−1 − 2ηj + ηj+1) , (j = 1, . . . , n) .

Então, para as partículas nas extremidades da rede,

(j = 0) :

∂L

∂η0= mη0,

∂L

∂η0= −κ (η0 − η1)− ∂U0

∂η0.

(j = n+ 1) :

∂L

∂ηn+1= mηn+1,

∂L

∂ηn+1= −κ (−ηn + ηn+1)− ∂Un+1

∂ηn+1.

Já para as partículas internas da rede (j = 1, . . . , n),

∂L

∂ηj= mηj ,

∂L

∂ηj= −κ

n∑k=0

(ηk+1 − ηk) (δj,k+1 − δjk) = −κ (−ηj−1 + 2ηj − ηj+1) .

Portanto, as equações de movimento ficam:mη0 − κ (η1 − η0) +

∂U0

∂η0= 0

mηj − κ (ηj−1 − 2ηj + ηj+1) = 0,

mηn+1 + κ (ηn+1 − ηn) +∂Un+1

∂ηn+1= 0.

=⇒

η0 + ω2

0 (η0 − η1) +1

m

∂U0

∂η0= 0

ηj − ω20 (ηj−1 − 2ηj + ηj+1) = 0

ηn+1 + ω20 (ηn+1 − ηn) +

1

m

∂Un+1

∂ηn+1= 0,

(4.23)

sendo que no sistema acima, j = 1, . . . , n e ω0 =√κ/m.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 182: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

176 4.4. Oscilações longitudinais em uma rede periódica unidimensional

SOLUÇÃO DAS EQUAÇÕES DE MOVIMENTO

Para resolver o sistema de equações (4.23), o método desenvolvido anteriormente pode ser emprincípio aplicado; isto é, dadas as matrizes T e U, determinam-se primeiro as autofrequênciasde oscilação como as raízes da equação característica

det(U− ω2T

)= 0,

e, para cada autofrequência ωj, determina-se o correspondente autovetor ρj pela equação deautovalores (

U− ω2jT)ρj = 0.

O problema prático em aplicar este método para um sistema com n + 2 osciladores está nofato de que a equação característica é sempre uma equação polinomial de grau n + 2 para ω2, aqual somente terá solução analítica para n 6 2, isto é, para até 4 osciladores. Na prática, já para3 (n = 1) osciladores a fórmula de cálculo das raízes3 gera expressões algebricamente longas ede difícil aplicação. Para 4 (n = 2) osciladores, a correspondente fórmula4 gera resultados aindamais extensos. A partir de então, para 5 ou mais (n > 3) osciladores não existem fórmulas queforneçam expressões analíticas para as raízes, restando então o cálculo numérico das mesmas.Portanto, embora este método a princípio permite obter as soluções analíticas do sistema (4.23),a sua aplicação prática está restrita a sistemas com um número pequeno de osciladores.

Para encontrar a solução analítica do sistema de equações (4.23) para um número arbitráriode osciladores, um novo método será agora desenvolvido. Este método é válido para as suposi-ções descritas no inicio da seção.

No desenvolvimento do método anterior, foi realizada a suposição de que o movimento de cadaoscilador é periódico no tempo, de modo que a solução da equação para o j-ésimo oscilador podesempre ser escrita na forma de uma série (truncada) de Fourier

ηj (t) =

rm∑r=−rm

ηjre−iωrt, (j = 0, . . . , n+ 1) .

Esta suposição foi verificada a posteriori, sendo que a condição de validade da mesma levajustamente à equação característica para as autofrequências ωj.

Supõe-se agora que além da periodicidade temporal, o movimento de cada partícula da redepossui uma periodicidade espacial, originária da equidistância entre quaisquer pares de partí-culas. Esta suposição de periodicidade espacial também será demonstrada a posteriori e, paraimpor a mesma, escreve-se

ηjr = αreikrja,

(j = 0, . . . , n+ 1

r = −rm,−rm + 1, . . . , 0, . . . , rm − 1, rm

), (4.24)

sendo αr uma amplitude (complexa) a ser determinada, a o parâmetro de rede e kr, denominadoo número de onda, descreve a periodicidade espacial da rede. Assim, a solução proposta para aequação de movimento da j-ésima partícula é agora

ηj (t) =

rm∑r=−rm

αrei(krja−ωrt), (j = 0, . . . , n+ 1) .

Para explorar a implicação da hipótese de periodicidade espacial, denomina-se a quantidade

ψjr (t).= krja− ωrt

a fase do r-ésimo modo normal da oscilação da j-ésima partícula, de tal modo que

ηj =∑r

αreiψjr(t).

Então, periodicidade espaço-temporal implica que se a fase do r-ésimo modo da j-ésima partículano instante t é ψjr (t), então a mesma fase parcial ocorrerá no instante t+∆t para a j+∆j (∆j > 0)partícula à direita da primeira; ou seja,

ψj+∆j,r (t+ ∆t) = kr (j + ∆j) a− ωr (t+ ∆t) = ψjr (t) ,

3A conhecida fórmula de Cardano-Tartaglia.4A fórmula de Ferrari.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 183: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 177

o que implica que(∆j) akr − ωr∆t = 0.

Este resultado pode ser interpretado da seguinte maneira. As oscilações das partículas ocorremde tal forma que existe uma perturbação que se propaga a partir da j-ésima partícula para asua direita e que se desloca ao longo da rede periódica com uma velocidade igual a

vr (kr, ωr) =(∆j) a

∆t=ωrkr, (4.25)

para o r-ésimo modo normal de oscilação.Porém, a mesma periodicidade espaço-temporal pode ocorrer também via perturbações que se

propagam para a esquerda da j-ésima partícula. Neste caso, trocando-se ∆j → −∆j, observa-seque estas perturbações viajam com a velocidade

(∆j) a

∆t= −ωr

kr= −vr.

Portanto, a onda (perturbação) pode se deslocar em ambos os sentidos em qualquer ponto darede. Assim, uma expressão mais correta para ηj (t) em (4.24) é

ηj (t) =

rm∑r=−rm

α+rei(krja−ωrt)︸ ︷︷ ︸

para direita

+α−rei(krja+ωrt)︸ ︷︷ ︸

para esquerda

, (j = 0, . . . , n+ 1) ,

sendo que foram identificados os termos que descrevem perturbações deslocando-se sobre arede para a direita ou para a esquerda, com suas respectivas amplitudes.5 Uma expressão maiscompacta para esta proposta de solução é

ηj (t) =

rm∑r=−rm

∑s=±1

αsrei(krja−sωrt), (j = 0, . . . , n+ 1) . (4.26)

A função ηj (t) dada por (4.26) é uma proposta de solução, a qual deve ser ainda posta emprova pelas equações de movimento. Esta solução depende dos conjuntos de parâmetros αsr,kr e ωr, os quais são ainda independentes entre si e arbitrários. Os seus valores específicosdevem ser determinados agora por diversas imposições tais como (i) equações de movimento, (ii)realidade das soluções, (iii) condições iniciais e (iv) condições de contorno impostas às bordas darede. Essas condições serão agora aplicadas e discutidas.

RELAÇÃO DE DISPERSÃO

A proposta para ηj (t), dada por (4.26), será agora testada frente as equações de movimento(4.23). Mais especificamente, as soluções serão testadas nas equações de movimento para aspartículas internas da rede periódica (1 6 j 6 n), ou seja,

ηj − ω20 (ηj−1 − 2ηj + ηj+1) = 0.

Define-se agora o símbolo(r, j, s)

.= krja− sωrt,

o qual será empregado para compactar a notação, quando não houver ambiguidade. Então, de(4.26),

ηj (t) = −rm∑

r=−rm

∑s=±1

αsrω2rei(r,j,s)

ηj−1 (t) =

rm∑r=−rm

∑s=±1

αsrei(r,j−1,s) =

rm∑r=−rm

∑s=±1

αsrei(r,j,s)e−ikra

ηj+1 (t) =

rm∑r=−rm

∑s=±1

αsrei(r,j+1,s) =

rm∑r=−rm

∑s=±1

αsrei(r,j,s)eikra.

5Note que em α−r, −r 6= −1 ∗ r. As amplitudes αr e α−r são, a princípio, independentes.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 184: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

178 4.4. Oscilações longitudinais em uma rede periódica unidimensional

Inserindo estas expressões na equação de movimento, obtém-seforam identificados

−rm∑

r=−rm

∑s=±1

αsrω2rei(r,j,s) − ω2

0

rm∑r=−rm

∑s=±1

αsr[e−ikra − 2 + eikra

]ei(r,j,s) = 0,

rm∑r=−rm

∑s=±1

αsrω2r + ω2

0

[e−ikra − 2 + eikra

]ei(krja−sωrt) = 0.

Para que a identidade seja satisfeita para quaisquer condições iniciais e em todos os instantesde tempo, é necessário e suficiente que

ω2r + ω2

0

[e−ikra − 2 + eikra

]= 0, ∀r, s.

Mas,2i senx = eix − e−ix ⇒

(eix − e−ix

)2= e2ix − 2 + e−2ix = −4 sen2 x.

Portanto,

ω2r = 4ω2

0 sen2

(1

2kra

),

de onde resulta a relação de dispersão

ωr (kr) = 2ω0

∣∣∣∣sen

(1

2kra

)∣∣∣∣ . (4.27)

A forma (4.27) da relação de dispersão somente é válida se kr ∈ R (r = 1, . . . , n). Neste caso,ela mostra que a frequência do r-ésimo modo normal de oscilação é também uma quantidadereal e não é independente, mas sim depende do respectivo número de onda kr, sendo que ambosse relacionam por (4.27).

Por outro lado, a relação de dispersão apenas não determina quais são os valores que krdeve assumir. Para todos os fins, o número de onda ainda é uma quantidade (real) arbitrária.Contudo, a relação (4.27) mostra que o intervalo efetivo de variação de kr é finito, pois qualquertransformação

kr → kr +2`π

a, sendo ` = 0,±1,±2, . . . ,

irá resultar em

sen

(1

2kra

)−→ sen

(1

2kra+ `π

)= (−)

`sen

(1

2kra

).

Ou seja, o intervalo de valores distintos de ωr está restrito a

0 6 kr 6π

a; 0 6 ωr 6 2ω0,

pois

ωr

(kr =

π

a− ε)

= ωr

(kr =

π

a+ ε)

= 2ω0

∣∣∣∣cos

(1

2εa

)∣∣∣∣ , para 0 < ε <π

a

e ωr (−kr) = ω (kr).A relação de dispersão (4.27) também determina a velocidade da onda, a qual consiste na

velocidade de propagação do r-ésimo modo normal de oscilação. Esta velocidade é obtida apartir de (4.25) e é definida por

cr (kr).= |vr (ωr, kr)| =

∣∣∣∣ωr (kr)

kr

∣∣∣∣ = 2ω0

∣∣∣∣ sen (kra/2)

kr

∣∣∣∣ .Escrevendo

cr (kr) = ω0a

∣∣∣∣ sen (kra/2)

kra/2

∣∣∣∣ ,observa-se que no intervalo 0 6 kr 6 π/a, a velocidade da onda varia por

ω0a > cr >2

πω0a.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 185: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 179

Este resultado mostra que as oscilações desta rede periódica apresentam o fenômeno da disper-são. Suponha que uma determinada perturbação é aplicada em uma região da rede, de tal formaque as condições iniciais consistem na superposição de diversos modos normais de oscilação,cada um com a sua intensidade inicial. Para t > 0 esta perturbação inicial começa a se propagarem ambos os sentidos, sendo que cada modo normal se desloca com a sua própria velocidadecr. Isto significa que diferentes modos normais irão se deslocar pela rede com diferentes veloci-dades, o que irá deformar o perfil inicial da perturbação. Se o sistema for linear e conservativo,a mesma energia cinética inicial irá se distribuir por regiões cada vez maiores da rede, devido àdispersão, levando à consequente redução nas intensidades dos modos normais. O fenômenoda dispersão é comum a todos os sistemas periódicos oscilantes e é a razão pela qual a maiorparte dos materiais sólidos são opacos à luz (radiação eletromagnética).

CONDIÇÃO DE REALIDADE

A proposta de solução (4.26) deverá também satisfazer a condição de realidade, isto é,

η∗j (t) = ηj (t) , (j = 0, . . . , n+ 1) .

Ou seja,

η∗j (t) =

rm∑r=−rm

∑s=±1

α∗sre−i(r,j,s) =

rm∑r=−rm

∑s=±1

αsrei(r,j,s) = ηj (t) ,

onde já foi empregado o fato de que ωr, kr ⊂ R. Mas,

rm∑r=−rm

∑s=±1

α∗sre−i(r,j,s) r→−r−−−−→

rm∑r=−rm

∑s=±1

α∗s,−re−i(−r,j,s) =

rm∑r=−rm

∑s=±1

αsrei(r,j,s),

ou seja,rm∑

r=−rm

∑s=±1

α∗s,−re−i[k−rja−sω−r(k−r)t] =

rm∑r=−rm

∑s=±1

αsrei[krja−sωr(kr)t].

Para que a identidade seja satisfeita, é suficiente que

αsr = α∗s,−r, kr = −k−r, ωr (kr) = −ω−r (k−r) = −ω−r (−kr) . (4.28)

Impondo estas relações a (4.26), escreve-se primeiro6

ηj (t) =∑s=±1

(rm∑r=1

+

−rm∑r=−1

)αsre

i(r,j,s)

=

rm∑r=1

∑s=±1

(αsre

i(r,j,s) + αs,−rei(−r,j,s)

),

onde foi realizada a transformação r → −r no segundo somatório. Mas, de acordo com asrelações (4.28),

(−r, j, s) = k−rja− sω−r (k−r) t

= −krja+ sωr (kr) t

= − (r, j, s) .

Portanto, as soluções das equações de movimento podem ser escritas como

ηj (t) =

rm∑r=1

∑s=±1

[αsre

i(krja−sωr(kr)t) + α∗sre−i(krja−sωr(kr)t)

], (j = 0, . . . , n+ 1) , (4.29)

de forma que a condição de realidade e é automaticamente satisfeita.

6O termo r = 0 continua sendo inexistente.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 186: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

180 4.4. Oscilações longitudinais em uma rede periódica unidimensional

CONDIÇÕES DE CONTORNO PARA A REDE FINITA

A solução (4.29) foi escrita de modo a mostrar que a solução ηj (t) é sempre real e que afrequência do r-ésimo modo normal ωr depende do número de onda kr através da relação dedispersão (4.27). Contudo, até este momento os números de onda continuam sendo arbitrários(dentro do intervalo 0 6 kr 6 π/a). O que irá determinar quais são os valores fisicamentecorretos para o conjunto kr são as condições de contorno impostas às partículas extremas darede periódica.

As condições de contorno empregadas na maior parte dos problemas físicos são:

(A) Extremos fixos. As forças externas aplicadas às partículas j = 0 e j = n+ 1 são tais que asmesmas permanecem sempre imóveis, ou seja,

η0 (t) = ηn+1 (t) = 0.

Esta situação pode ser visualizada estando estas partículas presas a paredes paralelas,quando então a rede somente pode executar oscilações entre as mesmas.

(B) Extremos livres. Quando U0 = Un+1 = 0 nas equações de movimento (4.23). Neste caso, ocentro de massa da rede desloca-se livremente pelo espaço.

(C) Extremos absorventes. Quando não são permitidas reflexões das ondas nos contornos, istoé, quando as intensidades dos modo normais com vr > 0 em j = 0 e vr < 0 em j = n+ 1 sãoimpostas nulas.

Estas condições emulam redes periódicas infinitas.

(D) Condições de contorno periódicas. São obtidas pela imposição

η0 (t) = ηn+1 (t) (6= 0) .

Isto implica que as partículas j = 0 e j = n+ 1 são, na verdade, a mesma partícula.

Estas condições de contorno são empregadas para descrever oscilações em redes fechadasou circulares. Por exemplo, oscilações longitudinais ao longo do anel aromático da moléculade benzeno (C6H6).

Serão consideradas aqui somente as condições de contorno (A), ou seja, extremos fixos. Nestecaso, somente n (j = 1, . . . , n) partículas realmente oscilam. Inicialmente, escreve-se (4.29) daseguinte maneira,

ηj (t) =

rm∑r=1

[∑s=±1

αsrei(krja−sωr(kr)t) +

∑s=±1

α∗sre−i(krja−sωr(kr)t)

]︸ ︷︷ ︸s→ −s↓

ηj (t) =

rm∑r=1

∑s=±1

[αsre

i(krja−sωr(kr)t) + α∗−sre−i(krja+sωr(kr)t)

].

Impondo as condições de contorno (A) sobre as soluções para j = 0, n+ 1 em (4.29), é neces-sário que

η0 (t) =

rm∑r=1

∑s=±1

(αsr + α∗−sr

)e−isωr(kr)t = 0

ηn+1 (t) =

rm∑r=1

∑s=±1

[αsre

ikr(n+1)a + α∗−sre−ikr(n+1)a

]e−isωr(kr)t = 0.

Estas condições são cumpridas em qualquer instante t > 0 se:

1. αsr = −α∗−sr. Impondo agora esta condição de contorno, resulta

ηj (t) = 2i

rm∑r=1

∑s=±1

αsr sen (krja) e−isωr(kr)t, (j = 0, . . . , n+ 1) . (4.30)

Fica agora evidente em (4.30) queη0 (t) = 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 187: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 181

2. Valores de kr. Escrevendo agora ηn+1 (t) a partir de (4.30) e impondo a condição de contorno,resulta

ηn+1 (t) =

rm∑r=1

∑s=±1

αsr

(eikr(n+1)a − e−ikr(n+1)a

)e−isωr(kr)t = 0,

o que implica que

eikr(n+1)a − e−ikr(n+1)a = 0 =⇒ sen [kr (n+ 1) a] = 0.

Para 0 6 kr 6 π/a, esta condição é cumprida se

kr (n+ 1) a = rπ =⇒ kr =rπ

(n+ 1) a, (r = 1, . . . , n) . (4.31)

Por fim, como as amplitudes αsr ainda são indeterminadas, escreve-se inicialmente

αsr =βsr2i

(βsr = β∗−sr

),

o que permite escrever a solução (4.30) como

ηj (t) =

n∑r=1

∑s=±1

βsrρjre−isωrt =

n∑r=1

ρjrξr (t) , (j = 1, . . . , n) , (4.32a)

sendo queξr (t) = Re

(γre

iωrt)

= µr cosωrt− νr senωrt, (4.32b)

onde γr ∈ C ou µr, νr ∈ R são constantes ainda a ser determinadas pelas condições iniciais.Em (4.32a) foi empregada a expressão (4.31) para os autovalores de kr e foi também definido

o autovetor ρj, cujos componentes são dados por

ρj =

ρ1j

ρ2j

...ρn−1,j

ρnj

⇐⇒ ρrj.= Fj sen

(rjπ

n+ 1

), (j, r = 1, . . . , n) .

Também devido a (4.31), as autofrequências ωr, de acordo com a relação de dispersão (4.27),ficam dadas por

ωr = 2ω0 sen

(rπ

2 (n+ 1)

), (r = 1, . . . , n) . (4.32c)

Na solução (4.32a), nota-se que as condições de contorno η0 = ηn+1 = 0 são automaticamentesatisfeitas e, portanto, o número total de autovalores kr, ωr é rm = n, o que corresponde aonúmero de partículas que realmente oscilam na rede periódica.

Impõe-se também a condição de que os autovetores ρj satisfazem a condição de ortonor-malidade

〈ρj , ρk〉.= ρTj ρk =

n∑`=1

ρ`jρ`k = δjk,

a qual fornece também o valor da constante de normalização Fj =√

2/ (n+ 1). Ou seja,

ρrj =

√2

n+ 1sen

(rjπ

n+ 1

)=⇒ ρj =

√2

n+ 1

sen(

1n+1jπ

)sen(

2n+1jπ

)...

sen(n−1n+1 jπ

)sen(

nn+1jπ

)

. (4.32d)

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 188: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

182 4.5. Oscilações arbitrárias de pequena amplitude: a corda carregada

Pode ser demonstrado que, dadas as condições iniciais ηr0.= ηr (0) e ηr0

.= ηr (0) (r = 1, . . . , n)

as constantes µr, νr são dadas por

µr =

n∑`=1

ρ`rη`0 νr = − 1

ωr

n∑`=1

ρ`rη`0. (4.32e)

Uma última observação importante é que as funções ξj (t) dadas por (4.32b) são, na verdade,os modos normais de oscilação da rede, pois substituindo (4.32a) na Lagrangiana (4.22) (comU0 = Un+1 = 0), a mesma pode ser escrita como

L =1

2

n∑j=1

(ξ2j − ω2

j ξj

),

cujas equações de movimento resultantes são

ξj + ω2j ξj = 0, (j = 1, . . . , n) ,

ou seja, equações de osciladores independentes.

4.5 OSCILAÇÕES ARBITRÁRIAS DE PEQUENA AMPLITUDE:A CORDA CARREGADA

Suposições:

1. Rede unidimensional formada por n+ 2 osciladores acoplados, com as partículas de bordafixas.

2. Interações somente entre vizinhos imediatos.

3. Forças internas centrais e restauradoras para oscilações de pequena amplitude.

Uma maneira de descrever oscilações de uma rede unidimensional tanto na direção longitu-dinal quanto nas direções transversais seria retornar a um modelo semelhante ao ilustrado nafigura 4.5, onde as partículas interagem por forças restauradoras lineares (as “molas”).

De acordo com este modelo, no equilíbrio as posições das n+ 2 partículas são dadas por

r0j = (d1 + ja) k, (j = 0, . . . , n+ 1) ,

sendo a o parâmetro de rede. Quando a rede é perturbada, as posições instantâneas das partí-culas passam a ser dadas por

rj (t) = r0j + ηj (t) , (j = 0, . . . , n+ 1) , sendo

ηj = ηj,xı+ ηj,y + ηj,zk ≡3∑i=1

ηi xi, com η0 = ηn+1 = 0.

A figura 4.6 ilustra um caso particular de oscilações possíveis em uma rede deste tipo, quandoo deslocamento das partículas é puramente transversal.

Embora este modelo seja realístico para diversos sistemas, há algumas dificuldades. A ideiaé que oscilações genéricas, que ocorrem tanto na direção longitudinal quanto na direção trans-versal possam ser desacopladas de tal forma que, independente da direção, a estrutura formaldas equações de movimento seja a mesma e semelhante às equações para o caso puramentelongitudinal discutido na seção 4.4.

Considerando-se somente as partículas identificadas por 1 6 j 6 n, a força sobre a j-ésimapartícula devida à k-ésima partícula deve ser

F jk = f (rjk) rjk, sendo f (rjk) > 0 e rjk =rjkrjk

, com rjk = rk − rj .

Mas,rjk = r0k − r0j + ηk − ηj .

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 189: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 183

ηj

η −1jη +1j

F −1j,jF +1j,j

a a

z

α β

Figura 4.6: Oscilações transversais de pequena amplitude em uma rede 1D e as forças internas atuando sobrea j-ésima partícula.

Como as interações ocorrem somente entre vizinhos imediatos, então sobre a j-ésima partículaatuam as forças

F j,j−1 = f (rj,j−1) rj,j−1 e F j,j+1 = f (rj,j+1) rj,j+1,

quando entãorj,j−1 = ηj−1 − ηj − ak e rj,j+1 = ηj+1 − ηj + ak,

conforme está ilustrado na figura 4.6. Em coordenadas Cartesianas,

rj,j±1 = (ηj±1,x − ηj,x) ı+ (ηj±1,y − ηj,y) + (ηj±1,z − ηj,z − a) k

rj,j±1 =

√(ηj±1,x − ηj,x)

2+ (ηj±1,y − ηj,y)

2+ (ηj±1,z − ηj,z − a)

2.

De acordo com o modelo, a força restauradora é elástica, i. e.,

f (rjk) = κ (rjk − a) (κ = cte.) =⇒ F jk = κ (rjk − a) rjk = κ (rjk − a)rjkrjk

.

Esta suposição leva a uma dificuldade conceitual. Definindo

δ±xi.=ηj±1,xi − ηj,xi

a,

pode-se escrever

F j,j±1 = κ (rj,j±1 − a)rj,j±1

rj,j±1

= κa

(√δ2±x + δ2

±y + (δ±z ± 1)2 − 1

)δ±xı+ δ±y + (δ±z ± 1) k√δ2±x + δ2

±y + (δ±z ± 1)2.

Se forem assumidas oscilações de pequena amplitude, tais que |δ±xi | 1, observa-se que

rj,j±1 =rj,j±1

rj,j±1=δ±xı+ δ±y + (δ±z ± 1) k√δ2±x + δ2

±y + (δ±z ± 1)2≈ δ±xı+ δ±y ± k,

onde a última expressão corresponde à ordem mais baixa na expansão em potências de δ±xi .Neste caso, uma expansão de F j,j±1 em mais baixa ordem na perturbação resulta

F j,j±1 ≈ κa(±δ±xδ±z ı± δ±yδ±z + δ±zk

).

Ou seja, as componentes transversais da força sobre a j-ésima partícula não são lineares; emconsequência, as equações de movimento na direção transversal serão formalmente distintasdas equações na direção longitudinal.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 190: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

184 4.5. Oscilações arbitrárias de pequena amplitude: a corda carregada

Para que a componente transversal da força restauradora seja linear, é necessário que a forçade tensão da “corda” seja constante, isto é, f (rjk) = τj, sendo τj o módulo da força de tensãoda corda sobre a j-ésima partícula devida a uma de suas vizinhas. Este novo modelo irá geraras equações de movimento desejadas na direção transversal, mas não pode ser aplicado paraoscilações longitudinais, uma vez que o mesmo prevê uma componente longitudinal constanteda força sobre a j-ésima partícula, ao invés de uma força restauradora.

Portanto, nenhum dos modelos de interações se aplica tanto a oscilações longitudinais quantopara oscilações transversais. Ou as forças são do tipo elástico na direção longitudinal ou do tipoforça de tensão constante na direção transversal. Devido a isto, o modelo a ser adotado dora-vante para a corda carregada somente serve para oscilações puramente transversais.

Escreve-se então

F j,j−1 = τj rj,j−1 = τjrj,j−1

rj,j−1=⇒ F j−1,j = −F j,j−1 = τj rj−1,j .

Mas, fazendo j → j + 1,

F j+1,j = τj+1rj+1,j = −F j,j+1 =⇒ F j,j+1 = τj+1rj,j+1,

onderj,j±1 ≈ δ±xı+ δ±y .

Assim, resulta como força total sobre a j-ésima partícula,

F j = F j,j−1 + F j,j+1 ≈ (τjδ−x + τj+1δ+x) ı+ (τjδ−y + τj+1δ+y) ,

F j =[τja

(ηj−1,x − ηj,x) +τj+1

a(ηj+1,x − ηj,x)

]ı+

[τja

(ηj−1,y − ηj,y) +τj+1

a(ηj+1,y − ηj,y)

],

para j = 1, . . . , n.Esta aproximação para F j,j±1 é equivalente a uma aproximação por tangentes. Por exemplo,

na figura 4.6 observa-se que, para ηj,y = 0 e com τj = τj+1, a força resultante sobre a j-ésimapartícula é

Fj = −Fj,j−1 senα− Fj,j+1 senβ = −τj (senα+ senβ) .

Mas, para pequenos deslocamentos do equilíbrio, |α, β| 1, o que permite aproximar

senα ≈ tanα =ηj − ηj−1

a= −δ−x, senβ ≈ tanβ =

ηj − ηj+1

a= −δ+x,

resultandoFj ≈ τj (δ−x + δ+x) =

τja

(ηj+1 − 2ηj + ηj−1) .

Para a derivação da energia potencial interna associada às oscilações transversais em umacorda carregada, retorna-se às propriedades (1.12) e (1.13), segundo as quais

F j,j−1 = −∇jUj,j−1 e F j,j+1 = −∇jUj,j+1 = −∇jUj+1,j .

Para que estas expressões sejam válidas, é necessário que

Uj,j−1 =1

2aτj

[(ηj−1,x − ηj,x)

2+ (ηj−1,y − ηj,y)

2], Uj,j+1 =

1

2aτj+1

[(ηj+1,x − ηj,x)

2+ (ηj+1,y − ηj,y)

2].

Por sua vez, a energia potencial interna total é obtida a partir de (1.14), segundo a qual,

U (int) =

n∑j=0

Uj,j+1 =

n∑j=0

τj+1

2a

[(ηj+1,x − ηj,x)

2+ (ηj+1,y − ηj,y)

2],

lembrando que η0,xi = ηn+1,xi = 0.Por sua vez, a energia cinética total das mesmas partículas é

T =1

2

n∑j=1

mj r2j , sendo rj = ηj .

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 191: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 185

Assim, a energia cinética total para oscilações puramente transversais é simplesmente

T =1

2

n∑j=1

mj

(η2j,x + η2

j,y

).

Portanto, a Lagrangiana do sistema de osciladores acoplados que executam oscilações pura-mente transversais no modelo da corda carregada é

L =1

2

n∑j=1

mj

(η2j,x + η2

j,y

)− 1

2a

n∑j=0

τj+1

[(ηj+1,x − ηj,x)

2+ (ηj+1,y − ηj,y)

2]. (4.33a)

Observa-se que esta Lagrangiana corresponde à forma generalizada de (4.22).Uma forma particular para (4.33a) consiste em assumir que todas as partículas são idênticas

e que a força de tensão da corda é uniforme. Neste caso,

L =m

2

n∑j=1

(η2j,x + η2

j,y

)− τ

2a

n∑j=0

[(ηj+1,x − ηj,x)

2+ (ηj+1,y − ηj,y)

2]. (4.33b)

Esta é a forma usualmente empregada para oscilações transversais em uma corda carregada.Para ambas as Lagrangianas, as equações de Euler-Lagrange correspondentes são

d

dt

∂L

∂ηj,x− ∂L

∂ηj,x= 0

d

dt

∂L

∂ηj,y− ∂L

∂ηj,y= 0,

para j = 1, . . . , n. (4.33c)

Para ondas transversais com polarização linear (isto é, para oscilações onde ηj,x 6= 0 e ηj,y = 0ou vice-versa), a solução das equações de movimento resultantes de (4.33a) seguem exatamenteo mesmo procedimento detalhado na seção 4.4. A figura 4.7 mostra os oito primeiros modos nor-mais de oscilações transversais lineares de uma corda uniforme carregada com n = 3 partículasidênticas, como solução do exercício a seguir.

Exercício 4.6. Considere uma corda carregada composta por três partículas de massa m re-gularmente espaçadas sobre a corda, a qual exerce a mesma força de tensão sobre todas aspartículas. No instante t = 0, somente a partícula central é deslocada por uma distância trans-versal h e liberada do repouso. Descreva o movimento subsequente.

Solução. Sem perda de generalidade, pode-se assumir que o deslocamento inicial é realizado aolongo da direção y. Como os movimentos transversais são desacoplados, de acordo com (4.33c),resulta que ηj,x (t) = 0, para t > 0 e j = 1, 2, 3. Assim, as condições iniciais ficam

η10 = η30 = 0, η20 = h, ηj0 = 0 (j = 1, 2, 3) ,

onde o subscrito “y” é suprimido. Da mesma forma, de (4.33a) a Lagrangiana do sistema fica

L =m

2

3∑j=1

η2j −

τ

2a

3∑j=0

(ηj+1 − ηj)2,

a qual é formalmente idêntica a (4.22) com a condição de contorno (A) (extremos fixos: η0 = η4 =0) e onde se identifica κ = τ/a.

Portanto, as soluções das equações de movimento são dadas por (4.32),

ηj (t) =

3∑r=1

ρjrξr (t) , ξr (t) = µr cosωrt− νr senωrt, ρjr =1√2

sen

(jrπ

4

),

ωr = 2ω0 sen(rπ

8

), ω0 =

√τ

ma,

para (j, r = 1, 2, 3). De acordo com as condições iniciais, conclui-se que νr = 0 (r = 1, 2, 3) e

µ1 = ρ21η20 =h√2, µ2 = ρ22η20 = 0, µ3 = ρ23η20 = − h√

2.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 192: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

186 4.5. Oscilações arbitrárias de pequena amplitude: a corda carregada

Figura 4.7: Modos normais de oscilações transversais para uma corda carregada com n = 3 partículas. Somenteos modos r = 1, 2, 3 são distintos, porque os modos r = 4, 8, . . . são nulos e os modos r = 5, 6, 7 são reproduçõesdos primeiros.

Por sua vez, os possíveis valores de√

2ρjr são mostrados na tabela abaixo:

j=

r=1 2 3

1 1√2

1 1√2

2 1 0 −13 1√

2−1 1√

2

Portanto, as soluções são:

η1 (t) =h

2√

2(cosω1t− cosω3t)

η2 (t) =h

2(cosω1t+ cosω3t)

η3 (t) =h

2√

2(cosω1t− cosω3t) ,

sendo

ω1 = 2ω0 sen(π

8

)=

√2−√

2ω0, ω2 =√

2ω0, ω3 = 2ω0 sen

(3π

8

)=

√2 +√

2ω0.

Observa-se que as condições iniciais são satisfeitas. Nota-se também que o segundo modonormal não é excitado. Os modos normais são ilustrados na figura 4.7.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 193: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 187

4.6 A CORDA CONTÍNUA: INTRODUÇÃO A UMA TEORIA

DE CAMPOS CLÁSSICOS

Será realizada nesta seção a transição de uma corda carregada, discutida na seção 4.5, parauma corda contínua, modelada como uma distribuição unidimensional contínua de massa.

O procedimento tradicional consiste em impor, sobre as quantidades definidas na seção 4.5,os limites m→ dm, a→ dx e n→∞, de tal forma que ndx→ `, sendo ` a extensão da corda, e m =´λdm finita, sendo λ a densidade linear de massa. Contudo, ao invés desse procedimento usual,

será aproveitada a oportunidade para se realizar uma breve introdução a uma teoria clássica decampos, a qual descreve a evolução dinâmica de um sistema clássico contínuo composto por umnúmero infinito de graus de liberdade. A transição discreto −→ contínuo será realizada sobre aLagrangiana da corda carregada (4.33), de onde então será obtida a equação de movimento deuma corda contínua. Este procedimento alternativo servirá de modelo para a introdução dessateoria de campo clássica.

4.6.1 A DENSIDADE LAGRANGIANA

Parte-se do sistema ilustrado pela figura 4.8, o qual representa uma corda carregada com Npartículas, regularmente espaçadas ao longo da corda que possui extensão `. Todas as suposi-ções que levam à Lagrangiana (4.33a) são supostas válidas; ou seja,

L =1

2

N∑j=1

mj η2j −

1

2a

N∑j=0

τj+1 (ηj+1 − ηj)2,

com η0 = ηN+1 = 0 e onde, por simplicidade, foram assumidas oscilações somente ao longo deuma direção transversal.

A transição discreto −→ contínuo será agora realizada sobre esta Lagrangiana. Escrevendo-se ∆x = a e a posição de equilíbrio da j-ésima partícula como xj = j∆x (j = 1, . . . , N), sendo(N + 1) ∆x = `, realiza-se a troca de notação

ηj (t)→ η (xj , t) , ηj (t)→ ∂

∂tη (xj , t) ,

de tal forma que a Lagrangiana passa a ser escrita

L =

N∑j=1

∆x1

2

mj

∆x

[∂

∂tη (xj , t)

]2

−N∑j=0

∆xτj+1

2

[η (xj + ∆x, t)− η (xj , t)

∆x

]2

.

Agora, o número total de partículas agregadas à corda passa a crescer de tal maneira que,à medida que N aumenta, as massas individuais das mesmas, que passam a ser identificadaspor ∆mj, se reduzem na mesma proporção, mantendo a massa total da corda constante. Comoa extensão da corda também permanece constante, isto implica que ∆x deve se reduzir também

Figura 4.8: Oscilações transversais em uma corda carregada com extremos fixos.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 194: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

188 4.6. A corda contínua: introdução a uma teoria de campos clássicos

na mesma propoção. Considera-se então os seguintes processos de limite:

lim∆m→0∆x→0

∆mj

∆x=dm

dx

.= λ (x) , lim

N→∞∆x→0

N∑j=0,1

∆x =

ˆ `

0

dx, lim∆x→0

η (xj + ∆x, t)− η (xj , t)

∆x=∂

∂xη (x, t) ,

onde as posições discretas xj (j = 1, . . . , N) passaram a ser referidas pela variável contínua 0 6x 6 `. De acordo com este processo de limite, a densidade linear de massa da corda pode nãoser constante ao longo da mesma. Da mesma forma, a tensão também pode não ser constante,quando então é realizada a transição τj+1 → τ (x).

Com este processo, a Lagrangiana passa a ser escrita

L =

ˆ `

0

dxL

η,∂η

∂x,∂η

∂t;x, t

,

L

η,∂η

∂x,∂η

∂t;x, t

=

1

2λ (x)

[∂

∂tη (x, t)

]2

− 1

2τ (x)

[∂

∂xη (x, t)

]2

,

(4.34)

onde o funcional L η, ηx, ηt;x, t é denominado densidade Lagrangiana, sendo introduzidatambém a notação

ηx =∂η

∂x, ηt =

∂η

∂t.

4.6.2 A INTEGRAL DE AÇÃO E A EQUAÇÃO DO CAMPO

Com a introdução da densidade Lagrangiana em (4.34), após um processo de transição deum sistema discreto de partículas para uma distribuição contínua de massa, a Lagrangianadeixa de conter a dinâmica de um sistema com um número finito de graus de liberdade para in-cluir a contribuição de um número infinito de coordenadas, através da integração da densidadeLagrangiana.

Ao final do mesmo processo, a quantidade ηj = ηj (t) deixou de descrever o valor da coorde-nada da j-ésima partícula no instante t e passou a ser escrita como a função de duas variáveisη = η (x, t), a qual descreve a amplitude da oscilação transversal da corda na posição x e no ins-tante t. A quantidade x não mais é uma variável dependente que varia com o tempo, passandoa ser também uma variável independente. Diz-se então que η = η (x, t) é o campo de oscilaçõesda corda contínua e o formalismo teórico que resulta na densidade Lagrangiana L η, ηx, ηt;x, té denominado uma teoria de campo.

Introduzindo-se agora a Lagrangiana (4.34) na integral de ação (1.36), obtém-se

S =

ˆ t2

t1

dt

ˆ x2

x1

dxL

η,∂η

∂x,∂η

∂t;x, t

, (4.35)

onde mudou-se os limites (0, `) → (x1, x2) para que a integral (4.35), escrita como um funcio-nal da densidade Lagrangiana L η, ηx, ηt;x, t, descreva de forma genérica a ação realizada pelocampo η = η (x, t) dentro do intervalo espacial x1 6 x 6 x2 e do intervalo de tempo t1 6 t 6 t2. Oformalismo responsável por este funcional visa descrever um campo com 1 + 1 dimensões (1 di-mensão espacial mais o tempo), o qual é uma variável dependente no funcional, juntamente comsuas derivadas primeiras. Dependendo do formalismo, o funcional L também pode dependerexplicitamente das variáveis independentes x e t.

Dentro do formalismo de uma teoria de campos, o Princípio de Hamilton originalmente apre-sentado na seção 1.4, deve ser ligeiramente modificado. O Princípio agora afirma que a condiçãode extremum δS = 0 irá determinar a forma do campo η (x, t) dentre todas as variações possíveisna região x1 6 x 6 x2 e t1 6 t 6 t2 e que mantêm os extremos desta região fixos, i. e., tais que

δη (x, t1) = δη (x, t2) = 0 e δη (x1, t) = δη (x2, t) = 0.

Procedendo então com o cálculo de δS em (4.35),

δS =

ˆ t2

t1

dt

ˆ x2

x1

dx δL η, ηx, ηt;x, t

=

ˆ t2

t1

dt

ˆ x2

x1

dx

(∂L

∂ηδη +

∂L

∂ηxδηx +

∂L

∂ηtδηt

).

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 195: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 189

Lembrando que δη = η2 − η1, resulta

δηx = δ

(∂η

∂x

)=∂η2

∂x− ∂η1

∂x=∂

∂x(η2 − η1) =

∂xδη, δηt =

∂tδη.

Portanto,

δS =

ˆ t2

t1

dt

ˆ x2

x1

dx

(∂L

∂ηδη +

∂L

∂ηx

∂xδη +

∂L

∂ηt

∂tδη

).

Integrando por partes os dois últimos termos,

ˆ x2

x1

dx

(∂L

∂ηx

∂xδη

)=

*0(

∂L

∂ηxδη

)∣∣∣∣x2

x1

−ˆ x2

x1

dx∂

∂x

(∂L

∂ηx

)δη,

ˆ t2

t1

dt

(∂L

∂ηt

∂tδη

)=

*0(

∂L

∂ηtδη

)∣∣∣∣t2t1

−ˆ t2

t1

dt∂

∂t

(∂L

∂ηt

)δη.

Introduzindo estes resultados de volta na expressão completa para δS e impondo a condição deextremum, resulta

δS =

ˆ t2

t1

dt

ˆ x2

x1

dx

[∂L

∂η− ∂

∂x

(∂L

∂ηx

)− ∂

∂t

(∂L

∂ηt

)]δη = 0,

o que leva por fim à equação do campo

∂x

(∂L

∂ηx

)+∂

∂t

(∂L

∂ηt

)− ∂L

∂η= 0. (4.36)

4.6.3 A EQUAÇÃO DA ONDA PARA UMA CORDA HOMOGÊNEA

Considera-se agora o caso particular de uma corda homogênea, para a qual λ = cte. e τ = cte.Introduzindo-se a densidade Lagrangiana da corda contínua (4.34),

L ηx, ηt =1

2λη2

t −1

2τη2x,

na equação de campo (4.36), observa-se que

∂x

(∂L

∂ηx

)= −τηxx = −τ ∂

∂x2,

∂t

(∂L

∂ηt

)= ληtt = λ

∂2η

∂t2,

de onde resulta a equação da onda

λ∂2η

∂t2− τ ∂

∂x2= 0. (4.37)

As soluções desta equação e diversas generalizações da mesma serão consideradas em seçõesposteriores.

4.6.4 GENERALIZAÇÕES PARA UMA TEORIA DE CAMPOS CLÁSSI-COS

Diversas generalizações para a densidade Lagrangiana (4.34) são possíveis. Esta Lagrangianacontém a dinâmica de um único campo clássico em um sistema com 1 + 1 dimensões. Umageneralização imediata para a mesma ocorre quando há N campos que evoluem em um espaçocom 3+1 dimensões (espaço 3-D + tempo). Este tipo de generalização é útil para uma formulaçãoLagrangiana do eletromagnetismo, por exemplo.

Para tanto, considera-se o conjunto de campos η1, η2, . . . , ηN, tais que

ηα = ηα (r, t) , (α = 1, . . . , N) .

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 196: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

190 4.6. A corda contínua: introdução a uma teoria de campos clássicos

Se a densidade Lagrangiana associada a estes campos depender, no máximo, de suas derivadasprimeiras, então a generalização de (4.34) fica

L = L

η1, . . . , ηN ,∇η1, . . . ,∇ηN ,

∂η1

∂t, . . . ,

∂ηN∂t

; r, t

,

onde os campos existem em um volume V (possivelmente ilimitado) de espaço.O Princípio de Hamilton aplicado a L é formulado então como

δS =

ˆ t2

t1

dt

ˆV

d3r δL

η1, . . . , ηN ,∇η1, . . . ,∇ηN ,

∂η1

∂t, . . . ,

∂ηN∂t

; r, t

= 0.

Calculando-se a variação δL , resulta

δS =

ˆ t2

t1

dt

ˆV

d3r

N∑α=1

∂L

∂ηαδηα +

∂L

∂ηα,tδηα,t +

∂L

∂ (∇ηα)· δ (∇ηα)

= 0,

onde foram empregadas as notações ηα,t = ∂ηα/∂t,

∂L

∂ (∇ηα)=

3∑k=1

∂L

∂ηα,xkxk, δ (∇ηα) =

3∑k=1

δ

(∂ηα∂xk

)xk,

onde ηα,xk = ∂ηα/∂xk.Nos dois últimos termos, pode-se realizar integrações por partes, sendo que as variações

dos campos são, como sempre, assumidas nulas sobre o contorno; ou seja, se Ω ∈ R3 é umasuperfície Gaussiana que delimita o volume V dentro do qual os campos existem, então

δηα (r, t)|Ω = 0, bem como δηα (r, t1) = δηα (r, t1) = 0, (α = 1, . . . , N) .

Adicionalmente,

δηα,t =∂

∂t(δηα) e δ (ηα,xk) =

∂xk(δηα) .

Assim, para cada campo,

ˆ t2

t1

dt∂L

∂ηα,tδηα,t =

*0

∂L

∂ηα,tδηα

∣∣∣∣t2t1

−ˆ t2

t1

dt∂

∂t

∂L

∂ηα,tδηα.

Dada também a identidade ∇· (fA) = f∇ ·A+A·∇f ,ˆV

d3r∂L

∂ (∇ηα)· δ (∇ηα) =

ˆV

d3r∂L

∂ (∇ηα)· ∇ (δηα)

=

ˆV

d3r ∇·[

∂L

∂ (∇ηα)δηα

]−ˆV

d3r ∇· ∂L

∂ (∇ηα)δηα

=

:0˛Ω

dS∂L

∂ (∇ηα)· nδηα −

ˆV

d3r ∇· ∂L

∂ (∇ηα)δηα

= −ˆV

d3r ∇· ∂L

∂ (∇ηα)δηα,

onde foi empregado o teorema da divergência, sendo n o vetor unitário que é ortogonal a cadaponto sobre a superfície Ω e dS o elemento de superfície.

Portanto,

δS =

ˆ t2

t1

dt

ˆV

d3r

N∑α=1

∂L

∂ηα− ∂

∂t

∂L

∂ηα,t−∇· ∂L

∂ (∇ηα)

δηα = 0.

Neste ponto deve ser retomada a discussão a respeito da existência de vínculos entre os diversoscampos. A situação mais simples é quando não há vínculos, em cuja situação todas as variaçõessão independentes, resultando daí o sistema de equações de campo

∂L

∂ηα− ∂

∂t

∂L

∂ηα,t−∇· ∂L

∂ (∇ηα)= 0, (α = 1, . . . , N) . (4.38)

Outras generalizações possíveis, dependendo do sistema físico em estudo podem ser:

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 197: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 191

• Campos vinculados; neste caso, a discussão sobre vínculos deve ser retomada.

• Densidades Lagrangianas que dependem de derivadas de mais alta ordem, e. g., ∂2ηα/∂t2.

• Integrais de ação com extremos não fixos: δηα (r, t1) 6= 0, etc. Este tipo de consideração éimportante na análise das propriedades de simetria dos campos e suas leis de conservação(teorema de Noether).

• Teorias de campos nos formalismos da relatividade especial e geral (campos eletromagné-ticos, gravitação).

• Teorias de campos quânticos.

O exemplo a seguir está relacionado com a última generalização e mostra como seria uma den-sidade Lagrangiana para a mecânica quântica não relativística.

Exemplo 4.3 (Formulação Lagrangiana da mecânica quântica não relativística). Sejaψ = ψ (r, t) ∈ C a função de onda de uma partícula de massa m sob um potencial U = U (r, t).Assumindo que os campos ψ (r, t) e ψ∗ (r, t) são independentes, a densidade Lagrangiana

L ψ,ψ∗, ψt,∇ψ,∇ψ∗; r, t = i~ψ∗ψt −~2

2m∇ψ · ∇ψ∗ − U (r, t)ψψ∗,

sendo ~ = h/2π onde h é a constante de Planck, com as equações de campo dadas por (4.38),tem como resultados

∂L

∂ψ− ∂

∂t

∂L

∂ψt−∇· ∂L

∂ (∇ψ)= 0 =⇒ − ~2

2m∇2ψ∗ + U (r, t)ψ∗ = −i~ψ∗t

∂L

∂ψ∗− ∂

∂t

∂L

∂ψ∗t−∇· ∂L

∂ (∇ψ∗) = 0 =⇒ − ~2

2m∇2ψ + U (r, t)ψ = i~ψt.

Ou seja, as equações de campo geram a equação de Schroedinger e o seu complexo conjugado.

4.7 SOLUÇÕES DA EQUAÇÃO DA ONDA PARA A CORDA

HOMOGÊNEA

Nesta seção alguns exemplos de soluções da equação (4.37). Esta equação será repetidaabaixo, juntamente com as condições de contorno e com condições iniciais,

∂2η

∂t2− c2 ∂

∂x2= 0,

η (0, t) = 0, η (`, t) = 0 (Condições de contorno)

η (x, 0) = Φ (x) ,∂η

∂t(x, 0) = Ψ (x) (Condições iniciais).

(4.39)

onde c =√τ/λ é uma constante com a dimensão de velocidade e, não por coincidência, é a

velocidade de propagação de uma perturbação transversal qualquer ao longo da corda.O sistema (4.39) é um típico problema de Sturm-Liouville, onde a equação diferencial parcial

é hiperbólica com condições de contorno de Dirichlet. A solução deste problema de contornopode ser obtida com o emprego de vários métodos conhecidos, alguns dos quais serão discutidosabaixo.

4.7.1 MÉTODO DE FOURIER

O método de Fourier consiste em primeiro realizar uma separação de variáveis na equaçãoparcial, obtendo-se assim equações diferenciais ordinárias, cujas soluções serão obtidas viaséries de Fourier. Os coeficientes das séries de Fourier serão finalmente determinados com aimposições das condições iniciais e de contorno.

Propõe-se a seguinte forma de solução para a equação parcial,

η (x, t) = X (x)T (t) .

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 198: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

192 4.7. Soluções da equação da onda para a corda homogênea

Inserindo esta proposta em (4.39), resulta

XT − c2X ′′T = 0 =⇒ T

c2T=X ′′

X= −k2,

onde T = dT/dt, X ′ = dX/dx, etc. Seguindo o procedimento usual do método de separação devariáveis, na última expressão, como o termo do lado esquerdo é uma função somente do tempoe o termo no centro somente depende de x, então a igualdade somente será válida para todos osvalores de x e t se ambos os lados forem iguais a uma constante, identificada por −k2. Resultamassim as equações diferenciais ordinárias

T + k2c2T = 0

X ′′ + k2X = 0.

Realizando-se a mesma separação das condições de contorno, resulta

X (0) = 0, X (`) = 0.

Isto já é o suficiente para se obter a solução da parte espacial da equação da onda. A soluçãogeral da equação para X (x) é

X (x) = A cos (kx) +B sen (kx) .

Impondo as condições de contorno, resultam

X (0) = A = 0, X (`) = B sen (k`) = 0.

Para que a solução não seja trivial (quando B = 0), é portanto necessário que

sen (k`) = 0 =⇒ kr =rπ

`, (r = 0,±1,±2, . . . ) .

Portanto, há uma infinitude de soluções possíveis para a parte espacial,

Xr (x) = Br sen (krx) , (r = 0,±1,±2, . . . ) .

As constantes Br ainda devem ser determinadas.Considera-se agora a parte temporal. A solução geral da equação correspondente é

T (t) = C cos (kct) +D sen (kct)k=kr===⇒ Tr (t) = µr cos (krct)− νr sen (krct) , (r = 0,±1, . . . ) ,

onde foi levada em conta a existência de infinitos valores possíveis para k, o que implica queexistem também infinitas soluções possíveis para a parte temporal.

Absorvendo-se as constantes indeterminadas Br nas constantes da parte temporal, a solu-ção mais geral possível do sistema (4.39), a qual satisfaz tanto a equação diferencial quanto ascondições de contorno resulta

η (x, t) =

∞∑r=1

[µr cos (krct)− νr sen (krct)] sen (krx) . (4.40a)

A esta solução serão impostas finalmente as condições iniciais, obtendo-se assim o sistema

η (x, 0) =

∞∑r=1

µr sen (krx) = Φ (x)

∂η

∂t(x, 0) = −

∞∑r=1

ckrνr sen (krx) = Ψ (x) .

Sabendo-se que ˆ `

0

dx sen (krx) sen (kmx) =1

2`δrm,

os coeficientes da série de Fourier resultam

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 199: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 193

µr =2

`

ˆ `

0

dxΦ (x) sen (krx) , νr = − 2

`ωr

ˆ `

0

dxΨ (x) sen (krx) , (4.40b)

ondeωr = krc =

`c, (r = 1, . . . ,∞)

são as autofrequências dos modos normais de oscilação da corda.

...

[EM CONSTRUÇÃO]...

4.7.2 SOLUÇÃO GERAL: MÉTODO DE CAUCHY

Como se sabe, de acordo com a teoria das equações diferenciais parciais de segunda ordem,a equação da onda (4.39) é uma equação hiperbólica. Empregando-se o método das caracterís-ticas, as curvas características desta equação são determinadas pelo sistema

dx− cdt = 0 =⇒ x− ct = ξ

dx+ cdt = 0 =⇒ x+ ct = ζ,

onde ξ e ζ são constantes ao longo das características.Isto significa que ao se realizar a troca de variáveis (x, t)→ (ξ, ζ) em (4.39), resulta

∂η

∂x=∂ξ

∂t

∂η

∂ξ+∂ζ

∂t

∂η

∂ζ=∂η

∂ξ+∂η

∂ζ,

∂η

∂t=∂ξ

∂t

∂η

∂ξ+∂ζ

∂t

∂η

∂ζ= −c∂η

∂ξ+ c

∂η

∂ζ,

∂2η

∂x2=

∂ξ

(∂η

∂ξ+∂η

∂ζ

)+

∂ζ

(∂η

∂ξ+∂η

∂ζ

)=∂2η

∂ξ2+ 2

∂2η

∂ξ∂ζ+∂2η

∂ζ2,

∂2η

∂t2= c2

∂ξ

(∂η

∂ξ− ∂η

∂ζ

)− c2 ∂

∂ζ

(∂η

∂ξ− c∂η

∂ζ

)= c2

∂2η

∂ξ2− 2c2

∂2η

∂ξ∂ζ+ c2

∂2η

∂ζ2.

Substituindo na equação, resulta∂2η

∂ξ∂ζ= 0,

a qual é a forma canônica da equação da onda.A solução geral da forma canônica é

η (ξ, ζ) = f (ξ) + g (ζ) ,

sendo f (ξ) e g (ζ) funções quaisquer das características. Portanto, a solução geral de (4.39)sempre pode ser escrita como

η (x, t) = f (x− ct) + g (x+ ct) . (4.41)

A solução geral (4.41) mostra que, independente das condições de contorno ou das condiçõesiniciais, qualquer oscilação transversal que ocorra ao longo de uma corda contínua homogêneapode ser decomposta em dois sinais que se propagam ao longo da corda com a mesma velocidadec =

√τ/λ; um dos sinais se propaga no sentido positivo e o outro no sentido negativo.

Para melhor compreender essa solução, toma-se o caso particular onde as condições decontorno e iniciais são tais que em uma fração ∆x < ` da corda somente ocorra a soluçãof (x− ct), durante um certo intervalo de tempo ∆t. Para um determinado par (x0, t0) contido

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 200: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

194 4.8. Movimento forçado ou amortecido da corda homogênea

nestes intervalos, se ξ0 = x0 − ct0, a amplitude da perturbação possui um certo valor f = f0,dado por f0 = f (ξ0). Percebe-se então que se a quantidade ξ0 permanecer constante, então aperturbação terá sempre o mesmo valor f0. Isto ocorre porque para um instante t = t1 > t0, omesmo valor para ξ = ξ0 irá ocorrer no ponto x = x1 > x0, desde que ξ0 = x1 − ct1. Ou seja, aperturbação f0 = f (ξ0) irá se deslocar ao longo da corda no sentido positivo com uma velocidadetal que ξ0 = cte. Esta velocidade é obtida derivando-se no tempo dξ/dt = 0 = dx/dt − c; ou seja,vsinal = c. A mesma interpretação vale para qualquer outro valor da constante ξ e, portanto, asolução f (x− ct) corresponde a um certo pulso com forma arbitrária que se propaga no sentidopositivo com velocidade vsinal = c. Esta interpretação pode ser repetida para a função g (x+ ct),porém, neste caso, o pulso se propaga no sentido negativo com velocidade vsinal = −c.

Figura 4.9: Propagação de um pulso ao longode uma corda em distintos instantes. Em (a),f (x− ct) = g (x+ ct). Em (b) - (d), os pulsos in-dividuais f (x− ct) e g (x+ ct) gradativamente setornam distinguíveis, à medida que o tempo passa.

Portanto, a solução geral da onda, em qualquerponto da corda e em qualquer instante de tempo,sempre pode ser escrita como uma combinaçãode dois pulsos contrapropagantes que se deslocamcom a mesma velocidade. A figura 4.9 ilustra estaconclusão.

Pode-se mostrar facilmente que a solução de on-das estacionárias (4.40), obtida após a imposiçãodas condições de contorno e iniciais, pode ser de-composta em dois pulsos contrapropagantes. Em-pregando as identidades

senα senβ =1

2[cos (α− β)− cos (α+ β)] ,

senα cosβ =1

2[sen (α− β) + sen (α+ β)] ,

observa-se que, de fato,

η (x, t) =1

2

∞∑r=1

[µr sen kr (x− ct)− νr cos kr (x− ct)]︸ ︷︷ ︸f(x−ct)

+1

2

∞∑r=1

[µr sen kr (x+ ct) + νr cos kr (x+ ct)]︸ ︷︷ ︸g(x+ct)

.

Também é interessante observar que

η (0, t) =1

2

∞∑r=1

[−µr sen krct− νr cos krct] +1

2

∞∑r=1

[µr sen krct+ νr cos krct] = 0,

η (`, t) =1

2

∞∑r=1

[µr sen kr (`− ct)− νr cos kr (`− ct)]

+1

2

∞∑r=1

[µr sen kr (`+ ct) + νr cos kr (`+ ct)] = 0.

Ou seja, as condições de contorno são sempre satisfeitas.

4.8 MOVIMENTO FORÇADO OU AMORTECIDO DA CORDA

HOMOGÊNEA

As soluções discutidas na seção 4.7 prevêem que, dada uma perturbação inicial, a oscilaçãoresultante permanecerá ocorrendo para todos os instantes posteriores. Em um sistema mais re-alístico, isto em geral não será verdade; é muito provável que ocorra a ação de algum mecanismodissipativo que irá gradativamente reduzir a amplitude das oscilações até a corda retornar aoequilíbrio. Um exemplo comum ocorre quando uma corda oscila em um fluido ou no ar.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 201: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 195

Nesta seção será apresentado um modelo que permite uma descrição um mais realística daoscilação de uma corda homogênea. O mesmo formalismo pode ser empregado quando existetambém um agente externo que serve como força motriz atuando sobre a corda.

Retornando à Lagrangiana da corda carregada homogênea (4.33b), considera-se a situaçãoonde as partículas oscilantes (j = 1, . . . , n) são submetidas a forças motrizes e/ou dissipativas,conforme discutido na seção 1.7.2.

Desta forma, supõe-se que a j-ésima partícula é submetida a uma força generalizada (nãopotencial)

Qj = Qi (ηj , ηj , t) .

Neste caso, de acordo com (1.50), as equações de Euler-Lagrange (4.33c) são transformadaspara

d

dt

∂L

∂ηj− ∂L

∂ηj= Qj (ηj , ηj , t) , (j = 1, . . . , n) ,

onde, por simplicidade, considerou-se somente oscilações em um plano.A forma final das equações de movimento depende da forma das forças generalizadas Fj. Para

obter-se expressões representativas de situações realísticas, supõe-se agora que cada partículaao longo da corda pode ser submetida tanto a uma força motriz, que depende da posição dapartícula ao longo da corda e que depende explicitamente do tempo, e também que o sistemaoscila em um meio viscoso homogêneo, o qual gera uma força de resistência proporcional àvelocidade de cada partícula; ou seja,

Qj = Fj (t)− gηj ,

sendo Fj (t) a força motriz aplicada à j-ésima partícula e g uma constante. Assim, resultam asequações

d

dt

∂L

∂ηj− ∂L

∂ηj= Fj (t)− gηj , (j = 1, . . . , n) . (4.42)

As equações de movimento acima descrevem corretamente a dinâmica das partículas, masesta formulação do problema não é adequada para se realizar a transição de uma corda car-regada para uma corda contínua executando oscilações (possivelmente forçadas) em um meioviscoso.

Uma maneira equivalente de se formular a descrição Lagrangiana deste problema e que per-mite a transição discreto −→ contínuo parte da Lagrangiana de Bateman associada. De acordocom esta formulação, a Lagrangiana (4.33b) é modificada para a forma

L =

[m

2

n∑k=1

η2k −

τ

2a

n∑k=0

(ηk+1 − ηk)2

+

n∑k=1

ηkFk (t)

]egt/m, (4.43)

onde para simplificar restringiu-se ao movimento planar das partículas. Percebe-se que nestaformulação as ações das forças motrizes e dissipativas são incorporadas à Lagrangiana.

Aplicando-se então as equações de Euler-Lagrange à Lagrangiana de Bateman (4.43),

d

dt

∂L

∂ηj− ∂L

∂ηj= 0, (j = 1, . . . , n) ,

resultam as equações de movimento

mηj + gηj −τ

a(ηj−1 − 2ηj + ηj+1) = Fj (t) , (j = 1, . . . , n) ,

as quais se reduzem a (4.23) nos casos particulares g = 0 e Fj (t) = 0. Verifica-se facilmentetambém que as mesmas equações de movimento são obtidas a partir de (4.42).

Para realizar agora a transição discreto −→ contínuo na Lagrangiana (4.43), procede-se àstransformações usuais

m→ ∆m, a→ ∆x, ja→ x, ηj (t)→ η (x, t) e ηj (t)→ ∂η

∂t,

com λ = ∆m/∆x = cte. Além disso, devem ser realizadas as seguintes considerações:

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 202: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

196 4.8. Movimento forçado ou amortecido da corda homogênea

1. Força resistiva fvisc,j = gηj: a constante g deve ser proporcional à seção reta da j-ésimapartícula durante o seu movimento no fluido viscoso. Assim, à medida que ∆m → 0, essaseção reta também deve tender a zero. Por essa razão, escreve-se g → ∆g, de tal forma que

D.=

1

2lim

∆m→0∆g→0

∆g

∆m= cte.

é uma constante de amortecimento, resultante do movimento da corda em um meio resis-tivo.

2. Força motriz Fj (t): novamente, como ∆m→ 0, a força motriz sobre cada partícula tambémdeve possuir o mesmo limite. Substui-se então Fj (t) → ∆Fj (t), de tal forma que existe olimite

f (x, t).= lim

∆m→0

∆Fj (t)

∆m,

sendo f (x, t) uma força motriz por unidade de massa aplicada à corda.

A partir das considerações acima, escreve-se inicialmente a Lagrangiana (4.43) como

L =

[1

2

n∑k=1

∆xλη2k −

1

2

n∑k=0

∆xτ

(ηk+1 − ηk

∆x

)2

+

n∑k=1

∆xληk∆Fk (t)

∆m

]e∆gt/∆m.

Aplicando-se os limites ∆x→ 0, ∆m→ 0, ∆g → 0, resulta então

L =

ˆ `

0

dxL η, ηx, ηt;x, t , (4.44a)

sendo

L η, ηx, ηt;x, t =

[1

2λη2

t −1

2τη2x + λf (x, t) η

]e2Dt (4.44b)

a densidade Lagrangiana da corda contínua em um meio viscoso e submetida a uma forçamotriz.

As equações de campo resultam então em:

∂t

∂L

∂ηt+

∂x

∂L

∂ηx− ∂L

∂η= 0,

levando a∂2η

∂t2+ 2D

∂η

∂t− c2 ∂

∂x2= f (x, t) , (4.45a)

sendo esta última a equação da onda para oscilações transversais da corda com amortecimentoe força externa.

Para se resolver a equação (4.45a) com as condições de contorno/iniciais

η (0, t) = η (`, t) = 0,

η (x, 0) = Φ (x) ηt (x, 0) = Ψ (x) ,(4.45b)

propõe-se a solução

η (x, t) =

∞∑r=1

ηr (t) sen (λrx) , sendo novamente λr =rπ

`,

a qual automaticamente satisfaz as condições de contorno. Inserindo essa solução na equação,resulta

∞∑r=1

(ηr + 2Dηr + ω2

rηr)

sen (λrx) = f (x, t) , com ωr = λrc.

Multiplicando-se ambos os lados por sen (λsx) e integrando, resulta

∞∑r=1

(ηr + 2Dηr + ω2

rηr) ˆ `

0

dx sen (λrx) sen (λsx)︸ ︷︷ ︸`2 δrs

=

ˆ `

0

dx f (x, t) sen (λsx)︸ ︷︷ ︸fs(t)

,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 203: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 197

ηr + 2Dηr + ω2rηr =

2

`fr (t) , (4.46)

sendo fr (t) a componente de f (x, t) que atua como um agente motriz sobre o r-ésimo modonormal de oscilação. A equação para ηr (t) pode ser resolvida com os métodos usuais paraEDOs.

Exercício 4.7. Descreva o movimento de uma corda homogênea de extensão ` que parte dorepouso e é submetida a uma força motriz sinusoidal com frequência angular ω, aplicada noponto x = `/2.

Solução. O primeiro passo consiste em resolver-se a EDO (4.46). Para tanto, primeiramente, aforça motriz por unidade de massa f (x, t) deve ser escrita

f (x, t) = f0 sen (ωt) δ

(x− `

2

).

Neste caso, a força por modo normal resulta

fr (t) =

ˆ `

0

dx f (x, t) sen (λrx) = f0 sen (ωt) sen

(λr`

2

).

Nota-se que fr (t) = 0 para r = 2, 4, 6, . . . . Portanto, a EDO (4.46) fica

ηr + 2Dηr + ω2rηr =

2

`f0 sen

(λr`

2

)︸ ︷︷ ︸

Cr

sen (ωt) .

A EDO acima é resolvida empregando-se o método de variação de parâmetros. Em primeirolugar, a equação homogênea associada tem como solução

ηr,h + 2Dηr,h + ω2rηr,h = 0 ; ηr,h (t) =

(Are

−√D2−ω2

rt +Bre√D2−ω2

rt)e−Dt.

Observa-se que ambas as soluções LI são amortecidas, com os três tipos possíveis de amorteci-mento,

Subamortecimento: D < ωr;

Amortecimento crítico: D = ωr;

Superamortecimento: D > ωr;

ocorrendo para diferentes modos normais; ou seja, o regime passa de subamortecido para su-peramortecido no modo normal r dado por

ωr = λrc = D ⇒ r =`D

πc.

Empregando-se o método de variação de parâmetros, pode-se mostrar que a solução geral daEDO acima é

ηr (t) = Are−(D+γr)t +Bre

−(D−γr)t + η(p)r (t) , sendo

η(p)r (t) =

Cr sen (ωt− φr)√(ω2r − ω2)

2+ 4D2ω2

, com tanφr =2ωD

ω2r − ω2

.

Observa-se que os dois primeiros termos correspondem a oscilações transientes amortecidase, após um intervalo suficientemente longo de tempo, a oscilação do r-ésimo modo normal édada simplesmente por η(p)

r (t). Portanto, após esse intervalo de tempo, a oscilação da corda serádada por

η (x, t) =2

`f0

∞∑r=1

sen(rπ

2

) sen (λrx) sen (ωt− φr)√(ω2r − ω2)

2+ 4D2ω2

.

Observa-se também que há uma dependência complicada o denominador, o qual pode seaproximar da ressonância para o modo normal r, tal que(

ω2r − ω2

)2+ 4D2ω2 = 0.

Mesmo que a ressonância não ocorra, somente um número finito de modos normais, situadospróximos ao mínimo do denominador, são os que dominam o movimento da corda.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 204: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

198 4.9. Equação da onda em meios dispersivos

4.9 EQUAÇÃO DA ONDA EM MEIOS DISPERSIVOS

Uma outra maneira de se obter a solução geral da equação da onda consiste no emprego detransformações integrais, em particular as transformações de Fourier ou Laplace. O método dastransformadas integrais é muito poderoso, pois permite resolver o problema da corda contínuaem situações onde os métodos discutidos na seção 4.7 não são válidos. Um ampla classe desituações onde os métodos anteriores não podem ser aplicados, mas que podem ser abordadosempregando transformações integrais ocorre quando a corda ou o ambiente que rodeia a cordasão modificados de tal forma que a mesma se torna um meio dispersivo.

Alguns casos de interesse empregando este método serão discutidos nesta seção.

4.9.1 MEIO NÃO DISPERSIVO; MÉTODO DAS TRANSFORMADAS IN-TEGRAIS

Retornando à equação da onda no vácuo,

∂2η

∂t2− c2 ∂

∂x2= 0,

a sua solução empregando o método de transformações integrais será discutida como introduçãoao assunto.

Dada a solução η (x, t), define-se a função dual no espaço de Fourier

η (k, ω).=

ˆ ∞−∞

dx

ˆ ∞−∞

dt η (x, t) e−i(kx−ωt), (4.47a)

desde que estas integrais existam. A correspondente transformação inversa é, portanto,

η (x, t) =

(1

)2¨dkdω η (k, ω) ei(kx−ωt), (4.47b)

a qual também é suposta existente. Os limites de integração na expressão acima dependem dasconsiderações que serão realizadas abaixo.

A solução da equação da onda escrita na forma (4.47b) permite uma generalização do conceitode modos normais de oscilação introduzido na seção 4.3.1 para um conjunto finito de osciladoresacoplados. Agora, a solução da equação da onda da corda contínua será composta pela soma de(em princípio) infinitos modos normais

ηkω (x, t) = η (k, ω) ei(kx−ωt),

distinguidos pelas quantidades k e ω. A função ηkω (x, t) descreve a propagação de um modonormal em particular, onde a quantidade η (k, ω) é a amplitude do modo normal, k é o número deonda, o qual se relaciona com o comprimento da onda λ pela relação λ = 2π/k e ω é a frequênciaangular da onda, relacionada com a frequência f e o período T da mesma por f = ω/2π eT = 2π/ω.

Algumas propriedades importantes da solução (4.47b) serão agora discutidas.

AS RELAÇÕES DE DISPERSÃO

Aplicando-se a transformação dupla de Fourier na equação da onda, observa-se queˆ ∞−∞

dt eiωt∂2η

∂t2= −ω2

ˆ ∞−∞

dt eiωtη

ˆ ∞−∞

dx e−ikx∂2η

∂x2= −k2

ˆ ∞−∞

dx e−ikxη;

ou seja, realizam-se as seguintes substituições na equação:

∂t−→ −iω, ∂

∂x−→ ik.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 205: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 199

Com a transformação dupla, a equação da onda se reduz à equação algébrica(ω2 − k2c2

)η (k, ω) = 0.

Para que a solução desta equação não seja trivial, i. e., η (k, ω) = 0, é necessário que a equaçãode dispersão

ω2 − k2c2 = 0

seja satisfeita. As soluções desta equação são denominadas as relações de dispersão dasondas propagando-se no meio; tratam-se de relações envolvendo a frequência angular ω dasondas com o número de onda k. Essas soluções podem ser escritas como ω = ωσ (k) ou k = kσ (ω),onde o índice σ distingue as diferentes soluções possíveis para a equação de dispersão. NestaApostila será adotada a primeira forma.

A existência das relações de dispersão mostra que o meio (no caso, a corda) somente po-derá sustentar ondas que possuam relações bem determinadas entre a frequência e o númerode onda. Outras relações entre estas duas quantidades não são suportadas e, portanto, nãoexistem.

Para o caso particular da corda homogênea, as relações de dispersão resultam, simplesmente,

ω = ωσk ≡ ωσ (k) = σkc, (σ = ±1) . (4.48)

Ou seja, a frequência das oscilações do meio será diretamente proporcional ao número de ondak.

A existência da relação de dispersão implica que na transformação inversa (4.47b) a ampli-tude espectral η (k, ω) somente será não nula para frequências que satisfaçam a relação ω = ωσk .Devido a isso, é necessário que

η (k, ω) =∑σ

η (k, ωσk ) δ (ω − ωσk ) ≡ 2π∑σ

Uσ (k) δ (ω − ωσk ) ,

ondeUσ (k)

.= (2π)

−1η (k, ωσk ) ,

sendo que a soma em σ deve refletir todas as soluções possíveis da equação de dispersão. Comisso, a transformação inversa (4.47b) passa a ser escrita

η (x, t) =1

∑σ

ˆ ∞−∞

dk Uσ (k) eikxˆdω δ (ω − ωσk ) e−iωt,

η (x, t) =1

∑σ

ˆ ∞−∞

dk Uσ (k) ei(kx−ωσk t). (4.49)

Observa-se que na expressão acima, o número de onda k foi suposto ser real.

CONDIÇÃO DE REALIDADE E PROPRIEDADES DE SIMETRIA

Como a solução η (x, t) da equação da onda descreve um fenômeno físico mensurável, estafunção deve ser necessariamente real,

η∗ (x, t) = η (x, t) .

Impondo-se esta condição de realidade à forma (4.49), resultaˆ ∞−∞

dk U∗σ (k) e−i(kx−ωσ∗k t) =

ˆ ∞−∞

dk Uσ (k) ei(kx−ωσk t),

onde foi assumido que o número de onda k é real. Fazendo-se k → −k na integral da esquerda,resulta ˆ ∞

−∞dk U∗σ (−k) ei(kx+ωσ∗−kt) =

ˆ ∞−∞

dk Uσ (k) ei(kx−ωσk t).

Para que esta igualdade seja sempre satisfeita, impõe-se as relações de simetria

Uσ (k) = U∗σ (−k) , ωσk = −ωσ∗−k ⇒

Reωσk = −Reωσ−k

Imωσk = Imωσ−k.(4.50)

Ou seja, em geral a amplitude espectral Uσ (k) e as relações de dispersão ωσk podem ser funçõescomplexas do número de onda. Isto será determinado pela equação de dispersão, que dependedas propriedades do meio onde ocorrem as oscilações e das condições iniciais e de contorno.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 206: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

200 4.9. Equação da onda em meios dispersivos

CONDIÇÕES INICIAIS E A AMPLITUDE ESPECTRAL

Dadas agora as condições iniciais

η (x, 0) = Φ (x) , ηt (x, 0) = Ψ (x) ,

de (4.49) vem

ηt (x, t) = − i

∑σ

ˆ ∞−∞

dk ωσkUσ (k) ei(kx−ωσk t).

Portanto,

η (x, 0) =1

∑σ

ˆ ∞−∞

dk Uσ (k) eikx = Φ (x)

ηt (x, 0) = − i

∑σ

ˆ ∞−∞

dk ωσkUσ (k) eikx = Ψ (x) .

Estas relações irão fornecer a intensidade espectral Uσ (k) dos modos normais de oscilação.Multiplicando-se ambos os lados das relações acima por e−ikx e integrando em x,

1

∑σ

ˆ ∞−∞

dx

ˆ ∞−∞

dk′ Uσ (k′) ei(k′−k)x =

ˆ ∞−∞

dxΦ (x) e−ikx

− i

∑σ

ˆ ∞−∞

dx

ˆ ∞−∞

dk′ ωσk′Uσ (k′) ei(k′−k)x =

ˆ ∞−∞

dxΨ (x) e−ikx.

Dada agora a identidade ˆ ∞−∞

dx ei(k′−k)x = 2πδ (k′ − k) ,

obtém-se então o sistema de equações∑σ

Uσ (k) =

ˆ ∞−∞

dxΦ (x) e−ikx

∑σ

ωσkUσ (k) = i

ˆ ∞−∞

dxΨ (x) e−ikx,

(4.51)

o qual normalmente é suficiente para fornecer a forma da intensidade espectral.Para a equação da onda em uma corda homogênea, a relação de dispersão é (4.48), o que

implica que U+ (k) + U− (k) =

ˆ ∞−∞

dxΦ (x) e−ikx

ω+k U+ (k) + ω−k U− (k) = i

ˆ ∞−∞

dxΨ (x) e−ikx,

cuja solução pode ser escrita

Uσ (k) =1

2

ˆ ∞−∞

dx e−ikx[η (x, 0) +

ωkηt (x, 0)

], (σ = ±1) , (4.52)

a qual sempre é válida quando σ = ±1 e ω−k = −ω+k.= −ωk. Este resultado fornece a intensidade

espectral da perturbação que se propaga sobre a corda.

A VELOCIDADE DE FASE

A solução formal (4.49) mostra que um determinado modo normal de oscilação será dado por

ηk,σ (x, t) = Uσ (k) ei(kx−ωσk t) = Uσ (k) eImωσk tei(kx−Reωσk t).

Para k e ωσk não nulos, esta expressão mostra que com o transcorrer do tempo, o modo normalirá se deslocar ao longo do meio, com a sua amplitude modulada por

max ηk,σ (t) = Uσ (k) eImωσk t.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 207: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 201

Usualmente, Imωσk 6 0 e isto implica que a amplitude do modo normal se reduz à medida queeste se propaga no meio. Diz-se que ocorre um amortecimento deste modo normal.

A amplitude do modo normal é multiplicada por uma função harmônica que varia com x e tdevido ao deslocamento do modo. Esse deslocamento pode ser quantificado determinando-se acondição para que a fase φ do modo normal permaneça constante, onde

φ = kx− Reωσk t.

As variações instantâneas de x e t que mantêm a fase constante são determinadas por

dt= k

dx

dt− Reωσk = 0 =⇒ vφ,σ (k) =

Reωσkk

. (4.53)

A quantidade vφ,σ (k) é a velocidade de fase do modo normal identificado pela quantidade σ.Como esta depende da relação de dispersão do modo normal, a velocidade de fase também irádepender das propriedades físicas do meio pelo qual a onda se propaga.

Uma definição importante que resulta da expressão (4.53) para a velocidade de fase é a de ummeio dispersivo. Um meio dispersivo é aquele cuja velocidade fase dos modos normais dependedo valor do número de onda (ou seja, depende do comprimento da onda); em contrapartida, ummeio não dispersivo é aquele no qual a velocidade de fase é uma constante.

A importância de um meio ser ou não dispersivo consiste no fato de que, uma vez que asolução completa da equação da onda, dada por (4.49), é escrita como uma superposição demodos normais, i. e., η (x, t) ∝

´dk ηk,σ (x, t), as condições iniciais e de contorno usualmente irão

resultar em uma distribuição de amplitudes para um número (possivelmente infinito) de modosnormais no instante t = 0, como soluções de (4.51). Se o meio for não dispersivo, a forma inicialdo pulso irá se propagar ao longo do meio sem deformação, pois todos os modos normais irãose deslocar com a mesma velocidade de fase. Por outro lado, se o meio for dispersivo, entãodiferentes modos normais irão se deslocar com diferentes velocidades de fase e o pulso inicialserá gradativamente deformado, à medida que se deslocar no meio. Este tipo de comporta-mento é muito importante na óptica, por exemplo, porque os meios materiais normalmente sãodispersivos para ondas eletromagnéticas.

SOLUÇÃO PARA MEIO NÃO DISPERSIVO

Retornando finalmente à equação da onda para a corda uniforme, como a sua relação dedispersão (4.48) é simplesmente ωσk = σkc (σ = ±1), a solução (4.49) pode ser escrita

η (x, t) =1

[ˆ ∞−∞

dk U+ (k) eik(x−ct) +

ˆ ∞−∞

dk U− (k) eik(x+ct)

]= f+ (x− ct) + f− (x+ ct) ,

onde

fσ (x− σct) .=

1

ˆ ∞−∞

dk Uσ (k) eik(x−σct), (σ = ±1)

sendo que f+(−) descreve um pulso se propagando no sentido positivo (negativo) da corda semdeformação, com o módulo da velocidade igual a c e com a amplitude espectral dada por Uσ (k).

Nota-se também que a velocidade de fase dos modos normais, dada por (4.53), neste caso setorna

vφ,σ (k) =ωσkk

= σc.

Isto é, a velocidade de propagação do pulso é exatamente a velocidade de fase.Esta é exatamente a forma geral da solução para a corda homogênea, obtida pelo método de

Cauchy apresentado na seção 4.7.2. O exemplo a seguir apresenta a solução completa para apropagação de um pulso Gaussiano.

Exemplo 4.4 (Pulso Gaussiano). Dada uma corda infinita com as condições iniciais

η (x, 0) = he−x2/α2

, ηt (x, 0) = 0,

as quais descrevem uma deformação inicial na forma de uma função Gaussiana com largura α.De (4.52) obtemos a amplitude espectral da perturbação

Uσ (k) =1

2

ˆ ∞−∞

dx e−ikxη (x, 0) =1

2h

ˆ ∞−∞

dx e−ikxe−x2/α2

,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 208: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

202 4.9. Equação da onda em meios dispersivos

resultando

Uσ (k) =

√π

2αhe−α

2k2/4;

ou seja, a amplitude espectral também é Gaussiana.Portanto, de (4.49) resulta então

η (x, t) =αh

4√π

∑σ

ˆ ∞−∞

dk e−α2k2/4eik(x−σct)

=αh

4√π

∑σ

e−(x−σct)2/α2

ˆ ∞−∞

dk exp

−1

4

[αk − 2

αi (x− σct)

]2

=αh

4√π

∑σ

2√π

αe−(x−σct)2/α2

,

ou seja,

η (x, t) =1

2h∑σ=±1

e−(x−σct)2/α2

,

o que mostra que a perturbação resultante é composta por dois pulsos Gaussianos contrapro-pagantes com a mesma largura mas com a metade da altura da deformação inicial.

4.9.2 ONDAS ESTACIONÁRIAS A PARTIR DA SOLUÇÃO GERAL

A solução obtida em (4.49), a qual descreve cada modo normal como uma onda propagando-se sobre a corda, aparentemente se contrasta com a solução da corda com as extremidadesfixas, dada, por exemplo, por (4.40), a qual descreve a solução na forma de ondas estacionárias.

Contudo, é fácil mostrar que a imposição das condições de contorno em (4.49) juntamentecom a condição de realidade, reproduz a solução em ondas estacionárias. Este procedimento érealizado a seguir.

Temos:

• Solução geral para a equação da onda:

η (x, t) =1

∑σ

ˆ ∞−∞

dk Uσ (k) ei(kx−ωσk t)

• Condições de contorno:η (0, t) = η (`, t) = 0.

• Relação de dispersão: ωσk = σkc.

• Propriedades de simetria:

Uσ (k) = U∗σ (−k) ωσk = −ωσ−k,

• Condiçoes iniciais:

Uσ (k) =1

2

ˆ ∞−∞

dx e−ikx[η (x, 0) +

ωkηt (x, 0)

](σ = ±1)

η (x, 0) = Φ (x) ηt (x, 0) = Ψ (x) .

Então, aplicando as condições de contorno e as propriedades de simetria:

η (x, t) =1

∑σ=±

ˆ ∞−∞

dk Uσ (k) eik(x−σct)

η (x, t) =1

∑σ=±

ˆ ∞0

dk[Uσ (k) eik(x−σct) + U∗σ (k) e−ik(x−σct)

]η (x, t) =

1

ˆ ∞0

dk[U+ (k) eik(x−ct) + U∗+ (k) e−ik(x−ct) + U− (k) eik(x+ct) + U∗− (k) e−ik(x+ct)

].

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 209: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 203

No contorno x = 0,

η (0, t) =1

ˆ ∞0

dk[(U+ (k) + U∗− (k)

)e−ikct +

(U∗+ (k) + U− (k)

)eikct

]Observa-se que se for imposta a relação

Uσ = −U∗−σ =⇒ η (0, t) = 0,

e esta condição de contorno é automaticamente satisfeita.Mas daí resulta ser possível escrever

η (x, t) =1

ˆ ∞0

dk[U− (k)

(eikx − e−ikx

)eikct + U∗− (k)

(e−ikx − eikx

)e−ikct

].

Escrevendo-se agora

i

πU− (k) =

1

2[µ (k) + iν (k)] , com µ (k) e ν (k) reais,

resulta então

η (x, t) =

ˆ ∞0

dk [µ (k) cos (kct)− ν (k) sen (kct)] sen (kx) .

Aplicando-se agora a condição de contorno em x = `,

η (`, t) =

ˆ ∞0

dk [µ (k) cos (kct)− ν (k) sen (kct)] sen (k`) = 0.

Se

µ (k) =

∞∑n=1

µn (kn) δ (k − kn) , kn =nπ

`(n = 1, 2, . . . ) ,

com o mesmo para ν (k), segue que

η (`, t) =

∞∑n=1

[µn (kn) cos (knct)− νn (kn) sen (knct)] sen (kn`) = 0,

a qual automaticamente satisfaz esta condição de contorno também.Portanto, resulta a solução escrita na forma de ondas estacionárias

η (x, t) =

∞∑n=1

[µn (kn) cos (knct)− νn (kn) sen (knct)] sen (knx) .

A partir deste ponto, a determinação de µn (kn) e νn (kn) a partir das condições iniciais segueo procedimento realizado na seção 4.7.1.

4.9.3 EXEMPLOS DE MEIOS DISPERSIVOS

Nesta seção serão discutidos alguns sistemas mecânicos que apresentam propriedades dis-persivas nas suas oscilações transversais.

Uma das consequências mais importantes devidas à existência da dispersão (i. e., vφ = vφ (k))é que a velocidade de fase de um determinado modo normal não mais é, em geral, a velocidadede propagação do pulso ao longo do meio. Além disso, a forma do pulso inicial não se mantémconstante à medida que este se propaga pelo meio.

CORDA OSCILANDO EM UM MEIO VISCOSO

Retornando à equação da onda (4.45a) e incluindo somente o efeito de uma força dissipativaproporcional à velocidade, a mesma se reduz a

∂2η

∂t2+ 2D

∂η

∂t− c2 ∂

∂x2= 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 210: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

204 4.9. Equação da onda em meios dispersivos

A aplicação da transformação dupla de Fourier (4.47a) implica nas substituições

∂t→ −iω, ∂2

∂t2→ −ω2,

∂2

∂x2→ −k2,

o que leva à equação de dispersão(ω2 + 2iDω − k2c2

)η (k, ω) = 0 =⇒ ω2 + 2iDω − k2c2 = 0,

cujas raízes são as relações de dispersão

ω (k) = −iD ±√k2c2 −D2 =⇒ ωσk = σ

√k2c2 −D2 − iD (σ = ±1) .

Observa-se que a relação de dispersão apresenta dois comportamentos distintos para nú-meros de onda reais; uma região (Região I) ocorre quando |k| < D/c, onde ωσk é puramenteimaginária,

ωσk = i(σ√D2 − k2c2 −D

),

(|k| < D

c

),

e outra (Região II) quando |k| > D/c, na qual ωσk é complexa,

ωσk = σ√k2c2 −D2 − iD,

(|k| > D

c

).

A figura 4.10 mostra os gráficos destas relações de dispersão para k > 0. Observa-se que, comoera esperado, Imωσk 6 0, devido à dissipação realizada pelo meio viscoso.

Reωk+

Imωk+

Reωk-

Imωk-

ωσ k/D

−3

−2

−1

0

1

2

3

kc/D

0 0.5 1 1.5 2 2.5 3

Figura 4.10: Gráficos das relações de dispersão para uma corda oscilando em um meio viscoso.

As relações de dispersão devem satisfazer as propriedades de simetria (4.50). Na região I, acondição Imωσk = Imωσ−k é automaticamente satisfeita; contudo, na região II, para que a condiçãoReωσk = −Reωσ−k seja satisfeita, é necessário que

Reω+k = −Reω−−k.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 211: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 205

A partir da solução (4.49), observa-se que as ondas parciais na região I comportam-se como

ηk (x, t) = U+ (k) ei(kx−ω+k t) = U+ (k) eikxe−(D−

√D2−k2c2)t, (kc/D < 1) ;

ou seja, são fortemente amortecidas sem se deslocarem (velocidade de fase nula). Já na regiãoII, as ondas parciais se comportam como

ηk (x, t) = U+ (k) ei(kx−√k2c2−D2t)e−Dt, (kc/D > 1) ;

ou seja, também são amortecidas, mas estas possuem velocidade de fase não nula,

vφc

=Reω+

k

kc=

√k2c2/D2 − 1

kc/D,

com uma significativa dispersão.

CORDA OSCILANDO EM UM MEIO RESTAURADOR; O MODELO DO “COLCHÃO DEMOLAS”

Figura 4.11: O modelo do “colchão de molas”: umaforça elástica resturadora é exercida pelo meio sobre acorda quando a mesma é perturbada a partir do equilí-brio.

A figura 4.11 ilustra um modelo simplespara uma corda homogêna que está imersaem um meio que irá exercer uma força res-tauradora elástica sobre a corda sempre quealgum pulso transversar se propagar ao longoda mesma. Este modelo ilustra uma situaçãoonde ocorre um valor mínimo para as frequên-cias dos modos normais de oscilação possíveisna corda. Essa frequência mínima é denomi-nada frequência de corte.

A descrição dinâmica deste sistema é rea-lizada novamente pela equação (4.45a). Para simplificar, será suposto que não existe dissipação(D = 0). Para se deduzir a forma da força motriz por unidade de massa, retorna-se brevementeà corda carregada descrita pelas equações de Euler-Lagrange (4.42), para as quais g = 0 e Fj (t)será a força motriz exercida sobre a j-ésima partícula pelo agente motriz; em outras palavras,será a força exercida por uma pequena mola de constante elástica κ sempre que a j-ésimapartícula se afastar do ponto de equilíbrio,

Fj = −κηj .

Na transição discreto −→ contínuo, é necessário que a força motriz também esteja sujeita aolimite Fj → ∆Fj; ou seja, κ→ ∆κ. Dessa maneira, a Lagrangiana de Bateman será escrita

L =1

2

n∑k=1

∆xλη2k −

1

2

n∑k=0

∆xτ

(ηk+1 − ηk

∆x

)2

−n∑k=1

∆x∆m

∆x

∆κ

∆mη2k,

a partir da qual identifica-se a densidade Lagrangiana

L =1

2λη2

t −1

2τη2x − ση2,

sendo σ a constante elástica do “colchão” por unidade de comprimento.Aplicando-se a equação de campo (4.36) a esta densidade Lagrangiana, resulta a equação da

onda modificadaηtt − c2ηxx + ω2

sη = 0,

onde ωs =√

2σ/λ é a frequência (angular) de corte.A aplicação das transformações de Fourier a esta equação corresponde à transformações

∂/∂t→ −iω e ∂/∂x→ ik, o que leva à equação de dispersão(−ω2 + k2c2 + ω2

s

)η = 0 =⇒ ωk =

√ω2s + k2c2. (4.54)

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 212: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

206 4.9. Equação da onda em meios dispersivos

Figura 4.12: Relação de dispersão dosmodos normais no sistema “colchão demola.”

A figura 4.12 mostra o gráfico desta relação de dispersão.Observa-se que como resultado da interação da corda com omeio restaurador, não existe modo normal de oscilação comfrequência inferior à frequência de corte ωs, a qual dependetanto do meio (via σ) quanto da corda (via λ).

A velocidade de fase do modo normal com número deonda k neste sistema é

vφ =

√c2 +

ω2s

k2.

Observa-se que vφk→0−−−→ ∞ e vφ

k→∞−−−−→ c. Ou seja, o meio éaltamente dispersivo para pequenos números de onda.

Este modelo simples ilustra um sistema onde uma cordahomogênea pode ser tornar um meio efetivamente dispersivodevido a interações da mesma com o meio em que ela seencontra.

4.9.4 PROPAGAÇÃO DE UM PULSO UNIDIMENSIONAL EM UM MEIO

DISPERSIVO

Para ilustrar uma aplicação prática dos resultados obtidos nas seções anteriores, considera-se um modelo físico para um meio contínuo específico, representado pela sua relação de disper-são, a ser utilizado no cálculo, sem aproximações, da propagação de um pulso policromático deoscilações transversais.

A solução da equação da onda em um meio dispersivo pode ser escrita, de (4.49), como

η (x, t) =1

∑σ

ˆ ∞−∞

dk Uσ (k) ei(kx−ωσk t), (4.55)

com as amplitudes espectrais determinadas das condições iniciais via (4.51).Uma relação de dispersão genérica é usualmente muito complicada para a obtenção de um

resultado analítico. Por isso, será suposto ser possível uma expansão, válida para o limitekc/ω 1, a qual é a região onde os efeitos dispersivos são usualmente mais relevantes. Assim,a relação de dispersão a ser empregada será modelada por

ωσk = σω0

(1 + 1

2a2k2), (σ = ±1) , (4.56)

sendo ω0 uma frequência característica, correspondente ao caso limite de um meio não disper-sivo, e a = c/ω0.

Como há 2 valores possíveis para σ, as quantidades Uσ (k) serão determinadas pelo sistemade equações (4.51); ou seja,

U+ (k) + U− (k) =

ˆ ∞−∞

dx e−ikxη (x, 0)

U+ (k)ω+k + U− (k)ω−k = i

ˆ ∞−∞

dx e−ikxηt (x, 0) .

Como ω−k = −ω+k , as soluções deste sistema são

Uσ (k) =1

2

ˆ ∞−∞

dx e−ikx[η (x, 0) +

ωkηt (x, 0)

](σ = ±1) , (4.57)

onde ωk ≡ ω+k . As expressões calculadas para Uσ(k) podem então ser utilizadas para se obter

η (x, t).Será considerado agora o caso de um pulso monocromático de extensão finita lançado a partir

da origem em t = 0 para ambos os sentidos ao longo do eixo x. Este tipo de pulso é modeladopor

η (x, 0) = e−x2/2L2

cos k0x,∂

∂tη (x, 0) = 0,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 213: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 207

sendo L a largura espacial do pulso e k0 = 2π/λ se refere ao comprimento de onda λ. Para estetipo de pulso, as amplitudes espectrais, obtidas a partir de (4.57), ficam

Uσ (k) =1

2

ˆ ∞−∞

dx e−ikxe−x2/2L2

cos k0x

=1

4

(ˆ ∞−∞

dx e−i(k−k0)xe−x2/2L2

+

ˆ ∞−∞

dx e−i(k+k0)xe−x2/2L2

)=

1

4

(e−(L2/2)(k−k0)2

ˆ ∞−∞

dx e−[x+iL2(k−k0)]2/2L2

+ e−(L2/2)(k+k0)2ˆ ∞−∞

dx e−[x+iL2(k+k0)]2/2L2

),

Uσ (k) =

√π

8L[e−(L2/2)(k−k0)2 + e−(L2/2)(k+k0)2

](σ = ±1) .

Com este resultado, a solução da equação da onda η (x, t) é obtida a partir de (4.55) e darelação de dispersão (4.56),

η (x, t) =1

[ˆ ∞−∞

dk U+ (k) ei(kx−ωkt) +

ˆ ∞−∞

dk U− (k) ei(kx+ωkt)

]=

1

[ˆ ∞0

dk U+ (k) ei(kx−ωkt) +

ˆ ∞0

dk U+ (−k) e−i(kx+ω−kt)

+

ˆ ∞0

dk U− (k) ei(kx+ωkt) +

ˆ ∞0

dk U− (−k) e−i(kx−ω−kt)].

Usando agora as propriedades matemáticas das relações de dispersão, resulta

η (x, t) =1

[ˆ ∞0

dk U+ (k) ei(kx−ωkt) +

ˆ ∞0

dk U∗+ (k) e−i(kx−ωkt)

+

ˆ ∞0

dk U− (k) ei(kx+ωkt) +

ˆ ∞0

dk U∗− (k) e−i(kx+ωkt)

],

onde foram empregas as condições de realidade, isto é, pode-se escrever a solução como

η (x, t) =1

πRe

[ˆ ∞0

dk U+ (k) ei(kx−ωkt) +

ˆ ∞0

dk U− (k) ei(kx+ωkt)

],

mostrando que o resultado realmente é real.Uma vez empregadas as propriedades matemáticas de Uσ (k) e ωk, pode-se fazer uso do fato de

que ambas são funções pares em k. Além disso, neste caso Uσ (k) também é real e independentede σ. Assim, pode-se escrever a expressão anterior da seguinte maneira,

η (x, t) =L√32π

ˆ ∞−∞

dk[e−(L2/2)(k−k0)2 + e−(L2/2)(k+k0)2

] [ei(kx−ωkt) + ei(kx+ωkt)

].

Nota-se que para t = 0 a expressão acima se reduz às condições iniciais. Para t > 0 pode-seescrever a expressão anterior de uma maneira mais compacta como

η (x, t) =L√32π

∑s1,s2=±1

ˆ ∞−∞

dke−(L2/2)(k+s1k0)2 expi[kx+ s2ω0

(1 + 1

2a2k2)t],

cuja solução é

η (x, t) =1

4

∑s1,s2=±1

exp

[− (x−s1s2a2k0ω0t)

2

2(L2−is2a2ω0t)

]√

1− is2a2ω0t/L2exp

[−is1k0x+ is2

(1 + 1

2a2k2

0

)ω0t]. (4.58)

A solução acima continua real, pois é fácil mostrar que η∗ (x, t) = η (x, t). Além disso,

η (x, 0) =1

2

∑s1=±1

exp(−x2/2L2

)exp (−is1k0x) ,

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 214: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

208 4.9. Equação da onda em meios dispersivos

Figura 4.13: Alteração na forma de um pacote de ondas durante propagação em um meio dispersivo. O pulsomais largo contém um número maior de comprimentos de onda (k0L 1) e é comparativamente menos dis-torcido que o pulso mais estreito (k0L . 1), o qual é rapidamente disperso.

a qual é idêntica à condição inicial empregada.A solução (4.58) descreve a propagação de dois pulsos pelo meio dispersivo em sentidos

opostos. A amplitude máxima de cada pulso propaga-se com a velocidade constante

x(t)− s1s2a2k0ω0t = 0⇐⇒ vg = ±ω0a

2k0,

também denominada velocidade de grupo. O envoltório, ou modulação do pulso permanece coma forma aproximadamente gaussiana, mas nem a largura nem a amplitude da modulação per-manecem constantes. Ao se propagar em um meio dispersivo, a largura da gaussiana aumentae sua amplitude diminui, ambas na mesma proporção, dada por

L(t) =

∣∣∣∣L− is2a2ω0

Lt

∣∣∣∣ =

√L2 +

(a2ω0t

L

)2

.

Assim, os efeitos dispersivos em um dado pulso são mais intensos durante um dado intervalode tempo ∆t quanto mais estreito for o pulso inicial, ou seja, quanto menor L. O critério paraum efeito dispersivo menos intenso é L a. Obviamente, para tempo longos o pulso sempre irávariar na proporção

L (t)

a−→ a

Lω0t,

mas o tempo necessário para se chegar a esta forma limite depende da razão a/L.A figura 4.13 mostra uma comparação entre dois pulsos lançados inicialmente com diferentes

larguras. O pulso mais largo (k0L 1) consiste em um pacote de ondas composto por umnúmero grande de comprimentos de onda e é pouco distorcido durante sua propagação pelomeio dispersivo. Já o pulso mais estreito (k0L . 1) é deformado em um tempo relativamentecurto.

4.9.5 A VELOCIDADE DE GRUPO EM UM MEIO DISPERSIVO

A discussão realizada nas seções anteriores mostrou que a velocidade de fase vφ = Reωk/kcom que um determinado componente de Fourier da onda plana se propaga não é uma medidafisicamente aceitável da velocidade propagação da energia transportada por um pulso eletro-magnético por um meio dispersivo. Isto ocorre devido a três razões principais:

1. Em um meio dispersivo, diferentes componentes de Fourier propagam-se com velocidadesdistintas; como consequência, o pulso se dispersa ao longo de sua propagação.

2. Para certos meios e certas regiões espectrais, é possível que a velocidade de fase exceda avelocidade de propagação dos pulsos, isto é, vφ > c.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 215: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 209

3. Em um meio que também é dissipativo, além de dispersivo, as oscilações serão tambématenuadas ao longo de sua propagação, acentuando ainda mais a distorção do pulso inicial.

Neste tipo de meio, uma medida mais precisa da velocidade de propagação do pulso é fornecidapela velocidade de grupo.

Para simplificar a discussão, considera-se um pulso unidimensional η (x, t) propagando-seem um meio dispersivo sem dissipação, semelhante ao exemplo considerado na seção 4.9.4.Para este caso, o pulso continua sendo descrito pelas expressões (4.55) e (4.57),

η (x, t) =1

ˆ ∞−∞

dk A (k) ei(kx−ωkt)

A (k) =

ˆ ∞−∞

dx e−ikxη (x, 0) ,

onde por simplificação foi assumido que ∂η (x, 0) ∂t = 0 e que o pulso propaga-se exclusivamenteno sentido positivo. Como o meio não apresenta dissipação, sua relação de dispersão ωk = ω (k)é uma função puramente real.

Se o pulso inicial for uma onda plana monocromática, então η (x, 0) = η0e−ik0x + c.c., de onde

resulta que A (k) = 2πδ (k − k0) e, portanto,

η (x, t) = ei(k0x−ωk0 t) + c.c.

Isto é, uma onda monocromática propaga-se sem dispersão pelo meio. Porém, se o pulso inicialapresentar uma extensão finita, representada pela curva modulatória tracejada ilustrada nafigura 4.14, então o seu espectro de Fourier A (k) não será uma delta de Dirac, mas apresentaráuma distribuição de largura ∆k centrada em um determinado valor máximo k0 do número deonda, correspondente ao comprimento de onda predominante no pulso. É possível mostrar,usando teoremas associados a transformadas de Fourier, que

∆x∆k >1

2.

Será assumido agora que a extensão inicial ∆x do pulso é relativamente grande, de tal formaque este não sofre uma dispersão acentuada à medida que se propaga pelo meio. Esta condiçãopode ser quantificada por

k0∆x 1,

o que corresponde ao pulso exemplificado na esquerda da figura 4.13, o qual sofre uma defor-mação pequena com sua propagação. Neste caso, como ∆k ' 1/2∆x, então

∆k k0,

Figura 4.14: (Acima) um pulso inicial de dimensão fi-nita ∆x é injetado em um meio dispersivo. (Abaixo)Espectro de Fourier do pulso η (x, 0).

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 216: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

210 4.10. Equação da onda em meios não uniformes

ou seja, o espectro de Fourier apresenta um pico acentuado em k = k0.Como somente valores de k próximos a k0 irão contribuir significativamente para η (x, t), pode-

se realizar a seguinte aproximação para ω (k):

ω (k) ≈ ω (k0) +dω

dk

∣∣∣∣k0

(k − k0) ,

de onde resulta

η (x, t) ≈ 1

2πei[−ω(k0)+ (dω/dk)|k0k0]t

ˆ ∞−∞

dk A (k) ei[x− (dω/dk)|k0 t]k.

Este resultado mostra que, a menos de um fator de fase que deve ser cancelado com o complexoconjugado, o pulso propaga-se sem distorção significativa como

η (x, t) ≈ η (x′, 0) ei[−ω(k0)+ (dω/dk)|k0k0]t,

onde

x′ = x− dω

dk

∣∣∣∣k0

t.

Isto significa que a frente de onda localizada em x′ = 0 propaga-se com a velocidade de grupo

vg.=∂ω

∂k. (4.59a)

Se a relação de dispersão é fornecida pelo índice de refração n (ω).= kc/ω, então

vg =c

n (ω) + ω∂n/∂ω. (4.59b)

vφvg

v/c

0

0.5

1

1.5

2

2.5

3

kc/ωs0 1 2 3 4 5

Figura 4.15: Velocidades de fase (vφ) e de grupo (vg)para o modelo do colchão de molas, obtidas a partir darelação de dispersão (4.54).

Um exemplo de aplicação da fórmula(4.59a) é fornecido pelo modelo do “colchãode molas,” cuja relação de dispersão é (4.54).A figura 4.15 mostra tanto a velocidade defase vφ quanto a velocidade de grupo paraeste sistema. Observa-se que a velocidade defase, para qualquer número de onda, é sempremaior que a velocidade de propagação de umpulso em um meio não dispersivo, enquantoque com a velocidade de grupo ocorre justa-mente o oposto. Em situações como esta, avelocidade de grupo é considerada a melhormedida para a velocidade de propagação deum pulso por um meio fracamente dispersivo.

Finalmente, se o pulso se propaga no es-paço R3, a generalização de (4.59a) fica sim-plesmente

vg (k) =∇kωk. (4.59c)

Uma dedução detalhada da expressão (4.59c)para um gás ionizado dispersivo, inomogêneoe não estacionário pode ser vista em Bernstein(1975) (BERNSTEIN, 1975).

4.10 EQUAÇÃO DA ONDA EM MEIOS NÃO UNIFORMES

Quando a corda não é uniforme, surge um caso extremo de meio dispersivo. Nesta seção serádiscutido brevemente o tratamento geral deste problema, bem como alguns exemplos de casossimples.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 217: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 211

4.10.1 TRATAMENTO GERAL

No caso geral de uma corda não homogênea, então tanto a densidade linear de massa quantoa tensão da corda podem depender de posição, isto é, λ = λ (x) e τ = τ (x). Esta possibilidade jáhavia sido prevista na dedução da densidade Lagrangiana (4.34), a qual fica então

L ηx, ηt;x =1

2λ (x) η2

t −1

2τ (x) η2

x.

Aplicando-se a equação de campo (4.36) a L , resulta a equação da onda em um meio inomogê-neo,

λ (x)∂2η

∂t2− ∂

∂x

[τ (x)

∂η

∂x

]= 0. (4.60)

Um dos métodos existentes para o tratamento da equação (4.60) é o método da transformaçãode Laplace, discutido brevemente a seguir.

MÉTODO DA TRANSFORMAÇÃO DE LAPLACE

A solução de (4.60) é normalmente difícil de ser obtida. Um método que pode ser empregadopara fornecer pelo menos uma informação parcial a respeito de sua solução consiste no uso datransformação de Laplace no tempo, ao invés da transformação de Fourier.

Dada a solução formal η = η (x, t) da equação da onda, define-se

η (x, s) ≡ Lη (x, t) =

ˆ ∞0

dt η (x, t) e−st,

onde é assumido que a integral existe. Dadas agora as seguintes propriedades

Lηt (x, t) = sη (x, s)− η (x, 0) , Lηtt (x, t) = s2η (x, s)− sη (x, 0)− ηt (x, 0) ,

as quais supõe o conhecimento das condições iniciais, a transformação L· · · será agora apli-cada à equação (4.60).

Realizando esta aplicação, resulta

d

dx

[τ (x)

d

dxη (x, s)

]− s2λ (x) η (x, s) = −λ (x) [sη (x, 0) + ηt (x, 0)] , (4.61a)

a qual está na forma de uma equação de Sturm-Liouville não homogênea, cuja solução estásubmetida às condições de contorno de Dirichlet

η (0, t) = 0 η (`, t) = 0. (4.61b)

A solução do problema de contorno (4.61) pode ser obtida a partir do método da função deGreen. Contudo, para isto, é necessário primeiro conhecer-se as formas de τ (x) e λ (x).

No caso mais simples de uma corda não uniforme, supõe-se

τ (x) = τ0 + ετx, λ (x) = λ0 + ελx.

Então, a equação fica

d

dx

[(τ0 + ετx)

d

dxη (x, s)

]− s2 (λ0 + ελx) η (x, s) = − (λ0 + ελx) [sη (x, 0) + ηt (x, 0)] ,

(τ0 + ετx) η′′ + ετη′ − s2 (λ0 + ελx) η = − (λ0 + ελx) [sη (x, 0) + ηt (x, 0)] .

No caso mais simples onde ετ = 0, esta equação se reduz a

τ0η′′ − s2 (λ0 + ελx) η = − (λ0 + ελx) [sη (x, 0) + ηt (x, 0)] .

Considerando-se a sua versão homogênea,

τ0η′′h − s2 (λ0 + ελx) ηh = 0

e realizando a transformação de variável

ζ =

(s2

τ0ε2λ

) 13

(λ0 + ελx) =⇒ d2

dx2=

(ελs

2

τ0

) 23 d2

dζ2,

obtém-sed2η

dζ2− ζηh = 0.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 218: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

212 4.10. Equação da onda em meios não uniformes

Figura 4.16: Gráficos das funções Ai (x) e Bi (x).

A equação acima é a conhecida equação deAiry,7 cuja solução geral é escrita como

ηh (ζ, s) = c1Ai (ζ) + c2Bi (ζ) ,

sendo que as funções Ai (ζ) e Bi (ζ) são obtidasa partir de séries de potências. Gráficos des-tas funções são apresentados na figura 4.16.

Portanto, a solução geral da parte homogê-nea fica escrita

ηh (x, s) = c1Ai

(3

√s2

τ0ε2λ(λ0 + ελx)

)

+ c2Bi

(3

√s2

τ0ε2λ(λ0 + ελx)

).

A função ηh (x, s) é empregada na derivação dafunção de Green deste problema.

4.10.2 REFLEXÃO E TRANSMISSÃO NA INTERFACE ENTRE MEIOS

DISTINTOS

Um tratamento muito mais simples do que o caso geral apresentado acima, porém que aindaapresenta diversos fenômenos típicos de meios não uniformes, será apresentado a seguir.

Considera-se uma corda infinita composta por duas cordas com densidades distintas λ1 eλ2. Coloca-se a origem do eixo x no ponto de junção das cordas. Escreve-se a solução geral daequação da onda dada por (4.49) como

η (x, t) =1

∑σ

ˆ ∞0

dk[Uσ (k) ei(kx−ω

σk t) + Uσ (−k) ei(−kx−ω

σ−kt)

]=

1

∑σ

ˆ ∞0

dk[Uσ (k) ei(kx−ω

σk t) + U∗σ (k) e−i(kx−ω

σk t)].

Se ωσk = σωk,

η (x, t) =1

ˆ ∞0

dk[U+ (k) ei(kx−ωkt) + U∗− (k) e−i(kx+ωkt)

]+ c.c.,

onde c.c. denota o complexo conjugado do termo anterior. As ondas parciais com amplitudeU+ (k) são aquelas que se propagam com velocidade de fase vφ > 0, ao passo que as ondas comamplitude U− (k) têm velocidade vφ < 0.

Supõe-se então um pacote de ondas de largura finita que incide sobre a interface entre ascordas diferentes vindo da esquerda (i. e., para x → 0−). Será mostrado que este pacote podesofrer reflexão parcial na interface, de modo que

η1 (x, t) =1

ˆ ∞0

dk[U1+ (k) ei(kx−ω1kt) + U∗1− (k) e−i(kx+ω1kt)

]+ c.c.,

para x < 0, sendo que ω1k = kc1. Este pacote sofre também uma transmissão parcial, de modoque

η2 (x, t) =1

ˆ ∞0

dk U ′2+ (k) ei(kx−ω2kt) + c.c.,

isto é, U2− = 0 por não existirem ondas incidentes vindas pela direita. Nesta expressão, ω2k = kc2.Ou seja,

η1 (x, t) =1

ˆ ∞0

dk[U1+ (k) eik(x−c1t) + U∗1− (k) e−ik(x+c1t)

]+ c.c.,

7Ver, por exemplo, <http://dlmf.nist.gov/9>.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 219: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

CAPÍTULO 4. Oscilações Acopladas 213

η2 (x, t) =1

ˆ ∞0

dk U ′2+ (k) eik(x−c2t) + c.c..

As condições de contorno em x = 0 devem ser, portanto

limx→0−

η1 (x, t) = limx→0+

η2 (x, t)

limx→0−

∂η1

∂x= limx→0+

∂η2

∂x.

Ou seja,

ˆ ∞0

dk[U1+ (k) + U∗1− (k)

]e−ic1kt =

ˆ ∞0

dk U ′2+ (k) e−ic2kt

k=c1k′/c2−−−−−−→ c1

c2

ˆ ∞0

dk U ′2+

(c1c2k

)e−ic1kt =

ˆ ∞0

dk U2+ (k) e−ic1kt,

onde U2+ (k) = (c1/c2)U ′2+ (c1k/c2).Da mesma forma,

∂η1

∂x=

1

ˆ ∞0

dk k[U1+ (k) eik(x−c1t) − U∗1− (k) e−ik(x+c1t)

]+ c.c.,

∂η2

∂x=

1

ˆ ∞0

dk kU ′2+ (k) eik(x−c2t) + c.c.

Então,ˆ ∞

0

dk k[U1+ (k)− U∗1− (k)

]e−iω1kt =

ˆ ∞0

dk kU ′2+ (k) e−iω2kt k=c1k′/c2−−−−−−→ c1

c2

ˆ ∞0

dk kU2+ (k) e−iω1kt.

Portanto, pode-se estabelecer as seguintes relações entre as amplitudes espectrais,

U1+ (k) + U∗1− (k) = U2+ (k)

U1+ (k)− U∗1− (k) =c1c2U2+ (k) .

A partir das mesmas, obtém-se

U2+ (k) =2U1+ (k)

1 + c1/c2,

da qual obtém-se também

U∗1− (k) =2U1+ (k)

1 + c1/c2− U1+ (k) =

1− c1/c21 + c1/c2

U1+ (k) .

Assim, tanto a amplitude do modo normal refletido quanto a amplitude do modo transmitidosão determinadas pela amplitude do modo incidente. Como c1/c2 > 0, o modo transmitidoestará sempre em fase com o modo incidente. Porém, a fase relativa entre U1+ e U∗1− tem aspossibilidades:

• c2 > c1: U∗1− e U1+ estão em fase.

• c2 < c1: U∗1− e U1+ estão em oposição de fase.

...

[EM CONSTRUÇÃO]...

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 220: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

214 4.10. Equação da onda em meios não uniformes

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018

Page 221: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

REFERÊNCIAS BIBLIOGRÁFICAS

ARFKEN, G. B.; WEBER, H. J. Mathematical Methods for Physicists. Sixth. New York: Elsevier,2005. 1182 + xii pp. ISBN 0-12-059876-0.

BERNSTEIN, I. B. Geometric Optics in Space- and Time-Varying Plasmas. The Physics of Fluids,v. 18, n. 3, p. 320–324, mar. 1975.

CALLEN, H. B. Thermodynamics and an Introduction to Thermostatistics. Singapore: Wiley, 1985.495 + xvi pp. ISBN 9780471862567. Disponível em: <https://books.google.com.br/books?id=XJ0RAQAAIAAJ>.

CAPECCHI, D. History of Virtual Work Laws: A History of Mechanics Prospective. Milão: Springer,2012. (Science Networks. Historical Studies). 492 + xii pp. ISBN 9788847020566. Disponívelem: <http://books.google.com.br/books?id=8qUXV6lo8-wC>.

CORBEN, H. C.; STEHLE, P. Classical Mechanics. Second ed. Dover Publications, 2013. (DoverBooks on Physics). ISBN 9780486140780. Disponível em: <https://books.google.com.br/books?id=baijAQAAQBAJ>.

DENMAN, H. H. Lagrangian formalism for vibrations in some damped continuous systems. Jour-nal of Sound and Vibration, v. 36, n. 4, p. 485–489, out. 1974. ISSN 0022-460X.

DREIZLER, R. M.; LÜDDE, C. S. Theoretical Mechanics: Theoretical Physics 1. Heidelberg: Sprin-ger, 2010. (Graduate Texts in Physics). ISBN 9783642111389.

DUGAS, R. A History of Mechanics. London: Dover Publications, 1988. (Dover Books on Phy-sics). 671 pp. ISBN 9780486656328. Disponível em: <http://books.google.com.br/books?id=jmKxffjQtasC>.

GAUSS, C. F. Über ein neues allgemeines Grundgesetz der Mechanik. Journal für die reine undangewandte Mathematik, v. 1829, n. 4, p. 232–235, jan. 1829.

GELFAND, I. M.; FOMIN, S. V. Calculus of Variations. Englewood Cliffs: Dover, 2012. (DoverBooks on Mathematics). 232 + viii pp. ISBN 9780486135014.

GOLDSTEIN, H.; POOLE, C.; SAFKO, J. Classical Mechanics. Third ed. New York: AddisonWesley, 2001. 638 + xi pp. ISBN 978-0201657029.

HAMILTON, W. R. On a General Method in Dynamics; By Which the Study of the Motions of AllFree Systems of Attracting or Repelling Points is Reduced to the Search and Differentiationof One Central Relation, or Characteristic Function. Philosophical Transactions of the RoyalSociety of London, v. 124, p. 247–308, jan. 1834.

HAMILTON, W. R. Second Essay on a General Method in Dynamics. Philosophical Transactionsof the Royal Society of London, v. 125, p. 95–144, jan. 1835.

HAND, L. N.; FINCH, J. D. Analytical Mechanics. New York: Cambridge University Press,1998. ISBN 9781139643313. Disponível em: <https://books.google.com.br/books?id=A1UhAwAAQBAJ>.

215

Page 222: RUDI GAELZER (INSTITUTO DE FÍSICA - UFRGS)

216 REFERÊNCIAS BIBLIOGRÁFICAS

HELRICH, C. S. Analytical Mechanics. Springer International Publishing, 2016. (UndergraduateLecture Notes in Physics). 349 + xv pp. ISBN 9783319444918. Disponível em: <https://books.google.com.br/books?id=bgUtDQAAQBAJ>.

HUANG, K. Statistical Mechanics. Second. New York: Wiley, 1987. ISBN 9780471859130. Dis-ponível em: <https://books.google.com.br/books?id=hhq6QgAACAAJ>.

JOSÉ, J. V.; SALETAN, E. J. Classical Dynamics: A Contemporary Approach. Cambridge:Cambridge University Press, 1998. 670 + xxvi pp. ISBN 9780521636360. Disponível em:<http://books.google.com.br/books?id=Eql9dRQDgvQC>.

KRASNOV, M. L.; MAKARENKO, G. I.; KISELIOV, A. I. Cálculo Variacional. Moscou: Mir, 1984.216 pp.

LEMOS, N. A. Sutilezas dos vínculos não-holônomos. Revista Brasileira de Ensino de Física,scielo, v. 25, n. 1, p. 28–34, mar. 2003. ISSN 1806-1117.

LEMOS, N. A. Mecânica Analítica. Segunda edição. São Paulo: Livraria da Física, 2007. 386+ vi pp. ISBN 9788588325241. Disponível em: <http://books.google.com.br/books?id=XpOS2eOdDR4C>.

LEVINSON, M. Application of an extended Hamilton’s principle to damped discrete and conti-nuous systems. Mechanics Research Communications, v. 3, n. 2, p. 125–131, 1976. ISSN0093-6413.

MALKIN, Z.; MILLER, N. Chandler wobble: two more large phase jumps revealed. Earth, Planetsand Space, v. 62, n. 12, p. 943–947, dez. 2010.

OLVER, F. W. J. Airy and Related Functions. In: OLVER, F. W. J. et al. (Ed.). NIST Handbook ofMathematical Functions. New York: Cambridge, 2010. cap. 9, p. 193–213. ISBN 978-0-521-19225-5. Http://dlmf.nist.gov/9.

PROTTER, M.; MORREY, C. Intermediate Calculus. New York: Springer, 2012. (UndergraduateTexts in Mathematics). ISBN 9781461270065.

RAMM, E. Principles of Least Action and of Least Constraint. GAMM-Mitteilungen, WILEY-VCHVerlag, v. 34, n. 2, p. 164–182, dez. 2011. ISSN 1522-2608.

REICHL, L. E. A Modern Course in Statistical Physics. Weinheim: Wiley, 2016. 467 +xiv pp. ISBN 9783527690480. Disponível em: <https://books.google.com.br/books?id=jRZMDQAAQBAJ>.

RILEY, K. F.; HOBSON, M. P.; BENCE, S. J. Mathematical Methods for Physics and Engine-ering. Third ed. Cambridge: Cambridge University Press, 2006. 1333 + xxvii pp. ISBN9781139450997. Disponível em: <http://books.google.com.br/books?id=Mq1nlEKhNcsC>.

SARAFIAN, H. Transverse Standing Waves in a Nonuniform Line and their Empirical Verificati-ons. World Journal of Mechanics, v. 1, n. 4, ago. 2011.

THORNTON, S.; MARION, J. Classical Dynamics of Particles and Systems. Fifth edition. Belmont:Brooks/Cole - Cengage Learning, 2004. 656 + xvi pp. ISBN 9780534408961. Disponível em:<http://books.google.com.br/books?id=HOqLQgAACAAJ>.

VÎLCU, A. D. On the elements of the Earth’s ellipsoid of inertia. ArXiv e-prints, abr. 2011. Dispo-nível em: <https://arxiv.org/abs/1104.1033>.

WILLIAMS, J. G. Contributions to the Earth’s obliquity rate, precession, and nutation. The As-tronomical Journal, v. 108, n. 2, p. 711–724, ago. 1994.

Autor: Rudi Gaelzer – IF/UFRGS Início: 03/2017 Impresso: 26 DE NOVEMBRO DE 2018