Capítulo 2 - Gradiente e Derivada Direcional.pdf

Capítulo 2 Derivada Direcional, Gradiente, Máximos e Mínimos

CÁLCULO 2 – PÁGINA 2

PROF. FÁBIO NOGUEIRA BATISTA ([email protected])

Produto escalar O produto escalar é uma operação entre vetores que produz um escalar. Essa operação é bastante utilizada no cálculo de tamanhos ou ângulos entre vetores. O produto escalar pode ser calculado através de duas fórmulas, dependendo das informações disponíveis: •••• Se possuirmos as coordenadas dos vetores:

Considere os vetores )y,x(u uu= e )y,x(v vv= . A fórmula que calcula o produto escalar

entre esses vetores é dada por:

vuvu yyxxvu +=⋅

•••• Se possuirmos os tamanhos dos vetores e o ângulo entre eles:

Considere que os vetores u , de tamanho u , e v , de tamanho v , formem um ângulo θ

entre eles. O produto escalar entre esses vetores é dado por:

θ=⋅ cosvuvu

Podemos utilizar a última fórmula para demonstrar que o produto escalar pode ser usado quando desejamos calcular o tamanho de um vetor, dispondo apenas das suas coordenadas. Fazendo

o produto escalar do vetor )y,x(u uu= com ele mesmo:

0cosuuuu =⋅ ∴ 2

uuu =⋅

Observe que o ângulo entre o vetor )y,x(u uu= e ele próprio é zero já que os dois vetores

estão na mesma direção e sentido. O produto escalar que se encontra do lado esquerdo da igualdade

pode ser calculado por vuvu yyxxvu +=⋅ .

Uma rápida introdução sobre vetores e retas Considere que desejamos encontrar a equação de uma reta r que passa pelo ponto

)y,x(P 00= e é paralela ao vetor )b,a(u = conforme mostra a figura:



Desejamos encontrar neste momento as coordenadas de qualquer ponto )y,x(A = sobre a

reta r. Conforme as considerações iniciais, o vetor )yy,xx(PA 00 −−= é paralelo ao vetor

)b,a(u = . Podemos então dizer que as coordenadas PA são múltiplas das coordenadas do vetor u :

utPA = Substituindo as coordenadas de cada vetor: )bt,at()yy,xx( 00 =−−

Como os vetores são iguais, as suas coordenadas são iguais: atxx 0 =− e btyy 0 =−

Reorganizando: atxx 0 += e btyy 0 +=

Essas expressões são chamadas de equações paramétricas da reta, pois ambas as equações dependem apenas do parâmetro t.

Vamos mostrar que se o vetor u for unitário (tiver tamanho igual a 1) então o vetor PA terá

tamanho t. Os tamanhos dos vetores PA e u podem ser calculados aravés dos seguintes produtos escalares:

PAPAPA2

⋅= e uuu2

⋅=

Podemos estabelecer a relação entre os tamanhos dos vetores PA e u , paralelos, sabendo

que utPA = :

)ut()ut(PA2

⋅=

)uu(tPA 22⋅=

222

utPA =

Extraindo a raiz quadrada de ambos os lados da igualdade:

utPA =

Só é possível que o vetor PA tenha tamanho t se o tamanho do vetor u for igual a 1, ou

seja, se o vetor u for unitário. A função do vetor unitário u é indicar a direção da reta r, já que o seu tamanho unitário não influencia em nada os cálculos.

Caso o vetor u não seja unitário basta normalizar o vetor, ou seja, tornar o seu tamanho igual a 1 dividindo o vetor pelo seu tamanho original:

u

uuunitário =

Derivada direcional A derivada direcional é uma derivada parcial especial calculada na direção de um vetor

unitário u . A função da derivada direcional é medir a taxa instantânea de crescimento ou

decrescimento de uma função num ponto )y,x( 00 segundo a direção de um vetor u unitário. A

derivada direcional é representada pela derivada parcial u

z

∂∂

.



A medida da taxa instantânea de crescimento ou decrescimento de uma função é dada pela inclinação da reta tangente à função no ponto )y,x( 00 conforme mostra a figura a seguir:

Na introdução do capítulo mostramos que se um ponto )y,x(A = está sobre uma reta r,

paralela a um vetor unitário )b,a(u = , então podemos afirmar que x e y são dados por:

atxx 0 += e btyy 0 +=

Considerando uma função )y,x(fz = em que atx)t(gx 0 +== e bty)t(hy 0 +== ,

podemos aplicar a seguinte expressão da regra da cadeia:

dt

dy

y

z

dt

dx

x

z

dt

dz

∂∂+

∂∂=

Sabemos que se:

atxx 0 += , então, adt

dx =

btyy 0 += , então, bdt

dy =

Substituindo na expressão da regra da cadeia:

by

za

x

z

dt

dz

∂∂+

∂∂=

A derivada dt

dz representa a taxa instantânea de crescimento ou decrescimento de z

considerando a direção do vetor unitário u que, daqui por diante, representaremos por u

z

∂∂

:

by

za

x

z

u

z

∂∂+

∂∂=

∂∂

Essa última expressão calcula a derivada direcional de z na direção do vetor unitário u .

Inclinação da reta tangente em

)y,x( 00 é dada por u

z

∂∂

tPA =



Conforme a definição geométrica dada por limites, as derivadas parciais em relação a x ou a y medem as inclinações das retas tangentes à superfície nas direções x e y conforme o gráfico:

A derivada parcial na direção do vetor u

r mede a inclinação da reta tangente à superfície na

direção do vetor ur

como mostra o gráfico a seguir:

Podemos perceber no gráfico anterior que, passando pelo ponto P, existem infinitas retas tangentes à superfície )y,x(fz = cuja inclinações são dadas pelas respectivas derivadas direcionais. A derivada direcional é o caso mais geral de derivação parcial, pois podemos obter as derivadas parciais em relação a x e a y fazendo a direção do vetor unitário u

r coincidir com as

direções dos vetores unitários ir

(direção x) e jr

(direção y).

A derivada de z na direção do vetor )0,1( i = é dada por:

x

z0

y

z1

x

z

i

z

∂∂=

∂∂+

∂∂=

∂∂

Inclinação da reta = y

z

∂∂

Inclinação da reta = x

z

∂∂

Inclinação da reta = u

zr∂

∂

ur

P

P



A derivada de z na direção do vetor )1,0( j = é dada por:

y

z1

y

z0

x

z

j

z

∂∂=

∂∂+

∂∂=

∂∂

Note que, no cálculo da derivada de z na direção do vetor )0,1( i = , desconsideramos a

derivada parcial em relação a y. Isso acontece porque o vetor )0,1( i = está apontando na direção do eixo x, então, devemos desconsiderar qualquer efeito da variação da função na direção y.

Raciocínio análogo se aplica ao cálculo da derivada da função z na direção do vetor )1,0( j = .

Por outro lado, se o vetor u apontar numa direção qualquer, diferente das direções dos eixos x e y, devemos então considerar uma combinação das derivadas parciais em relação a x e a y, ou seja, o resultado é uma combinação dos efeitos nas direções x e y. Exemplo

Calcular a derivada da função 23yx)y,x(fz == na direção do vetor )4,3(u = calculando

a derivada no ponto )2,1()y,x( 00 = .

Solução

Vamos calcular o módulo do vetor )4,3(u = :

25169)4,3()4,3(uuu2

=+=⋅=⋅= ∴ 5u =

Observe que o vetor )4,3(u = não é unitário, devemos então dividí-lo pelo seu tamanho para normalizá-lo:

===5

4,

5

3

5

)4,3(

u

uuunitário

Calcule o tamanho deste último vetor e verifique que o resultado é igual a 1.

A derivada de z na direção do vetor u (normalizado) é dada por:

by

za

x

z

u

z

∂∂+

∂∂=

∂∂

Onde:

22yx3x

z =∂∂

e yx2y

z 3=∂∂

5

3a = e

5

4b =

Substituindo os resultados temos que:

yx5

8yx

5

9

5

4)yx2(

5

3)yx3(

u

z 322322 +=+=∂∂

Finalmente, calculando a derivada parcial no ponto )2,1()y,x( 00 = :

5

5221

5

821

5

9)2,1(

u

z 322 =+=∂∂

A derivada direcional não é um vetor! A derivada direcional apenas utiliza a

direção do vetor u para calcular a taxa de crescimento/decrescimento instantânea nessa direção cujo resultado é um escalar e não um vetor.



Definição formal de derivada direcional

Considere um vetor )b,a(u = paralelo a uma reta r que contém o ponto )y,x(P 00= e o

ponto )y,x(A = cujas coordenadas são desconhecidas. Suponha uma função )y,x(fz = em que x

e y seguem a direção da reta r, ou seja, atx)t(gx 0 +== e bty)t(hy 0 +== . A derivada

direcional é definida pela seguinte equação:

t

)y,x(f)bty,atx(flim

t

)y,x(f)y,x(flim

u

z 0000

0t

00

0t

−++=

−=

∂∂

→→

Graficamente estamos calculando a inclinação da reta tangente à curva obtida no limite

quando t→0 (quando 0PA → ):

Propriedade da derivada direcional A derivada direcional tem uma propriedade bastante especial. Quando invertemos o sentido

do vetor unitário a derivada direcional troca de sinal. Considere o vetor unitário )b,a(u = e o seu

vetor unitário oposto )b,a(u −−=− . As derivadas parciais na direção de cada um desses vetores são dadas por:

by

za

x

z

u

z

∂∂+

∂∂=

∂∂

e )b(y

z)a(

x

z

)u(

z −∂∂+−

∂∂=

−∂∂

Podemos então dizer que:

u

zb

y

za

x

z

)u(

z

∂∂−=

∂∂+

∂∂−=

−∂∂

Essa equação nos revela que se em uma direção a função está crescendo, na direção contrária a função deve decrescer. Gradiente É interessante notar que a expressão da derivada direcional pode ser representada como um produto escalar entre dois vetores:

)b,a(y

z,

x

zb

y

za

x

z

u

z ⋅

∂∂

∂∂=

∂∂+

∂∂=

∂∂



Sabemos que o segundo vetor do produto escalar é u . O primeiro vetor é denominado

gradiente da função )y,x(fz = e será representado pela notação z∇ ou grad(z). Podemos então reescrever o produto escalar da seguinte forma:

uzu

z ⋅∇=∂∂

O símbolo ∇ é chamado operador nabla e, quando aparece ao lado da função, indica a presença da derivação parcial em cada coordenada do vetor gradiente. O nome do símbolo do gradiente é associado à um tipo de harpa hebraica que possui esse formato conforme mostra a figura.

1911, Webster´s Dictionary Exemplo

Calcule o gradiente da função:

43yx)y,x(fz == Solução

O gradiente da função é dado por:

∂∂

∂∂=∇

y

z,

x

zz

)yx4,yx3(z 3342=∇

A palavra gradiente deriva do latim gradus (mesma origem das palavras gradual e gradativo) que significa avançar passo-a-passo.

O significado do gradiente A derivada direcional, sendo um produto escalar entre vetores, pode também ser calculada da seguinte forma:

θ∇=⋅∇=∂∂

cosuzuzu

z

Como o vetor u é unitário, a derivada direcional se torna:

θ∇=⋅∇=∂∂

coszuzu

z

Como 1cos1 ≤θ≤− , o valor máximo e mínimo da derivada direcional é igual a:

zuzu

z ∇+=⋅∇=∂∂

(máximo)

zuzu

z ∇−=⋅∇=∂∂

(mínimo)

O valor máximo ocorre quando o ângulo θ entre o gradiente e o vetor u é igual a zero e o

valor mínimo ocorre quando o ângulo θ entre o gradiente e o vetor u é igual a 180o, ou seja,

quando o gradiente e o vetor u estão na mesma direção e no mesmo sentido, a derivada direcional é

máxima e tem valor igual a z∇ .



Por outro lado, quando o gradiente e o vetor u estão na mesma direção e sentidos

contrários, a derivada direcional é mínima e tem valor igual a z∇− .

Podemos também afirmar que a derivada direcional é máxima quando o vetor u é igual a:

z

zu

∇

∇=

Observe que a derivada direcional máxima ocorre quando o vetor u é o vetor unitário na direção do gradiente da função. O gradiente tem a finalidade de apontar para a direção de maior crescimento da função conforme mostra a figura a seguir:

Exemplo

Considere a função:

yx)y,x(fz 2== Determine o valor máximo da derivada direcional no ponto )1,2(P = , determinando o vetor unitário na direção a qual a derivada direcional é máxima. Solução

O vetor gradiente da função é dado por:

∂∂

∂∂=∇

y

z,

x

zz

Onde:

xy2x

z =∂∂

e 2xy

z =∂∂

Logo, o vetor gradiente no ponto )1,2(P = é igual a:

)4,4()1,2(z =∇ O módulo do gradiente pode ser calculado pelo seguinte produto escalar:

321616)4,4()4,4(zzz2

=+=⋅=∇⋅∇=∇

Direção de crescimento máximo (derivada direcional máxima)

Direção de decrescimento máximo (derivada direcional mínima)



2432z ==∇

O valor máximo da derivada direcional pode ser calculado pela fórmula:

24zu

z =∇+=∂∂

A derivada direcional é máxima quando o vetor u for igual a:

==∇

∇=2

1,

2

1

24

)4,4(

z

zu

Curvas de nível Os médicos recorrem à tomografia computadorizada quando desejam visualizar a imagem do cérebro do paciente. Nesse tipo de exame, a imagem do cérebro do paciente é “fatiada” em várias partes conforme mostram as figuras a seguir:

Em matemática, diríamos que cada “fatia” da tomografia computadorizada é uma curva de nível da função. Os engenheiros civis utilizam gráficos de nível, chamados mapas topológicos, para auxiliá-los na construção de estradas e pontes. Na construção do gráfico de nível, o relevo da região é “fatiado” em várias cotas (nível de altura) e desenhado num único mapa conforme mostra a figura:

Cada número que acompanha uma curva representa a altura da “fatia” do relevo. Por exemplo, o ponto 1 e o ponto 2 mostrados na figura estão na cota 10, ou seja, possuem a mesma altura igual a 10. No mapa topológico da região estão presentes as várias curvas de nível do relevo.



Os engenheiros mecânicos utilizam curvas de nível quando precisam selecionar bombas d’água que funcionem com o maior rendimento possível. Podemos relacionar a altura de descarga, a vazão e o rendimento de uma bomba d’água conforme a superfície a seguir:

Os fabricantes apresentam as curvas de nível da superfície anterior no seguinte gráfico:

' As curvas de nível de uma função representam as diversas “fatias” do gráfico da função, uma para cada valor escolhido da variável dependente z. As figuras a seguir mostram os gráficos de funções e as suas curvas de nível:

Gráfico da função 22 yx)y,x(fz +== Curvas de nível de 22 yx)y,x(fz +==

Curvas de rendimento constante

Vazão (litros por segundo)

Altu

ra (

met

ros)

Vazão (litros por segundo) Altura de descarga (metros)

Rendimento (%)



Gráfico da função )y(sen)x(sen)y,x(fz ⋅== Curvas de nível de )y(sen)x(sen)y,x(fz ⋅==

Observe que os pontos “mais altos” (maior valores de z) são mais claros e os pontos “mais baixos” (menores valores de z) são mais escuros.

Uma curva de nível é uma curva no espaço 2IR para um valor arbitrário de z, ou seja, escolhemos um valor para z (fazemos z igual a uma constante genérica c) e descobrimos qual é a característica das curvas de nível. Vale dizer que nem sempre é fácil imaginar o formato das curvas de nível de uma função a partir das equações obtidas fazendo cz = .

A expressão matemática das curvas de nível da função 22 yx)y,x(fz +== é dada por:

cyx 22 =+ Conforme a equação anterior, as curvas de nível são circunferências centradas na origem

com raios iguais a c . Gradiente e curvas de nível

Considere as curvas de nível da função 22 yx)y,x(fz +== :

Curvas de nível de 22 yx)y,x(fz +==

Suponha que o vetor u é tangente a uma das curvas de nível da função. Como todos os pontos sobre uma curva de nível possuem a mesma “altura” z, a taxa de crescimento ou decrescimento da função na direção tangente a qualquer curva de nível é igual a zero.

u u

u u



Fica mais fácil verificar a afirmação anterior na figura a seguir:

A derivada na direção do vetor u tangente à curva de nível é igual a zero, ou seja:

0u

z =∂∂

Sabemos que a derivada direcional é dada pelo seguinte produto escalar:

uzu

z ⋅∇=∂∂

Logo, podemos afirmar que:

0uz =⋅∇ O produto escalar anterior anterior é muito importante, pois indica que o vetor gradiente é

perpendicular ao vetor u que é tangente a qualquer curva de nível da função. A figura seguinte

mostra a configuração dos vetores u e z∇ sobre uma das curvas de nível da função:

Máximo, Mínimo e Ponto de Sela Um ponto )y,x(P 00= é chamado de ponto crítico da função )y,x(fz = se nesse ponto as

derivadas parciais em relação a x e em relação a y são ambas iguais a zero, ou seja, as inclinações das retas tangentes à função )y,x(fz = no ponto P devem ser iguais a zero.

Ao longo da curva de nível não há crescimento nem decrescimento da função já que todos os pontos estão “à mesma altura”.

u

z∇

u

u

u



Por exemplo, a figura a seguir mostra um ponto crítico da função. Observe que as derivadas parciais em relação a x e em relação a y são ambas iguais a zero:

Sabemos que a segunda derivada de uma função fornece a sua concavidade. Na figura mostrada anteriormente, a segunda derivada parcial em relação a x é negativa, pois a concavidade da curva paralela ao eixo x é para baixo. Estamos então sobre o ponto mais alto da curva. Além disso, a segunda derivada em relação a y também é negativa, indicando que a concavidade da curva paralela ao eixo y também está voltada para baixo. Combinando as duas situações, podemos afirmar que localizamos um ponto de máximo local. Observe a figura a seguir:

A inclinação da reta

tangente à curva: 0y

z =∂∂

A inclinação da reta

tangente à curva: 0x

z =∂∂



Na figura anterior, a segunda derivada parcial em relação a x é positiva, pois a concavidade da curva paralela ao eixo x é para cima. Estamos então sobre o ponto mais baixo da curva. Além disso, a segunda derivada em relação a y também é positiva, indicando que a concavidade da curva paralela ao eixo y também está voltada para cima. Combinando as duas situações, podemos afirmar que localizamos um ponto de mínimo local. Existe ainda um terceiro tipo de ponto crítico, denominado de ponto de sela, que ocorre quando as derivadas parciais em relação a x e a y se anulam e, mesmo assim, não estamos nem sobre um ponto de máximo, nem sobre um ponto de mínimo local. A figura seguinte ilustra um ponto de sela da função:

Se apenas derivarmos uma função parcialmente em relação a x e em relação a y, igualando a zero o resultado, não temos condições de afirmar que tipo de ponto crítico localizamos. Para caracterizarmos qual dos três tipos de ponto crítico foi calculado devemos utilizar o determinante Hessiano, ou simplesmente, Hessiano dado por:

2

22

2

2

2

y

z

xy

z

yx

z

x

z

)y,x(H

∂∂

∂∂∂

∂∂∂

∂∂

=

As condições para a caracterização dos pontos críticos são apresentadas no quadro a seguir:

• Se 0)y,x(H 00 > e 0)y,x(x

z002

2>

∂∂

, então, )y,x( 00 será ponto de mínimo local.

• Se 0)y,x(H 00 > e 0)y,x(x

z002

2<

∂∂

, então, )y,x( 00 será ponto de máximo local.

• Se 0)y,x(H 00 < , então, )y,x( 00 será ponto de sela.

• Se 0)y,x(H 00 = nada se pode afirmar.

Exemplo

Considere a função:

4y3x3yx)y,x(fz 33 +−−+== Determine os pontos críticos da função e classifique os resultados em pontos de máximo, mínimo ou de sela.



Solução

As derivadas parciais em relação a x e a y são dadas por:

3x3x

z 2 −=∂∂

3y3y

z 2 −=∂∂

Os pontos críticos da função podem ser encontrados anulando as derivadas parciais:

03x3x

z 2 =−=∂∂

03y3y

z 2 =−=∂∂

Temos então um sistema com duas equações e duas variáveis:

=−=−

03y3

03x32

2

As soluções do sistema são os pontos: )1,1( , )1,1( − , )1,1(− , )1,1( −− Embora tenhamos encontrado os pontos críticos da função, ainda não sabemos que tipo de ponto crítico é cada um dos pontos calculados. Para isso, precisamos da ajuda do determinante Hessiano conforme as condições dadas no quadro mostrado anteriormente. Vamos calcular as derivadas parciais presentes no Hessiano:

x6x

z2

2=

∂∂

e y6y

z2

2=

∂∂

0xy

z

yx

z 22=

∂∂∂=

∂∂∂

Substituindo as derivadas parciais no Hessiano temos a seguinte expressão:

xy36y60

0x6)y,x(H ==

Vamos analisar cada ponto crítico encontrado conforme as condições de caracterização dadas anteriormente.

• Ponto )1,1( :

Como 3660

06)1,1(H == e 6)1,1(

x

z2

2=

∂∂

, então, )1,1( é ponto de mínimo

• Ponto )1,1(− :

Como 3660

06)1,1(H −=

−=− , então, )1,1(− é ponto de sela

• Ponto )1,1(− :

Como 3660

06)1,1(H −=

−=− , então, )1,1(− é ponto de sela

• Ponto )1,1( −− :

Como 3660

06)1,1(H =

−−

=−− e 6)1,1(x

z2

2−=−−

∂∂

, então, )1,1(− é ponto de máximo



Observe o gráfico da função 4y3x3yxz 33 +−−+= e comprove os resultados obtidos:

As curvas de nível e o campo de gradientes da função 4y3x3yxz 33 +−−+= são mostrados nos gráficos a seguir:

Curvas de nível da função Campo de gradientes da função

Observe que o sentido das setas do campo de gradientes conduz aos pontos críticos, onde o gradiente é zero. As setas podem convergir de todas as direções para um ponto de máximo (1) ou divergir de um ponto de mínimo para todas as direções (2). Os pontos de sela (3) são caracterizados pela convergência de setas numa direção e divergência de setas em outra direção.

)1,1( −− é máximo

)1,1( − é ponto de sela

)1,1(− é ponto de sela

)1,1( é mínimo

1

2

3

3



Máximos e Mínimos Condicionados – Multiplicadores de Lagrange O método dos multiplicadores de Lagrange consiste em maximizar ou minimizar uma função )y,x(fz = sujeita a uma condição (restrição) do tipo 0)y,x(g = . As curvas de nível de z, segundo o gráfico a seguir, mostram os pontos “mais altos” (maiores valores de z) com tonalidades de cinza cada vez mais intensas e os pontos “mais baixos” (menores valores de z) com tonalidades de cinza cada vez mais fracas.

Todos os pontos sobre a curva 0)y,x(g = que cruzam com as curvas de nível da função

)y,x(fz = é uma possível solução ao problema: Maximizar )y,x(fz = Sujeito à restrição: 0)y,x(g = À medida que caminhamos ao longo de 0)y,x(g = do ponto A para o ponto B, a função

)y,x(fz = aumenta de valor, pois a curva de nível em A possui “altura” menor que a curva de nível em B. Se continuarmos caminhando em direção ao ponto C, podemos perceber que voltaremos ao mesmo nível que o ponto A já que estamos sobre a mesma curva de nível. Podemos concluir que o ponto B é o único ponto sobre a curva 0)y,x(g = em que a função assume o seu valor máximo. Sabendo que os vetores gradientes são perpendiculares às suas curvas de nível, percebemos

que z∇ e g∇ são paralelos no ponto B. No ponto A, por exemplo, esses vetores estão separados

por um ângulo diferente de zero. Como os vetores z∇ e g∇ são paralelos no ponto B é possível afirmar então que encontramos um ponto de máximo da função quando os dois gradientes são múltiplos um do outro. A relação entre os gradientes é expressa da seguinte forma:

gz ∇λ=∇ no ponto )y,x(B 00=

O método dos multiplicadores de Lagrange consiste em encontrar pontos sobre uma curva

0)y,x(g = de maneira que exista proporcionalidade entre os gradientes z∇ e g∇ .

O método dos multiplicadores de Lagrange é válido desde que as coordenadas do vetor g∇ sejam diferentes de zero.

z∇

g∇

0)y,x(g =

z∇ g∇

A B

C



Exemplo

Considere que desejamos maximizar a função: xy)y,x(fz == Sujeita à seguinte restrição:

8yx)y,x(g 22 −+= Solução

Devemos encontrar os gradientes z∇ e g∇ :

)x,y(z =∇ e )y2,x2(g =∇

Conforme o método dos multiplicadores de Lagrange, existe um λ tal que:

gz ∇λ=∇ Temos que: x2y λ= e y2x λ=

Isolando λ nas duas equações:

x2

y=λ e y2

x=λ

Igualando os valores de λ:

22 yx = Substituindo na curva 0)y,x(g = :

08yx)y,x(g 22 =−+=

08x2 2 =− ∴ 2x ±=

Substituindo na expressão 22 yx = temos que: 2y ±= Os pontos a seguir são candidatos à maximizar a função xy)y,x(fz == : )2,2( , )2,2( − , )2,2(− , )2,2( −− Para sabermos qual dos pontos anteriores maximiza a função basta calcular o valor de z para cada um dos pontos calculados:

)y,x( )2,2( )2,2( − )2,2(− )2,2( −− xyz = 4 -4 -4 4

O valor máximo da função é 4 e ocorre nos pontos )2,2( e )2,2( −− . Por outro lado, a função tem valor mínimo igual a -4 nos dois outros pontos encontrados.

Curva de nível 4z = Restrição 0)y,x(g =

Curva de nível 4z −=



Projeto de Aplicação: Mínimos Quadrados Suponha que tenhamos um conjunto de dados tabelados que foram obtidos de um experimento qualquer com n valores de x e y:

x x1 x2 x3 ... xn y y1 y2 y3 ... yn

Precisamos encontrar uma função f(x) que aproxime a tabela com o menor erro possível. Graficamente, podemos ter uma idéia melhor do problema:

Podemos descobrir a função f(x) através do método dos mínimos quadrados. Quando as quantidades envolvidas x e y são grandes em relação ao erro calculado, podemos facilmente verificar que esse erro elevado ao quadrado é pequeno e ainda sempre positivo. Deste conceito simples é que surge o método dos mínimos quadrados. Considere o seguinte gráfico:

Para a abscissa xi podemos identificar dois valores de y: um corresponde ao valor tabelado yi e o outro correspondente ao cálculo de f(xi), ou seja, substituindo xi na função que aproxima os pontos tabelados. O erro entre o valor tabelado yi e o valor calculado f(xi) é igual a: )x(fyE ii −= O erro elevado ao quadrado é dado por:

[ ]2ii2 )x(fyE −=

Como f(x) depende de vários parâmetros (constantes), vamos chamar: ,...)c,b,a,x(f)x(f = Quando os valores de a, b, c, ... são conhecidos, a função possui apenas uma variável. Para o nosso caso, conhecemos o valor de x e desconhecemos os valores das constantes. A função então possui várias variáveis.



Vamos somar todos os erros cometidos para os valores de xi presentes na tabela. Dessa maneira, a soma dos quadrados dos erros fica:

[ ]∑=

−=n

1i

2ii ,...)c,b,a,x(fy,...)c,b,a(S

Para que o valor da soma seja mínimo, devemos calcular:

0a

,...)c,b,a(S =∂

∂, 0

b

,...)c,b,a(S =∂

∂, 0

c

,...)c,b,a(S =∂

∂, ...

Na forma desenvolvida:

[ ] 0a

,...)c,b,a,x(f,...)c,b,a,x(fy

a

,...)c,b,a(S n

1i

iii =

∂∂

⋅−=∂

∂∑=

[ ] 0b

,...)c,b,a,x(f,...)c,b,a,x(fy

b

,...)c,b,a(S n

1i

iii =

∂∂

⋅−=∂

∂∑=

[ ] 0c

,...)c,b,a,x(f,...)c,b,a,x(fy

c

,...)c,b,a(S n

1i

iii =

∂∂

⋅−=∂

∂∑=

E assim sucessivamente. Vamos demonstrar a equação da reta que tenha o mínimo de erro ao aproximar um conjunto de dados. A tabela será aproximada pela seguinte função: bax)b,a,x(fy +== Observe que a equação da reta possui apenas duas constantes (a e b). A soma dos erros elevados ao quadrado é dada por:

[ ]∑=

−=n

1i

2ii )b,a,x(fy)b,a(S

[ ]∑=

+−=n

1i

2ii )bax(y)b,a(S

As derivadas da função soma são iguais a:

[ ] 0x)bax(y2a

)b,a(S n

1iiii =⋅+−−=

∂∂

∑=

[ ] 01)bax(y2b

)b,a(S n

1iii =⋅+−−=

∂∂

∑=

Ou melhor:

0bxaxyxn

1ii

n

1i

2i

n

1iii =−− ∑∑∑

===

0baxyn

1i

n

1ii

n

1ii =−− ∑∑∑

===

Ou ainda:

0xbxayxn

1ii

n

1i

2i

n

1iii =−− ∑∑∑

===

0nbxayn

1ii

n

1ii =−− ∑∑

==



Essas duas equações formam o seguinte sistema:

=+

=+

∑∑

∑∑∑

==

===n

1ii

n

1ii

n

1iii

n

1ii

n

1i

2i

ybnxa

yxxbxa

Da segunda equação encontramos:

n

xay

b

n

1ii

n

1ii ∑∑

==−

=

Substituindo na primeira equação:

∑∑∑∑

∑==

==

==

−+

n

1iii

n

1ii

n

1ii

n

1iin

1i

2i yxx

n

xay

xa

∑∑∑∑∑

∑=

====

==−+

n

1iii

n

1ii

n

1ii

n

1ii

n

1iin

1i

2i yx

n

xxa

n

xy

xa

Multiplicando os dois membros por n:

∑∑∑∑∑∑======

=−+n

1iii

n

1ii

n

1ii

n

1ii

n

1ii

n

1i

2i yxnxxaxyxna

∑∑∑∑∑=====

−=

−

n

1ii

n

1ii

n

1iii

2n

1ii

n

1i

2i yxyxnxxna

Enfim, o coeficiente a é encontrado a partir da seguinte fórmula:

2n

1ii

n

1i

2i

n

1ii

n

1ii

n

1iii

xxn

yxyxn

a

−

−=

∑∑

∑∑∑

==

===

Vejamos agora um exemplo numérico. Exemplo

Suponhamos que um experimento tenha fornecido os seguintes dados:

i xi yi

1 1 3 2 2 4 3 3 2,5 4 5 0,5

Qual é a reta que melhor se ajusta aos dados anteriores ?



Solução

Primeiramente, devemos construir a seguinte tabela:

i xi yi (xi) 2 xiyi 1 1 3 1 3 2 2 4 4 8 3 3 2,5 9 7,5 4 5 0,5 25 2,5 ΣΣΣΣ 11 10 39 21

Para calcularmos os coeficientes a e b devemos apenas aplicar as fórmulas:

2n

1ii

n

1i

2i

n

1ii

n

1ii

n

1iii

xxn

yxyxn

a

−

−=

∑∑

∑∑∑

==

=== ∴ 35

26

121156

11084

11394

1011214a

2−=

−−=

−⋅⋅−⋅=

n

xay

b

n

1ii

n

1ii ∑∑

==−

= ∴ 35

159

435286

10

4

113526

10b =

+=

⋅

−−=

A equação da reta que aproxima a tabela com o menor erro é dada por:

35

159x

35

26y +−=

O gráfico da função que aproxima os pontos tabelados com o menor erro conforme o método dos mínimos quadrados é dada por:

Documents

Capítulo 2 - Gradiente e Derivada Direcional.pdf