56
Apuntes de c´ alculo diferencial en una y varias variables reales Eduardo Liz Marz ´ an Diciembre de 2013

Apuntes de c alculo diferencial en una y varias variables ...eliz/pdf/apuntes_cal_2013.pdf · Apuntes de c alculo diferencial en una y varias variables reales Eduardo Liz Marz an

  • Upload
    lenhu

  • View
    227

  • Download
    3

Embed Size (px)

Citation preview

Apuntes de calculo diferencial en una y varias

variables reales

Eduardo Liz Marzan

Diciembre de 2013

Indice general

1. Preliminares 1

1.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. La relacion de orden en el conjunto de los numeros reales. . . . . . . . . . . . . . 1

1.3. El valor absoluto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4. Funciones reales de variable real. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2. Lımites y continuidad de funciones de una variable 5

2.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2. Lımite de una funcion en un punto. . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.3. Continuidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.4. Lımites en infinito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.5. Calculo de lımites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.6. Algunos teoremas para funciones continuas. . . . . . . . . . . . . . . . . . . . . . 9

3. Derivacion de funciones de una variable 11

3.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.2. El problema de la tangente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.3. Derivada de una funcion en un punto. . . . . . . . . . . . . . . . . . . . . . . . . 12

3.4. Funcion derivada. Derivadas sucesivas. . . . . . . . . . . . . . . . . . . . . . . . . 14

3.5. Propiedades de las derivadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.6. Calculo de derivadas en algunos casos especiales. . . . . . . . . . . . . . . . . . . 16

3.7. La regla de L’Hopital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.8. Extremos relativos de una funcion. . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.9. El teorema del valor medio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.10. El teorema de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4. Introduccion a las funciones vectoriales 25

4.1. Funciones vectoriales de una variable. Curvas en R2 y R3. . . . . . . . . . . . . . 25

4.2. Campos escalares y vectoriales. Curvas de nivel . . . . . . . . . . . . . . . . . . . 27

4.3. Nociones basicas de topologıa en Rn. . . . . . . . . . . . . . . . . . . . . . . . . . 28

5. Continuidad y calculo diferencial de funciones de varias variables 31

5.1. Lımites y continuidad de funciones de varias variables. . . . . . . . . . . . . . . . 31

5.2. Derivadas parciales y plano tangente. . . . . . . . . . . . . . . . . . . . . . . . . . 33

i

5.3. Diferenciabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345.4. Regla de la cadena. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5.4.1. Interpretacion de la diferencial como aplicacion. . . . . . . . . . . . . . . . 375.4.2. Regla de la cadena: una variable independiente . . . . . . . . . . . . . . . 375.4.3. Regla de la cadena: varias variables independientes . . . . . . . . . . . . . 39

5.5. Derivacion implıcita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405.6. Derivadas parciales de orden superior. . . . . . . . . . . . . . . . . . . . . . . . . 415.7. Extremos locales y globales de un campo escalar. . . . . . . . . . . . . . . . . . . 435.8. Extremos condicionados. Multiplicadores de Lagrange. . . . . . . . . . . . . . . . 46

Referencias 51

Introduccion

Se recogen aquı los apuntes de la asignatura “Calculo I” adaptada a los nuevos grados. En loque respecta a las titulaciones de Ingenierıa de la energıa e Ingenierıa de los recursos mineros yenergeticos en la Universidad de Vigo, el grado tiene tres asignaturas cuya docencia correspondeal area de Matematica Aplicada. En el primer cuatrimestre se imparten Algebra Lineal y CalculoI, y en el segundo cuatrimestre Calculo II.

La primera parte del calculo (a la que corresponden estos apuntes) se dedica al estudio de lacontinuidad y diferenciabilidad de funciones de una y varias variables reales y sus aplicaciones. Asu docencia se dedican 40 horas de aula (teorıa y problemas) y 10 horas de laboratorio (practicasde ordenador y problemas).

Estas notas no pretenden sustituir ni a los apuntes de clase ni a los libros de la bibliografıa(que incluyen mucho mas material, en particular muchos mas dibujos y ejemplos), sino servirde ayuda para que los alumnos tengan el material del curso organizado.

Agradezco la cuidadosa lectura y las observaciones de Guillermo Garcıa Lomba, que hanayudado a pulir versiones anteriores.

iii

Capıtulo 1

Preliminares

1.1. Introduccion.

En la primera parte del curso se estudia el calculo en una variable real, con lo que el conjuntoprotagonista es el de los numeros reales, que denotaremos por R. En este capıtulo preliminarrecordaremos algunas cuestiones importantes que se utilizan en los temas siguientes, como larelacion de orden total de los numeros reales, el valor absoluto y el concepto de funcion.

1.2. La relacion de orden en el conjunto de los numeros reales.

Una caracterıstica fundamental en el conjunto R de los numeros reales es que existe unarelacion de orden total compatible con las operaciones. En particular, se verifican las siguientespropiedades:

1. Si x ≤ y y z ∈ R entonces x+ z ≤ y + z.

2. Si x ≤ y y λ > 0 entonces λx ≤ λy.

3. Si x ≤ y y λ < 0 entonces λx ≥ λy. En particular, x ≤ y =⇒ −x ≥ −y.

4. Si 0 < x < y entonces 0 < 1/y < 1/x.

Intervalos.La relacion de orden permite definir los intervalos, que son los subconjuntos de numeros

reales que usaremos mas habitualmente. Si a, b son dos numeros reales tales que a < b, se definenlos siguientes intervalos:

(a, b) = {x ∈ R / a < x < b} (Intervalo abierto de extremos a y b).

[a, b] = {x ∈ R / a ≤ x ≤ b} (Intervalo cerrado de extremos a y b).

[a, b) = {x ∈ R / a ≤ x < b}.

(a, b] = {x ∈ R / a < x ≤ b}.

1

2 1. Preliminares

Observaciones:

1. Estos dos ultimos se llaman intervalos semiabiertos o semicerrados.

2. Todos estos tipos de intervalos se llaman intervalos finitos o acotados. Los intervalos ce-rrados acotados [a, b] se llaman tambien intervalos compactos.

Existen otros intervalos infinitos o no acotados:

Abiertos: (a,∞) = {x ∈ R / x > a}, (−∞, b) = {x ∈ R / x < b}.

Cerrados: [a,∞) = {x ∈ R / x ≥ a}, (−∞, b] = {x ∈ R / x ≤ b}.

Observese que R = (−∞,∞) tambien es un intervalo no acotado.

1.3. El valor absoluto.

Se define el valor absoluto de un numero real x como

|x| ={

x si x ≥ 0−x si x < 0

Propiedades

1. |x| ≥ 0, ∀x ∈ R y ademas |x| = 0⇐⇒ x = 0.

2. |x| = | − x|, ∀x ∈ R.

3. |x · y| = |x| · |y|, ∀x, y ∈ R.

4. |x+ y| ≤ |x|+ |y|, ∀x, y ∈ R.

5. Si r > 0 entonces |x| ≤ r ⇐⇒ −r ≤ x ≤ r ⇐⇒ x ∈ [−r, r].

La propiedad 5 permite caracterizar el intervalo [x0 − r, x0 + r] centrado en x0 ∈ R y deradio r > 0 en terminos del valor absoluto:

x ∈ [x0 − r, x0 + r]⇐⇒ |x− x0| ≤ r.

Lo mismo se obtiene para intervalos abiertos utilizando la desigualdad estricta.

1.4. Funciones reales de variable real. 3

1.4. Funciones reales de variable real.

Las funciones reales de variable real son el objeto principal de los primeros temas del curso.En esta seccion repasamos algunos conceptos relacionados.

Sea D un subconjunto de R. Una funcion real de variable real (en adelante nos referiremosa ella unicamente como funcion) es una correspondencia f : D → R que asigna a cada numerox ∈ D un unico numero f(x) ∈ R que se llama imagen de x.

El conjunto D se llama dominio de definicion de f . Se llama imagen de f o rango de f alconjunto f(D) = {f(x) / x ∈ D}.

Por ejemplo, la aplicacion f(x) = ln(x) esta definida unicamente en D = (0,∞) y su imagenes f(D) = R, ya que todo numero real y se puede escribir como y = ln(ey) = f(ey).

Composicion de funciones. Sean f : D1 → R, g : D2 → R. Si f(D1) ⊂ D2, se puede definirla composicion (g ◦ f) : D1 → R como (g ◦ f)(x) = g(f(x)), ∀x ∈ D1.

Por ejemplo, si f(x) = x2 + 1 y g(x) = ln(x), se define (g ◦ f) : R→ R como

(g ◦ f)(x) = g(f(x)) = ln(x2 + 1), ∀x ∈ R.

Funciones inversas.Se dice que dos funciones f : D1 → R, g : D2 → R son inversas si (g ◦ f)(x) = x, ∀x ∈ D1

y (f ◦ g)(y) = y, ∀ y ∈ D2. Si f y g son inversas, se denota g = f−1.Por ejemplo, las funciones f(x) = ex y g(x) = ln(x) son inversas ya que

g(f(x)) = ln(ex) = x, ∀x ∈ R ; f(g(y)) = eln(y) = y, ∀ y ∈ (0,∞).

En general, aunque una funcion f : D → R tenga inversa, no es sencillo calcularla. Porejemplo, la funcion f : R → R definida por f(x) = x + ex tiene inversa pero no se puedeencontrar una expresion sencilla para ella. En ocasiones, saber que la funcion tiene inversatambien es util, aunque no se pueda calcular explıcitamente.

Las funciones que tienen inversa se llaman funciones inyectivas. Se caracterizan por lasiguiente propiedad: f es inyectiva si y solo si para cualquier par de numeros reales distintosx, y ∈ D sus imagenes f(x), f(y) tambien son distintas. Por ejemplo, la funcion f : R → Rdefinida por f(x) = x2 no es inyectiva ya que f(−1) = f(1) = 1.

Sea I un intervalo real. Una funcion f : I → R es estrictamente creciente si para cualquierpar de numeros reales distintos x, y ∈ I se cumple que x < y =⇒ f(x) < f(y). Diremos que fes estrictamente decreciente si x < y =⇒ f(x) > f(y). Las funciones estrictamente crecienteso decrecientes se llaman funciones estrictamente monotonas. Es inmediato probar que todafuncion estrictamente monotona es inyectiva y por tanto tiene inversa. Por ejemplo, la funcionf(x) = x+ ex mencionada antes es claramente creciente ya que x < y =⇒ x+ ex < y + ey.

Como y = f(x)⇐⇒ x = f−1(y), el punto (x, y) esta en la grafica de f si y solo si el punto(y, x) esta en la grafica de f−1. Esto quiere decir que las graficas de f y f−1 son simetricasrespecto de la recta y = x.Ejercicio de aplicacion: representar la grafica de la funcion arccos(x) en el intervalo [−1, 1].

Repaso. Se recomienda repasar las propiedades principales y las graficas de las funciones ex,ln(x), sen(x), cos(x), tg(x) y arctg(x).

4 1. Preliminares

Capıtulo 2

Lımites y continuidad de funcionesde una variable

2.1. Introduccion.

En este capıtulo se introducen los conceptos de lımite de una funcion en un punto y delımite en infinito. La nocion de lımite conduce a la importante definicion de continuidad. Alfinal del tema se enuncian varios teoremas importantes que dependen de forma esencial de lacontinuidad.

2.2. Lımite de una funcion en un punto.

Sea x0 ∈ R y sea f una funcion definida en los intervalos (x0 − r, x0) y (x0, x0 + r) paraalgun r > 0. Se dice que existe el lımite de f en x0 si ocurre una de las siguientes posibilidades:

1. lımx→x0

f(x) = y0 ∈ R si las imagenes de los puntos cercanos a x0 se aproximan a y0.

Formalmente,

lımx→x0

f(x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ |f(x)− y0| < ε] .

2. lımx→x0

f(x) =∞ si las imagenes de los puntos cercanos a x0 toman valores arbitrariamente

grandes. Formalmente,

lımx→x0

f(x) =∞⇐⇒ [∀M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ f(x) > M ] .

3. lımx→x0

f(x) = −∞ si las imagenes de los puntos cercanos a x0 toman valores negativos

arbitrariamente grandes en valor absoluto. Formalmente,

lımx→x0

f(x) = −∞⇐⇒ [∀M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ f(x) < −M ] .

5

6 2. Lımites y continuidad de funciones de una variable

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el lımite de f enx0.

En ocasiones no existe el lımite de una funcion en x0, pero existe alguno de los lımiteslaterales. El concepto de lımite lateral se define de forma muy parecida al de lımite.

Sea f una funcion real. Si x0 es un numero real tal que f esta definida en un intervalo(x0 − r, x0) para algun r > 0 entonces diremos que existe el lımite por la izquierda de f enx0 si ocurre una de las siguientes posibilidades:

1) lımx→x−0

f(x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 − δ, x0) =⇒ |f(x)− y0| < ε] .

2) lımx→x−0

f(x) =∞⇐⇒ [∀M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0) =⇒ f(x) > M ] .

3) lımx→x−0

f(x) = −∞⇐⇒ [∀M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0) =⇒ f(x) < −M ] .

Si lımx→x−0

f(x) = ±∞ se dice que la recta vertical x = x0 es una asıntota vertical de la

grafica de f por la izquierda.

De modo completamente analogo (cambiando (x0−δ, x0) por (x0, x0+δ)) se define el lımitepor la derecha de f en x0 si f esta definida en un intervalo de la forma (x0, x0 + r) para algunr > 0. Se denota lım

x→x+0f(x).

Si lımx→x+0

f(x) = ±∞ se dice que la recta vertical x = x0 es una asıntota vertical de la grafica

de f por la derecha.

Observacion. Si f esta definida en intervalos de la forma (x0 − r, x0) y (x0, x0 + r) para algunr > 0 entonces existe lım

x→x0f(x) si y solo si existen los lımites laterales y coinciden, es decir,

lımx→x−0

f(x) = lımx→x+0

f(x). Por ejemplo, consideremos la funcion f : (−∞, 0)∪ (0,∞)→ R definida

por f(x) = 1/|x|. Existe lımx→0

f(x) = ∞ ya que 1/|x| toma valores arbitrariamente grandes y

positivos cuando x se aproxima a cero tanto por la derecha como por la izquierda.

Otros ejemplos:

1. Sea f : (0,∞)→ R definida por f(x) = ln(x). Existe lımx→0+

f(x) = −∞ ya que ln(x) toma

valores arbitrariamente grandes y negativos cuando x se aproxima a cero por la derecha.

2. Sea f : (−π/2, π/2)→ R definida por f(x) = tg(x).

lımx→π/2−

f(x) =∞ ; lımx→−π/2+

f(x) = −∞.

3. Sea f : (−∞, 0)∪ (0,∞)→ R dada por f(x) = sen(x)/x. Veremos que existe lımx→0

f(x) = 1.

2.3. Continuidad. 7

2.3. Continuidad.

Sea f : I → R una funcion definida en un intervalo abierto I. Se dice que f es continua enun punto x0 ∈ I si existe el lımite de f en x0 y ademas

lımx→x0

f(x) = f(x0).

Si f no es continua en x0, diremos que f tiene una discontinuidad en x0. Consideraremosdos tipos distintos de discontinuidades:

1. Discontinuidad de salto. Se produce cuando existen los lımites laterales de f en x0 perono coinciden. Se dice que el salto es finito si los dos lımites laterales son finitos. Si algunode ellos es infinito, diremos que el salto es infinito.

2. Discontinuidad esencial. Se produce cuando no existe alguno de los lımites laterales def en x0.

Ejemplos:

1. Sea f : R→ R definida por

f(x) =

{sen(x) si x ≤ 0ln(x) si x > 0.

Existe una discontinuidad de salto infinito en x0 = 0, ya que

lımx→0−

f(x) = sen(0) = 0 ; lımx→0+

f(x) = lımx→0+

ln(x) = −∞.

2. Sea f : R→ R definida por

f(x) =

{sen(x) si x ≤ 0sen(1/x) si x > 0.

Existe una discontinuidad esencial en x0 = 0, ya que no existe lımx→0+

f(x) = lımx→0+

sen(1/x).

La razon es que cuando x se aproxima a cero por la derecha, la funcion f toma todos losvalores entre −1 y 1 en cada intervalo de la forma [1/(kπ + 2π), 1/(kπ)], k ∈ N.

Se dice que una funcion es continua en un conjunto A si es continua en todos los puntos de A.

Algunos ejemplos de funciones continuas.Las funciones mas comunes son continuas en sus dominios de definicion. Por ejemplo:

Las funciones polinomicas p(x) = a0 + a1x+ a2x2 + · · ·+ anx

n, donde a0, a1, . . . , an ∈ R,son continuas en R.

Las funciones racionales (cocientes de polinomios) r(x) = p(x)/q(x) son continuas en sudominio de definicion, es decir, en el conjunto de los numeros reales x tales que q(x) 6= 0.

8 2. Lımites y continuidad de funciones de una variable

La funcion exponencial ex es continua en R y ln(x) es continua en (0,∞).

Las funciones trigonometricas sen(x), cos(x), tg(x) y sus inversas arcsen(x), arccos(x),arctg(x) son continuas en sus respectivos dominios de definicion.

Los ejemplos anteriores, combinados con las propiedades que enunciamos a continuacion,permiten probar la continuidad de muchas funciones.

Propiedades.

1. La composicion de funciones continuas es una funcion continua. Por ejemplo, la funcionf(x) = ln(1 + | cos(x)|) es continua en R ya que f(x) = f1(f2(f3(f4(x)))), donde f1(x) =ln(x), f2(x) = 1 + x, f3(x) = |x| y f4(x) = cos(x) son continuas.

2. Si f y g son funciones continuas en x0 entonces las funciones (f+g) y (f ·g) son continuas enx0. La funcion f/g es continua en x0 si g(x0) 6= 0. Por ejemplo, la funcion f(x) = ex/(x−1)es continua para todo x 6= 1.

2.4. Lımites en infinito.

Sea f una funcion definida en el intervalo (a,∞) para algun a ∈ R. Diremos que existe ellımite de f en ∞ si ocurre una de las siguientes posibilidades:

1. lımx→∞

f(x) = y0 ⇐⇒ [∀ ε > 0, ∃M > 0 / x > M =⇒ |f(x)− y0| < ε] . Es decir, y0 es el lımite

de f cuando x tiende a infinito si f(x) se aproxima arbitrariamente a y0 cuando x se hacesuficientemente grande.

2. lımx→∞

f(x) = ∞ ⇐⇒[∀M > 0, ∃M ′ > 0 / x > M ′ =⇒ f(x) > M

]. Es decir, si f(x) toma

valores arbitrariamente grandes cuando x se hace suficientemente grande.

3. lımx→∞

f(x) = −∞⇐⇒[∀M > 0, ∃M ′ > 0 / x > M ′ =⇒ f(x) < −M

].

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el lımite de f eninfinito.

De modo completamente analogo se define el lımite de f en −∞ si f esta definida en (−∞, b)para algun b ∈ R.

Si y0 ∈ R es el lımite de f en ±∞, entonces la recta horizontal y = y0 es una asıntotahorizontal de la grafica de f .

Ejemplos:

1. lımx→∞

ex =∞, lımx→−∞

ex = 0.

2. lımx→∞

1/x = lımx→−∞

1/x = 0.

3. No existe lımx→∞

sen(x).

2.5. Calculo de lımites. 9

2.5. Calculo de lımites.

Las siguientes propiedades son utiles para el calculo de lımites:

1. Sean f y g dos funciones. Supongamos que existen lımx→x0

f(x) ∈ R y lımx→x0

g(x) ∈ R (x0

puede ser ±∞). Entonces:

a) lımx→x0

(f(x) + g(x)) = lımx→x0

f(x) + lımx→x0

g(x).

b) lımx→x0

(f(x) · g(x)) =

(lımx→x0

f(x)

)·(

lımx→x0

g(x)

).

c) lımx→x0

(f(x)/g(x)) =

(lımx→x0

f(x)

)/

(lımx→x0

g(x)

), si lım

x→x0g(x) 6= 0.

d) lımx→x0

(f(x)g(x)

)=

(lımx→x0

f(x)

) lımx→x0

g(x), si lım

x→x0f(x) > 0.

Algunas de las propiedades anteriores se pueden extender al caso en que alguno de loslımites es ±∞, teniendo en cuenta las relaciones formales ∞ +∞ = ∞, ∞ · ∞ = ∞,λ · ∞ =∞ si λ > 0, λ · ∞ = −∞ si λ < 0, ∞∞ =∞.

2. Si g es continua y existe lımx→x0

f(x) entonces lımx→x0

g(f(x)) = g

(lımx→x0

f(x)

).

Por ejemplo, lımx→0

ln(x+ 1) = ln(

lımx→0

(x+ 1))

= ln(1) = 0.

3. Si lımx→x0

f(x) = 0 y g esta acotada en un entorno de x0 entonces lımx→x0

(f(x) · g(x)) = 0. Por

ejemplo, lımx→∞

sen(x)/x = 0, ya que sen(x) esta acotada y lımx→∞

1/x = 0.

4. Si f, g, h son tres funciones tales que h(x) ≤ f(x) ≤ g(x) en un entorno de x0 y lımx→x0

h(x) =

lımx→x0

g(x) entonces lımx→x0

f(x) = lımx→x0

h(x) = lımx→x0

g(x).

5. lımx→x0

f(x) = 0⇐⇒ lımx→x0

|f(x)| = 0.

En muchos caso el calculo de lımites conduce a indeterminaciones. Algunas de ellas se re-solveran utilizando la regla de L’Hopital, que se introduce en el tema siguiente.

2.6. Algunos teoremas para funciones continuas.

En esta seccion se recogen cuatro resultados muy utiles basados en la continuidad. Sonresultados muy intuitivos que se deducen del siguiente teorema:

Teorema 2.1 Sea I un intervalo real y f : I → R una funcion continua. Entonces f(I) ={f(x) / x ∈ I} tambien es un intervalo. Ademas, si I = [a, b] es un intervalo compacto entoncesf([a, b]) = [c, d] tambien es un intervalo compacto.

10 2. Lımites y continuidad de funciones de una variable

Como consecuencias de este resultado se tienen los siguientes teoremas importantes:

Teorema 2.2 (Teorema de los valores extremos) Sea f : [a, b]→ R una funcion continua.Entonces existen m,M ∈ R tales que m = mın

x∈[a,b]f(x), M = max

x∈[a,b]f(x).

Por ejemplo, sea f : [0, 2]→ R definida por f(x) = x4 − 2x2. Se puede probar que

mınx∈[0,2]

f(x) = f(1) = −1 ; maxx∈[0,2]

f(x) = f(2) = 8.

Este resultado no tiene por que ser cierto si f no es continua o no esta definida en unintervalo compacto. Por ejemplo, la funcion f : (0, 2)→ R definida por f(x) = 1/x es continuapero no existe max

x∈(0,2)f(x) ya que lım

x→0+f(x) =∞.

Teorema 2.3 (Teorema de los valores intermedios) Sea f : [a, b] → R una funcion con-tinua. Sean m = mın

x∈[a,b]f(x), M = max

x∈[a,b]f(x). Para cualquier c tal que m < c < M existe al

menos un numero x ∈ [a, b] tal que f(x) = c.

Teorema 2.4 (Teorema de Bolzano) Sea f : [a, b]→ R una funcion continua.Si f(a) · f(b) < 0 entonces existe al menos un numero x ∈ [a, b] tal que f(x) = 0.

El teorema de Bolzano es una buena herramienta para probar la existencia de ceros de unafuncion. (Diremos que c es un cero o una raız de f si f(c) = 0.)

Por ejemplo, la funcion continua f(x) = ex − x4 tiene un cero en el intervalo [1, 2] ya quef(1) = e− 1 > 0 y f(2) = e2 − 16 < 0.

Teorema 2.5 (Teorema de punto fijo) Si f : [a, b]→ [a, b] es una funcion continua entoncesexiste al menos un punto fijo de f en [a, b], es decir, ∃x ∈ [a, b] / f(x) = x.

En realidad, para asegurar la existencia de un punto fijo es suficiente considerar la funciong(x) = f(x)− x y probar que es continua y g(a) · g(b) < 0.

Por ejemplo, la funcion continua f(x) = ex−2 tiene un punto fijo en [0, 1] ya que si definimosg(x) = f(x)− x entonces g(0) = f(0)− 0 = e−2 > 0 y g(1) = f(1)− 1 = e−1 − 1 < 0.

Capıtulo 3

Derivacion de funciones de unavariable

3.1. Introduccion.

En este capıtulo se introduce el concepto de derivada de una funcion en un punto y algunasde sus propiedades, como la regla de la cadena. El calculo diferencial es la herramienta mas eficazpara obtener propiedades de una funcion como sus intervalos de crecimiento, decrecimiento,concavidad y convexidad. Tambien tiene importantes aplicaciones al calculo de lımites (y portanto de asıntotas) y a la aproximacion de funciones por otras mas sencillas.

3.2. El problema de la tangente.

Una de las aplicaciones del calculo de lımites, que conduce al concepto de derivada, es ladefinicion precisa de lo que se entiende por recta tangente a una curva en un punto. La ideaintuitiva de que la tangente es la recta que toca en un unico punto a la curva funciona bien conalgunas curvas, como la circunferencia, pero en general es bastante ambigua en otras situaciones.Para la curva de la figura 3.1, la recta en trazo discontinuo solo toca una vez a la grafica, mientrasque la de trazo continuo la toca dos veces. Sin embargo, esta ultima es la recta tangente.

La definicion correcta de recta tangente se basa en que la pendiente de la recta tangente auna curva en el plano (x, y) representa la razon de cambio instantaneo de y con respecto a x.

Si f es una funcion, la razon promedio de cambio en un intervalo [x0, x0 + h] de longitud hviene dada por el cociente de incrementos

∆y

∆x=f(x0 + h)− f(x0)

h.

Por tanto, tiene sentido definir la razon de cambio instantanea como

lımh→0

f(x0 + h)− f(x0)

h. (1)

11

12 3. Derivacion de funciones de una variable

Figura 3.1: Ilustracion del concepto de recta tangente.

Para cada h > 0, el cociente de incrementos representa la pendiente de la recta que pasa porlos puntos (x0, f(x0)) y (x0 +h, f(x0 +h)). Estas rectas cortan a la grafica de f en dos puntos yse aproximan cuando h tiende a cero a la recta tangente a la grafica de f en el punto (x0, f(x0)).Por tanto, si el lımite definido en (1) existe, se puede definir de forma precisa la recta tangenteen x0 como la recta que pasa por (x0, f(x0)) y tiene como pendiente dicho lımite.

La razon de cambio instantanea definida por (1) conduce al concepto de derivada de unafuncion en un punto.

3.3. Derivada de una funcion en un punto.

Consideremos una funcion f : I → R, donde I es un intervalo abierto (acotado o no). Sedice que f es derivable en un punto x0 ∈ I, si existe el siguiente lımite y es finito:

lımh→0

f(x0 + h)− f(x0)

h.

En caso de que exista, se llama derivada de f en x0 y se denota por f ′(x0). Si el lımiteno existe o es infinito, diremos que f no es derivable en x0 o que no existe la derivada de f en x0.

Una definicion equivalente de f ′(x0) se obtiene tomando h = x− x0:

f ′(x0) = lımh→0

f(x0 + h)− f(x0)

h= lım

x→x0

f(x)− f(x0)

x− x0.

Ejemplo:La funcion f(x) = x2 es derivable en todo punto x ∈ R y ademas

f ′(x) = lımh→0

f(x+ h)− f(x)

h= lım

h→0

(x+ h)2 − x2

h= lım

h→0

h2 + 2xh

h= lım

h→0(h+ 2x) = 2x.

3.3. Derivada de una funcion en un punto. 13

Interpretacion geometrica.

Como hemos comentado antes, la derivada de f en x0 representa la pendiente de la rectatangente a la grafica de f en el punto (x0, f(x0)). Por tanto, la ecuacion de dicha recta tangentees

y − f(x0) = f ′(x0)(x− x0).

Por ejemplo, la funcion f(x) = x2 es derivable en x0 = 1 y f ′(1) = 2. Por tanto, la ecuacionde la recta tangente a la grafica de f en el punto (1, 1) es y − 1 = 2(x− 1). Las graficas de f yla recta tangente R se representan en la figura 3.2.

-2 -1 1 2

-1

1

2

3

4 f(x)

R(x)

Figura 3.2: Grafica de f(x) = x2 y su tangente en (1, 1).

Derivadas laterales.

Tambien se pueden definir las derivadas laterales de f en x0.

Se llama derivada por la izquierda de f en x0, y se denota f ′(x−0 ), al lımite

f ′(x−0 ) = lımh→0−

f(x0 + h)− f(x0)

h,

siempre que este exista y sea finito.

Analogamente, se define la derivada por la derecha f ′(x+0 ) tomando el lımite por la derecha.

Propiedad. f es derivable en x0 si y solo si existen f ′(x−0 ) y f ′(x+0 ) y ademas f ′(x−0 ) = f ′(x+0 ).

Ejemplo:

La funcion f(x) = |x| no es derivable en x0 = 0 ya que

f ′(0−) = lımh→0−

f(0 + h)− f(0)

h= lım

h→0−

|h|h

= lımh→0−

−hh

= −1

f ′(0+) = lımh→0+

f(0 + h)− f(0)

h= lım

h→0+

|h|h

= lımh→0+

h

h= 1.

14 3. Derivacion de funciones de una variable

En caso de que una funcion f este definida en un intervalo compacto [a, b], la derivada def en a se define como la derivada por la derecha y la derivada de f en b se entendera como laderivada por la izquierda.

3.4. Funcion derivada. Derivadas sucesivas.

Sea f : I → R una funcion. Se dice que f es derivable en I si es derivable en todos lospuntos de I. En este caso se puede definir la funcion derivada de f :

f ′ : I −→ Rx 7→ f ′(x)

Si la funcion f ′ es a su vez derivable en I entonces se define la derivada segunda (o derivadade orden 2) de f como f ′′(x) = (f ′)′(x), ∀x ∈ I. En general, si n ≥ 2, existe la derivada deorden n− 1 de f y fn−1) es derivable en I entonces se define fn)(x) = (fn−1))′(x), ∀x ∈ I. Eneste caso, se dice que f es n veces derivable en I y fn) se llama derivada n-esima de f en I.

Por convenio, se define f0)(x) = f(x).Se dice que una funcion es de clase n en I y se denota f ∈ Cn(I) si f es n veces derivable

en I y la funcion fn) es continua.Si f tiene derivadas de todos los ordenes entonces se dice que f es de clase infinito y se

denota f ∈ C∞(I).

Ejemplos:

1. La funcion f(x) = ex es de clase infinito en R ya que existen todas las derivadas sucesivasde f . De hecho, fn)(x) = ex, ∀n ∈ N.

2. La funcion f : R→ R definida por

f(x) =

{−x2 si x ≤ 0x2 si x > 0

es derivable en R, pero su derivada

f ′(x) =

{−2x si x ≤ 0

2x si x > 0

no es derivable en x = 0. Por tanto f ∈ C1(R) pero f 6∈ C2(R).

Observacion. Toda funcion derivable es continua. Sin embargo, no toda funcion continua esderivable. Por ejemplo, la funcion f(x) = |x| es continua en R pero no es derivable en x = 0.

3.5. Propiedades de las derivadas. 15

Derivacion de funciones definidas a trozos.El siguiente resultado simplifica el estudio de la derivabilidad en funciones definidas a trozos:

Proposicion 3.1 Sea f una funcion continua en un punto x0 y derivable en los intervalos(x0 − r, x0) y (x0, x0 + r) para algun r > 0. Supongamos que existen lım

x→x−0f ′(x) y lım

x→x+0f ′(x).

Entonces f es derivable en x0 si y solo si lımx→x−0

f ′(x) = lımx→x+0

f ′(x). Ademas, en ese caso,

f ′(x0) = lımx→x0

f ′(x) y por tanto f ′ es continua en x0.

Por ejemplo, consideremos la funcion f : R→ R definida por

f(x) =

{−x2 si x ≤ 0x2 si x > 0

Claramente f es derivable para todo x 6= 0 y

f ′(x) =

{−2x si x < 0

2x si x > 0

Como lımx→0−

f ′(x) = lımx→0+

f ′(x) = 0, se deduce que f es derivable en x = 0 y f ′(0) = 0. Por tanto

f ′ esta definida y es continua en R:

f ′(x) =

{−2x si x ≤ 0

2x si x > 0

Ahora, como

f ′′(x) =

{−2 si x < 0

2 si x > 0

es claro que lımx→0−

f ′′(x) = −2 6= lımx→0+

f ′′(x) = 2 y por tanto no existe f ′′(0).

3.5. Propiedades de las derivadas.

Sean f : I → R, g : I → R dos funciones derivables en un punto x0 ∈ I. Entonces:

1. (f + g) es derivable en x0 y (f + g)′(x0) = f ′(x0) + g′(x0).

2. (λf) es derivable en x0 y (λf)′(x0) = λf ′(x0), ∀λ ∈ R.

3. (f · g) es derivable en x0 y (f · g)′(x0) = f ′(x0)g(x0) + f(x0)g′(x0).

4. Si g(x0) 6= 0, (f/g) es derivable en x0 y

(f/g)′(x0) =f ′(x0)g(x0)− f(x0)g

′(x0)

(g(x0))2.

16 3. Derivacion de funciones de una variable

Regla de la cadena.Se conoce con el nombre de regla de la cadena a la formula para la derivada de la composicion

de dos funciones.Sean f : D1 → R, g : D2 → R tales que f(D1) ⊂ D2. Si f es derivable en x0 y g es derivable

en f(x0) entonces (g ◦ f) es derivable en x0 y ademas

(g ◦ f)′(x0) = g′(f(x0)) · f ′(x0).

Ejemplo.

La funcion f(x) = e(x2) es derivable en R y f ′(x) = (2x)e(x

2), ∀x ∈ R.

3.6. Calculo de derivadas en algunos casos especiales.

Derivadas de funciones implıcitasEn algunas ocasiones la variable y no esta expresada como una funcion explıcita de x (es

decir, y = f(x)), sino de forma implıcita mediante una expresion F (x, y) = 0.Por ejemplo, los puntos de la circunferencia de centro (0, 0) y radio 1 estan definidos por la

ecuacion x2 + y2 = 1.Para calcular la derivada de y respecto de x no es necesario despejar y en funcion de x.

Veamos el procedimiento con el caso de la circunferencia:Escribiendo y = y(x) y aplicando la regla de la cadena, se tiene

x2 + y(x)2 = 1 =⇒ 2x+ 2y(x)y′(x) = 0 =⇒ y′(x) =−xy(x)

.

Por ejemplo, en el punto (1/√

2, 1/√

2) se tiene:

y′(1/√

2) =−1/√

2

1/√

2= −1,

y la ecuacion de la recta tangente a la circunferencia en ese punto es:

y − 1√2

= (−1)

(x− 1√

2

),

es decir, y = −x+√

2.

Derivadas de funciones inversas.Supongamos que f es derivable y estrictamente monotona en un intervalo I. Entonces

f tiene inversa y f−1 tambien es derivable. Denotemos y = f(x). Teniendo en cuenta que(f ◦ f−1

)(x) = x, por la regla de la cadena se tiene:(

f ◦ f−1)′

(x) = f ′(f−1(x)) · (f−1)′(x) = 1 =⇒ (f−1)′(x) =1

f ′(f−1(x)).

Por ejemplo, si f(x) = tg(x), se tiene que f−1(x) = arctg(x) y f ′(x) = 1 + (tg(x))2. Portanto, la derivada de la funcion arco tangente es:

(f−1)′(x) =1

f ′(f−1(x))=

1

1 + (tg(arctg(x)))2=

1

1 + x2.

3.7. La regla de L’Hopital. 17

3.7. La regla de L’Hopital.

En esta seccion nos saltamos el orden usual por dos razones: la primera es que la regla deL’Hopital es la aplicacion de las derivadas mas relacionada con el tema anterior. De hecho esprobablemente el metodo mas efectivo para el calculo de lımites en el caso de indeterminaciones.El segundo motivo es que no se incluye la demostracion del teorema y eso nos permite dejar elteorema del valor medio para mas adelante.

Teorema 3.1 (Regla de L’Hopital) Sea x0 ∈ R. Sean f y g dos funciones definidas y deri-vables en los intervalos (x0 − r, x0) y (x0, x0 + r) para algun r > 0, de tal manera que g no seanula en esos intervalos. Supongamos que se cumplen las siguientes condiciones:

(a) lımx→x0

f(x) = lımx→x0

g(x) = 0 o lımx→x0

f(x) = lımx→x0

g(x) =∞

(b) Existe lımx→x0

(f ′(x)/g′(x)) = l (l puede ser finito o infinito).

Entonces existe lımx→x0

(f(x)/g(x)) y

lımx→x0

f(x)

g(x)= lım

x→x0

f ′(x)

g′(x).

El resultado del teorema sigue siendo cierto si x0 = ±∞ y las funciones f y g son derivablesen intervalos de la forma (a,∞) o (−∞, b). Tambien se aplica para el calculo de lımites lateralesen caso de que f/g solo este definida a la izquierda o a la derecha de x0.

Ejemplo.

lımx→0

sen(x)

x= lım

x→0

cos(x)

1= cos(0) = 1.

Ordenes de crecimientoHay muchas funciones que tienen lımite infinito en infinito. Sin embargo, tambien es im-

portante la magnitud del crecimiento. Por ejemplo, es sabido que el crecimiento exponencial esmas rapido que el crecimiento logarıtmico.

Sean f , g dos funciones tales que lımx→∞

f(x) = lımx→∞

g(x) =∞. La regla de L’Hopital ayuda

a decidir cual de ellas crece mas rapido. Diremos que f y g tienen el mismo orden de crecimientocuando cuando x tiende a infinito si lım

x→∞(f(x)/g(x)) = c > 0. Si lım

x→∞(f(x)/g(x)) =∞ diremos

que el orden de crecimiento de f en infinito es mayor que el de g.

Los siguientes ordenes de crecimiento en infinito estan ordenados de mayor a menor:

1. Crecimiento exponencial: f crece exponencialmente cuando x tiende a infinito si existenconstantes a > 0 y c > 0 tales que lım

x→∞(f(x)/eax) = c.

2. Crecimiento superlineal: f crece superlinealmente cuando x tiende a infinito si existenconstantes a > 1 y c > 0 tales que lım

x→∞(f(x)/xa) = c.

18 3. Derivacion de funciones de una variable

3. Crecimiento lineal: f crece linealmente cuando x tiende a infinito si existe una constantec > 0 tal que lım

x→∞(f(x)/x) = c.

4. Crecimiento sublineal: f crece sublinealmente cuando x tiende a infinito si existen cons-tantes a ∈ (0, 1) y c > 0 tales que lım

x→∞(f(x)/xa) = c.

5. Crecimiento logarıtmico: f tiene crecimiento logarıtmico cuando x tiende a infinito si existeuna constante c > 0 tal que lım

x→∞(f(x)/ ln(x)) = c.

Por ejemplo, veamos que el crecimiento sublineal es mas rapido que el logarıtmico usandola regla de L’Hopital. En efecto,

lımx→∞

xa

lnx= lım

x→∞

axa−1

x−1= lım

x→∞axa =∞, ∀ a > 0.

3.8. Extremos relativos de una funcion.

Las siguientes aplicaciones que veremos del calculo diferencial se dirigen en primer lugar alestudio cualitativo de las funciones, con especial atencion al crecimiento, decrecimiento, conca-vidad y convexidad. Pero, ademas, los teoremas que se incluyen en esta seccion tienen muchasotras aplicaciones.

Empezamos recordando el concepto de maximo y mınimo relativo de una funcion. Seaf : D → R una funcion. Se dice que f alcanza un maximo relativo en un punto x0 ∈ D siexiste un numero r > 0 tal que f(x) ≤ f(x0) para todos los puntos x ∈ D tales que |x−x0| < r.

Analogamente, f alcanza un mınimo relativo en un punto x0 ∈ D si existe un numeror > 0 tal que f(x) ≥ f(x0) para todos los puntos x ∈ D tales que |x− x0| < r.

Observaciones:

1. En cualquiera de los dos casos anteriores se dice que f tiene un extremo relativo en x0.

2. El extremo es estricto si las desigualdades que relacionan f(x) y f(x0) son estrictas.

3. El extremo es absoluto si las desigualdades f(x) ≤ f(x0) o f(x) ≥ f(x0) se cumplen paratodo x ∈ D.

En virtud del teorema de los valores extremos (Teorema 2.2), si f : [a, b] → R es unafuncion continua entonces siempre se alcanzan el maximo y el mınimo absolutos, es decir, existenx1, x2 ∈ [a, b] tales que f(x1) ≤ f(x) ≤ f(x2), ∀x ∈ [a, b].

El siguiente resultado facilita la busqueda de los extremos relativos de una funcion.

Teorema 3.2 (Teorema del extremo relativo) Sea f : I → R una funcion derivable en unintervalo abierto I. Si f tiene un extremo relativo en un punto x0 ∈ I entonces f ′(x0) = 0.

Demostracion. Supongamos que f ′(x0) > 0. Entonces

lımx→x0

f(x)− f(x0)

x− x0= f ′(x0) > 0.

3.8. Extremos relativos de una funcion. 19

En consecuencia, los terminos (f(x) − f(x0)) y (x − x0) tienen el mismo signo en un intervalo(x0− r, x0 + r) para algun r > 0. Por lo tanto, f(x) > f(x0) si x > x0 y f(x) < f(x0) si x < x0.Esto quiere decir que f no puede alcanzar un extremo relativo en x0.

El razonamiento si f ′(x0) < 0 es completamente analogo. Por tanto, la unica posibilidadpara que f tenga un extremo relativo en x0 es que f ′(x0) = 0. ut

Observaciones:

1. Este teorema solo proporciona una condicion necesaria para la existencia de extremos. Elhecho de que f ′(x0) = 0 no garantiza que f tenga un extremo en x0. Por ejemplo, lafuncion f : R→ R definida por f(x) = x3 no tiene ningun extremo relativo y sin embargof ′(0) = 0.

2. El teorema solo se puede aplicar en intervalos abiertos. Si f esta definida en un intervalocompacto [a, b], el teorema se puede usar en el intervalo (a, b). En los extremos del intervalose debe estudiar directamente la posible existencia de extremos. Por ejemplo, la funcionf(x) = x2 definida en el intervalo [−1, 1] tiene tres extremos relativos: un mınimo relativoen x = 0 y maximos relativos en x = −1 y en x = 1.

Una de las consecuencias del teorema del extremo relativo es el teorema de Rolle.

Teorema 3.3 (Teorema de Rolle) Sea f : [a, b] → R una funcion derivable. Si f(a) = f(b)entonces existe al menos un punto x0 ∈ [a, b] tal que f ′(x0) = 0.

Demostracion. Si f es constante en [a, b] entonces f ′(x) = 0, ∀x ∈ (a, b). En otro caso, elmınimo y el maximo absolutos de f en [a, b] son distintos. Como f(a) = f(b), necesariamenteuno de ellos se alcanza en un punto x0 ∈ (a, b). El teorema 3.2 garantiza que f ′(x0) = 0. ut

Como consecuencia del teorema de Rolle se puede relacionar el numero de ceros de unafuncion derivable f con el numero de ceros de f ′.

Corolario 3.1 Sea f : I → R una funcion derivable definida en un intervalo real I. Entre dosceros consecutivos de f existe al menos un cero de f ′. En consecuencia, si f ′ tiene n ceros en Ientonces f tiene a lo sumo (n+ 1) ceros en I.

Demostracion. Sean c1 < c2 dos ceros consecutivos de f . Entonces f : [c1, c2] → R es deri-vable y f(c1) = f(c2). Por el teorema de Rolle, existe al menos un punto x0 ∈ (c1, c2) tal quef ′(x0) = 0. ut

Ejemplo. Veamos que la funcion f(x) = 2ex − x − 3 tiene exactamente una raız positiva. Enefecto,

f ′(x) = 2ex − 1 = 0⇐⇒ ex = 1/2⇐⇒ x = ln(1/2).

Como ln(1/2) = − ln(2) < 0, f ′ no tiene raıces en (0,∞) y por tanto f tiene a lo sumo una raızpositiva. Por otra parte, como f(0) = −1 < 0, f(1) = 2e−4 > 0, el teorema de Bolzano permiteafirmar que f tiene un cero en el intervalo (0, 1).

20 3. Derivacion de funciones de una variable

3.9. El teorema del valor medio.

Una de las consecuencias principales del teorema de Rolle es el teorema del valor medio.

Teorema 3.4 (Teorema del valor medio) Sea f : [a, b] → R una funcion derivable. Enton-ces existe al menos un punto x0 ∈ (a, b) tal que f(b)− f(a) = f ′(x0)(b− a).

Demostracion. La prueba de este resultado consiste en aplicar el teorema de Rolle a la dife-rencia entre f y la recta que pasa por (a, f(a)) y (b, f(b)). En efecto, sea g : [a, b]→ R definidapor

g(x) = f(x)−[f(a) +

f(b)− f(a)

b− a(x− a)

].

Como g es derivable y g(a) = g(b) = 0, existe un x0 ∈ (a, b) tal que g′(x0) = 0. Por tanto,

g′(x0) = f ′(x0)−f(b)− f(a)

b− a= 0 =⇒ f ′(x0) =

f(b)− f(a)

b− a.

utA continuacion se obtienen algunas consecuencias de este resultado. Incluiremos las pruebas

de alguno de ellos.

Corolario 3.2 (Intervalos de crecimiento y decrecimiento) Sea f una funcion derivableen un intervalo (a, b).

(a) Si f ′(x) > 0, ∀x ∈ (a, b) entonces f es estrictamente creciente en (a, b).

(b) Si f ′(x) < 0, ∀x ∈ (a, b) entonces f es estrictamente decreciente en (a, b).

Demostracion. Probaremos el apartado (a): Sean x, y ∈ (a, b) tales que x < y. Tenemos quedemostrar que f(x) < f(y).

Aplicando el teorema del valor medio en el intervalo [x, y] se deduce la existencia de unpunto x0 ∈ (x, y) tal que f(y)− f(x) = f ′(x0)(y − x). Entonces:

f ′(x0) > 0 =⇒ f(y)− f(x) > 0 =⇒ f(x) < f(y).

utRecordemos que toda funcion estrictamente creciente o decreciente en un intervalo (a, b) es

inyectiva en (a, b) y por tanto se puede definir su inversa f−1.

Corolario 3.3 (Determinacion de maximos y mınimos relativos) Sea f : I → R unafuncion definida en un intervalo abierto I. Supongamos que f es dos veces derivable en unentorno de un punto x0 ∈ I y f ′(x0) = 0.

(a) Si f ′′(x0) > 0 entonces f alcanza un mınimo relativo estricto en x0.

(b) Si f ′′(x0) < 0 entonces f alcanza un maximo relativo estricto en x0.

3.9. El teorema del valor medio. 21

Demostracion. Como antes, probaremos el primer apartado. Como f ′′(x0) > 0, la funcion f ′′

toma valores positivos en un intervalo (x0 − r, x0 + r) para algun r > 0. Por el corolario 3.2, f ′

es estrictamente creciente en (x0 − r, x0 + r). En consecuencia, f ′(x) > f ′(x0) = 0 si x > x0 yf ′(x) < f ′(x0) = 0 si x < x0. Por tanto, f es estrictamente decreciente en (x0 − r, x0) y estric-tamente creciente en (x0, x0+r). Esto quiere decir que f tiene en x0 un mınimo relativo estricto.ut

El ultimo de los corolarios que veremos sirve para determinar los intervalos de concavidady convexidad de la grafica de una funcion.

Recordamos estos conceptos. Sea f : I → R una funcion derivable en un intervalo I. Eneste caso se puede definir la recta tangente a la grafica de f en cada punto (x0, f(x0)), x0 ∈ I.Se dice que la funcion es convexa en I si la grafica de f queda por encima de cualquier rectatangente a dicha grafica en los puntos del intervalo I. Si la grafica de f queda por debajo de cual-quier recta tangente a dicha grafica en los puntos del intervalo I se dira que f es concava en I.Si f es convexa a un lado de x0 y concava a otro se dira que f tiene en x0 un punto de inflexion.

El ejemplo tıpico de funcion convexa en R es f(x) = x2, mientras que el de funcion concavaes f(x) = −x2. Ambas se muestran en la figura 3.3.

-2 -1 1 2

-4

-3

-2

-1

-2 -1 1 2

-1

1

2

3

4

Figura 3.3: Graficas de x2 y −x2.

Corolario 3.4 (Concavidad y convexidad) Sea f : I → R una funcion dos veces derivableen un intervalo abierto I.

(a) Si f ′′(x) > 0, ∀x ∈ I entonces f es convexa en I.

(b) Si f ′′(x) < 0, ∀x ∈ I entonces f es concava en I.

(c) Si f tiene en x0 un punto de inflexion entonces necesariamente f ′′(x0) = 0.

Demostracion. Probemos el apartado (a). Para ello, escogemos un punto x0 ∈ I; tenemos quedemostrar que la grafica de f queda por encima de la recta tangente a dicha grafica en el punto(x0, f(x0)). Recordemos que la ecuacion de la recta tangente es y = r(x) = f(x0)+f ′(x0)(x−x0).Por tanto, debemos probar que

f(x) > f(x0) + f ′(x0)(x− x0), ∀x ∈ I.

22 3. Derivacion de funciones de una variable

Como f ′′(x) > 0, ∀x ∈ I, se deduce que f ′ es estrictamente creciente en I. Distinguimos loscasos x > x0 y x < x0.

Por el teorema del valor medio, para cada x > x0 existe un punto ξx ∈ (x0, x) tal quef(x)− f(x0) = f ′(ξx)(x− x0). Como f ′ es creciente, f ′(ξx) > f ′(x0) y por tanto:

f(x)− f(x0) = f ′(ξx)(x− x0) > f ′(x0)(x− x0) =⇒ f(x) > f(x0) + f ′(x0)(x− x0).

El caso x < x0 se resuelve de forma completamente analoga. ut

3.10. El teorema de Taylor.

Sea f : I → R una funcion definida en un intervalo real I. El teorema de Taylor establecela forma de aproximar la funcion f por un polinomio en un entorno de un punto x0 ∈ I. Elcaso mas sencillo consiste en aproximar por la recta tangente a la grafica de f en (x0, f(x0)),es decir, por el polinomio de grado uno p1(x) = f(x0) + f ′(x0)(x − x0). Observese que p1 es elunico polinomio de grado 1 que satisface las relaciones p1(x0) = f(x0), p

′1(x0) = f ′(x0).

La recta tangente es una “primera aproximacion”de la funcion f en un entorno del puntox0. Cabe esperar que podamos mejorar esta aproximacion si imponemos condiciones adicionalesal polinomio (y por tanto incrementamos su grado).

Para una funcion n veces derivable en I se define el polinomio de Taylor de grado n def centrado en x0 al unico polinomio pn(x) de grado menor o igual que n que satisface las n+ 1

ecuaciones pn(x0) = f(x0), p′n(x0) = f ′(x0), . . . , p

n)n (x0) = fn)(x0). Su expresion abreviada es

la siguiente:

pn(x) = f(x0) +

n∑k=1

fk)(x0)

k!(x− x0)k.

Es decir,

pn(x) = f(x0) + f ′(x0)(x− x0) +f ′′(x0)

2!(x− x0)2 + · · ·+ fn)(x0)

n!(x− x0)n.

Por ejemplo, si f(x) = ex y x0 = 0, el polinomio de Taylor de grado 3 de f centrado en ceroes:

p3(x) = f(0) + f ′(0)x+f ′′(0)

2!x2 +

f ′′′(0)

3!x3 = 1 + x+

x2

2+x3

6,

ya que f(0) = f ′(0) = f ′′(0) = f ′′′(0) = e0 = 1.Usando este polinomio, podemos aproximar ex en puntos proximos a cero. Por ejemplo,√

e = e1/2 ≈ p3(1/2) = 1+1/2+1/8+1/48 = 1,64583. La calculadora proporciona√e = 1,64872,

con lo que las dos primeras cifras decimales son correctas.

El teorema de Taylor permite estimar el error cometido cuando aproximamos una funcionpor el polinomio de Taylor.

3.10. El teorema de Taylor. 23

Teorema 3.5 (Teorema de Taylor) Sea f : [a, b] → R una funcion derivable n + 1 vecesy sea x0 ∈ [a, b]. Entonces, para cada x ∈ [a, b], existe un numero ξx entre x0 y x tal quef(x) = pn(x) + rn(x), donde

rn(x) =fn+1)(ξx)

(n+ 1)!(x− x0)n+1.

El termino rn(x) se llama resto del polinomio de Taylor de grado n de f centrado enx0 y proporciona el error cometido en la aproximacion ya que |f(x)− pn(x)| = |rn(x)|, ∀x ∈ I.

Por ejemplo, el polinomio de Taylor de grado tres de f(x) = sen(x) centrado en x0 = 0 esp3(x) = x− x3/6. El error cometido al aproximar sen(1/2) por p3(1/2) es

|r3(1/2)| =

∣∣∣∣∣f iv)(ξx)

4!

(1

2

)4∣∣∣∣∣ , ξx ∈ (0, 1/2).

Dado que |f iv)(ξx)| = | sen(ξx)| ≤ 1, ∀ ξx ∈ (0, 1/2), se tiene que:

| sen(1/2)− p3(1/2)| = |r3(1/2)| ≤ 1

4! 24= 0,00260417.

De hecho p3(1/2) = 1/2− 1/48 = 0,479167 y la calculadora proporciona sen(1/2) = 0,479426.

Finalizamos el tema con dos aplicaciones del teorema de Taylor para obtener condicionesprecisas para la existencia de extremos relativos y puntos de inflexion de una funcion f suficien-temente regular (con suficientes derivadas sucesivas).

Corolario 3.5 (Criterio para la existencia de extremos) Sea f : I → R una funcion declase Cn en un intervalo abierto I. Sea x0 ∈ I tal que f ′(x0) = 0 y sea n el orden de la primeraderivada de f que no se anula en x0, es decir fk)(x0) = 0 si 1 ≤ k < n y fn)(x0) 6= 0.

(a) Si n es par y fn)(x0) > 0 entonces f es tiene un mınimo relativo estricto en x0.

(b) Si n es par y fn)(x0) < 0 entonces f es tiene un maximo relativo estricto en x0.

(c) Si n es impar entonces f no tiene un extremo relativo en x0.

Demostracion. Demostramos el apartado (a). El polinomio de Taylor de grado n − 1 de fcentrado en x0 es

pn−1(x) = f(x0) + f ′(x0)(x− x0) +f ′′(x0)

2!(x− x0)2 + · · ·+ fn−1)(x0)

(n− 1)!(x− x0)n−1 = f(x0),

ya que fk)(x0) = 0 si k < n. Por el teorema de Taylor, existe un ξx entre x0 y x tal que

f(x) = pn−1(x) + rn−1(x) = f(x0) +fn)(ξx)

n!(x− x0)n.

24 3. Derivacion de funciones de una variable

Como n es par y fn)(x0) > 0, se cumple que (x − x0)n > 0 y fn)(ξx) > 0 para x 6= x0 en unentorno (x0 − r, x0 + r) de x0. Por tanto,

f(x) = f(x0) +fn)(ξx)

n!(x− x0)n > f(x0), ∀x ∈ (x0 − r, x0) ∪ (x0, x0 + r).

De aquı se deduce que f tiene en x0 un mınimo relativo estricto. ut

Corolario 3.6 (Criterio para la existencia de puntos de inflexion) Sea f : I → R unafuncion de clase n en un intervalo abierto I. Sea x0 ∈ I tal que f ′′(x0) = 0 y sea n el orden de laprimera derivada de f mayor que dos que no se anula en x0, es decir fk)(x0) = 0 si 2 ≤ k < ny fn)(x0) 6= 0. Entonces f tiene un punto de inflexion en x0 si y solo si n es impar.

Ejemplo.Consideremos la funcion f(x) = x4 − x3.

f ′(x) = 4x3 − 3x2 = 0⇐⇒ x = 0 o x = 3/4

f ′′(x) = 12x2 − 6x = 0⇐⇒ x = 0 o x = 1/2.

Para x = 0 se tiene que f ′(0) = f ′′(0) = 0, f ′′′(0) = −6 6= 0. Por tanto, f tiene en x = 0 unpunto de inflexion.

Para x = 3/4 se tiene que f ′(3/4) = 0, f ′′(3/4) = 9/4 > 0. Por tanto, f tiene en x = 3/4un mınimo relativo estricto.

Para x = 1/2 se tiene que f ′′(1/2) = 0, f ′′′(1/2) = 6 6= 0. Por tanto, f tiene en x = 1/2 unpunto de inflexion.

La grafica se muestra en la figura 3.4.

1/2 13/40

Figura 3.4: Grafica de la funcion f(x) = x4 − x3.

Capıtulo 4

Introduccion a las funcionesvectoriales

4.1. Funciones vectoriales de una variable. Curvas en R2 y R3.

Sea I un intervalo real. Una funcion f : I → Rn se llama funcion vectorial de una variable.Para cada t ∈ I, f(t) es un vector de Rn y por tanto se puede escribir en la forma

f(t) = (f1(t), f2(t), . . . , fn(t)),

donde fi : I → R es una funcion escalar para i = 1, 2, . . . , n. Las funciones fi se llaman funcionescomponentes de f .

Por ejemplo, la funcion f : [0, 2π] → R2 dada por f(t) = (cos(t), sen(t)) es una funcionvectorial con valores en R2. Sus componentes son f1(t) = cos(t) y f2(t) = sen(t).

Las funciones componentes permiten extender facilmente los conceptos de lımite, continui-dad y derivada. Sea t0 ∈ R tal que f esta definida en los intervalos (t0 − r, t0) y (t0, t0 + r) paraalgun r > 0. Diremos que existe el lımite de f cuando t tiende a t0 si existe el lımite de cadauna de las componentes. En este caso, se define

lımt→t0

f(t) =

(lımt→t0

f1(t), lımt→t0

f2(t), . . . , lımt→t0

fn(t)

).

Una funcion f es continua en t0 ∈ I si existe el lımite de f cuando t tiende a t0 y ademaslımt→0

f(t) = f(t0). Es evidente que f es continua en t0 si y solo si todas sus componentes son

continuas en t0.Se dice que f : I → Rn es derivable en un punto t0 si lo es cada una de sus componentes;

en ese caso, la derivada de f en t0 es

f ′(t0) =(f ′1(t0), f

′2(t0), . . . , f

′n(t0)

)= lım

t→t0

f(t)− f(t0)

t− t0.

Por ejemplo, la derivada de f(t) = (cos(t), sin(t)) es f ′(t) = (− sen(t), cos(t)).

25

26 4. Introduccion a las funciones vectoriales

Curvas y vector tangenteLa grafica de una funcion vectorial f : I → Rn es el conjunto de puntos {(t, f(t)) / t ∈ I} y

por tanto es un subconjunto de Rn+1. En los casos n = 2 y n = 3, es habitual representar sololos puntos f(t) ∈ Rn en lugar de la grafica.

Sea f : I → Rn una funcion continua definida en un intervalo real I. El conjunto

C = {f(t) = (f1(t), f2(t), . . . , fn(t)) / t ∈ I}

se llama curva en Rn y se dice que la funcion f es una parametrizacion de la curva.

Ejemplos:

La funcion f : [0, π]→ R2 dada por f(t) = (cos(t), sin(t)) describe la curva plana

C = {(cos(t), sin(t)) / t ∈ [0, π]},

que es una semicircunferencia de centro (0, 0) y radio 1 en R2. Otra posible parametrizacion

de la misma curva es g : [−1, 1]→ R dada por g(t) =(t,√

1− t2). En este caso, la curva

se recorre en sentido contrario.

La funcion f : [0,∞)→ R3 definida por f(t) = (cos(t), sen(t), t) describe una curva en R3

llamada helice circular, que se enrolla en un cilindro circular de radio 1.

Si f : I → Rn es derivable en t0 y f ′(t0) 6= (0, 0, . . . , 0) entonces f ′(t0) es un vector tangentea la curva C en el punto f(t0). El vector tangente indica en que sentido se recorre la curva (suorientacion) y permite definir la recta tangente a la curva C en el punto f(t0) como la recta quepasa por f(t0) y tiene la direccion de f ′(t0), es decir, su ecuacion parametrica es

x(t) = f(t0) + t f ′(t0), t ∈ R.

Por ejemplo, la funcion f : [0, 2π]→ R2 dada por f(t) = (cos(t), sin(t)) define la circunferenciade centro (0, 0) y radio 1 en R2 y su derivada en cada punto t es f ′(t) = (− sen(t), cos(t)). Parat0 = π/4, f(π/4) = (1/

√2, 1/√

2) y el vector tangente es f ′(π/4) = (−1/√

2, 1/√

2). Por tantolas ecuaciones parametricas de la recta tangente son

(x(t), y(t)) = (1/√

2, 1/√

2) + t(−1/√

2, 1/√

2)⇐⇒

x(t) =

1− t√2

y(t) =1 + t√

2

Despejando t se obtiene la ecuacion cartesiana y = −x+√

2.Cuando n = 2 o n = 3, una curva se puede pensar como la trayectoria que sigue una

partıcula. Si denotamos por r(t) = (x(t), y(t), z(t)) el vector de posicion en un instante t, entoncesel vector tangente v(t) = r′(t) = (x′(t), y′(t), z′(t)) es el vector velocidad y a(t) = v′(t) = r′′(t) =(x′′(t), y′′(t), z′′(t)) es el vector aceleracion.

Las derivadas de funciones vectoriales de una variable tienen propiedades similares a lasde las derivadas escalares con respecto a la suma y el producto por escalares. En el caso del

4.2. Campos escalares y vectoriales. Curvas de nivel 27

producto de funciones, se cumple una regla analoga a la de funciones escalares de una variable,pero en terminos del producto escalar. Notese que si f : I → Rn y g : I → Rn son dos funcionesvectoriales entonces su producto escalar (f · g) es una funcion escalar (f · g) : I → R definida

por (f · g)(t) = f(t) · g(t) =

n∑i=1

fi(t)gi(t).

Si f : I → Rn y g : I → Rn son dos funciones vectoriales derivables entonces se tienen lassiguientes propiedades:

1) f + g es derivable y (f + g)′(t) = f ′(t) + g′(t).

2) λf es derivable y (λf)′(t) = λf ′(t), ∀λ ∈ R.

3) El producto escalar (f · g) es derivable y (f · g)′(t) = f ′(t) · g(t) + f(t) · g′(t).

4.2. Campos escalares y vectoriales. Curvas de nivel

Sea D un subconjunto de Rn, con n > 1. Una funcion f : D → Rp es una funcion de variasvariables reales. El conjunto D se llama dominio de definicion de f .

En el caso particular p = 1, una funcion f : Rn → R se suele llamar campo escalar (ofuncion escalar de varias variables). Por ejemplo, la funcion que asigna a cada punto (x, y, z)de un recinto tridimensional D su temperatura es un campo escalar T : D ⊂ R3 → R llamadocampo de temperaturas.

Si p > 1, una funcion f : D ⊂ Rn → Rp se llama funcion vectorial de varias variables.Especialmente en el caso p = n, la funcion vectorial f : D ⊂ Rn → Rn suele llamarse campo devectores. En el caso de R2 es un campo de vectores en el plano y en el de R3 es un campo devectores en el espacio.

Una funcion f : D ⊂ Rn → Rp se puede expresar en funcion de sus componentes:

f(x) = f(x1, x2, . . . , xn) = (f1(x1, x2, . . . , xn), f2(x1, x2, . . . , xn), . . . , fp(x1, x2, . . . , xn)).

Para cada k = 1, 2, . . . , p, la componente fk : Rn → R es un campo escalar.Por ejemplo, la funcion f : R2 → R3 definida por f(x, y) = (x+ y, exy, sen(x− y)) tiene tres

componentes f1(x, y) = x+ y, f2(x, y) = exy, f3(x, y) = sen(x− y).La grafica de una funcion f : D ⊂ Rn → Rp se define como el conjunto

G(f) = {(x, f(x)) / x ∈ D} .

Notese que los puntos de la grafica son de la forma

(x, f(x)) = (x1, x2, . . . , xn, f1(x1, x2, . . . , xn), f2(x1, x2, . . . , xn), . . . , fp(x1, x2, . . . , xn)) ∈ Rn+p,

y por tanto la grafica de f es un subconjunto de Rn+p.Por ejemplo, la grafica de la funcion f : R2 → R definida por f(x, y) = x2 +y2 es el parabo-

loide definido por la ecuacion z = x2 + y2 en R3. En general, las graficas de funciones de R2 enR son difıciles de representar; para n > 2 y/o p > 1, la grafica de una funcion de varias variablesf : Rn → Rp estarıa en un espacio de dimension mayor que 3 y por tanto no se podrıa representar.

28 4. Introduccion a las funciones vectoriales

Curvas de nivelSi f : D ⊂ R2 → R es un campo escalar definido en un dominio D del plano, se definen sus

curvas de nivel como los conjuntos de puntos sobre los que f toma el mismo valor, es decir, siK ∈ R, la curva de nivel K es

CK = {(x, y) ∈ R2 / f(x, y) = K}.

Ejemplos tıpicos de curvas de nivel son los mapas topograficos, donde cada curva de nivelse corresponde con los puntos que tienen la misma altura, y los mapas de isobaras, donde cadacurva de nivel (isobara) representa los puntos donde la presion atmosferica es la misma.

Por ejemplo, las curvas de nivel de la funcion f : R2 → R definida por f(x, y) = x2 + y2

solo tienen sentido para K = r2 > 0 y son circunferencias de centro (0, 0) y radio r:

CK = {(x, y) ∈ R2 / x2 + y2 = r2}, K = r2.

Cada curva de nivel representa la interseccion de la grafica de f con el plano z = K paraleloal plano horizontal z = 0.

4.3. Nociones basicas de topologıa en Rn.

En esta seccion generalizaremos a Rn algunos conceptos que en R proporcionan de formanatural los intervalos y el valor absoluto.

El papel de un intervalo real (x0 − r, x0 + r) centrado en x0 ∈ R y radio r > 0 lo juega enRn la bola abierta de centro P ∈ Rn y radio r > 0, que se define como el conjunto de puntos deRn cuya distancia a P es menor que r, es decir,

B(P, r) = {x ∈ Rn / ‖x− P‖ < r} ,

donde recordemos que ‖(x1, x2, . . . , xn)‖ =√x21 + x22 + · · ·+ x2n.

Por ejemplo, en R2 la bola abierta de centro (0, 0) y radio r esta formada por los puntosque quedan dentro de la circunferencia de centro (0, 0) y radio r, es decir:

B((0, 0), r) ={

(x, y) ∈ R2 / x2 + y2 < r2}.

Las bolas abiertas permiten definir el interior y la frontera de un conjunto de Rn.Sea A un subconjunto de Rn. Se dice que P ∈ A es un punto interior de A si existe alguna

bola abierta centrada en P que queda dentro de A, es decir, si

∃ r > 0 /B(P, r) ⊂ A.

El conjunto de los puntos interiores de A se llama interior de A y lo denotaremos por Int(A).Diremos que un conjunto A es abierto si todos sus puntos son interiores. Por ejemplo, las

bolas abiertas en Rn son conjuntos abiertos.Los puntos de A que no estan en el interior se llaman puntos frontera. Tambien puede haber

puntos de la frontera de A que no pertenecen a A. Diremos que un punto P ∈ Rn es un punto de

4.3. Nociones basicas de topologıa en Rn. 29

la frontera de A si cualquier bola abierta centrada en P contiene puntos de A y puntos que noestan en A. El conjunto de puntos frontera se llama frontera de A y lo denotaremos por Fr(A).Por ejemplo, la frontera de la bola abierta de centro (0, 0) y radio r es la circunferencia de centro(0, 0) y radio r:

Fr(B((0, 0), r)) ={

(x, y) ∈ R2 / x2 + y2 = r2}.

Diremos que un conjunto A es cerrado si contiene a todos los puntos de su frontera. Porejemplo, el cuadrado unidad I2 en R2 es cerrado:

I2 = [0, 1]× [0, 1] ={

(x, y) ∈ R2 / 0 ≤ x ≤ 1, 0 ≤ y ≤ 1}.

En general, los conjuntos cerrados que manejaremos estan definidos por desigualdades no es-trictas y los conjuntos abiertos estan definidos por desigualdades estrictas (observese la analogıacon los intervalos abiertos y cerrados).

Diremos que un subconjunto A de Rn esta acotado si existe una constante positiva K talque ‖x‖ ≤ K, ∀x ∈ A.

Diremos que un subconjunto A de Rn es compacto si esta acotado y es cerrado. Losconjuntos compactos de Rn juegan el papel de los intervalos compactos [a, b] de R.Ejemplos:

El cuadrado unidad I2 descrito anteriormente es compacto.

El cuadrante positivo A = {(x, y) ∈ R2 / x ≥ 0, y ≥ 0} no es compacto porque no esta aco-tado.

La bola abierta de centro (0, 0) y radio r no es compacta porque no es cerrada.

30 4. Introduccion a las funciones vectoriales

Capıtulo 5

Continuidad y calculo diferencial defunciones de varias variables

5.1. Lımites y continuidad de funciones de varias variables.

Sea f : D ⊂ Rn → Rp una funcion vectorial definida en un subconjunto abierto D de Rn.Sea P un punto de D o de su frontera. Diremos que L ∈ Rp es el lımite de f cuando x tiendea P si f(x) se aproxima a L cuando x se aproxima a P . Esta definicion se puede escribir enterminos de normas y es muy similar a la de lımite de funciones escalares de una variable:

lımx→P

f(x) = L⇐⇒ [∀ ε > 0, ∃δ > 0 / ‖x− P‖ < δ, x 6= P =⇒ ‖f(x)− L‖ < ε] .

Al igual que pasaba con las funciones vectoriales de una variable, si f : Rn → Rp y P ∈ Rnentonces existe el lımite de f en P si y solo si existen los lımites en P de cada una de las compo-nentes f1(x), f2(x), . . . , fp(x). Por tanto, podemos restringir nuestro estudio a campos escalares.

Lımites direccionales

Una de las diferencias fundamentales es que el lımite de una funcion de una variable en unpunto x0 ∈ R existe si y solo si existen los lımites laterales y coinciden. Sin embargo, las posiblesformas de aproximarse a un punto en Rn son infinitas.

Esta observacion resulta util como criterio para probar que el lımite en P no existe: bastaencontrar dos direcciones de tal forma que los lımites de f(x) cuando x tiende a P a lo largo deesas direcciones sean distintos. Estos lımites se llaman lımites direccionales.

Por ejemplo,

lım(x,y)→(0,0)

x2 − y2

x2 + y2

no existe porque cuando nos aproximamos a (0, 0) a lo largo de los dos ejes de coordenadas la

31

32 5. Continuidad y calculo diferencial de funciones de varias variables

funcion se aproxima a valores diferentes:

lım(x,y)→(0,0)

y=0

x2 − y2

x2 + y2= lım

x→0

x2

x2= lım

x→01 = 1.

lım(x,y)→(0,0)

x=0

x2 − y2

x2 + y2= lım

y→0

−y2

y2= lım

y→0(−1) = −1.

En el siguiente ejemplo estos dos lımites coinciden y consideramos las rectas y = λx quepasan por (0, 0):

lım(x,y)→(0,0)

2xy

x2 + y2

no existe porque cuando nos aproximamos a (0, 0) a lo largo de las rectas y = λx con distintosvalores de λ la funcion se aproxima a valores diferentes:

lım(x,y)→(0,0)

y=λx

2xy

x2 + y2= lım

x→0

2λx2

(1 + λ2)x2=

1 + λ2.

Para λ = 1, el lımite vale 1 mientras que para λ = −1 el lımite vale −1.

Continuidad

El concepto de continuidad para funciones de varias variables es similar al de funcionesde una variable. Sea f : D ⊂ Rn → Rp una funcion definida en un conjunto abierto D y seaP ∈ D. Se dice que f es continua en P si existe el lımite de f en P y ademas

lımx→P

f(x) = f(P ).

Diremos que f es continua en D si es continua en todos los puntos de D.

Es claro que f(x) = (f1(x), f2(x), . . . , fp(x)) es continua en P si y solo si todas sus compo-nentes son continuas en P . Por ello podemos centrarnos en campos escalares.

Las propiedades relacionadas con la continuidad para funciones de varias variables sonsimilares a las de las funciones de una variable:

1. La composicion de funciones continuas es una funcion continua.

2. Si f : Rn → R y g : Rn → R son funciones continuas en P entonces las funciones (f + g)y (f · g) son continuas en P . La funcion f/g es continua en P si g(P ) 6= 0.

Por ejemplo, la funcion f(x, y) =ex+y

xy − 1es continua para todos los puntos de R2 que no

estan sobre la hiperbola xy = 1.

5.2. Derivadas parciales y plano tangente. 33

5.2. Derivadas parciales y plano tangente.

Para definir el concepto de diferenciabilidad de funciones de varias variables, comenzaremoscon campos escalares en R2.

Sea f : R2 → R un campo escalar. Se llama derivada parcial de f respecto a la variablex a la funcion que resulta de considerar la variable y constante y aplicar la derivacion usual

respecto de x. Se representa por∂f

∂xo fx.

Por ejemplo, si f(x, y) = x3y + xy2 − ln(xy) entonces:

∂f

∂x= 3x2y + y2 − 1

x;

∂f

∂y= x3 + 2xy − 1

y.

Formalmente, la derivada parcial de f respecto de x en un punto (x, y) se define como

∂f

∂x(x, y) = lım

h→0

f(x+ h, y)− f(x, y)

h.

La derivada parcial de f respecto de x en el punto (x0, y0) representa la tasa de crecimientoinstantanea de f en la direccion paralela al eje x, cuando y0 se mantiene constante. La inter-pretacion geometrica es la siguiente: denotemos por z = f(x, y) la grafica de f ; entonces laderivada parcial respecto de x en un punto (x0, y0) representa la pendiente de la recta tangentea la curva z = f(x, y0) en el punto (x0, y0, f(x0, y0)), es decir, la pendiente de la tangente a lacurva interseccion de la grafica de f con el plano y = y0.

De modo analogo, la parcial respecto de y en el punto (x0, y0) representa la pendiente de latangente a la curva interseccion de la grafica de f con el plano x = x0.

Si existen las derivadas parciales respecto de x y de y en un punto (x0, y0) entonces el vectorfila

∇f(x0, y0) =

(∂f

∂x(x0, y0),

∂f

∂x(x0, y0)

)∈ R2

se llama vector gradiente de f en (x0, y0).

Plano tangente.

La interpretacion geometrica de las derivadas parciales motiva la idea de definir el planotangente a la superficie z = f(x, y) definida por la grafica de un campo escalar f : R2 → Ren un punto (x0, y0, z0) como el plano que pasa por (x0, y0, z0) y contiene a las rectas tangentesdefinidas por (∂f/∂x)(x0, y0) y (∂f/∂y)(x0, y0) respectivamente.

Recordemos que la ecuacion de la recta tangente a la grafica de una una funcion f : R→ Ren un punto (x0, f(x0)) es y−f(x0) = f ′(x0)(x−x0). La ecuacion del plano tangente es similar:

z − z0 =∂f

∂x(x0, y0) (x− x0) +

∂f

∂y(x0, y0) (y − y0), z0 = f(x0, y0).

Notese que si hacemos y = y0 entonces la interseccion del plano tangente con el plano y = y0es precisamente la recta tangente a la interseccion de la grafica de f con dicho plano.

34 5. Continuidad y calculo diferencial de funciones de varias variables

Por ejemplo, calculemos la ecuacion del plano tangente a la grafica de f(x, y) = x2 + y2 + yen el punto (1, 0, 1). Como fx(x, y) = 2x, fy(x, y) = 2y + 1, resulta:

z − 1 = fx(1, 0)(x− 1) + fy(1, 0)(y − 0) = 2(x− 1) + y ⇐⇒ 2x+ y − z = 1.

La ecuacion del plano tangente a f en el punto (x0, y0, z0), donde z0 = f(x0, y0), tambiense puede escribir en la forma:

z = f(x0, y0) +∇f(x0, y0) · (x− x0, y − y0).

5.3. Diferenciabilidad.

El plano tangente motiva la idea para extender el concepto de funcion diferenciable en unpunto para funciones de varias variables. Recordemos que una funcion f : R → R es derivableen un punto x0 si la recta tangente y = r(x) es una buena aproximacion de la grafica de f enpuntos cercanos a (x0, f(x0)):

lımx→x0

f(x)− f(x0)

x− x0= f ′(x0)⇐⇒ lım

x→x0

f(x)− [f(x0) + f ′(x0)(x− x0)]x− x0

= 0⇐⇒

⇐⇒ lımx→x0

f(x)− r(x)

x− x0= 0

De alguna manera esto quiere decir que, cuando x tiende a x0, f(x) se aproxima a r(x) conmayor rapidez.

Para funciones f : R2 → R una funcion sera diferenciable en un punto (x0, y0) si el planotangente en el punto (x0, y0, f(x0, y0)) es una buena aproximacion de la grafica de f . Por analogıacon el caso anterior, se tiene que f es diferenciable si existen las derivadas parciales fx(x0, y0),fy(x0, y0) y ademas:

lım(x,y)→(x0,y0)

f(x, y)− [f(x0, y0) +∇f(x0, y0) · (x− x0, y − y0)]‖(x, y)− (x0, y0)‖

= 0.

Si ocurre esto, se define la diferencial de f en (x0, y0) como el vector gradiente:

Df(x0, y0) = ∇f(x0, y0) =

(∂f

∂x(x0, y0),

∂f

∂y(x0, y0)

).

Se dice que f : R2 → R es diferenciable en P = (x0, y0) ∈ R2 si existen las derivadasparciales en P y el lımite anterior es 0. Una condicion suficiente mas facil de comprobar es lasiguiente:

Proposicion 5.1 Sea A un subconjunto abierto de R2 y sea f : A → R un campo escalar. Siexisten las derivadas parciales en todo punto de A y son continuas entonces f es diferenciableen todos los puntos de A.

5.3. Diferenciabilidad. 35

En general, sea f : Rn → R y P ∈ Rn. Si existen las derivadas parciales y son continuasentonces f es diferenciable en P . Se define la diferencial de f en P como el vector gradiente

Df(P ) = ∇f(P ) =

(∂f

∂x1(P ),

∂f

∂x2(P ), . . . ,

∂f

∂xn(P )

).

Por ejemplo, si f : R3 → R esta definida por f(x, y, z) = xyz − sen(xy) + z entonces elgradiente en (x, y, z) es

∇f(x, y, z) = (yz − y cos(xy), xz − x cos(xy), xy + 1) .

Para el punto P = (π/2, 1, 1),

∇f(π

2, 1, 1

)=(

1,π

2,π

2+ 1).

Por el momento hemos definido el concepto de diferencial para campos escalares. Si queremosextender este concepto a funciones vectoriales f : Rn → Rp, usaremos de nuevo las componentesf1, f2, . . . , fp.

Recordemos que si f : R → Rp entonces la derivada se definıa como el vector formado porlas derivadas de las componentes. Escribiremos esta diferencial como vector columna:

Df(x0) = f ′(x0) =

f ′1(x0)f ′2(x0)

...f ′p(x0)

.

Si f : Rn → Rp y P ∈ Rn entonces diremos que f es diferenciable en P si cada una de lascomponentes de f es diferenciable en P . Se define la diferencial de f en P como la matriz cuyasfilas son los vectores gradiente de cada una de las componentes:

Df(P ) =

∇f1(P )∇f2(P )

...∇fp(P )

=

∂f1∂x1

(P ) ∂f1∂x2

(P ) · · · ∂f1∂xn

(P )

∂f2∂x1

(P ) ∂f2∂x2

(P ) · · · ∂f2∂xn

(P )

......

......

∂fp∂x1

(P )∂fp∂x2

(P ) · · · ∂fp∂xn

(P )

.

Observese que si f : Rn → Rp entonces la diferencial en cada punto es una matriz con pfilas y n columnas. Esta matriz tambien se llama matriz jacobiana o matriz de las derivadasparciales. Cada elemento aij = ∂fi/∂xj(P ) representa la tasa de variacion instantanea de lacomponente fi respecto de la variable xj en el punto P .

Ejemplo: Sea f : R3 → R2 definida por f(x, y, z) = (xyz, sen(xy) + z). Vamos a calcularla diferencial de f en el punto (0, 1, 2). Para ello necesitamos las derivadas parciales de lascomponentes f1(x, y, z) = xyz, f2(x, y, z) = sen(xy) + z.

36 5. Continuidad y calculo diferencial de funciones de varias variables

∂f1∂x

= yz ;∂f1∂y

= xz ;∂f1∂z

= xy ;

∂f2∂x

= y cos(xy) ;∂f2∂y

= x cos(xy) ;∂f2∂z

= 1 .

Entonces:

Df(x, y, z) =

(yz xz xy

y cos(xy) x cos(xy) 1

)=⇒ Df(0, 1, 2) =

(2 0 01 0 1

).

Propiedades.

1. Si f : Rn → Rp es diferenciable en P entonces f es continua en P .

2. Si f : Rn → Rp y g : Rn → Rp son funciones diferenciables en P y λ, µ ∈ R entonces(λf + µg) es diferenciable en P y D(λf + µg)(P ) = λDf(P ) + µDg(P ).

5.4. Regla de la cadena.

Como en el caso de funciones escalares de una variable, una herramienta fundamental delcalculo de la diferencial es la regla de la cadena.

Sean f : Rn → Rp, g : Rp → Rq dos funciones. Si f es diferenciable en P y g es diferenciableen f(P ) entonces (g ◦ f) es diferenciable en P y ademas

D(g ◦ f)(P ) = Dg(f(P ))Df(P ).

Notese que el producto de matrices esta bien definido porque Dg(f(P )) tiene p columnas yDf(P ) tiene p filas.Ejemplo: Sea f : R3 → R2 definida por f(x, y, z) = (xyz, sen(xy) + z). Sea g : R2 → R2 definidapor g(u, v) = (uv2, v eu). Vamos a calcular la diferencial de g ◦f en el punto (0, 1, 2). Por la reglade la cadena, teniendo en cuenta que f(0, 1, 2) = (0, 2), se tiene:

D(g ◦ f)(0, 1, 2) = Dg(0, 2)Df(0, 1, 2).

Ya hemos calculado

Df(0, 1, 2) =

(2 0 01 0 1

).

A continuacion calculamos Dg(0, 2).

Dg(u, v) =

(Du(uv2) Dv(uv

2)Du(v eu) Dv(v e

u)

)=

(v2 2uvv eu eu

)=⇒ Dg(0, 2) =

(4 02 1

)Finalmente,

D(g ◦ f)(0, 1, 2) = Dg(0, 2)Df(0, 1, 2) =

(4 02 1

)(2 0 01 0 1

)=

(8 0 05 0 1

).

5.4. Regla de la cadena. 37

5.4.1. Interpretacion de la diferencial como aplicacion.

La regla de la cadena permite dar una interpretacion de la diferencial como aplicacion. Loveremos en el plano, aunque se extiende de forma natural a mas dimensiones.

Consideremos un campo vectorial f : R2 → R2 y una curva diferenciable c1(t) = (x(t), y(t)).La funcion c2(t) = f(c1(t)) representa otra curva en R2 obtenida como la imagen de c1 por elcampo f . Por la regla de la cadena:

c′2(t) = Df(c1(t)) c′1(t).

Esto quiere decir que la diferencial de f en c1(t) lleva al vector tangente c′1(t) en el vectortangente c′2(t), es decir, si un campo vectorial en R2 lleva puntos de una curva en puntos de suimagen, la diferencial en cada punto (x0, y0) es otro campo vectorial (lineal) en R2 que lleva alvector tangente a c1 en (x0, y0) en el vector tangente a c2 en f(x0, y0).

5.4.2. Regla de la cadena: una variable independiente

Sea f : R3 → R un campo escalar y c : R→ R3 una curva diferenciable en R3. Consideremosla funcion f sobre la curva, es decir, g(t) = f(c(t)). Denotemos c(t) = (x(t), y(t), z(t)).

Entonces, por la regla de la cadena,

g′(t) = ∇f(c(t)) · c′(t) =∂f

∂x(c(t))x′(t) +

∂f

∂y(c(t)) y′(t) +

∂f

∂z(c(t)) z′(t).

La formula g′(t) = ∇f(c(t)) · c′(t) se extiende de forma natural al caso g(t) = f(c(t)), conf : Rn → R y c : R→ Rn.

Ejemplo. Un cilindro circular recto varıa de tal manera que su radio r crece a razon de 3 cm/horay su altura decrece a razon de 5 cm/hora. Calcular la tasa de variacion de su volumen cuandor = 3 cm y h = 4 cm.

El volumen es V (r, h) = πr2h. Sabemos que las tasas de variacion son r′(t) = 3, h′(t) = −5.Entonces:

V ′(t) =∂V

∂rr′(t) +

∂V

∂hh′(t) = 2πrhr′(t) + πr2h′(t) = 6πrh− 5πr2.

Para r = 3 y h = 4, V ′(t) = 72π − 45π = 27π, es decir, el volumen crece a la razon de 27πcm3/hora.

A continuacion veremos dos aplicaciones de la regla de la cadena: la relacion entre el gra-diente y las curvas de nivel y las derivadas direccionales.

Gradiente y curvas de nivel.

Consideremos un campo escalar en el plano f : R2 → R.

Proposicion 5.2 Si f es diferenciable en (x0, y0) entonces el gradiente de f en (x0, y0) esortogonal a la curva de nivel que pasa por (x0, y0).

38 5. Continuidad y calculo diferencial de funciones de varias variables

Demostracion. Sea c(t) = (x(t), y(t)) la curva de nivel que pasa por (x0, y0). Para un ciertot0, c(t0) = (x0, y0) y por tanto el vector tangente a la curva de nivel en (x0, y0) es c′(t0).

Como g(t) = f(c(t)) = K para una constante K, usando la regla de la cadena se tiene:

0 = g′(t) = ∇f(c(t)) · c′(t) .

Para t = t0, c(t0) = (x0, y0) y por tanto:

∇f(x0, y0) · c′(t0) = ∇f(c(t0)) · c′(t0) = 0.

Esto quiere decir que el gradiente de f en (x0, y0) es ortogonal a la curva de nivel. ut

Usando que el gradiente es un vector normal, la ecuacion de la recta tangente a la curva denivel en el punto (x0, y0) se puede expresar en la forma

∇f(x0, y0) · (x− x0, y − y0) = 0.

Este resultado se puede aplicar al calculo de la recta tangente a una curva dada en formaimplıcita.

Ejemplo. Calcular la recta tangente a la circunferencia x2 + y2 = 2 en el punto (1, 1).

La circunferencia es una curva de nivel del campo f(x, y) = x2+y2. En este caso, ∇f(1, 1) =(2, 2) y por tanto la ecuacion es

(2, 2) · (x− 1, y − 1) = 0⇐⇒ y = 2− x.

Gradiente y derivadas direccionales.

Sean f : Rn → R un campo escalar, P ∈ Rn y u ∈ Rn un vector unitario, es decir ‖u‖ = 1.Se considera la recta y(t) = P +tu que pasa por P y tiene la direccion de u. Sea g(t) = f(P +tu)la accion del campo f sobre la recta. Se define la derivada direccional de f en P segun elvector u como g′(0) = ∇f(P ) · u. La derivada direccional mide la tasa de cambio de f en ladireccion de u.

Por ejemplo, la derivada direccional de f(x, y) = x2y + y3 en el punto (2, 1) en la direccionde u = (1, 1) es

D~uf(2, 1) = ∇f(2, 1) · u

‖u‖= (4, 7)

(1/√

2

1/√

2

)=

11√2,

ya que ∇f(x, y) = (2xy, x2 + 3y2).

Direccion de maximo crecimiento. Sea f : Rn → R un campo escalar diferenciable. Si∇f(P ) 6= 0 entonces el maximo valor de la derivada direccional se alcanza para el vector unitarioen la direccion del gradiente

u =∇f(P )

‖∇f(P )‖.

Es decir, el gradiente de f apunta en la direccion de Rn en la que f crece mas rapidamente.

5.4. Regla de la cadena. 39

La demostracion de esta propiedad para n = 2 se basa en la formula del producto escalar.La derivada direccional en la direccion de un vector unitario u es

∇f(P ) · u = ‖∇f(P )‖ ‖u‖ cos(φ) = ‖∇f(P )‖ cos(φ),

donde φ es el angulo entre ∇f(P ) y u. Claramente, la derivada direccional alcanza su maximovalor cuando cos(φ) = 1, es decir, cuando u apunta en la direccion y sentido del gradiente.

Observese que el mismo razonamiento indica que la direccion de crecimiento mınimo esla opuesta del gradiente, es decir, −∇f(P ). Ası, el valor maximo de la derivada direccional es‖∇f(P )‖ y el mınimo es −‖∇f(P )‖.

Para n arbitrario, la propiedad se basa en que para x, y ∈ Rn se cumple siempre que

x · y ≤ ‖x‖ ‖y‖,

y la igualdad solo se cumple cuando x e y tienen la misma direccion y sentido (es decir, y = λx,con λ > 0).

Ejemplo. Hallar la direccion de maximo crecimiento del campo escalar f(x, y) = x2 + y2 en elpunto (1, 1).

∇f(x, y) = (2x, 2y) =⇒ ∇f(1, 1) = (2, 2).

La direccion de maximo crecimiento es la del vector unitario v = (1/√

2, 1/√

2).

En fısica, una de las aplicaciones es que el campo electrico es ortogonal a las curvas equi-potenciales. En el siguiente ejemplo vemos otra aplicacion al flujo de calor.

Ejemplo. Consideremos una placa cuadrada [0, 5] × [0, 5] y supongamos que la temperatura enun punto (x, y) es T (x, y) = x2 + y2/4. Calcular en que sentido ira el flujo de calor C(x, y) en elpunto (2, 4).

Teniendo en cuenta que el calor fluye de puntos de mayor temperatura a puntos de menortemperatura y lo hace en direccion perpendicular a las isotermas, se tiene que

C(x, y) = −k∇T (x, y),

donde k es una constante llamada conductividad termica del medio. En este caso ∇T (x, y) =(2x, y/2) y por tanto

C(2, 4) = −k∇T (2, 4) = −k(4, 2).

Por tanto, el calor fluye en el sentido del vector unitario u =

(−2√

5,−1√

5

).

5.4.3. Regla de la cadena: varias variables independientes

Supongamos que z = f(x, y), donde x e y dependen de u y v, es decir, z = f(x(u, v), y(u, v)).Si f es diferenciable y existen las derivadas parciales de x = x(u, v) e y = y(u, v) respecto

de u y v entonces se pueden calcular las derivadas parciales de z respecto de u y v del siguientemodo:

40 5. Continuidad y calculo diferencial de funciones de varias variables

∂z

∂u=∂f

∂x

∂x

∂u+∂f

∂y

∂y

∂u;

∂z

∂v=∂f

∂x

∂x

∂v+∂f

∂y

∂y

∂v.

Estas formulas se extienden de forma natural al caso de mas variables dependientes y mas varia-bles independientes: si y = f(x1, x2, . . . , xn) y xi = xi(u1, u2, . . . , up) para cada i = 1, 2, . . . , n,entonces, para cada j = 1, 2, . . . , p,

∂y

∂uj=

∂f

∂x1

∂x1∂uj

+∂f

∂x2

∂x2∂uj

+ · · ·+ ∂f

∂xn

∂xn∂uj

.

5.5. Derivacion implıcita.

Ya hemos descrito en la seccion 3.6 del capıtulo 3 como derivar de forma implıcita unaexpresion F (x, y) = 0, donde y = y(x). Este proceso se puede generalizar a funciones de masvariables dependientes e independientes utilizando la forma general de la regla de la cadena.

Consideremos una expresion F (x, y, z) = 0 que define implıcitamente una funcion z =z(x, y), es decir, la variable z se puede despejar en funcion de las variables independientes x ey. Es posible calcular las derivadas parciales de z respecto de x e y sin necesidad de despejar z(lo cual es a veces imposible).

g(x, y) = F (x, y, z(x, y)) = 0 =⇒

∂g

∂x=∂F

∂x+∂F

∂z

∂z

∂x= 0 =⇒ ∂z

∂x= −∂F/∂x

∂F/∂z

∂g

∂y=∂F

∂y+∂F

∂z

∂z

∂y= 0 =⇒ ∂z

∂y= −∂F/∂y

∂F/∂z.

Ejemplo. Sabiendo que xy2 + z2 + sen(xz) = 1:

Calcular las derivadas parciales∂z

∂xy∂z

∂y.

Hallar ∇f(0, 1) sabiendo que z se puede despejar como z = f(x, y), con z > 0.

Se considera la funcion auxiliar F (x, y, z) = xy2 + z2 + sen(xz)− 1.

∂F

∂x= y2 + z cos(xz) ;

∂F

∂y= 2xy ;

∂F

∂z= 2z + x cos(xz) .

Por tanto,∂z

∂x= − y

2 + z cos(xz)

2z + x cos(xz);

∂z

∂y= − 2xy

2z + x cos(xz).

Para x = 0, y = 1, se tiene que z2 = 1 y por tanto (como z > 0), z = 1. Ası,

∇f(0, 1) =

(∂z

∂x(0, 1),

∂z

∂y(0, 1)

)= (−1, 0).

5.6. Derivadas parciales de orden superior. 41

5.6. Derivadas parciales de orden superior.

Sea f : Rn → R un campo escalar. Si las derivadas parciales ∂f∂xi

son funciones derivablesentonces se pueden definir las derivadas parciales segundas (o de segundo orden). Se define laderivada parcial segunda de f respecto de xi y de xj como

∂2f

∂xj∂xi=

∂xj

(∂f

∂xi

).

Ejemplo. Sea f(x, y) = xy + x2y2 + yex entonces

∂f

∂x= y + 2xy2 + yex ;

∂f

∂y= x+ 2x2y + ex .

Por tanto, las derivadas parciales segundas son:

∂2f

∂x2=

∂x

(∂f

∂x

)= 2y2 + yex ;

∂2f

∂y∂x=

∂y

(∂f

∂x

)= 1 + 4xy + ex ;

∂2f

∂y2=

∂y

(∂f

∂y

)= 2x2 ;

∂2f

∂x∂y=

∂x

(∂f

∂y

)= 1 + 4xy + ex .

Un campo f : Rn → R es de clase C1 si existen las derivadas parciales primeras y soncontinuas. Si existen las derivadas parciales segundas y son continuas, se dice que f es de claseC2. De modo analogo se definen las derivadas de orden superior a 2 y las funciones de clase Ckpara k > 2.

Por ejemplo, para la funcion del ejemplo anterior,

∂3f

∂y∂x2=

∂y

(∂2f

∂x2

)=

∂y

(2y2 + yex

)= 4y+ ex ;

∂3f

∂x3=

∂x

(∂2f

∂x2

)=

∂x

(2y2 + yex

)= yex .

Para funciones de clase C2, las derivadas cruzadas no dependen del orden de derivacion:

Teorema 5.1 (Teorema de las derivadas cruzadas) Sea f : Rn → R un campo escalar declase C2. Entonces, para cada par de variables independientes xi, xj , se cumple que

∂2f

∂xj∂xi=

∂2f

∂xi∂xj.

Este teorema se extiende a derivadas de orden superior. Si una funcion es de clase Ck suderivada parcial k−esima con respecto de k variables es independiente del orden de derivacion.

Matriz hessiana.

Sea f : Rn → R un campo escalar de clase C2. Se llama matriz hessiana de f a la matriz

cuadrada Hf(x) de tamano n×n que tiene en el lugar (i, j) la derivada parcial segunda∂2f

∂xi∂xj,

42 5. Continuidad y calculo diferencial de funciones de varias variables

es decir,

Hf(x) =

∂2f∂x21

∂2f∂x1∂x2

· · · ∂2f∂x1∂xn

∂2f∂x2x1

∂2f∂x22

· · · ∂2f∂x2∂xn

......

......

∂2f∂xn∂x1

∂2f∂xn∂x2

· · · ∂2f∂x2n

.

En cada punto P ∈ Rn,

Hf(P ) =

∂2f∂x21

(P ) ∂2f∂x1∂x2

(P ) · · · ∂2f∂x1∂xn

(P )

∂2f∂x2x1

(P ) ∂2f∂x22

(P ) · · · ∂2f∂x2∂xn

(P )

......

......

∂2f∂xn∂x1

(P ) ∂2f∂xn∂x2

(P ) · · · ∂2f∂x2n

(P )

∈Mn×n(R) .

En virtud del teorema de las derivadas cruzadas, Hf(P ) es una matriz simetrica.La forma cuadratica ω : Rn → R definida por ω(x) = xtH0 x, donde H0 = Hf(P ), se llama

diferencial segunda de f en P .Por ejemplo, para la funcion f(x, y) = xy + x2y2 + yex del ejemplo anterior, la matriz

hessiana es

Hf(x, y) =

∂2f∂x2

∂2f∂x∂y

∂2f∂y∂x

∂2f∂y2

=

(2y2 + yex 1 + 4xy + ex

1 + 4xy + ex 2x2

).

La matriz hessiana en el punto (0, 1) es

Hf(0, 1) =

(3 2

2 0

).

La diferencial segunda de f en (0, 1) esta definida por

ω(x, y) = (x, y)

(3 2

2 0

)(x

y

)= 3x2 + 4xy.

Recordemos que una forma cuadratica en Rn es una aplicacion ω : Rn → R definida por

ω(x) = xtAx =

n∑i,j=1

aijxixj ,

donde A = (aij) ∈Mn×n(R) es una matriz simetrica.La clasificacion de formas cuadraticas permite establecer la siguiente clasificacion de matri-

ces simetricas:

5.7. Extremos locales y globales de un campo escalar. 43

Definicion 5.1 Sea A ∈Mn×n(R) una matriz simetrica. Diremos que

1. A es definida positiva si xtAx > 0 , ∀x 6= 0,

2. A es definida negativa si xtAx < 0 , ∀x 6= 0,

3. A es indefinida si existen dos vectores x, y ∈ Rn tales que xtAx > 0 , ytAy < 0.

Si A es simetrica y |A| 6= 0 entonces se puede determinar si A es definida positiva, definidanegativa o indefinida analizando el signo de los menores principales de la matriz.

Teorema 5.2 Supongamos que A es simetrica y |A| 6= 0. Entonces:

(a) Si todos los menores principales de A son positivos entonces A es definida positiva.

(b) Si los menores principales de orden impar son negativos y los de orden par son positivosentonces A es definida negativa.

(c) En cualquier otro caso, A es indefinida.

Utilizaremos este resultado en la siguiente seccion.

5.7. Extremos locales y globales de un campo escalar.

Recordemos que los extremos relativos (locales) de funciones escalares de una variable sedetectan igualando a cero la derivada primera, y en la mayorıa de los casos se determina si esmaximo local o mınimo local utilizando el signo de la derivada segunda. Por ejemplo, f(x) = x2

alcanza un mınimo local en x = 0 porque f ′(0) = 0 y f ′′(0) > 0, lo que quiere decir que la rectatangente a la grafica de f en (0, 0) es horizontal y que f es convexa.

Estos argumentos se pueden generalizar a campos escalares en Rn. En primer lugar, intro-ducimos la definicion de maximo y mınimo local.

Sea f : D ⊂ Rn → R un campo escalar definido en un subconjunto D de Rn. Se dice que falcanza un maximo local (o maximo relativo) en un punto P ∈ D si existe un entorno B0 deP tal que f(x) ≤ f(P ), ∀x ∈ B0.

La definicion de mınimo local se obtiene cambiando el sentido de la desigualdad en ladefinicion anterior. Diremos que P es un punto de extremo local para f si f alcanza en P unmaximo local o un mınimo local.

Observacion: Un entorno del punto P se puede definir como la interseccion de una bola abiertacentrada en P con el dominio de definicion D.

Teorema 5.3 (Condicion necesaria de extremo) Sea f : D ⊂ Rn → R un campo escalarde clase C1 definido en un subconjunto abierto D de Rn. Si f alcanza en P ∈ D un extremolocal entonces ∇f(P ) = (0, 0, . . . , 0).

44 5. Continuidad y calculo diferencial de funciones de varias variables

Notese que si f : R2 → R es un campo escalar en el plano, la condicion anterior es equivalentea decir que el plano tangente a la grafica de f en el punto (P, f(P )) es paralelo al plano horizontalXY . (Esta dado por la ecuacion z = z0, donde z0 = f(P ).)

Por tanto, los extremos locales de f se buscaran entre los puntos que tienen gradiente ceroo aquellos donde f no es diferenciable. Estos puntos se llaman puntos crıticos de f .

Si ∇f(P ) = (0, 0, . . . , 0) pero f no alcanza un extremo en P , entonces se dice que f tieneen P un punto de silla. En estos puntos, la grafica de f crece en algunas direcciones cerca deP y decrece en otras.

Observacion: El teorema solo vale para conjuntos abiertos. Si el dominio de definicion de f noes abierto, el resultado se puede usar para encontrar los puntos crıticos del interior de D. Losposibles extremos locales en la frontera hay que determinarlos de otro modo.

Ejemplo. Calcular los puntos crıticos de la funcion f : R2 → R dada por f(x, y) = 4x3−12xy+y2.

∇f(x, y) = (12x2 − 12y,−12x+ 2y) = (0, 0)⇐⇒{y = x2

6x = y

}Por tanto,

x2 = y = 6x =⇒ x2 − 6x = 0 =⇒ x(x− 6) = 0.

Las unicas raıces reales son x = 0, x = 6. Como y = x2, se obtienen los puntos crıticos (0, 0) y(6, 36).

Al igual que las derivadas segundas de f permiten obtener condiciones suficientes paraasegurar que un punto crıtico es un maximo o un mınimo local para funciones de una variable,la diferencial segunda juega ese papel para campos escalares en Rn. La razon es que si la mejoraproximacion de grado 2 para una funcion f : R → R cerca de un punto x0 es el polinomio deTaylor p2(x) = f(x0) + f ′(x0)(x − x0) + (1/2)f ′′(x0)(x − x0)2, para funciones f : Rn → R lamejor aproximacion de grado 2 viene dada por

f(x) ≈ q(x) = f(P ) +∇f(P ) · (x− P ) +1

2(x− P )t (Hf(P )) (x− P ).

Por tanto, cuando ∇f(P ) = (0, 0, . . . , 0), lo que determina el signo de f(x)−f(P ) para puntos xproximos a P es el signo de la forma cuadratica ω(x) = xtHx, donde H = Hf(P ) ∈Mn×n(R).

Teorema 5.4 (Criterio de la derivada segunda para extremos locales) Sea f un cam-po escalar de clase C2 definido en un subconjunto abierto D de Rn. Supongamos que P ∈ D esun punto crıtico de f , es decir, ∇f(P ) = (0, 0, . . . , 0).

1. Si la matriz H = Hf(P ) es definida positiva entonces f alcanza en P un mınimo local.

2. Si la matriz H = Hf(P ) es definida negativa entonces f alcanza en P un maximo local.

3. Si el determinante de H no es cero y la matriz H = Hf(P ) es indefinida entonces falcanza en P un punto de silla.

5.7. Extremos locales y globales de un campo escalar. 45

Observacion: Los puntos crıticos de f para los que |Hf(P )| 6= 0 se llaman puntos crıticos nodegenerados. Los puntos crıticos degenerados se suelen examinar directamente.

Ejemplo. Calcular los extremos locales del campo escalar f : R2 → R definido por

f(x, y) = 4x3 − 12xy + y2.

Ya hemos visto que los puntos crıticos son (0, 0) y (6, 36). La matriz hessiana es

Hf(x, y) =

∂2f∂x2

∂2f∂x∂y

∂2f∂y∂x

∂2f∂y2

=

(24x −12

−12 2

).

Para (0, 0), los menores principales son

∆1 = 0 ; ∆2 = |Hf(0, 0)| =

∣∣∣∣∣ 0 −12

−12 2

∣∣∣∣∣ = −144 < 0.

Por tanto, Hf(0, 0) es indefinida y f tiene un punto de silla en (0, 0).

Por otra parte, para (6, 36),

∆1 = 144 > 0 ; ∆2 = |Hf(6, 36)| =

∣∣∣∣∣ 144 −12

−12 2

∣∣∣∣∣ = 144 > 0.

Como Hf(6, 36) es definida positiva, f alcanza un mınimo local en (6, 36).

Maximos y mınimos globales.

Sea f : D ⊂ Rn → R un campo escalar definido en un conjunto D de Rn. Sea P ∈ D. Sedice que f alcanza en P su maximo global (o maximo absoluto) en D si f(P ) ≥ f(x), ∀x ∈ D.De modo analogo se define el mınimo global (cambiando de sentido la desigualdad). El siguienteresultado es similar al de existencia de extremos absolutos en intervalos compactos de R.

Teorema 5.5 (Existencia de extremos globales) Sea f : D ⊂ Rn → R un campo escalardefinido en un conjunto D de Rn. Si D es compacto y f es continua entonces f alcanza en Dsu maximo global y su mınimo global.

Para localizar los etremos absolutos de f se siguen estos pasos:

1. Localizar los puntos crıticos de f en el interior de D.

2. Hallar los extremos de f considerada como funcion definida en la frontera de D.

3. Calcular el valor de f en todos los puntos crıticos y seleccionar el mayor y el menor.

Ejemplo. Calcular los extremos globales del campo escalar f(x, y) = x2 +3x+y2 +1 en la region

D ={

(x, y) ∈ R2 / (x+ 1)2 + y2 ≤ 1}.

46 5. Continuidad y calculo diferencial de funciones de varias variables

La region D representa un disco cerrado de centro (−1, 0) y radio 1. Por tanto D es com-pacto.

En primer lugar, calculamos los puntos crıticos de f en el interior de D.

∇f(x, y) = (2x+ 3, 2y) = (0, 0)⇐⇒ x =−3

2, y = 0.

El unico punto crıtico en el interior de D es (−3/2, 0).En la frontera, como y2 = 1− (x+ 1)2, se tiene:

g(x) = f(x, y) = x2 + 3x+ 1 + (1− (x+ 1)2) = x2 + 3x+ 2− x2 − 2x− 1 = x+ 1, x ∈ [−2, 0].

Como g es creciente, el mınimo se alcanza para x = −2 y el maximo para x = 0. Los extremosrelativos de f en la frontera se alcanzan en (−2, 0) y (0, 0).

Finalmente, como

f(−3/2, 0) =−5

4, f(−2, 0) = −1 , f(0, 0) = 1 ,

se deduce que el maximo global se alcanza en (0, 0) y el mınimo global se alcanza en (−3/2, 0).

5.8. Extremos condicionados. Multiplicadores de Lagrange.

En muchas ocasiones hay que maximizar o minimizar una funcion sujeta a ciertas restric-ciones; es lo que se conoce con el nombre de extremos condicionados. Por ejemplo, queremoshallar el maximo valor que toma una funcion f : R2 → R entre todos los puntos (x, y) que tienennorma 1. Una de las tecnicas mas efectivas para abordar este tipo de problemas es el metodo delos multiplicadores de Lagrange. Para motivarlo, consideremos el siguiente ejemplo:

Ejemplo. Calcular el punto de la recta y = 2− x mas proximo a (0, 0).La funcion que hay que minimizar es el cuadrado de la distancia de (x, y) a (0, 0), es decir,

f(x, y) = x2 + y2. Trazamos las circunferencias x2 + y2 = r de centro (0, 0) y radio√r, que son

las curvas de nivel de f . En la figura 5.1 se observa que para valores pequenos de r (r = 1/2,r = 1) las curvas de nivel no intersecan a la recta, lo cual quiere decir que no hay puntos de larecta a esa distancia de (0, 0); para valores grandes (r = 3), hay dos puntos de interseccion, perohay puntos de la recta dentro del disco de radio r, lo que indica que hay puntos de la recta quedistan del origen menos que

√r. El mınimo corresponde a la primera curva de nivel que corta a

la recta, que coincide con la circunferencia centrada en el origen que es tangente a la recta.Para calcular el valor de r, observese que un vector perpendicular a las curvas de nivel es

el gradiente ∇f(x, y) = (2x, 2y). Por otra parte, la recta y = 2 − x es una curva de nivel de lafuncion g(x, y) = x + y, y por tanto ∇g(x, y) = (1, 1) debe ser perpendicular a la recta. Como∇f y ∇g son perpendiculares a la recta en el punto P = (x0, y0) donde se alcanza el mınimo,deben tener la misma direccion; por tanto, debe existir un escalar λ ∈ R tal que

∇f(x0, y0) = λ∇g(x0, y0).

5.8. Extremos condicionados. Multiplicadores de Lagrange. 47

r=2

r=1r=0.5

r=3

y=2-x

Figura 5.1: Grafica de y = 2− x y las curvas de nivel x2 + y2 = r.

De aquı se deduce que 2x0 = 2y0 = λ y por tanto x0 = y0.

Como el punto esta sobre la recta, se cumple que y0 = 2−x0 y, en consecuencia, x0 = y0 = 1.

El punto donde la distancia es mınima es (x0, y0) = (1, 1) y la menor distancia posible es√2 (de ahı que el nivel correspondiente sea r = 2, como se observa en la figura).

Este ejemplo se generaliza a campos escalares en Rn para definir el metodo de los multipli-cadores de Lagrange.

Teorema 5.6 (de los multiplicadores de Lagrange)

Supongamos que f : Rn → R y g : Rn → R son dos funciones de clase C1 y

∇g(x1, x2, . . . , xn) 6= (0, 0, . . . , 0) si g(x1, x2, . . . , xn) = 0.

Si P ∈ Rn es un punto de maximo o mınimo local de f sujeto a la restriccion g(x1, . . . , xn) = 0,entonces existe un λ ∈ R tal que

∇f(P ) = λ∇g(P ).

Ejemplo 5.1 Calcular los valores maximos y mınimos de la funcion f(x, y) = x2 + 2y2 sujetosa la restriccion x2 + y2 = 1.

Definimos g(x, y) = x2 + y2 − 1, de modo que la restriccion se convierte en g(x, y) = 0. Laecuacion de los multiplicadores es:

∇f(x, y) = λ∇g(x, y)⇐⇒ (2x, 4y) = λ(2x, 2y)⇐⇒

{2x = λ 2x

4y = λ 2y

De la primera ecuacion se obtiene que x = 0 o λ = 1. De la segunda se obtiene que y = 0 oλ = 2. Por tanto las unicas posibilidades son [x = 0, λ = 2] e [y = 0, λ = 1].

48 5. Continuidad y calculo diferencial de funciones de varias variables

Para x = 0, como x2+y2 = 1, se obtienen los puntos (0, 1) y (0,−1). Para y = 0 se obtienenlos puntos (1, 0) y (−1, 0).

Para determinar cuales son los valores maximos y mınimos, evaluamos f en esos puntos:

f(0, 1) = f(0,−1) = 2 ; f(1, 0) = f(−1, 0) = 1 .

Por tanto, los maximos relativos se alcanzan en (0, 1) y (0,−1), y los mınimos relativos en (1, 0)y (−1, 0).

Observacion: El metodo de los multiplicadores de Lagrange se puede usar para determinar losextremos globales de una funcion en un conjunto compacto; en primer lugar se calcularıan lospuntos crıticos en el interior igualando el gradiente a cero y luego se usarıa el metodo de losmultiplicadores para determinar los extremos en la frontera.

Calculo de extremos con varias restricciones.

El metodo de los multiplicadores se extiende al calculo de extremos de una funcion sujetaa varias restricciones. El resultado general es el siguiente:

Teorema 5.7 Sean f y g1, g2, . . . , gk funciones de clase C1 definidas en Rn. Si P ∈ Rn es unpunto de maximo o mınimo local de f sujeto a las restricciones

g1(x1, . . . , xn) = 0

g2(x1, . . . , xn) = 0

...

gk(x1, . . . , xn) = 0,

entonces existen λ1, λ2, . . . , λk ∈ R tales que

∇f(P ) = λ1∇g1(P ) + λ2∇g2(P ) + · · ·+ λk∇gk(P ).

Ejemplo 5.2 Calcular las alturas maxima y mınima de la curva interseccion del plano x+y+z =0 con la esfera x2 + y2 + z2 = 1.

Tenemos que encontrar los extremos de la funcion f(x, y, z) = z restringidos a la intersecciondel plano con la esfera, es decir, sujetos a las restricciones

g1(x, y, z) = x+ y + z = 0 ; g2(x, y, z) = x2 + y2 + z2 − 1 = 0 .

Segun el resultado anterior, en los puntos de extremo deben existir λ, µ ∈ R tales que∇f(x, y, z) =λ∇g1(x, y, z) + µ∇g2(x, y, z). Por tanto:

∇f(x, y, z) = λ∇g1(x, y, z) + µ∇g2(x, y, z)⇐⇒ (0, 0, 1) = λ(1, 1, 1) + µ(2x, 2y, 2z)⇐⇒

⇐⇒

λ+ 2µx = 0λ+ 2µy = 0λ+ 2µz = 1

⇐⇒ 2µx = 2µy = 1− 2µz .

5.8. Extremos condicionados. Multiplicadores de Lagrange. 49

Es claro que µ 6= 0 y por tanto x = y. Como x+y+z = 0, se obtiene que z = −x−y = −2y.Sustituyendo en la ecuacion x2 + y2 + z2 = 1, tenemos :

1 = x2 + y2 + z2 = y2 + y2 + (−2y)2 = 6y2 =⇒ y = ± 1√6.

Si y = 1/√

6, entonces x = 1/√

6, z = −2/√

6. Si y = −1/√

6, entonces x = −1/√

6,z = 2/

√6. Por tanto los puntos de extremo son

P1 =

(1√6,

1√6,−2√

6

); P2 =

(−1√

6,−1√

6,

2√6

).

En consecuencia, la altura maxima es z = 2/√

6 y la mınima es z = −2/√

6.

Condicion suficiente para la existencia de extremos condicionados.

Hay que tener en cuenta que el metodo de los multiplicadores de Lagrange detecta puntosde tangencia, que pueden corresponder a mınimos, maximos o puntos de silla. En la situacionque se muestra en la figura 5.2, el punto A corresponderıa a un mınimo de f(x, y) = x2 + y2

restringido a la condicion g(x, y) = 0, pero el punto B serıa un punto de silla.

A

Bg(x,y)=0

Figura 5.2: Dos puntos de tangencia de la curva definida por una funcion g(x, y) = 0 y las curvasde nivel x2 + y2 = r.

Si la funcion objetivo f es continua y el conjunto de puntos que cumplen las restriccioneses compacto, entonces se alcanzan el mınimo y el maximo absolutos, de modo que para saber aque puntos corresponden de entre los que cumplen la ecuacion de multiplicadores, basta evaluarf en cada uno de ellos y escoger los valores extremos.

En otros casos se puede usar el siguiente criterio:

50 5. Continuidad y calculo diferencial de funciones de varias variables

Proposicion 5.3 Sean f, g1, g2, . . . , gk funciones de clase C2 definidas en Rn. Supongamos quepara un punto P ∈ Rn existen λ1, λ2, . . . , λk ∈ R tales que

∇f(P ) = λ1∇g1(P ) + λ2∇g2(P ) + · · ·+ λk∇gk(P ).

Se considera la funcion definida por

F (x) = f(x)− (λ1g1(x) + λ2g2(x) + · · ·+ λkgk(x)).

Denotemos porU = Ker (Dg(P )) = {x ∈ Rn /Dg(P )x = 0} ,

donde g : Rn → Rk es la funcion definida por g(x) = (g1(x), g2(x), . . . , gk(x)). Sea H = HF (P )la matriz hessiana de F en P y ω : U → R la forma cuadratica definida en U por ω(x) = xtHx.

Si ω es definida positiva entonces P es un mınimo local de f restringido a la condiciong(x) = (0, 0, . . . , 0).

Si ω es definida negativa entonces P es un maximo local de f restringido a la condiciong(x) = (0, 0, . . . , 0).

Si ω es indefinida y no degenerada entonces P es un punto de silla.

Ejemplo 5.3 Como ilustracion del metodo, comprobemos que en el ejemplo 5.1 el punto P =(1, 0) es un mınimo de la funcion f(x, y) = x2+2y2 sujeto a la restriccion g(x, y) = x2+y2−1 = 0.

Hemos visto que λ = 1 y por tanto

F (x, y) = f(x, y)− λg(x, y) = f(x, y)− g(x, y) = x2 + 2y2 − (x2 + y2 − 1) = y2 + 1.

La matriz hessiana es

H = HF (P ) =

(0 00 2

).

Como Dg(x, y) = ∇g(x, y) = (2x, 2y), en particular Dg(P ) = Dg(1, 0) = (2, 0). Por tanto,

U = Ker (Dg(P )) =

{(x, y) ∈ R2 / (2, 0)

(xy

)= 0

}={

(x, y) ∈ R2 / 2x = 0}

= {(0, y) / y ∈ R} .

La forma cuadratica ω sobre U esta definida por

ω(0, y) = (0, y)

(0 00 2

)(0y

)= 2y2.

Como ω es definida positiva, el punto P es un mınimo local de f restringido a g(x, y) = 0.

Referencias

Gerald L. Bradley y Karl J. Smith, “Calculo de una y varias variables” (dos volume-nes), Prentice Hall, 1998.

Serge Lang, “Calculo”, Addison-Wesley Iberoamericana, 1990.

Jerrold E. Marsden y Anthony J. Tromba, “Calculo vectorial”, 5a. ed., Pearson,2004.

Jon Rogawski, “Calculo: Varias variables”, Reverte, 2012.

James Stewart, “Calculo. Conceptos y contextos”, 4a. ed., Thompson, 2010.

51