Curso propedéutico de matemáticas

UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CC. POLÍTICAS Y SOCIOLOGIA DEPARTAMENTO DE SOCIOLOGIA I (CAMBIO SOCIAL) Campus de Somosaguas. 28223-Pozu

Story Transcript

Curso propedéutico de matemáticas

Cálculo diferencial e integral Tema: Funciones y relaciones

Facultad de Ingeniería, UNAM

Septiembre de 2014

I. Relaciones Funciones

Objetivo Al finalizar el tema, el alumno será capaz de determinar cuando una relación es una función, podrá operar con ellas, las identificará adecuadamente y sabrá graficar expresiones matemáticas determinando su dominio y contradominio.

ara entender los diversos fenómenos físicos, naturales o artificiales, a los que se enfrentan los interesados en el modelado y comportamiento matemático de tales eventos, es importante tener muy claro el concepto de relación y función, que son las expresiones que modelan o representan de manera matemática a fenómenos reales o imaginados. Para analizar y comprender el comportamiento y la gráfica de una función vamos iniciar definiendo el producto cartesiano, más adelante estudiaremos algunos tipos de funciones en especial.

P

Producto cartesiano Aún y cuando no lo parezca así, como mucha de las matemáticas que hemos aprendido, los productos cartesianos los utilizamos de manera frecuente en nuestra vida diaria, por ejemplo cuando acudimos a un pequeño restaurante que tiene en la carta las siguientes listas: ENTRADA

PLATO FUERTE

POSTRE

Sopa

Cecina con verduras

Gelatina

Consomé

Milanesa con arroz

Flan

Tortas de papa

Al solicitar nuestra orden de alimentos construimos un elemento del producto cartesiano que se puede originar de la combinación adecuada de toda la información antepuesta porque comemos en el orden que indica la tabla anterior. Podemos hacer la siguiente combinación, elegir primero la sopa como entrada, en seguida como plato fuerte pedimos cecina con verduras y, al final, ordenamos flan como postre:

( sopa, cecina con verduras, flan ) ; todas las posibles ordenes, que son los elementos totales del producto cartesiano, se muestran a continuación:

{( sopa, cecina con verduras, gelatina ) , ( sopa, cecina con verduras, flan ) , ( sopa, milanesa con arroz, gelatina ) , ( sopa, milanesa con arroz, flan ) , ( sopa, tortas de papa, gelatina ) , ( sopa, tortas de papa, flan ) , ( consomé, cecina con verduras, gelatina ) , ( consomé, cecina con verduras, flan ) , ( consomé, milanesa con arroz, gelatina ) , ( consomé, milanesa con arroz, flan ) , ( consomé, tortas de papa, gelatina ) , ( consomé, tortas de papa, flan )} Este conjunto es un producto cartesiano porque el orden es relevante, siempre nos van a dar el plato de entrada primero, luego se nos sirve el plato fuerte y al final consumimos el postre. Obvio es que al ordenar sólo pedimos un elemento del producto cartesiano y no todos a la vez, pero podríamos ir muchas veces al mismo restaurante sin repetir el mismo menú. Un producto cartesiano es el conjunto ordenado de parejas, triadas, etc. de elementos de dos o más conjuntos. Matemáticamente diríamos que el producto cartesiano entre los elementos del conjunto A = {ai } y los elementos del conjunto B = {b j } , donde i = 1, 2,3,..., n , y j = 1, 2,3,..., m es

A× B = {( a1 , b1 ) , ( a1 , b2 ) ,..., ( a1 , bm ) , ( a2 , b1 ) , ( a2 , b2 ) ,..., ( a2 , bm ) ,..., ( an , b1 ) ,..., ( an , bm )} Los elementos del producto cartesiano B × A son

B× A = {( b1 , a1 ) , ( b1 , a2 ) ,..., ( b1 , an ) , ( b2 , a1 ) , ( b2 , a2 ) ,..., ( b2 , an ) ,..., ( bm , a1 ) ,..., ( bm , an )} Cuando hablamos de conjuntos el orden de los elementos en tales estructuras no es relevante. Si nos referimos a productos cartesianos, por el contrario, es indispensable considerar el orden en cómo se ubican los valores; tal como ocurre al ubicar un punto en un plano cartesiano donde primero se indica la abscisa y posteriormente, separado por una coma, se establece la ordenada, ( x, y ) . El orden es obligatorio porque la ubicación de un punto en un plano cartesiano no es otra cosa que la ubicación o descripción gráfica de un punto de un producto cartesiano. Por ejemplo, en la figura 1.1 se pueden apreciar puntos distribuidos en el plano cartesiano. Para ubicar la orientación del eje de las abscisas y el eje de las ordenadas se sigue la regla de la mano derecha: La dirección del pulgar de la mano derecha extendida indica la proyección positiva del eje de las abscisas ( X ), a donde apunten los demás dedos al extender la mano se tendrá la proyección positiva del eje de las ordenadas ( Y ); si ubicamos tres dimensiones, la palma de la mano indica la dirección positiva de la tercera coordenada ( Z ). Donde se cruzan los ejes se tiene el origen o el valor cero de dichos ejes (figura 1.2).

Figura 1.1: Puntos distribuidos en el plano cartesiano siguiendo un orden establecido; primero abscisa x , luego ordenada y : ( x, y ) .

Figura 1.2. Espacio cartesiano con los ejes siguiendo la regla de la mano derecha.

Relaciones y funciones Cuando realizamos productos cartesianos dijimos que el orden era importante, primero la abscisa y después la ordenada para indicar un punto en el plano cartesiano, ( x, y ) . Si colocamos en un conjunto todos los valores posibles de asignar a x , la variable independiente, y los llamamos el conjunto X ; y colocamos en otro conjunto Y los valores de la variable dependiente y , entonces la expresión matemática que relaciona a los elementos de ambos conjuntos es conocida como relación matemática (figura 1.3).

Figura 1.3. Relación matemática entre dos conjuntos. Para un elemento del conjunto X hay una relación con uno o más elementos del conjunto Y . En las relaciones, cada valor del conjunto X puede tener relación con uno, dos o más datos del conjunto Y , tal como puede observarse en el valor de −3 del conjunto X que se relaciona solamente con el número −5 del conjunto Y ; y para el elemento 1/ 2 del conjunto X existen dos números en el conjunto Y , 7 / 3 y 6 / 9 . Un hecho especial de las relaciones son las funciones, que son los casos que se tienen cuando a cada elemento del conjunto X le corresponde solamente un número en el conjunto Y (figura 1.4), es decir, es una colección de pares ordenados donde nunca se repiten los valores de la abscisas. Compare las dos figuras 1.3 y 1.4, observe el 1/ 2 del conjunto X ; en la figura 1.3 que no representa una función, este término está relacionado con dos números del conjunto Y , 7 / 3 y 6 / 9 . En la figura 1.4, que sí representa una función, para el valor 1/ 2 sólo tenemos el dato 6 / 9 en el conjunto Y .

Figura 1.4 Función matemática entre dos conjuntos. Como para cada elemento del conjunto X existe sólo un número en el conjunto Y la relación es una función matemática.

Las funciones se representan simbólicamente mediante la expresión y = f ( x)

que se lee “ y es igual a f de x ” o “ y es una función de x ”. A x se le conoce como la variable independiente y a y se le identifica como la variable dependiente. Formalmente, para un conjunto dado X , una función es la expresión matemática f ( x) que relaciona a cada uno de de los valores x , x ∈ X , con un solo elemento y del otro conjunto Y , y ∈ Y . El conjunto X , de la variable independiente, se llama dominio y el conjunto Y , de la variable dependiente, se llama rango, recorrido, imagen o contradominio. El dominio de una función puede definirse de manera explícita o de manera implícita. Cuando es de manera explícita se indica el dominio enseguida de la función; cuando es implícita no se declara el dominio, es necesario deducirlo de la expresión. Por ejemplo, son relaciones de dominio implícito las siguientes: f ( x) = 2 x3 − 3x + 5 Esta función es un polinomio, puesto que las potencias de las variables son enteras positivas, y en consecuencia está definida en todo el campo de los números reales, porque para cualquier valor real asignado a la variable independiente x siempre tenemos un resultado real para f ( x) .

x −2.5

Sustitución 3 f ( −2.5 ) = 2 ( −2.5 ) − 3 ( −2.5 ) + 5

y = f ( x)

−18.75

0

f ( 0) = 2 ( 0) − 3( 0) + 5

5

1/ 3

f (1/ 3) = 2 (1/ 3) − 3 (1/ 3) + 5

4.074074

1000

f (1000 ) = 2 (1000 ) − 3 (1000 ) + 5

1.999997 ×109

3

3

3

En notación matemática de conjuntos tendremos que el dominio es

{ x x ∈ } f (= x)

x+2

Si nada más analizamos funciones reales de variable real, para no tener la raíz cuadrada de un número negativo, necesitamos que el radicando (lo que esta dentro del radical, el símbolo de la raíz cuadrada) sea mayor o igual que cero:

x+2≥0 despejando a la variable nos da

x ≥ −2 Por lo que el dominio no explicitado se compone del conjunto de números mayores o iguales que −2 . Gráficamente será:

o en conjuntos { x x ∈ [ −2, ∞ )} Si evaluamos algunos valores del conjunto indicado veremos que el resultado es un número real

x

y = f ( x)

Sustitución f ( −2 ) = −2 + 2

−2

0 7

0

f ( −2 ) =

0+2

f ( −2 ) =

1.414214

7+2

3

Si consideramos un número no incluido en el dominio veremos que la respuesta de la función no es un número real:

x

Sustitución f ( −3) =

−3

−3 + 2 =

−1

y = f ( x) Sin respuesta

Puedes verificar en tu calculadora que la raíz cuadrada de un número negativo no es un número real, tu calculadora marcará error. f ( x= )

4 − x2

Dado que estamos analizando variables reales necesitamos que el radicando sea mayor o igual que cero 4 − x2 ≥ 0

despejando la variable

4 ≥ x2 , o x2 ≤ 4

de la definición alterna de valor absoluto, a = a 2 , tendremos que

x=

x 2 ≤ 4 = 2 , esto es

x ≤2 de donde deducimos el intervalo (revisar la definición de valor absoluto):

−2 ≤ x ≤ 2 o { x ∈ [ −2, 2]} f ( x) =

2x + 3 x2 − 9

En este cociente el numerador puede tomar cualquier valor dado que es un polinomio. En el denominador se aplica el mismo razonamiento, excepto que como la división entre cero no está definida se necesita que x2 − 9 ≠ 0

De donde deducimos que, despejando x , x2 ≠ 9

Obteniendo la raíz cuadrada

x ≠ ±3 De este resultado y el razonamiento escrito antes encontramos que el dominio son todos los números reales con excepción de −3 y 3 . En notación matemática de conjuntos quedaría

{ x ∈  − {−3,3}} f ( x) =

3 x−2

Aquí necesitamos que el denominador no sea cero y para obtener una raíz cuadrada necesitamos que el denominador sea un número positivo, esto es

x−2>0

Despejando x

x > 2 o { x ∈ ( 2, ∞ )} Las expresiones con dominio explícito tienen anotados junto a ellas la región de validez:

f ( x ) = 2 x 2 − 1, x ≥ 1 = f ( x)

5 , x ∈ [ −4, 0 ) x −1

La siguiente es una función definida en segmentos o pedazos con dominio explícito, dado que es absolutamente necesario indicar qué región es representada por cada una de las expresiones anotadas: 2 x − 6, x ≤ 1 f ( x) =  2  −x , x > 1 Las expresiones que hemos estado analizando son conocidas como funciones explícitas porque desde un principio determinamos quién es la variable independiente y quién es la variable dependiente, y = f ( x) . Si no hacemos lo anterior se dice que la función es implícita; esto es, queda a criterio de cada uno decidir qué variable será la independiente y cuál la dependiente, Ejemplos de este último caso son las siguientes expresiones: y 2 + 2 x2 = 7 2 xy 2 − 3 x + 4 y = sen( xy ) 2 y − 3x = 5 I. Determine el dominio de la expresión dada: f ( x) =

5 x3 − 3x 2 + 7 4

4 − 3x 2 h ( x) = 5 2x − 3 h ( x) = 2 2x − 8

g= ( x) g ( x) =

f ( x) =

2x − 6 2 x −5 2x − 4

x −6 2

g= ( x) h ( x) =

h ( x) =

2 x2 − 8 5x − 3 x2 + 9

x−2 3x − 9

Graficación de funciones y relaciones Para graficar las funciones es valioso tener un conocimiento adecuado del comportamiento típico de las diversas relaciones que veremos más adelante, sin

embargo, es importante que sepamos construir tablas para ubicar puntos en el plano cartesiano. Para graficar la función y =x 3 − 1,

x −2 −1

0 1 2

sustitución

( −2 ) − 1 =−8 − 1 =−9 3 ( −1) − 1 =−1 − 1 =−2 3 ( 0 ) − 1 =0 − 1 =−1 3 (1) − 1 = 1 − 1 = 0 3 ( 2) −1 = 8 −1 = 7 3

y

−9 −2 −1

0 7

[ −2, 2]

construimos la tabla siguiente:

( x, y ) ( −2, −9 ) ( −1, −2 ) ( 0, −1) (1, 0 ) ( 2, 7 )

Cuya gráfica toma forma al distribuir los puntos en el plano cartesiano (figura 1.5) obviamente, para tener una gráfica como la mostrada se requieren más puntos que los tabulados:

Figura 1.5 Colección de puntos que insinúan la forma de la gráfica de la función analizada. Si unimos todos estos puntos vamos a tener la gráfica que buscamos (figura 1.6).

y x3 − 1 . Figura 1.6 Representación gráfica de la función = Para determinar el contradominio (que son los valores de la ordenada recorridos por la gráfica, es decir, los valores que toma y ) de la función podemos utilizar la gráfica. Dado

−9 y f ( 2 ) = 7 y que el dominio definido de forma explícita es de [ −2, 2] y como f ( −2 ) =

como entre −9 y 7 , que son los valores de y , la gráfica es continua entonces el recorrido es [ −9, 7 ] .

Para la expresión 2 x 2 − y 2 = 2 , necesitamos despejar una de las dos variables, hagámoslo con y : = y 2 2 x 2 − 2 , de donde y= ± 2 x2 − 2 El dominio de esta función lo podemos deducir de 2x2 − 2 ≥ 0

Despejando x 2x2 ≥ 2 x2 ≥ 1

(dividiendo entre 2)

De la definición de valor absoluto x ≥ 1= 1 , de donde x ≤ −1 ó x ≥ 1 De aquí se obtienen dos relaciones para las cuales construiremos una tabla

Sustitución en

x

= y

2x − 2 2

Sustitución en

( x, y )

y= − 2x2 − 2

( x, y )

−1

− 2 ( −1) − 2 =0

( −1, 0 )

x

−1

2 ( −1) − 2 =0

( −1, 0 )

−2

2 ( −2 ) − 2 =6

( −2, 6 )

−2

− 2 ( −2 ) − 2 =− 6

( −2, − 6 )

−3

2 ( −3) − 2 =16

( −3, 4 )

−3

− 2 ( −3) − 2 =− 16

( −3, −4 )

−4

2 ( −4 ) − 2 =30

−4

− 2 ( −4 ) − 2 =− 30

2

2

2

2

( −4,

30

)

2

2

2

2

− 2 (1) − 2 =0

( −4, −

30

1

2 (1) − 2 =0

2

2 ( 2 ) − 2 =− 6

( 2, 6 )

2

− 2 ( 2 ) − 2 =− 6

( 2, − 6 )

3

2 ( 3) − 2 =16

( 3, 4 )

3

− 2 ( 3) − 2 =− 16

( 3, −4 )

2

2

(1, 0 )

1

2

2

)

(1, 0 )

Al ubicar los puntos en un plano cartesiano encontramos los puntos de la figura 1.7

Figura 1.7 Puntos distribuidos en el plano cartesiano para la expresión y = ± 2 x2 − 2 Al unir todos los puntos construimos la gráfica de la figura 1.8

Figura 1.8. Gráfica de una elipse obtenida al unir los puntos de la figura 1.7.

Esta hipérbola tiene valores en todo el eje y entonces el recorrido son todos los números reales. Aún cuando la gráfica va sólo de −6 a 6 en el eje y dado que el dominio continúa hacia los infinitos la gráfica continúa hacia arriba y hacia abajo. Una manera elegante de encontrar el recorrido es despejar a la variable independiente ± 1+ x=

y2 2

Analizando el radicando, podemos ver que no hay ningún número que haga que el y2 polinomio 1 + sea negativo, porque todo número elevado al cuadrado da como 2 resultado un número positivo; por tanto, el recorrido son todos los números reales.

 x 2 − 1, x ≤ 1 Construyamos la gráfica de f ( x ) =   x −1 x > 1 En esta expresión tenemos la función definida en dos segmentos, para valores menores o iguales que 1 es una curva y para valores mayores que 1 tendremos una recta. Necesitamos construir una tabla para la sección parabólica y otra tabla para la recta.

y x2 −1 Sustitución en =

x −2

−1

0 1

( −2 ) − 1 =3 2 ( −1) − 1 =0 2 ( 0 ) − 1 =−1 2 (1) − 1 =0

( x, y ) ( −2,3) ( −1, 0 ) ( 0, −1) (1, 0 )

y

2

3 0 −1

0

x

Sustitución en y= x − 1

y

( x, y )

1.001

1.001 − 1 =0.001

0.001

3

3 − 1 =2

2

(1.001, 0.001) ( 3, 2 )

Ubicando estos puntos en el plano cartesiano y uniéndolos para darle forma a la figura nos producirá la gráfica de la figura 1.9.

Figura 1.9 Gráfica de una función definida en segmentos. El dominio de la gráfica de la figura 1.9 nos permite ver que el punto más bajo de la gráfica en el eje y es −1 por lo que el recorrido será el intervalo que inicia en ese punto y se extiende hacia el infinito, [ −1, ∞ ) .

Por la manera elegante veríamos que la sección lineal y= x − 1 nos daría un recorrido y > 0 porque el punto más bajo de la recta de pendiente positiva ocurre cuando x → 1 .

± y + 1 ; de donde necesitamos Para la parte parabólica, al despejar x encontramos x = que y + 1 ≥ 0 o también y ≥ −1 , con lo que el recorrido es [ −1, ∞ ) , para todos estos valores se cumple x ≤ 1 . II. Encuentre el dominio y construya la gráfica de las funciones siguientes, además determine el recorrido:

g ( x= ) 2x + 3

g (= x ) 3x 2 + 8

f ( x= ) x3 + 1

g ( x )= 3 − 4 x 2

f ( x )= 2 − 4 x3

h ( x= )

5 x3 + 7 4

g= ( x)

4 − 2x2 h ( x) = 7 x−4 h ( x) = 2 x −8

g ( x) =

f ( x) =

f ( x) =

2x − 6 2 2 x + 10 x−4

2x − 8 2

g (= x) h ( x) =

h ( x) =

4 +1 3x

x 2 − 25 3x − 2 x2 + 2

x+2 3x + 9

Prueba de la recta vertical para funciones A partir de las gráficas de las expresiones matemáticas podemos determinar quién es una función y quién no lo es. La prueba es conocida como de la recta vertical: al tener la gráfica y trazar sobre ella una recta vertical paralela al eje de las ordenadas y si al desplazarla en todo el dominio corta en un solo punto a la gráfica, entonces la relación es una función; si es cortada en más de un punto es solamente una relación pero no es función, la figura 1.10 muestra una función y la figura 1.11 es una relación.

Figura 1.10 La gráfica corresponde a una relación que es una función por que al desplazar la línea azul por todo el eje x , la curva es cortada solamente en un punto.

Figura 1.11. Gráfica de una relación dado que la línea azul de prueba corta en dos puntos a la gráfica de la expresión matemática en color rojo.

Las funciones elementales y sus gráficas Existen algunas funciones muy conocidas como las de las líneas rectas que sólo necesitan un par de puntos para que queden definidas sus gráficas, las de las parábolas que son funciones donde una de las variables está elevada a una potencia par mientras la variable dependiente tiene potencia unitaria, las funciones cúbicas de potencia impar en su variable independiente, etc.

Las rectas tienen la forma = y ax + b , donde a es la pendiente de la recta y b es el punto donde la gráfica corta al eje de las ordenadas (ordenada al origen es el nombre que se le asigna). Si a es positiva la recta está inclinada a la derecha, si, por el contrario, a es negativa la inclinación es hacia la izquierda (figura 1.12).

Figura 1.12 Gráfica típica de una recta. Dos rectas son paralelas si sus pendientes son iguales, no importa si la ordenada al origen son iguales o diferentes. Si coinciden los valores de la ordenada las rectas quedan encimadas, si difieren en tal valor pasan por puntos diferentes. La forma típica de una función parabólica= y ax m + b donde m es un número par, si a > 0 la curva se abre hacia arriba y si a < 0 la curva se abre hacia abajo; el valor de b es el punto donde la curva corta al eje Y (figura 1.13).

Figura 1.13 Gráfica típica de una parábola.

y ax n + b , donde n es impar. Figura 1.14 Curva de una expresión de la forma= y ax n + b donde n es un número impar La gráfica de una función cúbica de la forma= positivo. El valor de b es el punto donde la gráfica corta al eje Y . (Figura 1.14) 1 es una expresión con una gráfica de dos x−a secciones, una a la izquierda de a y otra a la derecha; así x = a es una asíntota vertical paralela al eje de las ordenadas (figura 1.15).

La función cociente de la forma y =

Figura 1.15 Curva de una expresión de la forma y =

1 . x−a

Otra función típica es la función parte entera que tiene dos formas. La función entero menor se define como f ( x ) =  x  (figura 1.16).

Figura 1.16 Función parte entera menor La función entero mayor se define del modo siguiente (figura 1.17)

f ( x ) =  x 

Figura 1.17 Función parte entera mayor. Los ejemplos de las funciones descritas antes se clasifican de acuerdo con sus características. Las funciones algebraicas son expresiones que contienen términos algebraicos como polinomios u otros. Los polinomios sólo contienen potencias enteras positivas en la variable independiente. Un polinomio de grado n , es el siguiente:

f ( x= ) an x n + an−1 x n−1 + ... + a2 x 2 + a1 x + a0 Algunos ejemplos de expresiones algebraicas son:

f= ( x ) ax1 3 + bx1 2

f ( x) =

x2 − 2x + 1

f ( x) =

x 2x − 4

f ( x) =

2x +1 3x − 2 x + 4 3

La penúltima ecuación es irracional puesto que tiene en el denominador una raíz. La última expresión es también conocida como función racional: f ( x) =

p( x) q( x)

Donde p ( x) y q ( x) son polinomios.

Gráficas de las funciones trigonométricas Existen también las funciones trigonométricas que contienen senos, cosenos o tangentes de ángulos:

f ( x) = sen ( x ) cuya gráfica está en la figura 1.18:

Figura 1.18 Gráfica de la función trigonométrica seno. La función trigonométrica coseno f ( x) = cos x

tiene la gráfica de la figura 1.19.

Figura 1.19 Gráfica de la función trigonométrica coseno La función trigonométrica f ( x) = tan x

Tiene la gráfica de la figura 1.20

Figura 1.20 Gráfica de la función trigonométrica tangente. Las gráficas de las funciones recíprocas de las tres anteriores se dan en las figuras 1.21, para cotangente; 1.22, para secante, y 1.23 para cosecante.

Figura 1.21 Gráfica de la función trigonométrica cotangente f= ( x) cot = x

1 tan x

Figura 1.22 Gráfica de la función trigonométrica secante f= ( x) sec = x

1 cos x

Figura 1.23 Gráfica de la función trigonométrica cosecante f= ( x) csc x =

1 sen x

Las funciones crecientes y decrecientes Las funciones decrecientes disminuyen su valor en la ordenada conforme la abscisa aumenta. Y la función es creciente si el valor de la ordenada crece conforme la abscisa también aumenta. Ver figura 1.24.

Figura 1.24 Función con partes crecientes y decrecientes. Matemáticamente tendremos que una función es creciente en un intervalo abierto ( a, b ) si para cualquier número c , con c ∈ ( a, b ) y donde c < x , se cumple f (c) < f ( x) . La función decrecerá si para cualquier número c , con c ∈ ( a, b ) y donde c < x , se cumple f (c) > f ( x) .

Las funciones pares, impares y periódicas Las gráficas de las funciones pares son simétricas con respecto al eje de las ordenadas Y (figura 1.25). Las funciones impares son simétricas con respecto al origen (ver figura 1.26).

Figura 1.25 La función par es simétrica con respecto al eje de las ordenadas.

Figura 1.26 Función impar. Su gráfica es simétrica con respecto al origen. Matemáticamente una función f ( x ) es par si cumple la siguiente condición: f (− x) = f ( x)

Una función f ( x ) impar cumple la condición:

f (−x) = − f ( x) Si no se cumple ninguna de las dos condiciones anteriores entonces las funciones no son ni pares ni impares.

x ) 2 x 2 − 3 . Para determinar si esta función es par o impar Revisemos la función f (= sustituimos a x por − x en la expresión matemática: f ( − x ) = 2 ( − x ) − 3 = 2x2 − 3 = f ( x ) 2

Dado que f (− x) = f ( x) la función es par.

x ) 4 x3 + 2 x . Para determinar si esta función es par o impar Analicemos la función f (= sustituimos a x por − x en la expresión matemática:

f (−x) = 4(−x) + 2(−x) = −4 x3 − 2 x = − ( 4 x3 + 2 x ) = − f ( x) 3

Dado que f (− x) = − f ( x) la función es impar. Si consideramos la expresión f ( x )= 2 x 3 − 3 x 2 + x − 2 , para evaluar si es par o impar sustituimos x por − x : f ( −x) = 2 ( −x) − 3( −x) + ( −x) − 2 3

2

haciendo las operaciones

f ( − x ) =−2 x3 − 3 x 2 − x − 2 ≠ f ( x ) Si factorizamos el signo negativo f ( − x ) = − ( 2 x3 + 3x 2 + x + 2 ) ≠ − f ( x ) .

Dado que f ( − x ) no es igual que f ( x ) ni que − f ( x ) , entonces la función no es par ni impar. Una función es periódica de periodo T si, para un número entero n , se cumple

f= ( x ) f ( x + nT ) Es más fácil observar en una gráfica cuando una función es periódica. Por ejemplo consideremos la función trigonométrica

f ( x ) = sen ( 2 x ) Cuya gráfica es la figura 1.27. Se puede ver en dicha figura que la forma de la gráfica se repite de manera regular (cada color representa un periodo completo de la gráfica).

Figura 1.27 Gráfica de la función periódica f ( x ) = sen ( 2 x ) Puede verse en el segmento verde que f ( 0 ) = 0 , dicho valor se repite en π  π   2π f   = 0 , donde inicia el segmento rojo; del mismo modo f   = f  2 8  3 puntos más altos de las secciones verde y roja.

π 2

porque

  , que son los 

Normalmente, para indicar una función periódica se anota la función de manera normal y se indica la longitud de su periodo.

f ( x)= x, − 1 < x ≤ 1, f ( x )= f ( x + 2 ) La gráfica de esta función está en la figura 1.28.

Figura 1.28 función periódica de periodo 2. La gráfica original está en negro y los esquemas que se repiten en azul. III. Las gráficas de las funciones que se anotan a continuación las construyó antes. Para cada una de ellas indique las partes crecientes y decrecientes de las mismas. Anote si la función es lineal, cuadrática, cúbica o de cociente, establezca sus razones:

g ( x= ) 2x + 3

g (= x ) 3x 2 + 8

f ( x= ) x3 + 1

g ( x )= 3 − 4 x 2

f ( x )= 2 − 4 x3

h ( x= )

5 x3 + 7 f ( x) = 4

g= ( x)

4 − 2x2 7 x−4 h ( x) = 2 x −8

g ( x) =

h ( x) =

f ( x) =

2x − 6 2 2 x + 10 x−4

2x − 8 2

g (= x) h ( x) =

h ( x) =

4 +1 3x

x 2 − 25 3x − 2 x2 + 2

x+2 3x + 9

IV. Indique si la expresión es par, impar o ni par ni impar:

g ( x= ) 2x + 3 g ( x) =

1 x

g (= x ) 3x 2 + 8

f ( x= ) x3 + 1

f ( x ) = 2 x5 − 3x3 + 2 x

2 x 4 − 3x 2 + 2 h ( x) = 9

Operaciones con funciones Las funciones las podemos sumar o restar, multiplicar y dividir. Lo único que hay que cuidar es el dominio de la función resultante, para determinarlo debemos considerar lo que indica la tabla siguiente Sea D f el dominio de f ( x ) y sea Dg el dominio de g ( x ) , entonces

f ( x ) + g ( x ) tiene como dominio D f ∩ Dg f ( x ) − g ( x ) tiene como dominio D f ∩ Dg f ( x ) * g ( x ) tiene como dominio D f ∩ Dg

f ( x ) / g ( x ) tiene como dominio D f ∩ Dg siempre que g ( x ) ≠ 0

En el caso de la división es necesario que no sea cero el denominador ya que en matemáticas no existe tal definición. Por ejemplo, sean f ( x )= x − 3 y g = ( x)

2 x − 4 . El dominio de cada una de ellas es

D f =  por que f ( x ) es un polinomio, y Dg = 2 x − 4 ≥ 0 , esto es x ≥ 2 o D= g

f ( x ) + g ( x ) = x − 3 + 2 x − 4 tendrá como dominio  ∩ [ 2, ∞ )= f ( x)× g ( x) = ( x − 3)

(

)

2 x − 4 tendrá como dominio  ∩ [ 2, ∞ )=

[ 2, ∞ ) . Así

[ 2, ∞ ) . [ 2, ∞ ) .

f ( x) x −3 tendrá como dominio  ∩ ( 2, ∞ )= ( 2, ∞ ) . No puede incluirse el extremo = g ( x) 2x − 4 2 como parte del dominio porque tendríamos una división entre cero.

Una operación muy especial es la composición, si consideramos las dos funciones anteriores tendríamos que la composición de f con g que se representa f g

se define del modo siguiente

f  g = f ( g ( x )) esto es, se sustituye la variable x de la función f por el valor de la función g ( x ) . El dominio de la composición f  g son los valores del dominio de g ( x ) que hacen que el recorrido de g ( x ) quede contenido en el dominio de f ( x ) .

f  g=

(

)

2x − 4 − 3

El recorrido de g ( x ) es el intervalo [ 0, ∞ ) (haga la gráfica de dicha función y constátelo). Como este recorrido está todo contenido en el dominio de f ( x ) , entonces el dominio de la composición es el dominio de g ( x ) : D= g Si hacemos g  f=

2 ( x − 3) − 4=

[ 2, ∞ ) .

2 x − 10 , entonces el dominio de la composición es

más elaborado de obtener. Primero hay que reconocer que el dominio de f ( x ) son todos los números reales y dado que es una recta inclinada el recorrido también son los números reales, pero este recorrido no cabe en el dominio de g ( x ) que es el intervalo D= [ 2, ∞ ) . g Debemos restringir el dominio de la composición. Vamos a necesitar restringir a que f ( x ) sólo tome valores entre [ 2, ∞ ) :

x −3≥ 2 Despejando a la variable

x≥5 Por tanto el dominio de la composición es [5, ∞ ) . V. Para las parejas indicadas obtener f ( x)

g ( x)

,

g(

)

f ( x)

f ( x) + g ( x) ,

f ( x) g ( x) ,

, f ( x )  g ( x ) y g ( x )  f ( x ) si:

f ( x= ) 5x − 3 f ( x )= 6 − 2 x 2

g ( x )= 3 − 4 x g ( x= )

3 − 5x

x 2− x

g ( x= )

(2 − x)

f ( x= )

2 − 3x 2

g= ( x)

2x − 5

f (= x)

x2 − 7

g ( x= )

6 − 2 x2

f ( x) =

f ( x) − 2g ( x) ,

2

Función inversa Sabemos que las funciones son conjuntos de pares de números ordenados. Por ejemplo, sea

f = {( −1, 2 ) , ( 0,1) , (1, −2 ) , ( 2, −4 ) , ( 3, −5)} Si invertimos el orden de cada uno de los pares tendremos otra función

g ={( 2, −1) , (1, 0 ) , ( −2,1) , ( −4, 2 ) , ( −5,3)}

2 implica que g ( 2 ) = −1 . En ambos casos, en f y en g , cada uno Observe que f ( −1) = de los valores en la primera posición son diferentes, eso implica que ninguna de las abscisas y las ordenadas en la función f se repiten; esto es, es una función biunívoca o de uno a uno. Formalmente, la función es biunívoca si f ( a ) = f ( b ) siempre que

a = b , lo que exige que f ( a ) ≠ f ( b ) cuando a ≠ b . A toda función biunívoca, y solamente si es biunívoca, se le puede obtener su función inversa. Es el caso de la función g ; que es la función inversa de f , que podemos representar por f −1 en lugar de g , la función inversa de f =

{( a , b )} será i

j

{

}

f −1 = ( b j , ai )

. Obtengamos la función inversa de f ( x ) = 2 x 3 − 3, x > 0 , cuya gráficas está en la figura 1.29.

Figura 1.29 Gráfica de la función biunívoca f ( x ) = 2 x3 − 3, x > 0 .

Dado que la función es de uno a uno podemos obtenerle su función inversa rescribiendo; = y 2 x3 − 3

De este modo podemos despejar a la variable independiente x

x=

3

y+3 2

Sustituimos a x por f −1 ( x ) y a y por x para tener la función inversa

= f −1 ( x )

3

x+3 , x > −3 2

Cuya gráfica está dada en la figura 1.30.

Figura

= f −1 ( x )

1.30 3

Gráfica

de

la

función

inversa

de

f ( x ) = 2 x3 − 3, x > 0 ,

x+3 , x > −3 . 2

Si graficamos conjuntamente la función original f ( x ) = 2 x 3 − 3, x > 0 y la función inversa

x+3 , x > −3 , figura 1.31, podemos ver que son simétricas con 2 respecto a la recta y = x , la línea verde en la figura. Nótese que el recorrido de la función original es el dominio de la función inversa y del mismo modo, el dominio de la función es el recorrido de la función inversa. f −1 ( x ) encontrada =

3

Figura 1.31 Gráficas de la función biunívoca f ( x ) = 2 x 3 − 3, x > 0 , de su función

f −1 ( x ) inversa=

3

x+3 , x > −3 y de la recta y = x . 2

Una manera de determinar si una función es inversa de otra es verificando la propiedad: f ( f −1 ( x ) ) = x o f −1 ( f ( x ) ) = x

Así, para el ejemplo aquí revisado tendremos: f(f

3

−1

 x+3  ( x ) ) = 2  3  −3 = 2  

 x+3 2 −3 = x +3−3 = x  2 

VI. Obtenga, si es posible y sino ajuste el dominio de la función hasta hacerla biunívoca, la función inversa de la función dada y grafique en un mismo plano a ambas gráficas.

f ( x= ) 4x +1

f ( x) = 2 − 3x 2 , x ≤ 0 f ( x) =

f ( x= )

2 3− x

2 − 3x 2

g ( x )= 2 − x g ( x= )

3 − 2x

g ( x= )

( 4 + 2x)

g ( x) =

x x−2

2

Funciones de varias variables En muchos fenómenos que ocurren a nuestro alrededor existe más de un factor que lo determina; por ejemplo, en el análisis del desplazamiento de un huracán se toman en cuenta la temperatura de la atmósfera, el porcentaje de humedad, la velocidad de las corrientes de aire, etc. Esto es, construir un modelo matemático requiere relacionar varias variables independientes ( x1 , x2 ,..., xn ) con una variable dependiente w mediante una función de la forma

w = f ( x1 , x2 ,.., xn ) donde n es un número natural. Cuando es una sola variable dependiente y dos variables independientes las que se relacionan mediante una función entonces, podemos graficar superficies. Si hay más de dos variables independientes no se pueden construir esquemas gráficos que representen los comportamientos de los modelos matemáticos establecidos; solamente se pueden interpretar los resultados obtenidos. La ley de gravitación universal de Newton tiene la forma F ( m, d ) = G

Mm d2

La única constante es la de Gravitación que tiene un valor aproximado de 6.67 ×10−11 Nm 2 / kg 2 , todas las demás pueden ser consideradas variables. Si decimos que M representa la masa de la tierra ( M = 6 ×1024 kg ), podemos analizar y construir una gráfica para observar cómo cambia la fuerza con que un cuerpo de masa m es atraído hacia al centro de la tierra cuando cambia la distancia entre el centro gravitacional terrestre y el centro de gravedad del cuerpo (figura 1.32)

Figura 1.32 Variación de la fuerza de atracción que ejerce la tierra sobre un cuerpo de masa m a una distancia d del centro de la tierra. Analizando la figura 1.32 podemos ver que la fuerza de atracción disminuye conforme la masa m decrece, y conforme la distancia d se reduce la fuerza de atracción aumenta. Otro ejemplo muy similar es la ley de Gauss que permite calcular la intensidad de un campo eléctrico, E , a una distancia, r , de una partícula cargada eléctricamente con una carga q . E ( q, r ) =

q 4πε 0 r 2 1

Otra función común que relaciona más dos variables es la que permite determinar el momento de torsión τ en una espira que limita un área A y transporta una corriente I , inmersa en un campo magnético de magnitud B y el ángulo descrito por el campo magnético y la espira es φ :

τ ( I , B, A, φ ) = IBA sen (φ ) . Algunas otras expresiones pueden ser: z =2 x − 3 y 2 + 5 xy

U ( t , x ) = An e knt sen ( Rn x ) , que es una forma simple de la solución de la ecuación de Laplace con An , kn y Rn son constantes.

Bibliografía de consulta recomendada George B. Thomas, Cálculo una variable. Pearson-Addison Wesley, 2005, México. James Stewart, Cálculo duna variable. Thomson Learning, 2001, México. Stefan Waner y S. R. Costenoble, Cálculo aplicado. Thomson Learning, 2002, México.

1

LA DERIVADA Nuestro mundo es cambiante. Las variaciones de una cantidad inciden en que otras cantidades cambien. Si se decide aumentar el precio de un artículo la utilidad de la empresa ya no será la misma, probablemente la demanda disminuya y la cantidad de materia solicitada cambiará. Si se aumenta la temperatura de un gas contenido en un recipiente hermético la presión del gas sobre las paredes del recipiente aumenta. Si aumentamos nuestro consumo diario de azucares probablemente aumente la insulina en sangre. El cálculo diferencial trata del estudio del cambio de una cantidad cuando otra cantidad que está relacionada con la primera varía.

CONCEPTO TASA DE CAMBIO PROMEDIO En una relación lineal entre dos variables: y = mx + b , sabemos que la pendiente m es la razón de cambio entre las variables y y x . La razón de cambio es constante si la relación entre las variables es lineal. El problema empieza a complicarse cuando pensamos en relaciones entre las variables que no son lineales. Normalmente se piensa que una de las variables es función de la otra. Esto es y = f (x) . Normalmente habrá puntos de la gráfica de la función donde suben más que en otros puntos y otros incluso bajan. Una manera de medir la relación entre los cambios de dos variables relacionadas es a través de la tasa o razón de cambio promedio. Definición.- Sea f definida en un intervalo conteniendo los puntos x1 y x 2 . Se define la tasa de cambio promedio de la función y = f (x) desde x = x1 a x = x 2 como

f ( x 2 ) − f ( x1 ) x 2 − x1

Observe que esta tasa de cambio promedio no es otra cosa que la pendiente de la recta que une los puntos ( x1 , f ( x1 )) y ( x 2 , f ( x 2 )) llamada la recta secante a la gráfica de f que pasa por los puntos ( x1 , f ( x1 )) y ( x 2 , f ( x 2 )) .

Si denotamos ∆ y = f ( x 2 ) − f ( x1 ) como el cambio en y y ∆ y f ( x 2 ) − f ( x1 ) = entonces la tasa de cambio puede ser escrita como ∆x x 2 − x1

∆ x = x 2 − x1 el cambio en x,

2 Observaciones: 1) Cuando el cambio en y, ∆ y, es positivo se habla del incremento de y 2) La tasa de cambio promedio es un cociente de cambios ó un cociente de diferencia. 3) La tasa de cambio promedio es conocida también como la razón de cambio promedio. La tasa de cambio puede ser positiva y esto corresponde cuando el cambio en y es positivo al pasar de un punto x1 a un punto x 2 ( x1 < x 2 ) o puede ser negativo y esto corresponde al caso en que y disminuye o decrece.

Ejemplo 1.- El tamaño de una población está modelada por P(t ) = 5000 + 500t − 50t 2 donde t es el número de años después del 2001. Calcule la razón de cambio promedio de a) t = 2 a t = 4 . b) t = 2 a t = 3 y c) t = 2 a t = 2 12 . Solución: a) La razón de cambio promedio de t = 2 a t = 4 viene dada por P( 4) − P (2) 5000 + 500 ⋅ 4 − 50 ⋅ 16 − (5000 + 500 ⋅ 2 − 50 ⋅ 4) 400 = = = 200 hab/año 4− 2 4− 2 2 b) La razón de cambio promedio de t = 2 a t = 3 viene dada por P(3) − P (2) 5000 + 500 ⋅ 3 − 50 ⋅ 9 − (5000 + 500 ⋅ 2 − 50 ⋅ 4) = = 250 hab/año 3− 2 3− 2 c) La razón de cambio promedio de t = 2 a t = 2 12 viene dada por P( 2 12 ) − P ( 2) 2 12 − 2

=

5000 + 500 ⋅ 2,5 − 50 ⋅ ( 2.5) 2 − (5000 + 500 ⋅ 2 − 50 ⋅ 4) 137.5 = = 275 2,5 − 2 0.5

Observe que entre el lapso de tiempo de t = 2 a t = 4 el crecimiento promedio de la población fue de 200 hab/año. Este es un crecimiento promedio porque efectivamente en la primera parte de este periodo el crecimiento promedio de la población fue mayor: de 250 habitantes por año, con lo cual deducimos que en la segunda parte el crecimiento debió de ser menor a 200. En el primer semestre del año t = 2 el crecimiento era de 275 habitantes por año. Así que todo parece indicar que en el lapso de t = 2 a t = 4 , la población aumentaba más rápidamente al comienzo que al final. En este ejemplo estamos hablando en algún sentido de la velocidad. El concepto físico de velocidad está estrechamente ligado con el concepto de tasa de cambio promedio y de derivada.

3

VELOCIDAD PROMEDIO Y VELOCIDAD INSTANTANEA Desarrollaremos estos dos conceptos para entender mejor los conceptos de razón de cambio promedio y razón de cambio instantáneo. Suponga que un objeto parte de un punto siguiendo un movimiento rectilíneo. Sea y = d (t ) la función desplazamiento hasta el momento t, esta función es conocida también como la función posición. El incremento: d (t 2 ) − d (t1 ) es la distancia recorrida por el objeto desde el tiempo t1 hasta el tiempo t 2 y la razón de cambio promedio desde t1 hasta el tiempo t 2 está dada por

Esta es la velocidad promedio en el lapso de tiempo desde t1 hasta el tiempo t 2 . Ejemplo 2.- Suponga que el desplazamiento de un móvil hasta el tiempo t está dado por la ecuación d (t ) = 64 + 4t 2 metros, donde t está medido en segundos. Determinar la velocidad promedio durante los tiempos de a) t = 2 a t = 4 . b) t = 2 a t = 3 y c) t = 2 a t = 2 12 . Solución: a) La velocidad promedio durante el tiempo de t = 2 a t = 4 viene dada por d (4) − d ( 2) 64 + 4 ⋅ 16 − (64 + 4 ⋅ 4) = = 24 m/seg 4− 2 4− 2 b) La velocidad promedio durante el tiempo de t = 2 a t = 3 viene dada por d (3) − d (2) 64 + 4 ⋅ 9 − (64 + 4 ⋅ 4) = = 20 m./seg. 3− 2 3− 2 c) La velocidad promedio durante el tiempo de t = 2 a t = 2 12 viene dada por d (2 12 ) − d (2) 2 12 − 2

=

64 + 4 ⋅ ( 2.5) 2 − (64 + 4 ⋅ 4) = 18 m./seg. 2,5 − 2

De nuevo observamos que en el lapso de tiempo de 2 a 4 la velocidad promedio es de 24m./seg. Sin embargo en la primera parte de este tiempo iba en promedio más despacio: 20m./seg. Esto nos indica que la velocidad no se mantiene constante como efectivamente ocurre cuando vamos en un automóvil. Se quisiera tener una mejor idea de lo que está ocurriendo cerca de 2, por eso nos aproximamos más a 2 tomando la velocidad promedio de t = 2 a t = 2 12 . Deberíamos cada vez aproximarnos más a 2 para tener una mejor idea de lo que está ocurriendo con la velocidad en ese instante. En términos generales estamos interesados en “la velocidad” en el instante c, la que marca el velocímetro en ese instante. Denotaremos como c+h un tiempo próximo a c, entonces h será un valor próximo a 0. La velocidad promedio en el lapso de tiempo entre c y c+h será entonces d (c + h ) − d ( c ) (c + h ) − (c )

=

d (c + h ) − d (c ) h

Esta velocidad está cercana a la velocidad instantánea (o simplemente velocidad) en el tiempo c definida por: d (c + h ) − d ( c ) vt = lim h→ 0 h

4 Este límite si existe es llamado también la derivada de d (x) en el instante c. Ejemplo 3.- Suponga que el desplazamiento de un móvil hasta el tiempo t está dado por la ecuación d (t ) = 64 + 4t 2 metros, donde t está medido en minutos. Determinar la velocidad en el tiempo t=2. Solución: vt = lim h→ 0

d (2 + h) − d ( 2) h

Evaluamos la función d en 2+h y en 2.

(64 + 4( 2 + h) 2 ) − (64 + 4 ⋅ 2 2 ) h→ 0 h

Se desarrolla el producto notable

(64 + 4( 4 + 4h + h 2 ) − (64 + 16) h→ 0 h

Se distribuye el 4 y el signo menos. Luego se simplifica

= lim = lim

16h + 4h 2 h→ 0 h

= lim

= lim h→ 0

h(16 + 4h) = 16 metros/min. h

Se factoriza, sacando h de factor común Se simplificó y luego se evalúo en h=0

De nuevo reiteramos que la velocidad instantánea en el momento c es el límite de la velocidad promedio en un intervalo que va a c

CONCEPTO DE DERIVADA Derivada de una función.- La derivada de una función f (x) con respecto a x en el punto c se define como: f (c + h ) − f (c ) f ′ (c) = lim h→ 0 h siempre y cuando el límite exista. Observaciones: 1) Como c + h representa un punto cercano a c, entonces podemos escribir alternativa la derivada f ( x ) − f (c ) como f ′ (c) = lim x→ c x− c Esta última escritura de la derivada nos permite interpretarla como la razón de cambio instantánea en el punto c, obtenida a través del límite de la razón de cambio promedio para intervalos que llegan a c. 2) A efectos de cálculo es preferible trabajar con la forma f ′ (c) = lim h→ 0

f (c + h ) − f (c ) h

Si la función tiene derivada en cada punto x de un intervalo contenido en el dominio entonces la función se dice diferenciable o derivable en el intervalo y f ′ (x) denota la función derivada. Algunos libros prefieren usar la notación ∆ x en vez de h, quedando escrita la función derivada como: f ( x + ∆ x) − f ( x) f ′ ( x) = lim ∆ x→ 0 ∆x

5

Observación.- Siempre que planteamos este límite para funciones continuas nos da una indeterminación 0 0 , así que se harán manipulaciones algebraicas según las recomendaciones para cada caso. 2 x+ 1 Solución: Se plantea la definición de derivada para x variable f ( x + h) − f ( x) f ′ ( x) = lim Se evalúa la función en f ( x + h) y se sustituye f (x) h→ 0 h Ejemplo 4.- Calcule la derivada de

f ( x) =

2 2 − ( x + h) + 1 x + 1 = lim h→ 0 h 2( x + 1) − 2( x + h + 1) ( x + h + 1)( x + 1) = lim h→ 0 h

Se realiza la suma algebraíca de fracciones

Se aplica la propiedad distributiva y se simplifica

− 2h ( x + h + 1)( x + 1) = lim h→ 0 h = lim − h→ 0

2h 2 = − h( x + h + 1)( x + 1) ( x + 1) 2

Observe que cuando se simplifica el factor h del numerador con el denominador la indeterminación desaparece.

Ejercicio de desarrollo: Encuentre la derivada de f ( x) =

x en x=1 1 + 2x

LA DERIVADA COMO RAZON DE CAMBIO f ( c + h ) − f (c ) es la razón de cambio promedio en el intervalo entre c y c+h. h f (c + h ) − f ( c ) El límite: lim es entonces la razón de cambio instantáneo o simplemente la razón de h→ 0 h El cociente

cambio de f con respecto a x cuando x=c. Así pues la derivada se interpreta también como la razón de cambio instantánea. En ocasiones nos referimos a la tasa de cambio como la razón de cambio. Ejemplo 5.- El tamaño de una población está modelada por P(t ) = 5000 + 500t − 50t 2 donde t es el número de años después del 2001. Calcule la tasa de crecimiento instantáneo en t=2. Solución: P( 2 + h) − P (2) h→ 0 h

tasat = 2 = P ′ ( 2) = lim

6      P (2+ h)          P( 2)    2 5000 + 500( 2 + h) − 50( 2 + h) − (5000 + 500 ⋅ 2 − 50 ⋅ 4) = lim h→ 0 h

Desarrollamos y simplificamos

500h − 50(4 + 4h + h 2 ) + 50 ⋅ 4 h→ 0 h

= lim

h(300 − 50h) 300h − 50h 2 = = lim h → ∞ h→ 0 h h

= lim

Se factoriza sacando h de factor común.

= lim(300 − 50h) = 300 habitantes/año h→ 0 Este es un ejemplo de interés para un geógrafo. En diversas partes de las ciencias sociales, naturales y económicas se emplea el concepto de derivada a través de distintas terminologías: tasas de cambio o rapidez. Un meteorólogo puede estar interesado en la rapidez de cambio de la presión atmosférica con respecto a la altura. Un geólogo le puede interesar la rapidez con que cambia la temperatura en cierta roca fundida. En economía se habla de ingreso, costo y utilidad marginal para referirse a la tasa de cambio de estas magnitudes.

NOTACIONES La derivada de y = f (x) con respecto a x se la denota también por

d df d ( y) , ( f ) , y′ . , dx dx dx

dy es un solo símbolo que ayuda a recordar que es el límite de cociente de diferencias o una dx razón de cambio de y con respecto a x. df es conocida como la notación de Leizbniz. dx Para indicar la derivada en un punto particular, por ejemplo c, se usan las siguientes notaciones: df dy f ′ (c) ; ; dx x = c dx x = c Si por ejemplo f ( x) = x 2 − 2 x , es decir conocemos una fórmula para f entonces las siguientes notaciones se usan: d 2 ( x − 2 x) ; ( x 2 − 2 x) ′ dx Ejercicio de desarrollo Para la función y = x − x 2 Calcule: a) La razón de cambio promedio de x=2 a x=2.05; b) La razón de cambio instantánea en x=2

OTRA INTERPRETACION DE LA DERIVADA: DE LA RECTA SECANTE A LA RECTA TANGENTE. Recordemos que la tasa de cambio promedio de t=c a t=c+h es la pendiente de la recta secante a la curva en los puntos (c, f (c)) y (c + h, f (c + h)) . Si c+h está muy cerca de c, (esto ocurre cuando h está muy cerca de 0), la recta secante pasa casi rasante a la gráfica de la función en el punto (c, f (c)) . Si h → 0 intuitivamente la recta limite es la recta tangente a la curva en el punto (c, f (c)) y la pendiente de esta recta es

7

mtag = lim msec (c, c + h) h→ 0

= lim h→ 0

f (c + h ) − f (c ) = f ′ (c ) h

En conclusión: La derivada en un punto x=c es la pendiente de la recta tangente a la gráfica de f en el punto (c, f (c)) . Ejemplo 6.- a) Calcule la derivada de la función f ( x) = 2 x + 1 + 3 . b) Use este resultado para calcular la pendiente de la recta tangente a la curva cuando x=1 Solución: a) Calculamos primero la función derivada usando la definición: f ′ ( x) = lim h→ 0

= lim

f ( x + h) − f ( x) h

Al sustituir una expresión por otra considere encerrarla entre paréntesis. Observe como se colocará entre paréntesis las expresiones x+h (no hace falta) y 2 x + 1 + 3 , pues ellas sustituyen a x y f(x) respectivamente.

2 ( x + h) + 1 + 3 − ( 2 x + 1 + 3) h

h→ 0

Cuando hay indeterminación en un límite de esta naturaleza se tiene que considerar usar el truco de la conjugada, pero tiene que existir dos términos. Primero simplificamos el numerador.

2 ( x + h) + 1 + 3 − 2 x + 1 − 3 = lim h→ 0 h 2 ( x + h) + 1 − 2 x + 1

= lim

h

h→ 0

⋅ 1.

Ahora podemos usar la conjugada

2 ( x + h) + 1 − 2 x + 1 2 ( x + h) + 1 + 2 x + 1 ⋅ h→ 0 h 2 ( x + h) + 1 + 2 x + 1

= lim

= lim

(2 ( x + h) + 1) 2 − ( 2 x + 1) 2 h( 2 ( x + h) + 1 + 2 x + 1)

h→ 0

= lim h→ 0

= lim h→ 0

=

= lim h→ 0

4( x + h + 1) − 4( x + 1) 2h( x + h + 1 +

x + 1)

4h 2h ( x + h + 1 +

x + 1)

2 ( x+ h+ 1+

x + 1)

Se evalúa el límite

1 x+ 1

b) La pendiente de la recta tangente a la gráfica de la función en el punto x=1 es: f ′ (1) =

Ejercicio de desarrollo.- Calcule la pendiente de la recta tangente a la gráfica de f ( x) =

1 1+ 1

=

2 . 2

x en x=1. 2x + 1

8

FUNCIONES NO DERIVABLES Existen funciones que no son derivables en algún punto x0 . En esta sección pretendemos mostrar algunas situaciones en que la derivada puede no existir. 1) Si la gráfica de la función tiene un punto anguloso entonces la función no es derivable en ese punto. La función f ( x) = x no es derivable en 0. Observe que la pendiente de la recta tangente por la derecha es ella misma y vale 1 y por la izquierda la pendiente de la recta tangente vale -1. Para establecerlo de una manera más formal nos valemos de la definición analítica del valor absoluto.  x si x ≥ 0 x=   − x si x < 0 Calculamos entonces los límites laterales: h− 0 f (0 + h) − f (0) h lim+ = lim+ = lim+ = 1 h→ 0 h→ 0 h→ 0 h h h lim−

h→ 0

h− 0 f (0 + h) − f (0) − h = lim− = lim− = −1 h→ 0 h→ 0 h h h

Como lim+ h→ 0

f (0 + h) − f (0) f (0 + h) − f (0) f (0 + h) − f (0) ≠ lim− entonces lim no existe. h→ 0 h→ 0 h h h

Observe que esta función es continua en 0. Así que continuidad no implica que la función sea derivable.

.

2) Sin embargo, si una función no es continua en un punto c entonces no es derivable en ese punto.  x 2 + 1, si x < 1 f ( x ) = Por ejemplo para la función tenemos que   x + 2 si x ≥ 1

f (1 + h) − f (1) =1 h→ 0 h f (1 + h) − f (1) (1 + h) 2 + 1 − (1 + 2) lim− = lim− = +∞ . h→ 0 h→ 0 h h Como los límites laterales son distintos entonces el límite no existe y por tanto no existe la derivada Observe que no tiene recta tangente en ese punto. lim+

3) La recta tangente en el punto es vertical La función f ( x ) = 3 x no tiene derivada en 0. f (0 + h) − f (0) h1 / 3 − 0 = lim h→ 0 h→ 0 h h 1 = lim 2 / 3 = ∞ . h→ 0 h

f ′ ( x) = lim

Como el límite no existe entonces no es derivable. Este caso lo podemos expresar diciendo que la recta tangente a la curva en 0 es vertical.

9 EJERCICIOS 1) Para la función y = 2t 2 − 1 calcule a) La razón de cambio promedio de t=0 a t=2 b) Para estos valores de t ¿cuál es el incremento de y? c) La razón de cambio instantánea en t=1 2) Para la función y = 1 + 2t calcule a) La razón de cambio promedio de t=1 a t=1.1. b) Para estos valores de t ¿cuál es el incremento de y? c) La razón de cambio instantánea en t=1 3) El tamaño de una población está modelada por P(t ) = 70000 + 80t 2 donde t es el número de años después del 2001. a) ¿Cuál es el incremento de la población desde el tiempo t=3 a t=3.1? b) Calcule la tasa de cambio promedio desde t=3 a t=3.1 c) Calcule la tasa de crecimiento instantáneo en t=3. 4) Emplee la definición de la derivada para encontrar

dF dx

4.1) f ′ ( 2) si f ( x ) = 4 − x ;

4.2)

2 dy si y = 2 − 1 ; dx x

d x (2 − ) ; dx 4

4.7)

4.5)

x= 0

4.6)

dC si C ( q) = q 2 + 3q − 3 ;4.8) f ′ (x) si f ( x) = dq

4.10) f ′ (x) si f ( x) = e ;

4.3) g ′ (3) si g (t ) = t 2 − t ; 4.4)

si F ( x) = x 2 − 2 x ;

d 2 ( x − 2 x − 1) dx

4.9) g ′ (x) si g ( x) =

x+ 3 − 2;

4.11) g ′ (x) si g ( x) = 2 1 − x ;

4.12)

2 ; 4− x

d 2 (1 − ) dx 4− x

Respuestas: 1) a) 4 ; b) 8 ;c) 4; 2) a) 0.568; b) 0.0568; c) 0.5773; 3) a)48.80; b) 488; c)480; 4.1) 1; 4.2) -2; 4.3) 5; 4.4) −

=

dC 1 4 d x 1 = 2q + 3 ; 4.8) ( 2 − ) = − 2 x − 2 ; 4.5) ; 4.6) ; 4.7) 4.9) dq 2 x+ 3 dx 4 4 x3

2 ; 4.10) 0; 4.11) (4 − x) 2

−

1 1− x

2

; 4.12) − (4 − x)2

5) Encuentre la pendiente de la curva y = 2 − 3x 2 en el punto (1,-1). Use la definición de derivada. Respuesta: m=-6 6) Encuentre la pendiente de la curva f ( x) = 3 − x en el punto (2,1). Use la definición de derivada. Respuesta: m=-1/2 7) Calcule la derivada de la función f ( x) =

1 . Use este resultado para calcular la pendiente de la 2x + 1

recta tangente a la curva cuando x=1.Respuesta: f ′ ( x) = −

2

( 2 x + 1) 2

; m=-2/9

8) Calcule las derivadas de las funciones f ( x) = x 2 y f ( x ) = x 2 + 3 . Grafique ambas funciones y de una argumentación geométrica porque ambas funciones tienen la misma derivada. 9) Un móvil se desplaza a lo largo del eje x, la función f dada por f (t ) = 16 − t 2 metros da la localización del objeto en el instante t, donde t está medido en minutos. Determinar la velocidad en el tiempo t=3. Interprete el resultado. Respuesta: -6 metros/min.

10

REGLAS DE DERIVACION El cálculo de las derivadas por definición, como se ha hecho hasta ahora, es un proceso tedioso y repetitivo. En esta sección se darán reglas básicas que permitirán encontrar las derivadas de una manera más rápida.

1) REGLA DE LA CONSTANTE: Si f entonces

es una función constante, esto es f ( x) = c ,

f ′ ( x) = 0

(La derivada de una constante es 0) Este resultado es claro desde un punto de vista geométrico, la gráfica de la función constante es una recta horizontal, la pendiente es 0. Ejemplo 1.d (5) = 0 a) dx b) Si f ( x) = ln 3 , entonces f ′ ( x ) = 0 c) Sea g ( x) = 2 para calcular g ′ ( 4) primero observamos que g ′ ( x) = 0 y al evaluar g ′ en 4 obtenemos que g ′ (4) = 0 . Podemos verificar, usando la definición de derivada, que - Si f ( x) = x 2 entonces f ′ ( x) = 2 x . 1 1 = x − 1/ 2 . - Si f ( x) = x = x1 / 2 entonces f ′ ( x) = 2 x 2 1 1 −2 -Si f ( x) = = x − 1 entonces f ′ ( x) = − 2 = − 1 ⋅ x . x x Como el lector observará existe una tendencia la cuál está descrita en la siguiente regla clave para la derivación

2) REGLA DE LA POTENCIA: Si f ( x) = x r , donde r es un número real distinto de 0, entonces

f ′ ( x) = rx r − 1 Veamos el siguiente ejemplo que ilustra las aplicaciones de la regla de la potencia en las diversas notaciones. Ejemplo 2.d 3 ( x ) = 3x 2 a) dx b) Si f ( x) = x 10 , entonces f ′ ( x) = 10 x 9 c) Si g ( x) = x , entonces g ′ ( x) = 1 ⋅ x 0 . Así g ′ ( x) = 1 Efectivamente la función g ( x) = x es una recta cuya pendiente es 1 3

d) ( x 3 / 2 ) ′ =

1

3 2− 1 3 2 x = x 2 2

En muchas ocasiones es conveniente reescribir algunas funciones para derivar más fácilmente.

Reescritura

11

a) Funciones con radicales. Las funciones con radicales se reescriben con exponente fraccionario Ejemplo a de reescritura: Si f ( x) = 3 x 5 , entonces se reescribe como f ( x) = x 5 / 3 . A esta última 5

3 2 −1 forma de escribir f se le aplica la regla de la potencia f ′ ( x) = 5 x 3 = 5 x 2 / 3 = 5 x . 3 3 3

3) REGLA DEL FACTOR CONSTANTE: Si f constante entonces cf es derivable y

es una función derivable en x y c una

(cf ( x))′ = cf ′ ( x ) .

En notación de Leibniz

d d (cf ( x)) = c ( f ( x )) dx dx El factor constante sale fuera de la derivación. Ejemplo 3.- Encuentre la derivada de f ( x) = 5 ⋅ 3 x 2 Solución: Reescribimos f ( x) = 5 ⋅ x 2 / 3 . Entonces

Reescritura

Reescritura

f ′ ( x) = (5 x 2 / 3 ) ′ = 5( x 2 / 3 )′ 2 − 1/ 3 10 = =5⋅ x 3 3⋅ 3 x rg ( x) r = g ( x) , r y k constantes. k k 2 2 x h( x) = x 1 / 2 , la cuál se deriva usando Ejemplo b: Si h( x) = , entonces se reescribe como 3 3 primero la regla del factor constante y luego la regla de la potencia d 2 1/ 2 2 d 1/ 2 ( x )= (x ) Así dx 3 3 dx 1 d 2 1 −1 1 (h( x)) = ⋅ x 2 = dx 3 2 3 x r r 1 r = = ( g ( x)) − 1 , donde r y k c) Funciones fraccionaria con numerador constante: kg ( x) k g ( x) k son constantes 2 2 Ejemplo c: Si h( x) = , entonces se reescribe como h( x) = x − 9 , la cuál es la que se deriva usando 9 3 3x primero la regla del factor constante y luego la regla de la potencia 2 2 h ′ ( x) = ( x − 9 ) ′ = ( x − 9 ) ′ 3 3 2 6 h ′ ( x) = ( − 9) x − 10 = − 6 ⋅ x − 10 = − 10 . 3 x b) Funciones fraccionarias con denominador constante. :

Ejercicio de desarrollo: Encuentre la derivada de f ( x) =

2x , reescribiendo la función previamente. 2

(Recomendación: use la propiedad de la raíz de un producto, reescriba, aplique entonces la propiedad del factor constante y luego la regla de la potencia.)

12

4) REGLAS DE LA SUMA Y DE LA RESTA: Sean f entonces f + g y f − g también lo son y

y g funciones derivables en x,

( f + g )′ ( x) = f ′ ( x) + g ′ ( x) (( f − g )′ ( x ) = f ′ ( x ) − g ′ ( x) .

La derivada de una suma es la suma de las derivadas. La derivada de una diferencia es la diferencia de las derivadas. Demostración: Para demostrar esta propiedad de las derivadas planteamos la derivada de la función ( f + g )( x) por definición, manipulamos usando propiedades de límite y algebraicas para llegar que es la suma de las derivadas: ( f + g ) ( x + h) − ( f + g ) ( x) ) = lim f ( x + h) + g ( x + h) − ( f ( x) + g ( x)) ( f + g ) ′ ( x) = lim h→ 0 h→ 0 h h = lim

f ( x + h) + g ( x + h) − f ( x ) − g ( x ) h

= lim

f ( x + h) − f ( x) + g ( x + h) − g ( x ) h

h→ 0

h→ 0

Se distribuyó el signo

Se reordenó la suma

 f ( x + h) − f ( x) g ( x + h) − g ( x )  = lim +  h → 0 h h  = lim h→ 0

f ( x + h) − f ( x) g ( x + h) − g ( x) + lim h → 0 h h

= f ′ ( x) + g ′ ( x)

Se descompuso como suma de fracciones con igual denominador

Se uso la propiedad del límite de una suma Se aplicó la definición de la derivada de f y g.

Esta regla puede ampliarse a la suma o diferencia de un número finito de funciones. En notación de Leizbniz podemos escribir que:

d d ( f 1 ( x) ) ± d ( f 2 ( x ) ) ± ⋯ ± d ( f n ( x) ) (( f1 ± f 2 ± ⋯ ± f n )( x)) = dx dx dx dx Ejemplo 4.- Encuentre las derivadas de las siguientes funciones 4 4z 2 a) h( z ) = z + ; b) g ( x) = 4 − 3 + 3 x x 3 4 Solución: a) Reescribimos h( z ) = z 1 / 2 + z 2 . Esta última reescritura se deriva aplicando primero la 3 propiedad de la suma. Así

′ 4 2 4  1/ 2 h ′ ( z ) =  z + z  = ( z 1 / 2 )′ + ( z 2 )′ . 3  3  = =

1 − 1/ 2 4 2 z + ( z )′ 2 3 1 2 z

+

8 z 3

Al primer término aplicamos la regla de la potencia y al segundo la regla del factor constante.

Aplicamos al segundo término la regla de la potencia

13

b) Reescribimos primero antes de derivar g ( x) = 4 x − 4 − suma y diferencia.

(

g ′ ( x) = 4 x − 4 −

3 + 3x

3 + 3 x . Ahora aplicamos la propiedad de la

Al primer y tercer término se aplica la regla del factor constante y al segundo la regla de la constante. No se suelen reescribir las constantes.

)′

= (4 x − 4 )′ − ( 3 )′ + (3 x) ′ La última igualdad se obtuvo al aplicar la regla de la potencia a los términos en derivación

= 4( x − 4 )′ − 0 + 3( x)′ = − 16 x − 5 + 3

Reescritura

Reescribir para derivar: d)

Un

cociente

donde

el

denominador

consta

de

un

solo

término

en

xr .

a r −k a r −k a1 x r1 + ⋯ + an x rn a1 x r1 an x rn = + ⋯+ = 1 x 1 + ⋯ + n x n , ri , k constantes k k k c c cx cx cx 3x 5 − 2 x 2 − x 3x 5 2 x 2 x , entonces se reescribe como una suma : , g ( x ) = − − 2 2 2 3x 3x 3x 3x 2 la cuál se sigue simplificando para que quede expresado de tal manera que posteriormente se use las reglas del factor constante y el de la potencia. De esta forma obtenemos que g puede ser expresado como: 2 1 g ( x) = x 3 − − x − 1 3 3 Ahora podemos derivar con facilidad usando primero la regla de la suma ′ 2 1   g ′ ( x) =  x 3 − − x − 1  . 3 3   2 1 = ( x 3 ) ′ − ( )′ − ( x − 1 ) ′ 3 3 1 = 3x 2 − (− 1) x − 2 3

Reescritura

Ejemplo d: Si g ( x) =

e) Un Producto se transforma en una suma al usar la propiedad distributiva. Ejemplo e: g ( x) = x (3x − 4 x − 1) . Esta función posteriormente puede interpretarse como un producto, pero conviene para derivar reescribir usando la propiedad distributiva, transformándose entonces en una suma. g ( x) = x 1 / 2 (3x − 4 x − 1) = 3x ⋅ x 1 / 2 − 4 x − x 1 / 2 g ( x) = 3 x 3 / 2 − 4 x − x1 / 2 . Esta última forma de reescribir g es la que derivamos, aplicando la propiedad de la suma primero, luego del factor constante y de la potencia después. De esta manera g ′ ( x ) = (3 x 3 / 2 − 4 x − x 1 / 2 ) ′ = (3x 3 / 2 ) ′ − ( 4 x) ′ − ( x1 / 2 ) ′

14 = 3( x 3 / 2 ) ′ − 4( x) ′ − =

1 − 1/ 2 x . 2

Derivamos los términos que se indican

9 1/ 2 1 x − 4− 2 2 x1 / 2

Podemos dejar de esta forma la derivada pero también podemos sacar

1 de factor común para 2 x1 / 2

expresar la derivada como − 1/ 2 g ′ (x) = x (9 x − 8 x1 / 2 − 1) 2 Ejercicio de desarrollo: Encuentre las derivadas de las siguientes funciones, reescribiendolas previamente. x 2 − 2x + 1 a) f ( x) = x 3 ( x − 3x) b) g ( x) = 3 x Ejemplo 5.- Encuentre la pendiente de la recta tangente a la gráfica de f ( x ) = 2 x 2 + 1 en a) x = − 1 , b) x = 0 y c) x = 1 . Grafique la curva y = 2 x 2 + 1 y las rectas tangentes en x = − 1 , x = 0 y x = 1 . Solución.- Para calcular la pendiente de la recta tangente se debe primero encontrar la derivada f ′ ( x) = 4 x

a) En x = − 1 , la pendiente es f ′ (− 1) = 4(− 1) = − 4 b) En x = 0 , la pendiente es f ′ (0) = 4(0) = 0 c) En x = 1 , la pendiente es f ′ (1) = 4(1) = 4

Una manera de obtener la ecuación de una recta es usar la ecuación punto-pendiente: ( y − y 0 ) = m( x − x 0 ) . Para ello necesitamos un punto ( x 0 , y 0 ) por el cual pasa la recta y la pendiente m de la misma. Si se necesita determinar la ecuación de la recta tangente a la gráfica de una función f (x) cuando x = x 0 entonces el punto es ( x 0 , y 0 ) = ( x 0 , f ( x 0 ) ) . Es claro que la pendiente es m = f ( x 0 ) Ejemplo 6.- Encuentre la ecuación de la recta tangente a la gráfica de f ( x) =

x 3 − 3x + 3 en x = 2 . 3

Solución.• Se determina completamente el punto ( x 0 , y 0 ) Para determinar completamente el punto sobre la gráfica evaluamos la función en x = 2 .

15

f ( 2) =

23 − 3 ⋅ 2 + 3 5 = 3 3

Enfatizamos ahora que queremos la recta tangente a la gráfica de

5 f (x) en el punto (2, ) . 3

•

Se determina la pendiente de la recta tangente. Para calcular la pendiente de la recta tangente se debe primero encontrar la derivada y luego evaluar esta derivada en x = 2 . Antes de derivar consideramos reescribir la función. Efectivamente la función se puede reescribir como: 1 f ( x) = x 3 − x + 1 3 la cual es la que derivamos usando primero la regla de la suma. 1 f ′ ( x) = ( x 3 ) ′ − ( x) ′ + (1) ′ 3 1 = ( x 3 )′ − 1 3 obteniendo

f ′ ( x) = x 2 − 1 Al evaluar esta última en 2 tenemos m = f ′ ( 2) = 4 − 1 = 3 .

•

Recuerde evaluar para obtener la pendiente

Se determina la ecuación de la recta tangente, usando la forma punto-pendiente ( y − y 0 ) = m( x − x 0 ) (y −

5 ) = 3 ⋅ ( x − 2) 3

Se sustituye los valores Simplificando y manipulando obtenemos una ecuación general de la recta

3 y − 9 x + 13 = 0 . Ejemplo 7.- Encuentre los puntos sobre la gráfica de f ( x) = x 3 − 3x 2 − 9 x tales que la recta tangente es horizontal. Solución.- Recordemos que una recta horizontal tiene pendiente 0. Entonces como la derivada evaluada en x es la pendiente de la recta tangente a la gráfica de f en dicho punto, debemos ubicar los valores de x donde la derivada se hace 0. Planteamos entonces la ecuación f ′ ( x) = 0 y la resolvemos. Derivamos primero f ′ ( x) = 3 x 2 − 6 x − 9 . Ahora se plantea 3x 2 − 6 x − 9 = 0 . Esto es una ecuación cuadrática cuyas soluciones son x = 3 y x = − 1 . Evaluamos estos puntos en la función para así obtener los puntos sobre la gráfica en que las rectas tangentes son 0. f (3) = 33 − 3(3) 2 − 3 ⋅ 9 = − 27 f (− 1) = (− 1) 3 − 3(− 1) 2 − 9 ⋅ (− 1) = − 5 Se concluye que (3,-27) y (-1,-5) son los puntos sobre la gráfica donde la recta tangente a la curva en dichos puntos son horizontales.

16

RAZON DE CAMBIO PORCENTUAL La razón de cambio nos da una medida de cómo cambia una magnitud frente a otra. Pero este cambio depende de la situación en que estemos. No es lo mismo que en un año una población cambie en 100.000 habitantes si la población es de 10.000.000 que si es de 500.000. La razón de cambio porcentual para una cantidad C permite calibrar mejor estas situaciones, la cual es definida por:

El cambio porcentual para la población de 10.000.000 es de 1%. El cambio porcentual para la población de 500.000 es de 20%. La razón de cambio porcentual es conocida también como la tasa de cambio porcentual. Cuando sabemos que hay crecimiento hablamos de razón (tasa) de crecimiento porcentual de la cantidad. La C ′ ( x) cantidad también es usada para comparar la razón de cambio de una cantidad con respecto a ella C ( x) misma,

C ′ ( x) es conocida como la razón de cambio relativo y toma valores entre -1 y 1. C ( x)

Ejemplo 1.- El PIB de cierto país es aproximado por la función N (t ) = t 2 + 4t + 150 mil millones de UM t años después del 2003. a) Estime la razón de cambio al comienzo del 2005; b) Estime la razón de cambio porcentual del PIB al comienzo del 2005 Solución: a) Como han pasado 2 años después del 2003 se tiene que calcular N ′ ( 2) . Primero se calcula la función derivada

′ N ′ (t ) = t 2 + 4t + 150 = 2t + 4

(

)

La razón de cambio para comienzos del 2005 es N ′ (2) = 2 ⋅ 2 + 4 = 8 mil millones de UM por año. b) La razón de cambio porcentual para el 2005 es estimada en N ′ (2) 8 100 = 100 = 4.93% por año. N (2) 162

EJERCICIOS 1) Encuentre la derivada de las siguientes funciones: 1.1) f ( x ) = x 7 ; 1.2) f ( x) = 9 x 2 ; 1.4) g ( w) = 1.7) f ( x) =

5w ;

x2 ; 3

1.10) y = 108( x 2 + 1167) ; 1.13) f ( x) =

x6 x4 ; + 6 2

1.16) f ( x ) =

2x− 3 ;

1.3) f ( x) =

5;

1.5) f ( x) = ln(2) x 2 ;

1.6) f ( x) =

1 2 x ; 3

1.8) y = − x 2 + 2 x ;

1.9) h( w) = w9 − 3w3 + e 2 ;

1.11) f ( x) =

5 (4 − x 2 ) ; 2

1.14) h( s ) = s 3 / 4 − 3s − 1/ 3 ; 1.17) C (q) =

4 ; 5q

1.12) f ( x) = 1.15) f ( x) =

5(4 − x 2 ) ; 2 4

;

3⋅ 3 x 2 q3 5 − 3; 1.18) C (q ) = 5 q

17 1.19) f ( x) =

2x −

2x ;

1.22) f ( s) = s 2 (3s ) 2 ; 2

1.25) f ( s ) = s 3 ( s 2 − 2s ) ;

2

1.20) f ( x) =

3 x

;

1.23) f ( s ) = s 2 3s 2 ; x − x2 ; x3

1.26) f ( x) =

Respuestas: 1.1) 7x 6 ; 1.2) 18 x ; 1.3)0; 1.4)

1.21) f ( x) = x ⋅ 4 x ; 1.24) f ( x) = x( 4 − 5 x − x 3 ) ; 1.27) f ( x) =

5 ; 1.5) 2xln2; 1.6)

x(3 − x 2 ) 2 x

2 2x x ; 1.7) ; 1.8) − 2 x + 2 ; 3 3 3 − 1/ 4 s + s− 4/3 ; 4

1.9) 9 w 2 ( w 6 − 1) ; 1.10) 216 x ; 1.11)-5x; 1.12) − 5 x ; 1.13) x 3 ( x 2 + 2) ; 1.14)

8

1.15) −

−

9⋅ x 3

1 3 x

1.25)

3

5

; 1.16) − 3 2 x − 4 ; 1.17) −

4 3q 2 15 + 4 ; 1.19) ; 1.18) 5q 2 5 q

2−

2 2 x

; 1.20)

; 1.21) (5/4) 4 x ; 1.22) 36s 3 ; 1.23)12s3; 1.24) 4 − 10 x − 4 x 3 ;

x− 2 3 − 5x 2 2s 2 / 3 ; 1.27) (4 s − 5) ; 1.26) 3 x3 4 x

2) Para cada una de las siguientes curvas encuentre la pendiente de la recta tangente en x=1. Graficar la curva y la recta tangente en x=1 a) y = − x 3 − 4 ; x=1; b) y = 2 x − 3 . 3) Encuentre la recta tangente a la curva en el punto dado 3.1) y = 2 x 3 − 6 x + 1 ; x=-1;

3.2) y = 2 x 3 − 4 x + 1 ; x=-1;

3.3) y =

x − x2 ; x=4 x

4) Para cada una de las siguientes funciones encuentre los puntos en los cuales la recta tangente a la gráfica de la función en esos puntos es horizontal. 4.1) F ( x) = x 2 − 4 x ; 4.2) G ( x ) = x 3 − x 2 ; 4.3*) H ( x ) = x 4 − 8 x + 1 ; 4.4*) K ( x) = x 4 − x 2 (* la ecuación que se plantea se resuelve por Ruffini o factorizando directamente por productos notables) 5*) Encuentre la ecuación de la recta tangente a la gráfica de la función F ( x) = x 4 + 8 x − 2 que es paralela a la recta y = 4 x + 1 . (* plantear F ′ ( x) = 4 , (¿por qué?) consiga la solución x 0 de la ecuación, forme la recta con pendiente F ′ ( x 0 ) = 4 y que pasa por el punto ( x 0 , F ( x 0 )) , justifique el procedimiento) 6*) Encuentre la ecuación de la recta tangente a la gráfica de la función F ( x) = x 3 − 6 x − 1 que es paralela a la recta 2 y + 6 x + 1 = 0 . (* Imite el ejercicio anterior, puede existir más de una solución) x 7*) Encuentre la ecuación de la recta tangente a la gráfica de la función F ( x) = que es paralela a 3 la recta 2 y + 6 x + 1 = 0 .

18

Respuestas: 2)

3.1) y = 0 3.2) y= 2 x + 5 ; 3.3) −

17 3 x+ 16 4

2 4 ) ,(0,0); 4.3) 4.1)(2,-4) ; 4.2) ( ,− 3 27 (3 2 ,− 6 ⋅ 3 2 ) ; 4.4) (

2 1 2 1 ,− ) , ( − ,− ) 2 4 2 4

y (0,0) 5) y + 9 = 4( x + 1) ; 6) y + 4 = − 3( x − 1) ; y − 6 = − 3( x + 1) ; 7) No existe PROBLEMAS EN CIENCIAS SOCIALES 3

1) Se proyecta que dentro de x meses, la población de cierto pueblo será de P ( x ) = 2 x + 4 x 2 + 5000 a) ¿A qué razón cambiará la población respecto al tiempo dentro de 9 meses? b) ¿A qué razón porcentual cambiará la población respecto al tiempo dentro de 9 meses? Respuesta: a) 20 personas por mes, b) 0.39% PROBLEMAS EN ECONOMÍA 1) El PIB de un país t años después del 1 de enero del 2001 es aproximado por N (t ) = t 2 + 8t + 170 mil millones de UM. a) Estime la tasa de cambio al comienzo del 2007 b) Estime la tasa de cambio porcentual del PIB al comienzo del 2007 Respuesta: a) 20 miles de millones por año, b) 7.87% 2) Las ganancias trimestrales de la compañía EME depende de la cantidad x (en miles de UM) invertida en publicidad dada por la siguiente relación.

P ( x) =

−1 + 7 x + 30 miles de UM x2

¿Cuál es la razón de cambio de las ganancias trimestrales si se invierten 100000 UM en publicidad? Respuesta: 3499/500 miles de UM 3) Un nuevo artículo ha sido introducido al mercado. Se espera que la demanda del artículo sea de q = 300 + 0.5t + 0.05t 3 / 2 unidades al cabo de t meses. ¿A qué razón porcentual cambiará la demanda mensual dentro de 9 meses? Respuesta: 0.23 % 4) Se ha decidido establecer el precio de la gasolina por mes de acuerdo a la siguiente formula p = 15 + 0.3t + 0.08t 3 / 2 UM contados a partir del próximo mes. ¿A qué razón porcentual cambiará el precio de la gasolina un mes después de implementado el plan tarifario? ¿4 meses después? ¿9 meses? Respuesta: 2.73%; 3.2%; 3.32%

19

ANÁLISIS MARGINAL En economía el concepto marginal se refiere al cambio instantáneo de una cantidad con respecto a otra. Esto es la derivada de una cantidad con respecto a otra. Daremos a continuación el concepto y la interpretación de varias cantidades marginales de uso frecuente en economía.

COSTO MARGINAL

Sea C (q ) el costo total de producir q unidades de un determinado artículo. Aún cuando en la mayoría de los casos q es un número entero, en la teoría y en la práctica es conveniente considerar el dominio de C un intervalo de R. En economía se está interesado como los costos cambian cuando hay incrementos en la producción. La derivada puede ayudar a analizar estos cambios de una manera rápida. La derivada del costo total, C ′ (q ) , se llama costo marginal Costo marginal= C ′ (q)

En general se interpreta el costo marginal , C ′ (q ) , como el costo aproximado de producir la unidad q + 1 . Veamos la justificación. Recuerde que el costo de las primeras q + 1 es C (q + 1) . Así que El costo exacto de la unidad q + 1 = C ( q + 1) − C ( q) =

C (q + 1) − C ( q) 1

Esta última expresión es una aproximación de la derivada C ′ (q ) ≈

con h = 1 Así pues

C (q + h) − C ( q ) h

C ′ (q) ≈ costo de producir la unidad adicional q + 1

Veamos los siguientes ejemplos. Ejemplo 1.- La función de costo total por producir y vender q artículos está dada por: C (q ) = 0.001q 2 + 1.1q + 30 en UM. a) Encuentre la función de costo marginal. b) Encuentre el costo marginal en q = 40 c) Interprete sus resultados. Solución: a) Para conseguir la función de costo marginal derivamos la función de costo total. C ′ (q ) = (0.001q 2 + 1.1q + 30)′ C ′ ( q ) = (0.001q 2 ) + (1.1q ) ′ + (30) ′ C ′ (q ) = 0.002q + 1.1 UM

b) El costo marginal en q = 40 está dado por C ′ (40) = 0.002 ⋅ 40 + 1.1 = 1.18 UM c) El costo de producir la unidad 41 es aproximadamente 1.18 UM

20 El lector debe darse cuenta lo tedioso que hubiese sido calcular el costo de la unidad 41 de una manera exacta. En el siguiente ejemplo haremos el cálculo aproximado y exacto pero antes recordemos el siguiente concepto. Si C (q ) es el costo total de producir q artículos, el costo promedio por artículo se define como

C (q) =

C (q) q

En el ejemplo anterior el costo promedio por artículo está dado por C (q) =

0.001q 2 + 1.1q + 30 q

= 0.001q + 1.1 + 30

1 q

El lector puede verificar que C (40) = 1.89 , lo cual representa el costo de cada artículo en promedio cuando se producen 40 artículos. Este valor es muy distinto al costo marginal en 40 que representa aproximadamente el costo de producir la unidad 41. Podemos ver entonces que el costo promedio y el costo marginal son dos conceptos distintos pero relacionados. Usando los dos conceptos, podemos decir en nuestro ejemplo que los primeros 40 artículos cuestan 1.89UM en promedio y fabricar uno más le costaría tan sólo 1.18UM. Ejemplo 2.- La función de costo promedio de un producto está dada por C ( q) = 0.1q + 120 +

22000 q

a) Encuentre la función de costo marginal. b) Encuentre el costo marginal cuando q = 40 y cuando q = 60 c) Encuentre el costo de producir la unidad 41. d) Interprete los resultados Solución: Recuerde que el costo marginal es la derivada del costo total. Así que debemos conseguir la función de C (q ) costo total primero despejándola en la ecuación C (q) = q C (q) = q ⋅ C (q) 22000 C ( q) = q ⋅ (0.1q + 120 + ) q Se distribuye a fin de obtener una expresión más sencilla para derivar 22000 C ( q) = 0.1q 2 + 120q + q q C (q ) = 0.1q 2 + 120q + 22000

a) Derivamos la función costo total recién obtenida C ′ ( q) = (0.1q 2 )′ + (120q) ′ + ( 22000) ′ C ′ (q ) = 0.2q + 120

b) El costo marginal cuando q = 40 está dado por C ′ (40) = 0.2 ⋅ 40 + 120 = 128 El costo marginal cuando q = 60 está dado por C ′ (60) = 0.2 ⋅ 60 + 120 = 132 c)

Recordemos que el costo exacto de la unidad q + 1 es igual a C ( q + 1) − C ( q) . Así

21 El costo exacto de la unidad 41 = C ( 41) − C (40) C (41) = 0.1 ⋅ 412 + 120 ⋅ 41 + 22000 C ( 40) = 0.1 ⋅ 40 2 + 120 ⋅ 40 + 22000 C ( 41) − C ( 40) = 0.1(412 − 40 2 ) + 120 = 128.1 UM C ′ ( 40) = 128 se interpreta como el costo aproximado de producir la unidad 41. Efectivamente d) este costo está bastante cercano al costo exacto de la unidad 41 que es 128.1. C ′ (60) = 132 es el costo aproximado de producir la unidad 61 si se decide aumentar la producción de 60 a 61 unidades. También podemos decir que los costos totales aumentarían aproximadamente en 132UM si se decide fabricar una unidad adicional

Comentarios.- El costo de la unidad adicional depende del nivel de producción. Algunos autores prefieren interpretar C ′ (q) como el aumento aproximado en los costos si se decide aumentar la producción en una unidad. ¿Por qué?

INGRESO Y UTILIDAD MARGINAL Podemos hacer un análisis similar para la función ingreso y utilidad total. Sea I (q ) la función ingreso total por producir y vender q productos. El ingreso marginal se define como la derivada del ingreso total: Ingreso marginal= I ′ (q) y se suele interpretar como el ingreso por producir y vender la unidad adicional q + 1 cuando el nivel de producción es q . Ejemplo 3.- La ecuación de demanda de un artículo está dada por p =

1 (40 − q) . Encuentre la función 5

ingreso marginal Solución: Tenemos que conseguir la función de ingreso. Recuerde que I (q) = pq Así 1 I ( q) = ( 40 − q) q 5 Reescribimos antes de derivar, distribuyendo solo la variable 1 I ( q) = ( 40q − q 2 ) 5 Derivamos, usando primero la regla del factor constante 1 I ′ (q ) = (40q − q 2 )′ 5 Podemos ver finalmente, usando la regla de la diferencia que el ingreso marginal está dado por 1 I ′ (q ) = ( 40 − 2q ) 5 Recordemos: Sea U (q) la función utilidad total por producir y vender q productos. Recuerde que la utilidad es la diferencia entre el ingreso y el costo, esto es

U (q ) = I ( q ) − C ( q )

22 La utilidad marginal se define como la derivada de la utilidad total: Utilidad marginal= U ′ (q) y se suele interpretar como la utilidad por producir y vender una unidad adicional cuando el nivel de producción está en q . Ejemplo 4.- Un comerciante estima que su ingreso mensual por la venta de un artículo sea I ( q) = 30q − 0.02q 2 , para 0 ≤ q ≤ 1500 . Si el costo de adquisición es de 10UM por cada artículo. a) Encuentre la función de utilidad marginal b) ¿Cuál es el nivel de adquisición y venta en que la utilidad marginal es 0? c) Interprete el resultado anterior. Solución: a) La función de utilidad marginal es la derivada de la función utilidad total. Debemos conseguir primero U (q) mediante la relación U (q) = I (q ) − C (q ) La función costo total está dada por C (q ) = 10 ⋅ q De esta manera U ( q ) = (30q − 0.02q 2 ) − (10q ) Simplificando se obtiene U (q ) = 20q − 0.02q 2

La utilidad marginal es la derivada de U (q) U ′ (q ) = ( 20q ) ′ − (0.02q 2 ) = 20 − 0.04q . b) Para calcular el nivel en que la utilidad marginal es 0 debemos plantear

U ′ (q) = 0

20 − 0.04q = 0 Resolviendo, obtenemos

q = 500

El nivel de adquisición y ventas en que la utilidad marginal es 0 es 500 artículos. c) Esto se puede interpretar como: La utilidad dejada por la adquisición y venta de una unidad por encima de 500 es aproximadamente 0. La negociación de una unidad extra en este nivel de comercialización no aportaría ganancia ni perdida al negocio.

PROPENSION MARGINAL AL AHORRO Y AL CONSUMO. Pensemos primero estos conceptos a nivel de un individuo. Si una persona tiene un ingreso mensual variable de I, una cantidad C la consume en bienes y servicios y otra S la ahorra. Es decir I = C + S . Es claro que los porcentajes de lo que ahorra y lo que consume depende del nivel de ingreso. Es probable que un individuo cuando reciba muy poco prácticamente lo gaste todo y en cambio si recibe una gran cantidad ahorre una parte. Así pues podemos pensar que el consume C es una función del ingreso. Podemos extrapolar estos conceptos a nivel de una nación. Sea I el ingreso nacional disponible (en miles de millones de UM) . La función de consumo nacional, C (I ) , es la cantidad de dinero del ingreso que se consume La función de consumo nacional, S (I ) , es la cantidad de dinero del ingreso que se ahorra.

23

Definición.- Se llama propensión (o tendencia) marginal al consumo a la derivada de C con respecto a I: C ′ (I ) =

dC =propensión (o tendencia) marginal al consumo dI

La propensión (tendencia) marginal al ahorro se la define como la derivada de S con respecto a I: S (I ) =

dS = propensión (o tendencia) marginal al ahorro. dI

Podemos ver que a nivel del ingreso nacional la relación I = C ( I ) + S ( I ) se cumple. Al derivar ambos lados queda dI dC dS = + dI dI dI dC dS + dI dI Así que las dos propensiones marginales suman 1. Frente a un pequeño incremento de ingreso nacional, podemos interpretar las propensiones marginales como las proporciones de ese incremento que se ahorran o se consume. 1=

Ejemplo 5.- Suponga que la función de consumo de un país está dado por C ( I ) =

I 4 I + + 7 donde I 3 5

y C vienen dadas en miles de millones de UM a) Encuentre las propensiones marginales al consumo y al ahorro cuando el ingreso nacional es de 9 mil millones de UM. b) Interprete sus resultados Solución: a) Se calcula la propensión marginal al consumo. dC I 4 I = C ′ ( I ) = ( )′ + ( ) ′ + (7 ) ′ dI 3 5 1 4 = ( I ) ′ + ( I 1 / 2 ) ′ + (7 ) ′ 3 5 1 4 1 = + ⋅ I − 1/ 2 ) 4 5 2 1 2 = + 3 5 I

Para calcular la propensión marginal al ahorro nos valemos de la formula dC dS 1= + dI dI dS dC = 1− dI dI Se procede ahora a evaluar las propensiones marginales en I = 9 dC 1 2 1 2 7 = C ′ (9) = + = + = dI I = 9 3 5 9 3 15 15 dS dC 7 8 = 1− = 1− = dI dI 15 15

24

b) Para un nivel de ingreso nacional de 9 mil millones de UM, si hay un aumento en un millardo de 7 unidades monetarias, aproximadamente el 46.6% ( ⋅ 100 ) de ese aumento se consume y el 53.3% 15 se ahorra. Es decir 466,6 millones se consumen y 533,3 millones se ahorran aproximadamente.

PROBLEMAS DE ANÁLISIS MARGINAL q 2 20 + + 450 el costo total por producir q artículos. a) Encuentre la función de costo 1) Sea C ( q) = 5 q marginal. b) ¿Cuál es el costo marginal para q = 10 ? c) Interprete sus resultados. 2q 20 − Respuesta: a) C (q) = ; b) 3.8UM. 5 q2 2) Si C = − 0.1q 2 + 2q + 850

representa el costo total de producir q unidades de un producto. a)

Encuentre la función de costo marginal. b) ¿Cuál es el costo marginal para q = 3 ? c) ¿Cuál es el costo real por producir la unidad 4? Respuesta: a) c ′ ( q) = − 0.2q + 2; b) c ′ (3) = 1.4 ; c) c( 4) − c(3) = 1.3 300 3) Si c ( q) = 2 + es la función costo promedio de producir q unidades de un producto. a) q Encuentre la función de costo marginal. b) ¿Cuál es el costo marginal para q=30? c) Interprete sus resultados. Respuesta: a) c ′ ( q) = 2; b) c ′ (30) = 2 4) La función de ingreso total viene dada por I = 2q (20 − 0.2q ) . a) Encuentre la función de ingreso marginal; b) El ingreso marginal para q = 10 ; c) el ingreso marginal para q=20; d) Interprete sus resultados. Respuesta: a) I ′ (q ) = 40 − 0.8q ; b) 32UM; c) 24UM 5) Si la ecuación de demanda es p = 500 − q 2 q3

2

3

, calcule el ingreso marginal.

5 3 6) El costo total de un fabricante es C (q ) = 0.1q 3 − 0.5q 2 + 500q + 200 UM, donde q es el número de unidades producidas. a) Utilice el análisis marginal para estimar el costo de fabricación de la cuarta unidad b) Calcule el costo real de fabricar la cuarta unidad. Respuesta: a) 499,7; b)500,2 7) El ingreso total mensual de un fabricante es I (q ) = 240q + 0.05q 2 UM cuando produce y se venden q unidades al mes. En la actualidad, el fabricante produce 80 unidades mensuales y planea aumentar la producción en una unidad. a) Utilice el análisis marginal para estimar el ingreso adicional que generará la producción y venta de la unidad 81. b) Utilice la función ingreso para calcular el ingreso adicional real que generará la producción y venta de la unidad 81. Respuesta: a) 248; b) 248.05 q 8) La ecuación de demanda de un artículo es p = 200 − .a) Determinar la función de ingreso 4 marginal b) El ingreso marginal cuando q = 20 c) ¿Cuál es el ingreso real por vender la unidad 21? q Respuestas: a) p = 200 − b) 190UM; c) 189.75UM 2 Respuesta I ′ (q ) = 500 −

25 9) La ecuación de demanda de un tipo de reloj es

3

q + 20 p = 800 .a) Determinar la función de ingreso

marginal. b) Si la función de costo total por la producción de q relojes es C (q ) = utilidad marginal. Respuestas: a) 40 −

3

q

15

; b) 40 −

3

q

15

−

3

q + 10 , calcule la 2

1 62 q 2

10) La ecuación de demanda de un producto es q 2 + 100q + 1000 p = 8000 . a) Determinar la función de 5q 2 ingreso marginal. b) Si la función costo total por la producción de q productos es C (q ) = 500 + , 100 calcule la utilidad marginal. Respuestas: a) 8 − 0.2q − 0.003q 2 ; b) 8 − 0.3q − 0.003q 2

I 8 I − + 4 UM. Encuentre la 2 3 propensión marginal al consumo y al ahorro cuando I= 36 UM. Interprete sus resultados. Respuesta: 5/18; 13/18 12) La producción semanal de una fabrica depende del número de obreros x en la planta y está dada por P( x) = − 2 x 2 + 1600 x . Si la fabrica cuenta en este momento con 30 obreros, a) use derivadas para estimar el cambio de la producción si se contrata un obrero más b) Haga el calculo exacto. Respuesta: a) 1480; b) 1478 unidades 11) La función de consumo de cierta nación está dada por C ( I ) =

13) La ecuación de demanda de un producto está dada por 45 p +

q 3 = 7000 Si la función de costo

está dada por C (q ) = 45 + q 3 . a) Calcule la utilidad marginal cuando se producen y se venden 100 unidades. b) Interprete sus resultados. Respuesta: a) 85UM 14) Un kiosco de comida rápida prepara hamburguesas a un costo de 2UM cada una. Las hamburguesas se han vendido a 5UM cada uno y a ese precio, los consumidores han comprado 4000 al mes. El dueño planea incrementar el precio de las hamburguesas y estima que por cada UM de aumento en el precio se venderán 200 hamburguesas menos. Calcule la utilidad marginal en función del número de hamburguesas vendidas, suponiendo que la ecuación de demanda es lineal. Respuesta: −

q + 23 100

15) Un distribuidor vende 5000 lavadoras al mes si el precio es de 40UM cada una y estima que por cada incremento de 5UM las ventas bajarán en 300 lavadoras. Si el costo de adquisición de cada lavadora es de 25UM. Suponga que la ecuación de demanda es lineal. Calcule la función utilidad marginal en función del número de lavadoras adicionales a las 5000. Respuesta: 23000 − 3000q 16*) Se estima que un gimnasio tiene 500 clientes cuando la cuota es de 30UM y si sube el precio a 40 el número de clientes se reduce a 450. Suponga que existe una relación lineal entre el número de clientes y la cuota mensual. a) Determine la función de ingreso. b) Determine el ingreso marginal. 1 2 Respuestas: a) I = − q 2 + 130q ; b) I ′ = − q + 130 5 5 17*) El calendario ecológico es vendido a 20UM., a ese precio se compran 25.000 ejemplares. Se ha estimado que si el precio aumenta a 30UM se venderán 15.000 unidades. El costo de producción de q unidades está dado por C ( q) = 500 + 5q . Suponiendo que hay una relación lineal entre el precio y la demanda de calendarios. a) Encuentre la utilidad marginal. b) Calcule la demanda q 0 para la cual la utilidad marginal es cero. c) Calcule el precio p 0 para esta demanda. d) Calcule la utilidad en p 0 − 1 , p 0 y p 0 + 1 (*para calcular la ecuación de demanda use la ecuación pto-pendiente, calculando previamente la pendiente) q + 40 ; b) q 0 = 20.000 ; c) p 0 = 25 ; d) U (24) = 459.42 , U (25) = 499.38, Respuestas: a) U ′ = − 500 U ( 26) = 539.32 UM

26

REGLAS DEL PRODUCTO Y DEL COCIENTE La función h( x) = (3x 2 + 4 x + 1)( x + 1) la podemos derivar usando las ideas de la sección pasada, podemos reescribir la función aplicando la propiedad distributiva y luego sumar términos semejantes. Sin embargo, tal como está se puede interpretar como el producto de dos funciones f ( x) = 3 x 2 + 4 x + 1 y g ( x) = x + 1 y para derivar se usa entonces la regla del producto que a continuación se enuncia.

Regla del producto: Sean f y g funciones derivables en x, entonces f ⋅ g también es derivable en x y (( f ⋅ g ) ′ ( x) = f ′ ( x) g ( x) + f ( x) g ′ ( x) . La derivada de un productote dos funciones es la derivada de la primera por la segunda sin derivar más la primera por la derivada de la segunda Al final de esta sección daremos de prueba de esta regla. Ejemplo 1.- Encuentre la derivada de la siguiente función h( x) = (3 x 2 + 4 x + 1)( x + 1) Solución: Aplicamos la regla del producto a la función h( x) = (3 x 2 + 4 x + 1)( x + 1) , interpretando a

h como el producto de las funciones f ( x ) = 3x 2 + 4 x + 1 y g ( x) =

h ′ ( x) = f ′ ( x) g ( x) + f ( x ) g ′ ( x) = (3 x + 4 x + 1)′ ( x + 1) + (3x + 4 x + 1)( x + 1)′ 2

2

x + 1 . Así

Observe que se deja la derivada indicada y se deriva en la siguiente línea

1 = (6 x + 4)( x + 1) + (3x 2 + 4 x + 1) x − 1 / 2 2 Aplicando la propiedad distributiva y agrupando términos semejantes tenemos h′ ( x) =

15 3 / 2 1 x + 6 x + 6 x1 / 2 + 4 + x − 1 / 2 . 2 2

Ejercicio de desarrollo: Encuentre las derivadas de las siguientes funciones a) h( x) = 3( x 2 − 3 x − 3) ; b) f ( x) = ( x − x + 1)( x 2 − 3x − 3)

La demostración de la regla del producto se hace al final de esta sección. Otra regla que vamos a necesitar es la derivada de un cociente que a continuación presentamos Regla del Cociente: Sean f y g funciones derivables en x y g ( x) ≠ 0 , entonces f / g es derivable en x y f f ′ ( x ) g ( x) − f ( x) g ′ ( x) ( ) ′ ( x) = . g g 2 ( x)

27 La regla de cociente es un poco más complicada que las anteriores. Pero observe como al escribirla se a puesto cierta semejanza con la regla del producto, excepto el signo menos en el numerador y que contiene un denominador igual al denominador de la función a derivar al cuadrado. x 2 + 4x + 1 x3 − 1 Solución: Aplicamos la regla del cociente interpretando a h como el cociente de la función f ( x) = x 2 + 4 x + 1 entre g ( x) = x 3 − 1 . Así La derivada la calculamos en varios pasos dejando indicada algunas derivaciones para f ′ ( x) g ( x) − f ( x) g ′ ( x) h ′ ( x) = analizarla y derivarla en las líneas siguientes. 2 Ejemplo 2.- Encuentre la derivada de la función h( x) =

( g ( x) )

=

( 2 x + 4)( x 3 − 1) − ( x 2 + 4 x + 1)3 x 2 = ( x 3 − 1) 2 =

En ambas derivadas se aplica la propiedad de la suma y de la potencia

( x 2 + 4 x + 1)′ ( x 3 − 1) − ( x 2 + 4 x + 1)( x 3 − 1)′ ( x 3 − 1) 2

Se aplica la propiedad distributiva. En el segundo termino distribuimos el 3x 2 . Observe la necesidad de mantener el paréntesis.

2 x 4 + 4 x 3 − 2 x − 4 − (3x 4 + 12 x 3 + 3 x 2 ) ( x 3 − 1) 2

Se distribuye el menos.

2 x 4 + 4 x 3 − 2 x − 4 − 3x 4 − 12 x 3 − 3x 2 ( x 3 − 1) 2 Agrupando términos semejantes finalmente obtenemos: =

h′ ( x) =

− x 4 − 8 x 3 − 3x 2 − 2 x − 4 ( x 3 − 1) 2

Ejercicio de desarrollo: Encuentre la derivada de x+ 2 x + 1 x− x + 1 a) f ( x) = ; b) f ( x ) = x− x 5

Comentario: Le recordamos que en este último ejercicio es conveniente reescribir la función como: 1 f ( x) = ( x − x + 1) para luego aplicar la regla del factor constante. Resulta más largo aplicar la regla 5 k del cociente. Más adelante se presentarán las formas f ( x) = que conviene escribirlas como f ( x) f ( x) = k ( f ( x)) − 1 laboriosa.

para emplear otra regla distinta a la regla del cociente, la cual resulta más

Ejemplo 3.- Encuentre la ecuación de la recta tangente a la curva y = ( 20 − 3x)( x 2 − 3x − 1) en el punto donde x=4 Solución :

28 •

Se determina completamente el punto sobre la gráfica evaluando la función en x = 4 . y (4) = (20 − 3 ⋅ 4)(4 2 − 3 ⋅ 4 − 1) = 8 ⋅ 3 = 24

Remarcamos que queremos la recta tangente a la gráfica de

•

f (x) en el punto (4,24) .

Para determinar la pendiente se calcula y ′ y luego se evalúa en x=4 Usamos la regla del producto para conseguir la derivada y ′ = (20 − 3 x) ′ ( x 2 − 3 x − 1) + (20 − 3 x)( x 2 − 3x − 1)′ y ′ = − 3( x 2 − 3 x − 1) + (20 − 3 x)(2 x − 3)

Podemos simplificar este resultado, pero preferimos evaluar de una vez y ′ ( 4) = − 3( 4 2 − 3 ⋅ 4 − 1) + (20 − 3 ⋅ 4)(2 ⋅ 4 − 3) y ′ ( 4) = 31

Esto es mtag = 31 . •

Finalmente para calcular la recta tangente usamos la ecuación punto pendiente ( y − y 0 ) = m( x − x 0 ) ( y − 24) = 31 ⋅ ( x − 4)

Llevándolo a la forma pendiente-ordenada en origen tenemos que la recta tangente en el punto (4,24) es: y = 31x − 100 APLICACIONES Ejemplo 1.- El gobierno va implementar unas medidas para disminuir el porcentaje de desempleo en el país. Él prevee que el impacto de sus medidas se verá reflejado en el siguiente modelo 0.15t 2 − 0.2t + 0.17 P(t ) = ⋅ 100 t 2 + 1.1 donde P es el porcentaje de desempleados en el tiempo t, medidos en años. a) Encuentre la función que modela la tasa de cambio instantáneo del porcentaje de desocupados una vez que se apliquen las medidas. b) Estime la tasa de cambio instantáneo a los 3 meses, 6 meses, 1 año y 2 años. Solución : La tasa de cambio instantáneo no es otra cosa que la primera derivada. Así que la calculamos usando la regla del cociente previamente sacamos 100 fuera de la derivada ′  0.15t 2 − 0.2t + 0.17    P ′ (t ) = 100  t 2 + 1.1   P ′ (t ) = 100

(0.3t − 0.2)(t 2 + 1.1) − (0.15t 2 − 0.2t + 0.17)(2t ) (t 2 + 1.1) 2

P ′ (t ) = 100

0.2t 2 − 0.01t − 0.22 (t 2 + 1.1) 2

Para medir la tasa de cambio a los tres meses, evaluamos en t = 1 / 4 la primera derivada:

29 1 − 0.22 4 P ′ (0.25) = 100 = − 15,8% ((0.25) 2 + 1.1) 2 1 0.2(0.5) 2 − 0.01 ⋅ − 0.22 2 P ′ (0.5) = 100 = − 9,602% ((0.5) 2 + 1.1) 2 0.2(0.25) 2 − 0.01 ⋅

P ′ (1) = 100

0.2(1) 2 − 0.01 ⋅ 1 − 0.22 = − 0,68% ((1) 2 + 1.1) 2

P ′ ( 2) = 100

0.2(2) 2 − 0.01 ⋅ 2 − 0.22 = 2.15% ((2) 2 + 1.1) 2

EJERCICIOS 1) Derive las siguientes funciones 1.1) f ( x) = (4 − x 2 )( x + 1) ; 1.3) f ( s) = ( s 2 + 1)(3s 2 − 3s ) ; 1.5) h( s) = 2 s ( s 2 + 2 s − 1) ;

1.2) f ( x) = 4 − x 2 ( x + 1) ; 1.4) f ( x ) = (2 x − 1)(4 − 5 x − x 3 ) ; 1.6) f ( x ) = 3( x − 3)(4 − x) ;

1.7) f ( x) = ( x − 1)( x − 2)(2 − x 2 ) ;

1.8) C (q) =

1.9) C (q) = 1.11) f (t ) =

4− q ; q2 − 1

q3 − 1 ; q − 2q + 1 2 1.12) f ( x ) = ; 3 x

1.10) C (q) =

2t 2 + 3t − 1 3

4− q ; 5q

t

;

1.13) f ( x) = x 3 ⋅ 33 x ;

1.14) f ( s ) =

1.15) f ( s ) = s 2 / 3 ( s 2 − 2s ) ;

1.16) f ( x) =

1.17) f ( x) =

x(3 − x 2 ) 3 x

;

2

s 2 + 5s + 6 ; s 2 + 4s + 4

x − x2 1− x 1 + − ; x − 1 2 x − 4 3x ( x − 1)(3 − x 2 ) f ( x ) = 1.18) ; 3(1 − x)

2) a) Utilice la regla del cociente para derivar la función f ( x) =

2x − 3 x3

b) Reescriba la función como f ( x) = x − 3 (2 x − 3) y derívela como un producto.

c) Rescriba la función como f ( x) = 2 x − 2 − 3 x − 3 y derívela como una suma. d) Demuestre que todas las respuestas son iguales. 3) a) Utilice la regla del cociente para derivar la función f ( x) =

x− 2 x + 1 x

b) Reescriba la función como un producto y derívela usando la regla del producto. c) Reescriba la función como una suma y derívela usando la regla de la suma. (no use la regla del cociente ni del producto) d) Demuestre que todas las respuestas son iguales. 4) Encuentre la ecuación de la recta tangente a la curva y = ( x 3 − 3x)( x 2 − x ) en el punto donde x=4. 2x − 1 5) Encuentre la ecuación de la recta tangente a la curva y = en el punto donde x = − 1 . 1 − 3x

30 6*) Encuentre los puntos en los cuales la recta tangente a la gráfica de la función f ( x) =

x+ 1 es x

horizontal. 1.1) − 3x 2 − 2 x + 4 ; 1.2) − 3x 2 − 2 x ; 1.3) 12s 3 − 9s 2 + 6s − 3 ; 1.4) 13 − 20 x + 3x 2 − 8 x 3 ; 1.5) 4 5 2 2 q 2 − 8q + 1 2 3 x 3 2 − s s+ 2 2− 3 ( + 3 − ) ; 1.6) ; 1.7) − 4 x + 9 x − 6 ; 1.8) ; 1.9) ; 1.10) 5q 2 2 x 2 ( q 2 − 1) 2 2 s

Respuestas:

q 2 − 2q − 2 2

q − 2q + 1

; 1.11)

10t 2 + 6t + 1 33 t 4

; 1.12) −

1 3 x

3

; 1.13) (1+1/33) 33 x ; 1.14) −

1 ; s + 4s + 4 2

x− 1 2 1 3 − 5x 2 + ; 3) ; 2 2 ; 1.17) ( 2 x − 4) 3x 2 x3 6 x 1 13 x− 4) y − 728 = 1033( x − 4) ; 5) y = − ); 6) (1,2) 16 16 1.15) s 2 / 3 (8 / 3s − 10 / 3) ; 1.16) − 1 +

PROBLEMAS EN ECONOMÍA 1) Encuentre la función ingreso marginal cuando I = 2q (30 − 0.1q ) . Encuentre el ingreso marginal para q=10. Interprete sus resultados. Respuesta: I ′ = 60 − 0.4q ; I`(10)=56 q + 750 2) p = representa la ecuación de demanda para cierto artículo donde p denota el precio por q + 50 unidad cuando se demanda q unidades. Encuentre la función de ingreso marginal. q 2 + 100q + 37500 ′ I = Respuesta: ) (q + 50) 2 3) El Producto Nacional Bruto de cierto país crece con el tiempo de acuerdo con PNB(t)= t 2 + 4t + 20 . La población al tiempo t es P(t)= 0.1t 2 + t + 2 (millones de habitantes). Calcule la razón de cambio del ingreso per capita en el instante t=10. (El ingreso per capita se define como f ( x) =

PNB (t ) el Producto P (t )

Nacional Bruto dividido entre el tamaño de la población.) Respuesta: 0.099 4) Se espera que la venta de un nuevo equipo de sonido siga el siguiente comportamiento con respecto al 10t número de meses luego que se ha lanzado al mercado S (t ) = 2 miles de equipos al mes. t + 30 a) Encuentre la razón de cambio instantánea de las ventas a los 3 meses. b) Encuentre la razón de cambio instantánea de las ventas a los 6 meses. c) Encuentre la razón de cambio instantánea de las ventas a los 9 meses. d) Interprete sus resultados. Respuesta: a) 0.1381x1000; b)-13.8; c) -41.4; d) A los diez meses se venderán aproximadamente 41 equipos menos que en el mes anterior. 250 − p 5) La ecuación de demanda de cierto artículo es q = . Determinar la razón de cambio de la p demanda con respecto al precio. a) Calcule esta razón de cambio para p=5. b) Interprete sus resultados. (Respuesta: a) − 25 , b) Si el precio aumenta en 1UM, es decir cuando pasa a 6UM, entonces la demanda disminuye en aproximadamente 25 unidades) 6) Las ventas de un artículo V depende de la inversión x que se haga en publicidad mediante la 30 relación V ( x) = 100 − , donde x está expresado en miles de UM y V en miles de unidades. a) x+ 5 Encuentre la razón de cambio promedio de las ventas con respecto a la inversión en publicidad cuando x = 5 ; b) Interprete sus resultados. c*) Su interpretación se basa en hacer una estimación, haga el

31 calculo exacto. Respuesta: a)300 unidades, b) Si la inversión aumenta en un 1000 UM, es decir ahora se gasta x=6 UM en publicidad, las ventas aumenta en 300 unidades aproximadamente; c) 272,7 7) Sea C ( I ) =

I3 + I +

I + 6

la función de consumo de cierto país, donde I y C vienen dadas en I + 2 miles de millones de UM.. Encuentre la propensión marginal al consumo y al ahorro cuando el ingreso es de 16 miles de millones de UM. Interprete su resultado. Respuesta 0.868; Para un nivel de ingreso nacional de 16 mil millones de UM, si hay un incremento del ingreso de la nación de mil millones de unidades monetarias, aproximadamente el 86.8% de ese aumento se consume y el resto se ahorra) 3 8) Sea S ( I ) = I + 2 I + 6 la función de ahorro de cierto país. a) Encuentre la propensión marginal al I + 10 consumo y al ahorro cuando I = 100 . b) Interprete sus resultados. Respuesta: C ′ (100) = 0.89 ; S (100) = 0.11

3q 2 + 3.5q 9) El ingreso total por la venta de q artículos está dada por I ( q) = . Encuentre el ingreso q+ 1 marginal cuando se venden 30 artículos. b) Interprete sus resultados. Respuesta: 3 UM 10) En ciertos terrenos se estima que si se plantan 100 matas de mangos por hectárea se obtendrá un valor de la cosecha por árbol de 500 UM en su edad adulta. Se estima que por cada árbol que se siembre de más hará que el valor promedio por árbol disminuya en 4 UM. Determine la función de ingreso marginal en función del número de árboles adicionales sembrados después de 100. Respuesta: − 8q + 100

Demostración de la Regla del Producto: Planteamos la derivada de la función ( f ⋅ g )( x) por definición: ( f ⋅ g ) ( x + h) − ( f ⋅ g ) ( x ) ( f ⋅ g ) ′ ( x) = lim h→ 0 h = lim h→ 0

f ( x + h) g ( x + h) − ( f ( x) g ( x) ) h

Se suma y resta f ( x) g ( x + h)

= lim

f ( x + h) g ( x + h) − f ( x ) g ( x + h) + f ( x ) g ( x + h) − f ( x) g ( x) h

= lim

f ( x + h ) g ( x + h ) − f ( x ) g ( x + h) f ( x ) g ( x + h) − f ( x) g ( x + h) + lim h→ 0 h h

h→ 0

h→ 0

f ( x + h) − f ( x )  g ( x + h) − g ( x)    = lim g ( x + h)  + lim f ( x)  h → 0 h → 0 h h   = lim g ( x + h) lim f ( x + h) − f ( x) + lim f ( x) lim g ( x + h) − g ( x) h→ 0 h→ 0 h→ 0 h→ 0 h h = f ′ ( x ) g ( x) + f ( x ) g ′ ( x )

Límite de una suma Se reescribe Límite del producto Se usa definición de derivada

32

REGLA DE LA CADENA Hasta ahora funciones como h( x) = x 2 + 1 no tenemos una regla para derivarla: no es una suma, producto o cociente. La regla de la cadena es usada para derivar funciones compuesta. La función h( x) = x 2 + 1 la interpretamos como una composición. Si definimos f ( x) =

x y g ( x) = x 2 + 1 , entonces

h( x) = ( f ° g )( x) = f ( g ( x)) Regla de la cadena Teorema.- Sean f y g dos funciones tales que f es diferenciable en g (x) y g es diferenciable en x , entonces h = ( f ° g ) es diferenciable en x y

h ′ ( x) = f ′ ( g ( x)) ⋅ g ′ ( x)

La forma de decir la regla de la cadena en la práctica es: La derivada de una composición es la derivada de la función externa, f, evaluada en la interna por la derivada de la interna.

En la notación de Leibniz si consideramos u = g (x) , la regla de la cadena queda expresada como dy dy du = ⋅ dx du dx Ejemplo 1.- Encuentre la derivada de h( x) = ( 2 x 3 + 1) 33 Solución: Se define la función interna como u = g ( x) = 2 x 3 + 1 y la externa como f (u ) = u 33 . Entonces h( x) = ( f ° g )( x) y du = g ′ ( x) = 6 x 2 y f ′ (u ) = 33u 32 dx Aplicando la regla de la cadena se obtiene h ′ ( x) = f ′ ( g ( x)) ⋅ g ′ ( x) = f ′ ( 2 x 3 + 1) ⋅ 6 x 2 = 33(2 x 3 + 1) 32 ⋅ 6 x 2 = 198 x 2 ( x 3 + 1) 32 Funciones como la del ejemplo anterior o como h( x) = x 2 + 1 son de la forma ( g ( x)) r , en este último caso con r = 1 / 2 . Para derivar esta forma podemos usar directamente la siguiente:

REGLA DE LA POTENCIA GENERALIZADA: ′ ( g ( x )) r = r ( g ( x)) r − 1 g ′ ( x)

(

)

33 Demostración: Si definimos la externa como h( x) = ( f ° g )( x) y du = g ′ (x) y dx Aplicando la regla de la cadena se obtiene

f (u ) = u r y simplemente u = g (x) . Entonces f ′ (u ) = ru r − 1

h ′ ( x) = f ′ ( g ( x)) ⋅ g ′ ( x) = r ( g ( x) ) r − 1 ⋅ g ′ ( x ) Ejemplo 2.- Encuentre la derivada de las siguientes funciones: a) h( x) =

x 2 + 1 b) f ( x) =

2 x + 3x 2

Solución: a) Reescribimos h( x) = ( x 2 + 1)1 / 2 y aplicamos la regla de la cadena generalizada con r = 1 / 2 : h ′ ( x) = r (( g ( x)) r − 1 ⋅ g ′ ( x) =

1

−1 1 2 ( x + 1) 2 ( 2 x) 2

x

h′ ( x) =

x2 + 1 c) Reescribimos

(

f ′ ( x) = 2( x 2 + 3x)

(

2

f ( x) = 2( x 2 + 3 x) − 1 −1 ′

= 2 ( x + 3 x)

y

aplicamos

la

regla

del

factor

constante

)

−1

)

A la parte que queda por derivar se le aplica la regla de la potencia generalizada = 2r ( g ( x)) r − 1 ⋅ g ′ ( x) con r = − 1 y g ( x) = ( x 2 + 3 x)

′

= 2( − 1)( x 2 + 3x) − 2 ( x 2 + 3x) ′ = 2( − 1)( x 2 + 3x) − 2 (2 x + 3) = −

2(2 x + 3) ( x 2 + 3 x) 2

2 como f ( x) = 2( x 2 + 3 x) − 1 . Este x + 3x procedimiento resulta útil si el numerador es numérico, pero en el caso que contenga la variable es preferible considerarlo como un cociente. Comentario. En este último ejemplo se reescribió f ( x) =

2

Ejemplo 3.- Encuentre la derivada de las siguientes funciones 3  2x + 3  4 2 2 a) y =   ; b) f ( x) = (3x + 5) ( x + 2) . 3 x + 5   Solución: 3  2x + 3  r a) La función y =   es de la forma ( g ( x)) . Así que aplicamos la regla de la potencia  3x + 5  generalizada. y ′ = r ( g ( x) r − 1 ⋅ g ′ ( x) 2

 2x + 3   2x + 3  y ′ = 3  ⋅   3x + 5   3x + 5 

′

La parte que queda por derivar es un cociente

34 2

 2 x + 3  2(3x + 5) − 3(2 x + 3) y ′ = 3  ⋅ (3x + 5) 2  3x + 5  2

 2 x + 3  6 x + 10 − 6 x − 9 y ′ = 3  ⋅ (3x + 5) 2  3x + 5  2

1  2x + 3  y ′ = 3  ⋅ 3 x + 5   (3x + 5) 2 y′ =

Aplicando propiedades de exponentes podemos expresar la derivada como

3( 2 x + 3) 2 (3x + 5) 4

c) La función f ( x) = (3x + 5) 4 ( x 2 + 2) 2 es un producto, para derivar aplicamos entonces la regla del producto: ′ ′ f ′ ( x) = (3x + 5) 4 ( x 2 + 2) 2 + (3x + 5) 4 ( x 2 + 2) 2 .

(

)

(

)

Las partes a derivar tienen la forma ( g ( x)) r , así que usamos la regla de la potencia generalizada: f ′ ( x) = 4(3 x + 5) 3 (3 x + 5)′ ( x 2 + 2) 2 + (3x + 5) 4 2( x 2 + 2)( x 2 + 2) ′ = 4(3x + 5) 3 3( x 2 + 2) 2 + (3x + 5) 4 2( x 2 + 2) 2 x . En vez de desarrollar las potencias, multiplicar y agrupar términos semejantes, se va a presentar el resultado factorizado, esto será conveniente posteriormente para conseguir las raíces de la primera derivada. Para factorizar sacamos factor común: 4(3x + 5) 3 ( x 2 + 2) . Así

(

f ′ ( x) = 4(3x + 5) 3 ( x 2 + 2) 3( x 2 + 2) + x(3x + 5)

(

= 4(3x + 5) 3 ( x 2 + 2) 3x 2 + 6 + 3x 2 + 5 x

(

= 4(3x + 5) 3 ( x 2 + 2) 6 x 2 + 5 x + 6

)

)

Se distribuye el 3 y x Se agrupan términos semejantes

)

Ejercicio de desarrollo Encuentre la derivada de las siguientes funciones: (3x 2 + 1) 4 4 3 a) y = (3 x 2 + 1) x + 1 ; b) f ( x) = ; c) f ( x) = ( 2 x − 1) 3x + 1

(

)

La regla de la cadena también es usada en la siguiente forma: En ocasiones tenemos una variable y que depende de una variable u y u a su vez es función de la variable x. Es claro que y es una función de x al realizar la composición. Se quiere conseguir dy sin realizar la composición de funciones, sino a través de la regla de la cadena: dx dy dy du = ⋅ . dx du dx

35 Ejemplo 4.- Sean y =

3u + 1 y u = x 2 + x . Encontrar

dy dx

Solución: Usando la regla de la cadena tenemos: dy dy du = ⋅ dx du dx dy 2 = ⋅ (2 x + 1) . dx 2 2u + 1

Sustituyen u por x 2 + x obtenemos finalmente

dy 2 = ⋅ (2 x + 1) 2 dx 2 2( x + x) + 1

APLICACION Ejemplo 1.- Un estudio ambiental revela que el nivel medio de monóxido de carbono será aproximadamente de c( p ) = 0.5 p + 17 partes por millón cuando la población es de p miles de habitantes. Se ha modelado que la población de la comunidad será de p (t ) = 100 −

3 , donde t es t+ 2

medido en años ¿A qué razón cambiará el nivel de monóxido de carbono respecto al tiempo dentro de 4 años? Solución: Se pide

dc en t=4. Calculamos la derivada usando la regla de la cadena para este caso, dt

observe que c es función de p y p de t, así: dc dc dp = ⋅ dt dp dt dc 0.5 3 = ⋅ . dt 2 0.5 p + 17 (t + 2) 2 Calculamos

dc dt

usando la formula anterior. Para ello debemos determinar el valor de p cuando t=4 t= 4

3 1 = 100 − = 99,5 . 4+ 2 2 De esta manera p ( 4) = 100 −

dc dt

t= 4

dc dt

t= 4

=

0.5

3 2 2 0.5(99.5) + 17 ( 4 + 2) ⋅

= 0.00255 partes por millón por año.

Ejercicio de desarrollo.- Para cada una de las siguientes funciones indique los pasos que usted haría para conseguir la derivada. Ejemplo: f ( x) = 2 x 2 + 1 . Se reescribe la raíz. El 2 sale afuera de la derivación por la regla del factor constante. Se aplica la regla de la potencia generalizada ( x 2 + 1)1 / 2 . La derivada interna se deriva como una suma a) f ( x ) = x + 5 x + x 2 ; b) f ( z ) = 5 4 − 5 1 − z ; c) h( x) = x ( x 2 − 1) 2 − 2 ( x − 1) 2 ;

36 3x

d) f ( x ) = g) y =

x

3

2( x + 3) 5

+

1 3 3

h) h( x) =

;

( 2 x − 1) 2 ; 5x + 1

j) y =

x

e) g ( x) =

;

k) g (t ) =

( 2 x − 1)5 (1 − x )5

5  2t − 1  i) f (t ) =   ;

;

 1− t 

(t + 3) 2 ; 2t + 1

3

( 2 x − 1) 3 ( x + 3) ;

f) f ( x) =

;

x+ 2

l) y =

(2 x − 1)

2

2

−

5x + 1

x− 1

+ 2

(3x − 1) 4 5

EJERCICIOS 1) Derive las siguientes funciones 1.1) y = (4 x − 1) 6 ; 1.2) f ( x) = (4 − x 2 ) 4 ; 1.4) y = 4(1 + 3 x − 3 x 2 ) 2 ; 1.7) f ( x) =

1 ; (3 x − 1)

1.10) f ( x ) = 5 2 x 2 + 3 ; f ( z) =

2z +

(3 x 3 + 1) 3 ; 4

1.5) y =

2 ; (3 x + 1) 2

1.9) f (t ) =

1.11) y =

(1 − x) 2 ;

1.12) f (t ) =

3

2

5

4x −

1 5

4x

1.16) f ( x) = 3 x 2 (3 − x ) 5 ;

1.17) f (t ) = t 2 t + 3 ;

1.19) y =

1.20) f ( x) =

1.22) y =

( x + 3)(1 − x ) ;

x2 − 1 ; (3x + 1) 2

1.23) f ( x) =

(3 x − 1) 3 ; (1 − 5 x ) 3 3

t+ 3; 2 5 (3t − 1) 3

; 1.13)

1.15) f ( x) = x( x − 1) 3 ; 1.18) f ( x ) = ( 4 x − 1) 3 (5 x + 3) 2 ; 3

 3x − 1   ;  1 − 5x 

1.21) f ( x) =  3

(3x − 1) 2 ; (2 − x ) 5

1.26) f ( x ) = 5 x 3 − 2 x + 2 3 − x ;

3

x − 1  x − 1 −   ; 4− x  4 

;

3x − 1 ; 1.24) f ( x) = 2− x

1.25) f ( x) = 5( x 3 − 2 x + 2) x + 3 ; 1.27) y =

1.6) y = ( 4 x 2 + 1) − 4 ;

1.8) f ( x) =

1.14) f ( x) =

2z ;

1.3) f ( x) = (3 x − x 2 ) 4 ;

1.28) f ( z ) =

z2 + 1 1− z

;

1.29) h(t ) =

2) Encuentre la ecuación de la recta tangente a la gráfica de f ( x) =

( 2t + 1)( t + 2) + ( x 2 − 5) 3

2

cuando x =3

Respuestas: 1.1) 24(4 x − 1) 5 ; 1.2) − 8 x(4 − x 2 ) 3 ; 1.3) 4(3 − 2 x)(3x − x 2 ) 3 ;

3 27 x 2 (3 x 3 + 1) 2 ; 1.6) − 32 x(4 x 2 + 1) − 5 ; 1.7) − ; (3x − 1) 2 4 9 10 x 1 − 2 1.8) − 24 x (3x 2 + 1) − 3 ; 1.9) ; 1.10) ; 1.11) 3 ; 1.12) − ; 1.13) 2 5 (3t − 1) 5 2x + 3 2 t+ 3 3 1− x 1.4) 24(1 − 2 x)(1 + 3 x − 3 x 2 ) ; 1.5)

2 2 z

+

5

2 ; 1.14)

5

4

5 x

4

+

1 5

5 4x

1.16) 3x (3 − x ) 4 (6 − 7 x) ; 1.17)

6

; 1.15) f ( x) = ( x − 1) 2 (4 x − 1) ;

t (5t + 12) t+ 3

; 1.18) 2(4 x − 1) 2 (5 x + 3)(50 x + 13) ; 1.19) 2

1.20) −

− ( x + 1) ( x + 3)(1 − x)

2 2x + 6 6(3 x − 1) 2 − 6  3x − 1  5  2− x  3 ; 1.21) ⋅    ; 1.22) (3x + 1) 3 ; 1.23)  ; (1 − 5 x) 4 (1 − 5 x ) 2  1 − 5 x  3(2 − x) 2  3x − 1 

;

37  7 x 3 + 18 x 2 − 6 x − 10  1   ; 1.26) 15 x 2 − 2 − 5 ; 1.25) ;   33 (2 − x ) (3 x − 1) 3 − x 2 x+ 3   z+1 4t + 5 3 3( x − 1) 2 − 1.27) ; 1.28) ; 1.29) ; 2) y = 18 x − 46 2 2 3 ( z − 1) x + 1 2 ⋅ 2t 2 + 5t + 4 (4 − x ) 4 1.24)

9x + 7 8

PROBLEMAS DE ECONOMÍA 1) Se ha estimado que el consumo de gasolina en cierta ciudad dependerá de los habitantes que tenga y 50 p2 está dado por c( p) = miles. + 11 . Si el tamaño de la población se estima en p(t ) = 100 − ( t + 2) 2 2 dc 50 p = ¿A qué razón de cambiará el consumo de gasolina con respecto al tiempo? Respuesta: dt (t + 2) 3 50 donde p (t ) = 100 − (t + 2) 2 1 2) La ecuación de demanda de cierto artículo es p = 25 . Determinar la razón de cambio del precio 1+ q con respecto a la demanda. a) Calcule esta razón de cambio para q=9. b) Interprete sus resultados. 1 Respuesta: − 4 1 = 0 . Determinar 3) (Demanda marginal) La ecuación de demanda de un artículo está dada por q − p+ 2 la demanda marginal para un precio de p=1. Interprete sus resultados. (Se define como demanda 1 marginal a dq dp ) Respuesta: − 9 4) Sea C ( I ) = 1.2 I − 5 I + 4 + 6 la función de consumo de cierto país, donde I y C vienen dadas en miles de millones de UM . a) Encuentre la propensión marginal al consumo y al ahorro cuando I = 32 . b) Interprete sus resultados. Respuesta 0.783 20 + 20 x − 10 , donde q 5) La función de ingreso por la venta de cierto artículo está dada por I ( q ) = (1 + 3 x ) está dado en miles de unidades y el ingreso en miles de UM. Determine el ingreso marginal cuando el nivel de ventas es de 1000 unidades. Interprete sus resultados. Respuesta: 16.250UM PROBLEMAS EN CIENCIAS SOCIALES 1) (Demografía) Para una población de 50.000 habitantes el número de personas que se estiman vivirán más de x años está modelado por E ( x) = 5.000 100 − x . Calcule la razón de cambio de E con respecto a x cuando x=51? Respuesta: -357

38

DERIVADAS DE FUNCIONES ESPECIALES A continuación presentamos la derivada de funciones de uso frecuente.

1 x x (e ) ′ = e x

(ln x )′ =

Podemos obtener por definición la derivada del logaritmo neperiano, haciendo uso del límite notable 1/ x lim(1 + x ) = e . Tenemos entonces por definición de límite que x→ 0

 x+ h 1/ h ln 1  h d ln( x + h) − ln( x)  h  = lim ln 1 + (ln( x)) = lim   = lim ln 1 + x    h→ 0 h→ 0 = lim  h  x  h→ 0  dx h x h→ 0 h Usando continuidad de la función logaritmo tenemos que 1

x x x   1/ h     1 1/ x xh  h  h   d     h  h     ln lim 1 +    = ln lim 1 +   = ln lim 1 +  (ln(x)) =  = ln lim(1 + z ) z  h → 0   h → 0 x  x  dx     z→ 0  x    h → 0     1 1 = ln e1 / x = ln e = . x x Próximamente deduciremos la derivada de e x

Observación: La fórmula para la derivada del logaritmo es en base e, luego se dará la fórmula para cualquier base. Un comentario similar hay con respecto a la función exponencial. Ejemplo 1.- Encontrar la derivada de las siguientes funciones: a) y = 3 ln x ; b) y = xe x ; c) y = ln x Solución: a) Aplicando la regla del factor constante queda

1 3 ′ ′ y ′ = ( 3 ln x ) = 3( ln x ) = 3 ⋅ = x x b)Se aplica la regla de producto

y ′ = x ′ e x + x(e x )′ = e x + xe x Finalmente podemos expresar el resultado de la derivada en forma factorizada

y ′ = e x (1 + x ) c) Se reescribe primero y =

ln x = (ln x)1 / 2 , se aplica la regla de la potencia generalizada 1 1 1 y ′ = (ln x ) − 1 / 2 (ln x )′ = (ln x) − 1 / 2 ⋅ Reescribiendo esta última expresión obtenemos 2 2 x

y′ =

1 2 x ln x

Ejercicio de desarrollo. Encontrar la derivada de las siguientes funciones: a) y = x ln x

b) y =

ex 2

c) y =

x e− x

39 FORMAS FRECUENTES DE FUNCIONES ESPECIALES: Las funciones especiales frecuentemente vienen dadas con un argumento distinto a simplemente la variable. Esta situación la podemos escribir en cada caso como: ln g ( x) y e g ( x ) ,. Todas ellas pueden ser expresadas como una composición donde la función interna es u = g (x) . Para obtener la derivada de cada una de estas formas se usa la regla de la cadena. Las funciones externas f son respectivamente: ln• , e • . La función interna es en todos los casos: u = g (x) . Aplicando a cada caso la regla de la cadena: h ′ ( x) = f ′ ( g ( x)) ⋅ g ′ ( x) .

( ln g ( x)) ′

=

1 ⋅ g ′ ( x) ( g ( x))

(e )′ = e g ( x)

g ( x)

⋅ g ′ ( x)

Ejemplo 2.- Encontrar la derivada de las siguientes funciones: b) y = e − x ; c) y =

a) y = ln( x 2 + 1)

1 2π

2

xe − x .

Solución a) La función es de la forma ln g ( x) . Remarcamos que la función externa es ln y la interna

g ( x) = x 2 + 1 . Aplicamos entonces la regla de la cadena:

(

y ′ = ln( x 2 + 1)

)′

=

1 ⋅ ( x 2 + 1) ′ 2 x +1

=

2x x +1

No se olvide de la derivada interna

2

b) La función es de la forma e g ( x ) . La función externa es e ⋅ y la interna g ( x) = − x

( )′ = e

y′ = e − x

c) Para derivar y = 1

y′ =

2π 1

y′ =

2π 1

y′ =

2π 1

y′ = y′ =

2π e

− x2

2π

−x

(− x)′ = − e − x

1

x ⋅ e− x

2π

2

usamos primero la regla del factor constante

( x ⋅ e )′ ( e + x (e ) ′ ) (e + x(e )(− x )′ ) (e − 2 x (e ) ) − x2

− x2

− x2

− x2

− x2

− x2

2

(1 − 2 x ) 2

2

− x2

Se aplica entonces la regla del producto. 2

Ahora queda por derivar e − x que tiene la forma e g ( x ) Al derivar − x 2 y reordenar la expresión queda 2

Se saca e − x de factor común

Reescritura

40 Cuando tenemos un logaritmo de un producto, cociente o potencia podemos usar las propiedades del logaritmo para reescribir la función de tal manera que resulte más fácil y rápido de derivar. Ejemplo 3.- Encontrar la derivada de la siguiente función y = ln[(3x + 1)( x + 2) 2 ] Solución: Reescribimos la función usando primero la propiedad del producto y luego la de la potencia: y = ln(3x + 1) + ln( x + 2) 2 y = ln(3 x + 1) + 2 ln( x + 2) Esta última forma es la que derivamos, aplicando primero la derivada de la suma ′ ′ y ′ = ( ln(3x + 1) ) + ( 2 ln( x + 2) ) y′ =

1 ′ ⋅ (3x + 1)′ + 2( ln( x + 2) ) 3x + 1

y′ =

1 1 ⋅ 3+ 2 ⋅1 3x + 1 x+ 2

y′ =

3 2 + 3x + 1 x + 2

Se aplica regla de la cadena a ln(3 x + 1) y regla del factor constante al segundo término.

Ejercicio de desarrollo. Encontrar la derivada de las siguientes funciones: b) y =

a) y = ln 1 − x

x 4e 3 x

2

+1

;

 2x − 1   c) y = ln  3x x + 1 

Ejemplo 4.- Encontrar la derivada de la siguiente función: y = ln x Solución: Reescribimos la función usando exponente fraccionario y = (ln x 1 / 2 )1 / 2 . Quedó escrita de la forma ( g ( x)) r , con g ( x) = ln x1 / 2 y r=1/2. Se aplica la regla de la potencia generalizada:

y′ =

1 (ln x1 / 2 ) − 1 / 2 ⋅ (ln x 1 / 2 )′ 2

Se reescribe la expresión a derivar

y′ =

1 1 (ln x 1 / 2 ) − 1 / 2 ⋅ ( ln x )′ 2 2

Se aplica la regla del factor constante

y′ =

1 1 (ln x1 / 2 ) − 1 / 2 ⋅ (ln x )′ 2 2

y′ =

1

1 1 = 4 ln x x 4 x ln x

⋅

Ejercicio de desarrollo. Encontrar la derivada de las siguientes funciones: xe 3 x + 1 − 1 xe − 2 x a) y = ln( x( x 2 − 1)) b) y = c) y = x+ 1 e 3x

41 A continuación deduciremos la derivada de la exponencial a partir de las derivadas de logaritmos Sea g ( x) = e x , como el logaritmo es la función inversa de la exponencial tenemos que ln g ( x) = x Derivamos ambos miembros g ′ ( x) g ( x)

=1

Finalmente al despejar g ′ (x) obtenemos que g ′ ( x) = g ( x) , esto es

g ′ ( x) = e x Finalmente hemos concluido que (e x ) ′ = e x

FÓRMULAS PARA LAS DERIVADAS DE FUNCIONES LOGARÍTMICAS Y EXPONENCIALES CON BASE DISTINTA A e. Para obtener una fórmula para la derivada de y = log a g ( x ) nos basamos en la fórmula de cambio de base

log a ( g ( x)) =

ln( g ( x)) . ln(a )

Así

′ 1  ln( g ( x ))  1 1  = ( log a ( g ( x)) ) =  ⋅ (ln( g ( x ))′ = ⋅ ( g ( x)) ⋅ g ′ ( x) ln a ln a  ln(a )  ′

( log a ( g ( x ) ) ) ′

=

1 1 ⋅ g ′ ( x) ⋅ ( g ( x)) ln a

Esta fórmula es expresada en manera coloquial como sigue: La derivada de un logaritmo con base distinta a e es la derivada del logaritmo por un factor de 1 corrección. En este caso el factor de corrección es ln a Para obtener una fórmula para la derivada de y = a g ( x ) , usamos el hecho que el logaritmo es la función inversa de la exponencial: derivamos

( a ( ) )′ = e g x

ln a⋅ g ( x )

a g ( x ) = e ln a

g ( x)

. Esta la escribimos como y = e ln a⋅ g ( x ) , la cuál

Usamos la regla del factor constante

⋅ (ln a ⋅ g ( x)) ′

Finalmente usamos a g ( x ) = e ln a

= e ln a⋅ g ( x ) ⋅ ln a ⋅ g ′ ( x)

( a ( ) )′ = a g x

g ( x)

g ( x)

para obtenemos

g ′ ( x) ⋅ ln a

Esta derivada es expresada como: La derivada de una función exponencial con base distinta a e es la derivada de la exponencial por un factor de corrección. En este caso el factor de corrección es ln a

42 Ejemplo 6.- Encontrar la derivada de las siguientes funciones: a) y = log 2 ( x + 2 x) b) y = x log 2 ( x 3 + x) ; c) y = 2 x Solución: 1 1 ⋅ g ′ ( x) ⋅ a) Se derivará usando la formula ( log a ( g ( x)) ) ′ = ( g ( x)) ln a ′ y ′ = log 2 ( x + 2 x)

(

)

Recuerde que si la base es distinta a e hay un factor de corrección en la derivada

=

( x + 2x

=

 1  1  + 2  ⋅ x + 2x  2 x  ln 2

=

1

)

′ 1 x + 2x ⋅ ln 2

1

1+ 4 x 2 ln 2 x

(

x + 2x

Realizando la suma intermedia y los productos tenemos

)

b) Aplicamos la regla del producto dy d d = ( x) log 2 ( x 3 + x) + x ⋅ (log 2 ( x 3 + x)) dx dx dx = 1 ⋅ log 2 ( x 3 + x) + x ⋅ = log 2 ( x 3 + x) + x ⋅

Se usa cambio de base en el segundo logaritmo.

d ln( x 3 + x) ( ) En el segundo término aplicamos la regla del Factor Cte. dx ln 2

1 d (ln( x 3 + x)) ln 2 dx

= log 2 ( x 3 + x) +

x 1 d 3 ( x + x) 3 ln 2 ( x + x) dx

= log 2 ( x 3 + x) +

x 1 ⋅ 3 (3x 2 + 1) ln 2 ( x + x)

= log 2 ( x 3 + x) +

3x 2 + 1 ln(2)( x 2 + 1)

Alternativamente para calcular

Sacamos x de factor común en el denominador y simplificamos.

d (log 2 ( x 3 + x)) pudimos usar la fórmula dx

( log a ( g ( x))) ′

=

1 1 ⋅ g ′ ( x) ⋅ ( g ( x)) ln a

en vez de usar la fórmula de cambio de base antes de derivar.

c) Alternativa 1.- Reescribimos la función y = 2 derivamos, la cual tiene la forma e

dy d = (e dx dx

x ln 2

)=e

x ln 2

g ( x)

d ( x ln 2) dx

x

como y = e ln 2

x

= e

x ln 2

. Esta última es la que

43

x

= 2 =

d 1/ 2 (x ) dx 1 ln 2 1 / 2 2x

x ln 2

=e

2

x−1

ln 2

De una vez usamos el hecho que e

x ln 2

= 2

x

Esta forma de la derivada la reescribimos usando propiedades de exponente y multiplicación de fracciones.

ln 2

x

Alternativa 2.- Se usa la fórmula: y ′ = a g ( x ) g ′ ( x) ⋅ ln a Directamente entonces obtenemos

( )′

y′ = 2

x

= 2

x

=

( x )′ ln 2

ln 2 2 x

2

x

=

2

x−1

ln 2

x

Ejercicio de desarrollo. Encontrar la derivada de las siguientes funciones:  (1 − x) 2 x + 1  ; a) y = log  x3  

b) y = 10

−

1 x

x

APLICACIONES Ejemplo 1.- Un modelo de crecimiento de cierto país está dado por P(t ) = 25(1.03) t millones de habitantes a partir de 1999. ¿A qué razón cambiará la población con respecto al tiempo t años después? dP Solución: Debemos conseguir . La función P(t ) = 25(1.03) t tiene forma exponencial dt dP d (1.03) t . Se aplica (a x )′ = ln(a) ⋅ a g ( x ) ⋅ g ′ ( x ) , obteniendo = 25 dt dt dP = 25 ln(1.03) ⋅ (1.03) t ⋅ 1 . dt

Por tanto la población cambiará a una razón de

dP = 25 ln(1.03) ⋅ (1.03) t millones de habitantes en el dt

año t. Ejercicio de desarrollo.- Para cada una de las siguientes funciones indique los pasos que usted haría para conseguir la derivada. Considere reescribir. Ejemplo: f ( x) = 2 x ln( x 2 + 1) . El 2 sale afuera de la derivación por la regla del factor constante. Se aplica la regla del producto, quedan dos términos en uno hay que derivar ln( x 2 + 1) el cual tiene la forma del logaritmo de g(x). La derivada interna se deriva como una suma 2 a) f ( x ) = e + ln x + x 2 ; b) f ( z ) = 3e x + 1 ; c) h( x) = ln( x 2 − x) + ln 2 ;

44 d) f ( x ) =



ln x ; ln x 2



x

; e) g ( x) = ln   x+ 2

f) f ( x) = ln(e x − 1) ;

 ( x − 1)5 

g) y =

ln(3 x − 1) 1 + x; 5 e

 h) h( x) = ln 5  ;  (1 − 3x ) 

i) h( x) =

j) y =

2 ; ln(3 x − 1)

k) g (t ) =

e 2x 2 ln 3 ; − + 2 5x + 1 e x e2x − x ñ) y = ; x

(

2

2

)

m) g ( x) = ln 2 x ⋅ ⋅ 3x ; ln( x − 1)

o) y = log( x ) ;

ln x − 1 ; ln( x − 1)

2 3e x

;

2

l) y =

n) g ( x) = ( ln( x 2 + 1) ) ; 2

q) g ( x) =

p) h( x) = x ⋅ 23 x ;

2 2x + 1

EJERCICIOS 1) Encuentre la derivada de las siguientes funciones 1.1) y = ln(3 x − 4) ; 1.2) f ( x) = x ln x 2 ; 1.4) g (t ) = (4t − 1) 2 ln(3t + 5) ; 1.5) h( z ) = 

x2 

 ; 1.7) f ( x) = ln 2  x + 1

ln( z 2 + 1) ; z

1.8) f ( s) = ln 4

s4 + 1 ; s4 − 1

1.10) y = ln ( (3 x − 1)(4 x + 1) ) ;

1.11) h( x ) = ln ( x( x − 1) 3 ) ;

1.13) y =

1.14) y = ln x + ln x ;

ln( x ) − 1 ; 3

1.16) h( x ) = ln( 2 x + 1) ;

4

4

1.3) f ( x) = ln(1 − 2 x 3 ) ;

z

1.6) f ( z ) =

2

ln( z + 1)

 s 4 + 1  ; ln 4  s − 1

1.9) f ( s) =

(

1.15) y = ln(1 + ln( x ) ) ;

3

1.17) g ( x ) = ln( 2 x ) + 1 .

ex

2

− 3x

2.1) y = e 4 x − 5 ;

2.2) y = 2e 4 − 3 x ;

2.3) y =

2.4) y = e ln x − 3 ;

2.5) y = x 2 e − x ;

2.6) y =

2.7) y = ( x 3 + 1)e − 3 x ;

2.8) y = 4 x 3 + 3 x ;

ex − 1 ; e− x + 1 2.9) y = 3 x ;

2.10) y = 3 ⋅ 3 x ⋅ 3 x ;

2.11) y = 3 e ;

2.12) y =

2.13) y = (e 2 x + 1) 9 ;

2.14) y = ln(1 + e 2 x ) ;

2.15) y =

4

;

2

2 + (e 2 x ) 2 ; e − 2x 2 e

− 2x

+ 2

;

3) Encuentre la derivada de las siguientes funciones. Considere reescribir ln(1 − x ) 1 1 3.1) y = ln(1 + e 2 x ) ; 3.2) y = + 2 x ; 3.3) y = ; ln(1 + x ) e e  1 − e− x   3.4) y = ln x  ; 1 + e   2 x2 + 1 3.7) y = ln 2 ⋅ ln 3 x ;

 e− x 

; 3.5) y = ln  2   2 ln x + 1 3.8) y = e ;

3.6) y =

3.11) y = 4 x ⋅ 22 x ;

3.12) y = ln 5 (e x + 1) ;

ln x 2 ⋅ ln x 3 ;

3.9) y = ln x + 1 ⋅ ln x ;

2

3.10) y =

ex ⋅ e ex

;

)

1.12) y = ln ( 4 x − 1) 2 3 x 2 + 1 ;

2) Encuentre la derivada de las siguientes funciones

2

;

45

3.13) y = ln(e x + 1) 5 ;

( )

3.16) y = log e 3 x ; 4) Si

f ( x) = 33

x

3.14) y = 3.17) y =

ln(1 − x) 2x

2

3.15) y =

;

( );

log x 2

e x− 1 − x ; e x+ 2

3.18) y = 1 + log( x)

x2

; encuentre f ′ (4)

5) Encuentre la ecuación de la recta tangente a la curva y = x 2 e 3 x − 3 cuando x=1; 6) Cierta cantidad crece según la ley C (t ) =

e kt . Calcule la razón de cambio porcentual de C con t

respecto a t. Respuestas: 1.1)

3 3( 4t − 1) − 6x 2 ) ; 1.5) ; 1.2) 2(ln x + 1) ; 1.3) ; 1.4) (4t − 1)(8 ln(3t + 5) + 3 3x − 4 3t + 5 1 − 2x

2 2 z 2 − ( z 2 + 1) ln( z 2 + 1) ( z 2 + 1) ln( z 2 + 1) − 2 z 2 8s 3 ; 1.6) ; 1.7) ; 1.8) ; 1.9) − 2 x( x + 1) ( z 2 + 1) ln 2 ( z 2 + 1) z 2 ( z 2 + 1) s8 − 1 − 1/ 2

24 x − 1 4x − 1 12 x 2 + 27 x + 8 ; 1.10) ; 1.11) ; 1.12) ; 1.13) (3x − 1)(4 x + 1) x( x − 1) (4 x + 1)(3x 2 + 1) − 6 1 1 −3 4 4 ln 3 x 1.14) + ; 1.15) (ln( x ) + 1) x ; 1.16) ;1.17) (ln( 2 x ) + 1)2 x ; 2 (2 x + 1) ln ( 2 x + 1) 2 x ln x − 1 x x

− 4 s 3   s 4 + ln s 8 − 1   s 4 −

1    1  

2.1) 4e 4 x − 5 ;2.2) − 6e 4− 3 x ; 2.3)

2 + e x − e− x 2 x − 3 x2 − 3x e ; 2.4) 1 ; 2.5) x(2 − x)e − x ; 2.6) ; 2.7) 4 (e − x + 1) 2

3(− x 3 + x 2 − 1)e − 3 x ; 2.8) 12 x 2 + 3 x ln 3 ; 2.9) 2 ln(3) x3 x ; 2.10) 3 ⋅ ln 3 ⋅ 3 x ⋅ 3 x (1 + 2 x) ; 2.11)0; 2

2

2e 2 x 4 2e 2 x ; 2.15) ; 3.1) ; 3.2) − 2e − 2 x ; 1 + 2e 2 x 1 + e 2x 1 + e 2x (1 + x ) ln(1 + x) + ln(1 − x)(1 − x) e− x + 2 − ex 6 3.3) ; 3.4) ; 3.7) (4 x 3 + 2 x) ln 2 ⋅ ln 3 ; 2 2 x − x ; 3.5) -1: 3.6) ( x − 1)( ln(1 + x) ) (1 + e )(1 − e ) x 4 x ln x + ( x + 1) ln( x + 1) 2 5e x ln(1 + e x ) 3.8) 2ex; 3.9) ; 3.10) ( x − 1 / 2)e ( x − x + 1) / 2 ; 3.11) 4 x⋅ ⋅ ln 4 ; 3.12) ; 2 x( x + 1) 1+ e x 1 2 − 4 ln 10 ⋅ log x 5e x 3.13) ; 3.16) 3 log e ; 3.17) ; 3.18) 3 x 2 x ln 10 1 + log x x ⋅ ln 10 1+ e

2.12) 4(e 2 x + e 4 x ) ;2.13) 18e 2 x (e 2 x + 1) 8 2.14) y =

(

4)

)

37 kt ( kt − 1) ln 3 ; 5) y = 5 x − 4 ; 6) e t2 4

PROBLEMAS DE CIENCIAS SOCIALES 1) Un modelo de crecimiento de cierto país está dado por P(t ) = 30e 0.025t millones de habitantes a partir de 1999. a)¿A qué razón cambiará la población respecto al tiempo 2009? b) Calcule la razón porcentual con que cambiará la población t años después de 1999? Respuesta: a) 0.96 millones por año; b) 2.5%. 2) Un modelo de crecimiento poblacional de cierto país está dado por P (t ) = 25(1 + r ) t millones de habitantes a partir de 1999. Encuentre la razón de cambio de P con respecto a t. Respuesta: 25(1 + r ) t ln(1 + r ) 25 3) Una población crece de acuerdo al siguiente modelo logístico P(t ) = 2 + 3e − 0.04t

46

Calcule la tasa de crecimiento de la población en el momento t. Respuesta:

3e − 0.04t 2 + e − 0.04t

PROBLEMAS DE ECONOMÍA 400 el costo promedio de producir q unidades. a) Encuentre la función de costo ln(q + 4) marginal. b) Calcule el costo marginal para q=30. c) Interprete sus resultados. 400( (q + 4) ln(q + 4) − q ) Respuesta: a) C ′ (q ) = b) C ′ (30) ≈ 5.48 2 (q + 4)( ln(q + 4) ) 1) Sea

c=

2) Sea C = 25 ln(q 2 + 1) + 12 el costo total de producir q unidades de un producto. a) Encuentre la función de costo marginal. b) Encuentre el costo marginal para q=3; c) Interprete sus resultados. 50q Respuesta: a) C ′ (q ) = 2 ; b) C ′ (3) = 15 q +1 3) Suponga p =

25 representa la ecuación de la demanda de un determinado producto. Determine ln(q + 2)

a) la función de ingreso marginal; b) la función ingreso marginal para q=2; c) Interprete sus resultados. ( (q + 2) ln(q + 2) − q ) Respuestas: a) I (q ) = 25 ; b) I ′ (2) ≈ 11.52 (q + 2)( ln(q + 2) ) 2 400e (3q + 200 ) / 300 el costo promedio de producir q unidades. Encuentre la función de costo q marginal y el costo marginal para q=98. Respuestas: 4e ( 3q + 200 ) / 300 ; 20.75 4) Sea c (q) =

5) Sea p = 25e − 0.02 q la ecuación de la demanda de un determinado artículo. Determine la función de ingreso marginal y la función ingreso marginal para q=98. Interprete sus resultados. Respuesta: I´(q)=25e-0.02q(1-0.02q); I´(98)=-24e-1.96=-3.38 6) (Precio marginal) La ecuación de demanda de cierto artículo es p = 25e − 0.02 q . a) Determinar la función de precio marginal. b) Evalúe el precio marginal para un nivel de producción de 100 unidades. c) Interprete sus resultados (Recuerde que el precio marginal es dp dq ).Respuesta: a) –0.5e-0.02q 7) Una máquina se deprecia t años después de su compra a un valor dado por D(t ) = 5000e − 0.03t . Calcule la razón de cambio y la razón de cambio porcentual con respecto al tiempo. Respuesta: D(t ) = − 150e − 0.03t 8) Sea S ( I ) = 0.3I − 0.5e − 0.2 I la función de ahorro de cierto país. a) Encuentre la propensión marginal al consumo y al ahorro cuando I = 5 miles de millones. b) Interprete sus resultados. Respuesta S ′ (5) = 0.337 9) Un capital de 6000UM se deposita en un banco a una tasa anual del 8% capitalizada continuamente. Calcule la razón de cambio y la tasa de cambio porcentual con respecto al tiempo? Respuesta: 48e 0.08t 10) Un capital de 5000UM se deposita en un banco a una tasa anual del 8% capitalizada anualmente. Calcule la razón de cambio y la tasa de cambio porcentual con respecto al tiempo? 11) Por la venta de un artículo se obtiene una utilidad de 10U.M Se ha decidido hacer una campaña publicitaria a fin de aumentar las ventas. Si se invierte x UM se estima que se venderán 1000(1 − e − kx ) artículos donde k=0,001. Sea U la utilidad cuando se han invertido x U.M. en publicidad. a) Calcule

dU . b) Evalúe esta derivada cuando se han invertido 1000 U.M. en publicidad. c) Ahora evalúe dx cuando la inversión es de 3.000 U.M. d) Intérprete sus resultados.

47 VERDADERO O FALSO. Diga si las siguientes proposiciones son verdaderas o falsas. Justifique. 1.1) ( ) La derivada se interpreta como la razón de cambio momentánea de y con respecto a x 1 1.2) ( ) ( ln(2) )´= ; 1.3) ( ) f ( x) = | x − 1 | no es derivable en 0 2 

x



′

( )

x '

1.4) ( )  xe  = xe ; (e − x )'  e − x 1.5) ( ) Si f es derivable en un punto entonces es continua en ese punto 1.6) ( ) Si f es continua entonces es derivable.; 1.7) ( ) f ( x ) = x 2 / 5 es derivable en su dominio. Para las siguientes afirmaciones suponga que f y g son diferenciables 



1

g ′ ( x)

1.8) ( ) (2 f ( x ) − 3g ( x ))′ = 2 f ′ ( x ) − 3g ′ ( x ) ;

)  ´= − 1.9) ( )  ln( g ( x)  g ( x) 

1.10) ( ) ( xf ( x )) ′ = f ( x ) + xf ′ ( x ) ;

1.11) ( )

(

)

′ f ( x) =

1 2 f ′ ( x)

1.12) La ecuación de la recta tangente a la curva y = x 3 en el punto (2,8) es y − 8 = 3x 2 ( x − 2) 1.13) El Ingreso de la unidad 51 es estimado por el ingreso marginal evaluado en 50 1.14) U (21) − U ( 20) es la utilidad exacta por producir y vender la unidad 21. Respuestas:1.1)Verdadera; 1.2) Falsa, la derivada vale cero porque es una constante;1.3)Falso, no es derivable en 1; 1.4) Falsa, se debe aplicar correctamente la regla del cociente; 1.5)Verdadera; 1.6)Falsa y= |x| es continua pero no derivable en 0; 1.7)Falso, no es derivable en 0; 1.8) Verdadera, se aplica la regla de la diferencia y luego la del factor constante; 1.9)Verdadera, se reescribe y se aplica la derivada ( − ln( g ( x)))´ , no hay que olvidar la derivada interna; 1.10) Verdadero, se aplica la regla del producto; 1.11) Falsa, hay que reescribir y aplicar la regla de la potencia generalizada, queda

(

)

′ f ( x) =

f ′ ( x)

;

2 f ( x) I (51) − I (50) ≈ I ′ (50) 1.12) Falso, hay que evaluar la derivada en x =2, la pendiente es 12.1.13) Verdadera, 1 e I (51) − I (50) es el ingreso exacto de la unidad adicional a 50.1.14) Verdadera, U (21) es la utilidad por

la producción y venta de las primeras 21 unidades si se le quita la utilidad de las primeras 20 se obtiene la utilidad de la unidad 21.

Métodos de Integración Indice Introducción Cambio de Variable Integración por partes Integrales de funciones trigonométricas Sustitución Trigonométrica Fracciones parciales

Introducción. En esta sección, ya con la ayuda del Teorema Fundamental del Cálculo, desarrollaremos las principales técnicas de Integración que nos permitirán encontrar las integrales indefinidas de una clase muy amplia de funciones. En cada uno de los métodos de integración, se presentan ejemplos típicos que van desde los casos más simples, pero ilustrativos, que nos permiten llegar de manera gradual hasta los que tienen un mayor grado de dificultad.

estudiaremos los principales métodos de integración, consistiendo todos ellos en reducir la integral buscada a una integral ya conocida, como por ejemplo una de las de la tabla, ó bien reducirla a una integral más sencilla.

Regresar al índice

El Método de Cambio de Variable. Antes de ver la fórmula de cambio de variable, resolveremos algunos ejercicios sencillos que nos llevarán de manera natural a la mencionada fórmula. Tomemos la primera fórmula de la tabla de integrales del capítulo anterior:

∫

xα dx =

x α +1 +k α +1

si α ≠ −1

a partir de ésta podemos encontrar integrales como

∫x

4

dx =

5

∫

x +k , 5

x dx =

1 +1 x2

1 +1 2

+k =

3 x2

3 2

+k =

2 3 x +k 3

, etc.

Sin embargo, si la variable no aparece de manera sencilla en la función a integrar, ¿podemos afirmar que

∫

(3 x − 5) 5 (3 x − 5) dx = +k? 5 4

La respuesta es NO, pues al derivar el lado derecho no obtenemos el integrando d  (3 x − 5) 5  4   = 3(3 x − 5) dx  5  lo correcto sería

∫ o bien

3(3 x − 5) 4 dx =

(3 x − 5) 5 +k 5

∫

(3 x − 5) 4 dx =

Análogamente ¿podemos afirmar que

∫

1  (3 x − 5) 5   +k 3 5 

(cos x) 4 dx =

(cos x) 5 +k? 5

De nuevo la respuesta es NO, pues al derivar el lado derecho no obtenemos el integrando d  (cos x) 5  4   = − senx(cos x) dx  5 

lo correcto sería

∫

senx(cos x) 4 dx = −

(cos x) 5 +k 5

En el cálculo de estas dos integrales

∫

3(3 x − 5) 4 dx =

(3 x − 5) 5 +k 5

∫

senx(cos x) 4 dx = −

(cos x) 5 +k 5

como una variante de la fórmula

∫

xα dx =

x α +1 +k α +1

si α ≠ −1

advertimos que si la variable x se reemplaza por una función u(x), para que la integral se calcule sustituyendo u(x) por x, en el integrando debe aparecer u'(x) multiplicando a u(x)α, es decir

[u ( x)] α [ u ( x)] u ' ( x)dx = ∫

α +1

α +1

+k

si α ≠ −1

En general, si partimos de una integral conocida

∫ f ( x) dx = g ( x) + k y cambiamos la variable x por la función derivable u(x), tal que u'(x) es continua, obtenemos LA FORMULA DE CAMBIO DE VARIABLE

∫ f [u( x)] u' ( x)dx = g[u( x)] + k Podemos comprobar fácilmente su validez, derivando el lado derecho d [g[u ( x)] + k ] = g ' [u ( x)]u ' ( x) = f [u( x)]u' ( x) dx

este último paso utilizando el hecho de que g es una primitiva para f. Si en la fórmula anterior escribimos u = u(x) y u'(x)dx = du, la fórmula de cambio de variable nos quedaría como:

∫ f (u)du = g (u) + k En todos los ejemplos que veremos a continuación, trataremos de reducir el grado de dificultad de la integral mediante un cambio de variable, de tal manera que la integral resultante sea más fácil de integrar ó que sea una integral conocida. Para que la fórmula de cambio de variable tenga posibilidades de éxito, debemos identificar en el integrando a una función u y a u', su derivada. Ejemplo 1. Encuentre

∫

(3 x − 5) 4 dx

Solución. En este caso sencillo podemos observar que esta integral "se parece" a lo cual nos sugiere tomar el cambio de variable u = 3x-5 u = 3x-5

⇒ du = 3 dx ⇒ dx = (1/3)du

Sustituyendo en la integral,

∫

∫

(3 x − 5) 4 dx = u 4 du / 3 =

1 1 u5 (3 x − 5) 5 u5 u 4 du = ( ) + c = +c = +c 3 3 5 15 15

∫

coincidiendo con el resultado anterior. Ejemplo 2. Encuentre

∫ cos

4

x senx dx

∫ u du , 4

Solución. En este caso podemos observar que esta integral "se parece" a nos sugiere tomar el cambio de variable u = cosx

∫ u du , lo cual 4

u = cosx ⇒ du = -senx dx ⇒ senx dx = -du Sustituyendo en la integral,

∫

cos 5 x u5 (cos x) ( senx dx) = (u )(− du ) = − u du = −( ) + c = − +c 5 5

∫

4

4

∫

4

coincidiendo con el resultado anterior.

(3 ln x − 5) 4 dx x Solución. Advertimos la presencia de la función lnx y su derivada 1/x, lo cual nos sugiere tomar el cambio de variable:

Ejemplo 3. Encuentre

∫

u = lnx ⇒ du = dx/x Sustituyendo en la integral,

∫

(3 ln x − 5) 4 dx = (3u − 5) 4 du x

∫

A su vez esta integral tendría que resolverse por cambio de variable, tomando w = 3u-5, como se hizo en el ejemplo 1, obteniendo:

∫

(3 ln x − 5) 4 (3u − 5) 5 (3 ln x − 5) 5 +c = +c dx = (3u − 5) 4 du = x 15 15

∫

Sin embargo para evitar tomar dos o más cambios de variable, debemos percatarnos de que lo importante es que aparece la expresión 1/x que es la derivada de lnx, que también lo es de (3lnx-5), salvo constantes. Más precisamente, podemos tomar el cambio de variable: u = 3lnx-5 ⇒ du = 3dx/x, ò bien dx/x = du/3, y al sustituir en la integral original:

∫

(3 ln x − 5) 4 1 dx = x 3

∫

u 4 du =

1 u5 (3 ln x − 5) 5 +c = +c 3 5 15

Observación: De lo anterior podemos concluir que el cambio de variable procede cuando en el integrando aparece una función u y su derivada multiplicada por una constante. Además que la integral de la variable u sea posible resolverla.

∫ 3x

Ejemplo 4. Encuentre

6

2 − x 7 dx

Solución. En este caso aparece la función u = 2-x7 y su derivada (-7x6) multiplicada por la constante (-3/7), precisando: u = 2-x7

⇒ du = -7x6 dx

Como en la integral tenemos que sustituir 3x6 dx, du = -7x6 dx ⇒ x 6 dx =

∫ 3x

6

−3 2 − x dx = 7 7

∫

−1 −3 du ⇒ 3 x 6 dx = du 7 7

− 3 u 3/ 2 − 2 3/ 2 −2 ( )+c = u du = u +c = (2 − x 7 ) 3 / 2 + c , 7 3/ 2 7 7

así pues

∫ 3x

6

2 − x 7 dx =

−2 (2 − x 7 ) 3 + c , 7

Nótese que una vez identificado el cambio de variable u, vemos que la integral por resolver es

∫

∫

u du , es decir, resolver nuestra integral

∫ 3x

6

2 − x 7 dx se reduce a resolver

u du mediante el citado cambio de variable ó en otras palabras nuestra integral de la

variable x es similar a

∫

u du

Existen otras situaciones en que el cambio de variable no es tan evidente en términos de la función u y su derivada, por lo cual tenemos que echar la vista adelante y ver a que función fácil de integrar es similar nuestra función. Ejemplo 5. Encuentre

∫

x2 dx 1 + x6

Solución. En una primera vista no advertimos la presencia de una función u y su derivada, ya que la derivada de 1 + x6 = 6x5 y en el integrando no aparece x5 sino x2. No debemos

perder de vista que al hacer un cambio de variable es por que nuestra integral es similar ó se puede reducir a otra fácil de resolver. Si pensamos que x2 dx será el nuevo diferencial, entonces u tendría que ser x3, es decir u = x3 ⇒ du = 3x2 dx como se ve al expresar la integral de la siguiente manera: x2

∫ 1 + (x )

dx =

∫

x3

3 2

Ejemplo 6. Encuentre

∫

du 1 1 1 = arctan u + c = arctan( x 3 ) + c 2 3 3 1+ u 3

1 − 9x8

dx

Solución. En analogía al ejemplo anterior, podemos decir que esta integral se reduce a du du , ya que si tomamos el cambio de variable u2 =9x8, ó equivalentemente 1− u2

∫

u = 3x4 ⇒ du = 12x3 dx, es decir x3 dx = (1/12)du, y sustituyendo:

∫

x3 1 − 9x8

dx =

1 12

∫

du 1− u2

=

1 1 arcsen(u ) + c = arcsen(3x 4 ) + c 12 12

Podemos utilizar el método de cambio de variable para encontrar las integrales de algunas funciones conocidas Ejemplo 7. Encuentre

Solución.

∫ tan x dx

∫ tan x dx = ∫ cos x dx senx

u = cosx ⇒ du = -senx

∫

∫

senx du = − ln u + c = − ln(cos x) + c dx = − cos x u

Como -ln(cosx) = ln1 - ln(cosx) = ln(1/cosx) = ln(secx) Podemos expresar

∫ tan x dx = ln sec x + C Análogamente

∫ cot x dx = ln senx + C Ejemplo 8. Encuentre

∫9+ x dx

2

Solución. Debemos poder reducir esta integral a

∫

du mediante un cambio de variable, 1+ u2

por la similitud de las expresiones. Primeramente vemos que en el denominador la variable al cuadrado esta sumada a 1, lo cual nos sugiere factorizar el 9 para tener algo similar, es decir:

∫9+ x dx

2

=

∫

∫

1 1 dx dx = 9 1 + x 2 / 9 9 1 + ( x / 3) 2

y esto nos sugiere tomar el cambio de variable u = x/3 ⇒ du =dx/3

∫ 9 + 4x dx

2

=

∫

∫

dx du 1 1 3 1 =( ) = arctan u + c = arctan( x / 3) + c 2 2 3 3 9 1+ u 9 1 + ( x / 3)

En general podemos deducir la fórmula que engloba todo este tipo de integrales. Ejemplo 9. Encuentre

∫

dx a + x2 2

Solución. En analogía al problema anterior:

∫a

2

dx 1 = 2 2 +x a

∫ 1 + ( 1 )x dx a

2

2

y tomando el cambio de variable u =(1/a)x y por lo tanto du =(1/a)dx

∫a

2

dx 1 = 2 2 a +x

∫ 1 + ( 1 )x dx

2

1 1  x  a  du = arctan u + c = arctan  + c = 2  2 a a a  a  1+ u

a2

∫

es decir:

∫a

2

dx 1  x = arctan  + c 2 a +x a

---------- (I)

a reserva de probarlo más adelante, aceptaremos la siguiente fórmula:

∫

1 a+x dx = ln +c 2a a − x a2 − x2

--------- (II)

y probaremos lo siguiente:

∫

dx , con a ≠ 0, se reducen a las fórmulas (I) ó ax + bx + c (II) mediante cambio de variable.

Las integrales de la forma

2

El procedimiento consistirá en completar trinomio cuadrado perfecto y tomar el cambio de variable adecuado. Ejemplo 10. Encuentre

∫

dx 2 x + 12 x + 10 2

Solución. Completemos el trinomio cuadrado perfecto.

2 x 2 + 12 x + 10 = 2[x2 + 6x + 5] = 2[x2 + 6x + 9-9 +5] = 2[(x2 + 6x + 9) - 4] =2[(x+3)2 - 4] sustituimos en la integral e identificamos con la fórmula (II)

∫

∫

1 1 dx dx = = − 2 ( x + 3) 2 − 4 2 2 x 2 + 12 x + 10

∫

dx  1  1  2 + ( x + 3) = +c  −   ln 4 − ( x + 3) 2  2  4  2 − ( x + 3)

es decir

∫

dx 5+ x  1 +c =  −  ln 2 x + 12 x + 10  8  − 1 − x 2

Obsérvese que no importa cual sea el trinomio cuadrado, al completarlo nuestra integral siempre se reducirá a una de las dos fórmulas. Una vez visto lo anterior, veremos un procedimiento que nos permitirá calcular integrales de la forma

∫ Ejemplo 11. Encuentre

∫

( Ax + B) dx ax 2 + bx + c

con a ≠ 0

(5 x + 3)dx 3x 2 + 4 x + 2

Solución. Por supuesto que el tipo más sencillo de este tipo de integrales es cuando en el numerador aparece la derivada del término cuadrático del denominador.

∫

(6 x + 4)dx = ln 3 x 2 + 4 x + 2 + c 2 3x + 4 x + 2

Partiremos de esta función y modificaremos el numerador para obtener una expresión fácil de integrar

∫

(5 x + 3) dx = 3x 2 + 4 x + 2 =

5 6

∫

∫

5 6

(6 x + 4) + 3 − 20 6 3x 2 + 4 x + 2

dx =

5 6

(6 x + 4) − 13

∫ 3x

2

+ 4x + 2

dx =

( 6 x + 4) 1 dx dx − 2 2 3 3x + 4 x + 2 3x + 4 x + 2

∫

La primera de las integrales ya está resuelta y la segunda se resuelve con el procedimiento descrito en el ejemplo anterior. 3x2+4x+2 = 3[x2 + 4/3x + 2/3] = 3[(x2 + 4/3x + 4/9) + 2/3-4/9] = 3[(x +2/3)2 + 2/9]

∫

 3( x + 23 )  1 dx dx  1  3  +c = =    arctan  3 ( x + 23 ) 2 + 92 2 3x 2 + 4 x + 2  3  2   

En consecuencia :

∫

(5 x + 3)dx 5 1  3x + 2  arctan = ln 3x 2 + 4 x + 2 − +c 2 6 3 2 + 4x + 2  3 2 

∫ 3x

Regresar al índice

El método de Integración por partes Este método nos permitirá resolver integrales de funciones que pueden expresarse como un producto de una función por la derivada de otra. Más precisamente, deduciremos la fórmula de integración por partes a partir de la regla para derivar un producto de dos funciones. [f(x)g(x)]' = f '(x)g(x) + f(x)g'(x) integrando en ambos lados

∫ [f(x)g(x)] dx = ∫ f ' (x)g(x) dx + ∫ f (x)g' (x) dx '

obtenemos:

∫

∫

f ( x) g ( x) = f ' (x)g(x) dx + f ( x)g' (x) dx

y despejando la segunda integral:

∫ f (x)g' (x) dx = f ( x) g ( x) + ∫ f ' (x)g(x) dx obtenemos finalmente la FORMULA DE INTEGRACIÓN POR PARTES. A continuación veremos en algunos ejemplos como utilizar esta fórmula. Ejemplo 1. Encuentre

∫ x cos(x) dx

Solución. Con el fin de utilizar la fórmula anterior, tomaremos f(x) = x y g'(x) = cos(x), es decir el integrando xcos(x) = f(x) g'(x)

f(x) = x f '(x) = 1

g '(x) = cos(x) g(x) = sen(x)

∫ x cos( x) dx = xsen( x) − ∫ sen( x) dx = − xsen( x) + cos( x) + c Observe que también hubiéramos podido hacer la siguiente elección de f y g':

f(x) = cos(x) f '(x) = -sen(x)

g '(x) = x g(x) = x2/2

sólo que la función por integrar en el lado derecho tiene un mayor grado de dificultad para resolverse que la original.

∫

x cos( x) dx =

x2 x2 cos( x) − − sen( x) dx 2 2

∫

NOTACIÓN. Con el fin de ser congruentes con la notación utilizada en la mayoría de los libros del mercado, le llamaremos u = f(x) y v = g(x) y en consecuencia du = f '(x)dx nueva notación resolveremos los siguientes ejercicios. Ejemplo 2. Encuentre

∫ xe

x

así como du = g '(x)dx. Con esta

dx

Solución. Utilizaremos el siguiente cuadro

u=x du = dx

v = ex dv = ex dx

obsérvese que con esta notación, en vez de tomar g' (x) = ex , tomamos su diferencial dv = ekdx y análogamente con f, permitiendo que una parte del integrando sea u y el resto sea dv.

∫ xe

x

∫

dx = xe x − e x dx = xe x − e x + c

En estos primeros dos ejemplos, una adecuada elección de u y dv nos lleva en un solo paso a resolver nuestra integral reduciéndola a una integral más fácil de resolver. Existen otras situaciones, como se verá en los siguientes ejemplos, en que si bien la integral del lado derecho tiene un menor grado de dificultad, no es una integral inmediata, requiere de un nuevo proceso de integración por partes ó resolverla por cambio de variable, ó algún otro procedimiento.

Ejemplo 3. Encuentre

∫x e

2 x

dx

Solución. Utilizaremos el siguiente cuadro

u = x2 du = 2xdx

v = ex dv = ex dx

∫x e

2 x

∫

dx = x 2 e x − 2 xe x dx

la integral del lado derecho se resuelve por partes (Ejemplo 2), obteniendo:

∫x e

2 x

dx = x 2 e x − 2( xe x − e x ) + c

Observación: La elección u = ex, dv = x2dx nos lleva a una integral con un mayor grado de dificultad. Ejemplo 4. Encuentre

∫ arctan x dx

Solución. Utilizaremos el siguiente cuadro

u = arctanx dx du = 1 + x2

v=x dv = dx

∫

arctan x dx = x arctan x −

∫

x dx 1 + x2

En este caso, la integral del lado derecho se resuelve por un cambio de variable, obteniendo:

∫ 1+ x x

2

dx =

∫

1 2x 1 dx = ln(1 + x 2 ) + c 2 2 1+ x 2

y en consecuencia:

∫

arctan x dx = x arctan x −

1 ln(1 + x 2 ) + c 2

Ejemplo 5. Encuentre

∫ sen (x) dx 2

Solución. Utilizaremos el siguiente cuadro

u = senx du =cos dx

v = -cosx dv = senx dx

∫ sen ( x) dx = −senx cos x − ∫ − cos ( x) dx = −senx cos x + ∫ cos ( x) dx 2

2

2

La integral del lado derecho, al parecer tiene el mismo grado de dificultad que la integral original, incluso es de la misma naturaleza que la original, lo que nos sugiere utilizar de nuevo el método de integración por partes

u = cosx du =-sen dx

v = senx dv = cos dx

∫ cos ( x) dx = −senx cos x − ∫ − sen ( x) dx = senx cos x + ∫ sen ( x) dx 2

2

2

que al sustituirse nos da:

∫ sen ( x) dx = −senx cos x + ∫ cos ( x) dx = −senx cos x + senx cos x + ∫ sen ( x) dx 2

2

2

obteniendo la identidad

∫ sen ( x) dx = −senx cos x + senx cos x + ∫ sen ( x) dx 2

2

en la que si dejamos en el lado izquierdo las integrales, obtenemos 0 = 0, que no nos ayuda a encontrar el valor de nuestra integral. La alternativa en este caso es utilizar la identidad trigonométrica sen2x + cos2x =1 inmediatamente después de la primera integración por partes.

∫ sen ( x) dx = −senx cos x + ∫ cos ( x) dx = −senx cos x + ∫ (1 − sen x) dx 2

2

2

∫ sen ( x) dx = −senx cos x + x − ∫ sen ( x) dx . 2

2

Si bien nos vuelve a aparecer la misma integral, esta vez aparece con distinto signo, lo que nos permite despejarla, es decir si dejamos del lado izquierdo las integrales, obtendremos:

∫

2 sen 2 ( x) dx = − senx cos x + x .

O bien

∫ sen ( x) dx = 2

Ejemplo 6. Encuentre

x − senx cos x +c. 2

∫ e sen( x) dx x

Solución. Utilizaremos el siguiente cuadro

u = ex du = ex dx

v = -cosx dv = senx dx

∫ e sen( x) dx = −e x

x

∫

cos x + e x cos x

De nuevo como en el ejemplo anterior, la integral del lado derecho es de la misma naturaleza y del mismo grado de dificultad, por lo que podríamos intentar utilizar de nuevo el método de integración por partes. u = ex du = ex dx

v = senx dv = cosx dx

∫e Sustituyendo, obtenemos:

x

∫

cos x dx = e x senx − e x senx dx

∫ e senx dx = −e x

∫

∫

cos x + e x cos x = e x senx − e x cos x − e x senx

x

∫ e senx dx = e senx − e x

x

x

∫

cos x − e x senx

de donde podemos despeja a la integral

∫

2 e x senx dx = e x senx − e x cos x

y en consecuencia

∫

e x senx dx =

e x senx − e x cos x +c 2

A continuación abordaremos unos ejemplos en que, debido a la gran cantidad de posibilidades debe tenerse un criterio preciso para decidir sobre la elección de u y dv. Ejemplo 7. Encuentre

∫

2

x 3e x dx

Solución. En este tipo de funciones a integrar, hay muchas maneras de expresar al integrando como un producto: 2

2

2

2

u = x3, dv = e x dx ; u = x2, dv = x e x dx ; u = x, dv = x2 e x dx ; u = 1, dv = x3 e x dx ; 2

u = x3 e x dx , dv = dx, etc. ¿Cuál de estas opciones elegir?

Lo primero que debemos hacer es asegurarnos que en nuestra elección, dv sea una función fácil de integrar. Si examinamos con detalle las opciones, sólo la opción 2 u = x2, dv = x e x dx cumple con esto ya que dv es fácil integrar por un simple cambio de variable: v=

∫

2

xe x dx =

∫

2 1 1 2 2 xe x dx = e x + c 2 2

Así pues el cuadro para la integración por partes será:

u = x2 du = 2x dx

1 x2 e 2 2 dv = xe x dx

v=

∫

2

x 3e x dx =

Ejemplo 8. Encuentre

∫x

9

∫

2 2 1 2 x2 1 1 2 x e − xe x dx = x 2 e x − e x + c 2 2 2

6 − 3 x 5 dx

Solución. Con un criterio similar al del caso anterior, tomamos la siguiente elección:

3

u=x

−2 v= (6 − 3 x 5 ) 2 45

du = 5x4 dx

dv = x 4 6 − 3x 5 dx

5

donde v =

∫x

∫ dv =∫ x

4

∫

3

9

1

3

−1  − 1  2  − 15 x 4 (6 − 3x 5 ) 2 dx =   (6 − 3 x 5 ) 2 6 − 3x dx = 15  15  3  5

3

10 4 − 2x5 x (6 − 3x 5 ) 2 dx (6 − 3 x 5 ) 2 + 6 − 3x dx = 45 45

∫

5

3

3

− 2x5  10  − 1  = (6 − 3x 5 ) 2 +    − 15 x 4 (6 − 3x 5 ) 2 dx 45  45  15 

∫

3

5

− 2 x5  2  2  5 = (6 − 3 x 5 ) 2 −    ( 6 − 3 x ) 2 + c 135 5 45    Así pues:

∫

x 9 6 − 3 x 5 dx =

− 2 x5 45

 4  5 5 (6 − 3 x 5 ) 3 −   (6 − 3 x ) + c 675  

Regresar al índice

Integrales de funciones trigonométricas A continuación veremos algunas reglas para integrar cierto tipo de funciones trigonométricas, que posteriormente se utilizarán en el método de sustitución trigonométrica. I. Potencias de senos y cosenos

∫ sen x dx ∫ cos x dx n

n

Para resolver este tipo de integrales, consideraremos dos casos: a) Si n es impar, es decir n = 2k +1, factorizamos el integrando, por ejemplo senn x dx = sen2k+1 x dx = (sen2 x)k senx dx Utilizamos la identidad sen2x + cos2x =1 y tomamos el cambio de variable u =cosx. De manera análoga en el caso de las potencias del coseno, tomando el cambio de variable u= senx. b) Si n es par, es decir n = 2k, factorizamos el integrando, por ejemplo senn x = sen2k x = (sen2 x)k ó en el caso del coseno cosn x = cos2k x = (cos2 x)k y utilizamos las identidades trigonométricas: sen 2 x =

Ejemplo 1. Resolver Solución:

1 − cos(2 x) 2

ó

cos 2 x =

1 + cos(2 x) 2

∫ sen x dx 3

∫ sen x dx = ∫ sen x senx dx = ∫ (1 − cos 3

2

2

x ) senx dx

sea u = cosx, entonces du = -senx, y al sustituir en la integral obtenemos:

∫

sen 3 x dx =

∫

∫

∫ cos x dx 5

Ejemplo 2. Resolver Solución:

∫

u3 cos 3 x −u +c = − cos x + c 3 3

(1 − cos 2 x) senx dx = − (1 − u 2 ) du =

cos 5 x dx =

∫

2

(cos 2 x) cos x dx =

∫

2

(1 − sen 2 x) cos x dx

sea u = senx, entonces du = cosx, y al sustituir en la integral obtenemos:

∫

2

∫

cos 5 x dx = (1 − u 2 ) du =

Ejemplo 3. Resolver Solución:

∫ sen x dx = ∫ 4

=

∫

(1 − 2u 2 + u 4 )du = u −

2u 3 u 5 2 sen 3 x sen 5 x + + c = senx − + +c 3 5 3 5

∫ sen x dx 4

1 − cos( 2 x) 1 ( sen x) dx = ( ) dx = (1 − 2 cos(2 x) + cos 2 ( 2 x )) dx 2 4 2

∫

2

∫

2

∫

∫

∫

1 1 1 dx − cos 2 ( 2 x ) dx cos( 2 x) dx + 4 4 2

∫ sen

II. Productos de potencias de senos y cosenos

m

x cos n x dx .

a) Si m y n son pares, utilizaremos las identidades: sen 2 x =

1 − cos 2 x 2

y

cos 2 x =

b) Si m ó n es impar, utilizaremos la identidad

II. Productos de potencias de tangentes y secantes

1 + cos 2 x 2

sen2x + cos2x = 1

∫ tan

m

x sec n x dx .

a) Si n es par, utilizamos la identidad: sec2x = 1 + tan2x.

b) Si m es impar, utilizamos la identidad: tan2x = sec2x- 1.

c) Si n es impar y m par usamos algún otro método como por ejemplo integración por partes. Regresar al índice

El Método de Sustitución Trigonométrica Este método, el cual es un caso especial de cambio de variable, nos permitirá integrar cierto tipo de funciones algebraicas cuyas integrales indefinidas son funciones trigonométricas, como por ejemplo nuestra conocida fórmula:

∫

1 1− x2

dx = arcsenx + c

la cual "resolveremos" con el fin de motivar el uso del método. Observe que si tomamos el cambio de variable x = senθ

donde -π/2 < θ < π/2 pues -1 < x < 1

y en consecuencia dx = cosθ dθ y 1 − x 2 = 1 − sen 2θ = cos 2 θ = cos θ = cos θ pues cosθ > 0 en el intervalo -π/2 0 en el intervalo (-π/2 , π/2) También del cambio de variable obtenemos el valor de

θ = arcsenx, pues la función inversa de f(x) = senx se encuentra definida precisamente en el intervalo (-a,a) y con valores en (-π/2, π/2).

Ejemplo 1. Encuentre el área del círculo de radio 2. Solución. La ecuación de la circunferencia de radio 2 y centro en le origen es:

x2 + y2 = 4 cuya gráfica es:

-2

2

Evidentemente esta gráfica no corresponde a una función, pero podemos restringirnos al intervalo [0, 2], calcular el área bajo la grafica y multiplicarla por 4 para obtener el área deseada.

La función de la figura la obtenemos despejando a y en términos de x, en la ecuación de la circunferencia: y = 4 − x2 Así pues el área buscada será: A=4

∫

2

4 − x 2 dx

0

Primeramente encontraremos

∫

4 − x 2 dx

En esta integral, tomamos el cambio de variable trigonométrico x = 2senθ

por lo cual

dx = 2cosθ dθ y

4 − x 2 = 2 cos θ .

sustituyendo en la integral original, en términos de la nueva variable θ, e integrando, obtenemos:

∫

∫

∫

4 4 − x 2 dx = (2 cosθ )(2 cosθ ) dθ = 4 cos 2 θ dθ = (θ + senθ cosθ ) + c 2

Del cambio de variable x = 2senθ obtenemos que senθ = x/2, es decir, θ = arcsen(x/2). Asimismo del cambio de variable, podemos construir el triángulo: 2

x

θ

4 − x2

En este caso particular senθ = x/2 y cosθ =

4 − x2 . 2

Así pues la integral resuelta en términos de la variable θ, la expresamos en términos de la variable original, x.

∫

4 x 4 − x2 (θ + senθ cos θ ) + c = 2(arcsenθ + )+c 2 4

4 − x 2 dx =

∫

4 − x 2 dx = 2arcsenθ +

x 4 − x2 +c 2

Calculemos ahora la integral definida

∫

2

4 − x 2 dx = 2arcsen(1) +

0

2 4 − 22 0 4 − 02 − 2arcsen(0) + = 2arcsen1 = 2(π / 2) = π 2 2

y finalmente el área será: A=4

∫

2

4 − x 2 dx = 4π

0

Ejemplo 2. Encuentre

∫x

dx 9 − x2

Solución. Tomemos el cambio de variable trigonométrico:

x = 3senθ

por lo cual

dx = 3cosθ dθ y

9 − x 2 = 3 cos θ .

sustituyendo en la integral original, en términos de la nueva variable θ, e integrando, obtenemos:

∫x

dx 9 − x2

=

∫

3 cosθ 1 1 1 1 dθ = dθ = cscθdθ = ln cscθ − cot θ + c (3senθ )(3 cosθ ) 3 senθ 3 3

∫

∫

Del cambio de variable x = 3senθ obtenemos que senθ = x/3, y , podemos construir el triángulo: 3 θ

9 − x2

x

A partir del cual podemos encontrar cualquier función trigonométrica de θ. 9 − x2 . 3

En este caso particular cscθ = 3/x y cotθ =

Así pues la integral resuelta en términos de la variable θ, la expresamos en términos de la variable original, x.

∫

1 1 3 9 − x2 = ln csc θ − cot θ + c = ln − +c 3 x x x 9 − x2 3 dx

∫ Ejemplo 3. Encuentre

∫

1 3 9 − x2 = ln − +c x x 9 − x2 3 x dx

x dx 16 − x 2

Solución. Tomemos el cambio de variable trigonométrico:

x = 4senθ

por lo cual

dx = 4cosθ dθ y

16 − x 2 = 4 cos θ .

sustituyendo en la integral original, en términos de la nueva variable θ, e integrando, obtenemos:

∫

x dx 16 − x 2

=

∫

(4senθ )(4 cosθ ) dθ = 4 senθ dθ = − 4 cosθ + c (4 cosθ )

∫

Del cambio de variable x = 4senθ obtenemos que senθ = x/4, y , podemos construir el triángulo:

4 θ

16 − x 2

x

Y a partir de él calcular cosθ =

16 − x 2 . 4

Así pues la integral resuelta en términos de la variable θ , la expresamos en términos de la variable original, x.

∫

 16 − x 2 = − 4 cos θ + c = −4  4 16 − x 2 

x dx

2   + c = 16 − x + c  4 

Observación: Esta integral puede resolverse también con un sencillo cambio de variable algebraico u = 16 - x2. Compruebe este resultado como ejercicio. Ejemplo 4. Encuentre

∫

x 3 dx 4 − 9x2

Solución. Nótese que para verlo como una integral del primer caso, debemos hacer un cambio de variable ó sencillamente factorizar el 9 en el radical: 4 − 9 x 2 = 9( 4 / 9 − x 2 ) = 3 4 / 9 − x 2 .

A continuación tomamos el cambio de variable: x=

2 senθ 3

por lo cual

2 dx = cosθ dθ 3

y

4 / 9 − x2 =

2 cos θ . 3

sustituyendo en la integral original, obtenemos:

∫

2 2 ( senθ ) 3 ( cosθ ) x dx 1 3 8 8 1  3 = dθ = sen 3θ dθ =  cos 3 θ − cosθ  + c 2 2 3 81 81  3  4 − 9x ( cosθ ) 3 3

∫

Del cambio de variable x =

∫

2 3x senθ , obtenemos que senθ = , y podemos construir el 2 3

triángulo: 2 θ

4 − 9x 2

3x

Y a partir de él, calcular cosθ =

4 − 9x2 . 2

Finalmente:

∫

8 1 8  4 − 9 x 2  3 =  cos θ − cos θ  + c = 243  2  4 − 9 x 2 81  3 x 3 dx

3

2    − 8  4 − 9x  81  2  

 +c  

Segundo caso.

Si en el integrando aparece un radical de la forma variable

a 2 + x 2 tomamos el cambio de

x = a tanθ, con a > 0. En este tipo de radicales la variación de x es en toda la recta real, razón por la cual se toma a la tangente, la cual varía tiene esta misma variación en el intervalo (-π/2 , π/2) En este segundo caso la expresión del radical en términos de θ será: a 2 + x 2 = a 2 + a 2 tan 2 θ = a 2 (1 + tan 2 θ ) = a sec 2 θ = a sec θ = a sec θ y al igual que en el caso anterior como cosθ > 0 en el intervalo (-π/2 , π/2), también lo será secθ. También del cambio de variable obtenemos el valor de

θ = arctanx. Pues la inversa de la función f(x) = tanx se encuentra definida en todos los reales y con valores en (-π/2 , π/2)

Ejemplo 5. Encuentre

∫

2 + x 2 dx

Solución. Tomamos el cambio de variable:

x = 2 tan θ por lo cual dx = 2 sec 2 θ dθ sustituyendo en la integral original, obtenemos:

y

2 + x 2 = 2 sec θ .

∫

∫

∫

2 + x 2 dx = ( 2 secθ )( 2 sec 2 θ )dθ = 2 sec 3 θ dθ = 2(secθ tan θ + ln secθ + tan θ + c

Del cambio de variable x = 2 tan θ ,

obtenemos que tanθ =

x , y podemos construir el 2

triángulo: 2 + x2

x

θ

2 2 + x2 2

Y a partir de él calcular secθ =

y

tan θ =

x , que al sustituir en la integral 2

obtenemos:

∫

 x 2 + x2 2 + x dx == 2(sec θ tan θ + ln sec θ + tan θ ) + c = 2  2  2

2    + 2 ln x + 2 + x   2  

 +c  

En general el método de sustitución trigonométrica se utiliza cuando aparece un radical de las formas señaladas en los casos, lo cual no significa que debe aparecer solo (elevado a la potencia 1). En el siguiente ejemplo calcularemos una integral en la que el radical aparece elevado al cubo. Ejemplo 6. Encuentre

∫

dx (1 + x 2 ) 3

Solución. Tomamos el cambio de variable: x = tan θ por lo cual dx = sec 2 θ dθ sustituyendo en la integral original, obtenemos:

∫

dx (1 + x 2 ) 3

=

∫

y

(1 + x )

2 3

=

( 1 + x ) = sec θ .

sec 2 θ dθ = cosθ dθ = senθ + c sec 3 θ

∫

Del cambio de variable x = tanθ , podemos construir el triángulo:

1+ x2

x

2

3

3

θ 1

x

a partir del cual calculamos senθ =

∫

1 + x2

dx (1 + x )

2 3

.

x

= senθ + c =

1 + x2

+c

A continuación encontraremos la integral de una función en la que no aparece explícitamente el radical. Ejemplo 7. Encuentre

∫ (1 + x )

2 −2

dx

Solución. Obsérvese que el integrando lo podemos expresar como

(1 + x 2 ) −2 =

1 = (1 + x 2 ) 2

1

( 1+ x ) 2

Tomamos el cambio de variable: x = tan θ

dx = sec 2 θ dθ

por lo cual

4

( 1 + x ) = sec θ . 2

y

4

4

sustituyendo en la integral original, obtenemos:

∫ (1 + x )

2 −2

dx =

∫

dx (1 + x )

2 4

=

∫

sec 2 θ dθ sec θ 4

∫

= cos 2 θ dθ =

Del cambio de variable x = tanθ , construimos el triángulo: x

1+ x2 θ 1

a partir del cual calculamos senθ = Obteniendo finalmente:

x 1+ x

2

y cosθ =

1 1 + x2

.

1 (θ + senθ cos θ) + c 2

∫

(1 + x 2 ) −2 dx =

1 1 x (θ + senθ cos θ ) + c = (arctan x + )+c 2 2 1 + x2

Tercer caso.

Si en el integrando aparece un radical de la forma variable x = a secθ, con a > 0.

x 2 − a 2 tomamos el cambio de

En este tipo de radicales la variación de x es en (-∞, -a)∪(a, ∞), razón por la cual se toma x = asecθ, la cual tiene esta misma variación en (0, π/2) ∪( π/2, π), justamente donde la función secante tiene inversa. En este tercer caso la expresión del radical en términos de θ será: x 2 − a 2 = a 2 sec 2 θ − a 2 = a 2 (sec 2 θ − 1) = a tan 2 θ = a tan θ solamente que en este dominio, la tangente toma valores positivos y negativos, por lo que no podemos quitar impunemente el valor absoluto. Para resolver este conflicto, asociaremos las variaciones de x y de θ, de la siguiente manera: x > k ⇔ 0 < θ < π/2 x < -a ⇔ π < θ < 3π/2 siendo la función tangente, positiva en estos intervalos para poder tomar x 2 − a 2 = a tan θ tomaremos el valor de θ de la siguiente manera:  x θ = arc sec  si x > a a  x θ = 2π − arc sec  si x < − a a

Como ejercicio, encuentre

∫

dx

.

x2 − 9

Regresar al índice

El Método de las Fracciones Parciales Este método nos permitirá polinomios)

integrar cierta clase de funciones racionales (cociente de

A manera de ilustración consideremos la siguiente integral: .

∫

x2 + x + 3 dx. x−2

Obsérvese que difícilmente podríamos abordarla con alguno de los métodos que disponemos. Procederemos efectuando la división de los polinomios:

x+3 x-2

2

x +x+3 -x2 + 2x 3x + 3 -3x + 6 9

Posteriormente aplicamos el algoritmo de la división y obtenemos: x2 + x + 3 = (x - 2 ) ( x + 3 ) + 9 Para obtener en el lado izquierdo de la igualdad la función que queremos integrar, dividimos en ambos lados entre ( x - 2 ):

9 x2 + x + 3 = ( x + 3) + x−2 x−2

descomponiendo de esta manera nuestra fracción "complicada" en una suma de fracciones "sencillas" a las que llamaremos fracciones parciales, las cuales son fáciles de integrar.

∫

x2 + x + 3 dx = ( x + 3) dx + x−2

∫

∫

9 x2 + 3 x + 9 ln x − 2 + c dx = x−2 2

P( x) en el que el grado de P(x) Q( x) es mayor o igual al grado de Q(x), procederemos como en el caso anterior, aplicando el algoritmo de la división En general si queremos integrar un cociente de polinomios

q(x) Q(x)

P(x) r(x)

Donde r(x) = 0 ó grad r(x) < grad Q(x) P(x) = Q(x) q(x) + r(x) Dividiendo entre Q(x), obtenemos: P( x) r ( x) = q ( x) + Q( x) Q( x) en donde la integral buscada,

∫ Q( x) dx = ∫ q( x) dx + ∫ Q( x) dx P( x)

r ( x)

con gr r ( x) < gr Q( x)

se reduce a calcular la integral de un polinomio q(x) y la integral de una función racional en la cual el numerados tiene grado menos que el denominador. A continuación describiremos varios casos de descomposición de fracciones racionales (en las cuales el polinomio del numerador tiene grado menor que el denominador) como una suma de fracciones parciales las cuales son fáciles de integrar.

Primer caso.

[Q(x) tiene todas sus raíces reales y distintas] Cuando la factorización del polinomio Q(x) es en factores lineales y distintos, es decir:

Q(x) = (x - a1) (x - a2) (x - a3)... (x - an), hacemos la siguiente descomposición: A3 An A1 A2 P ( x) = + + + ... + Q( x) x − a1 x − a 2 x − a3 x − an donde A1, A2, A3,... An son constantes reales. Nótese que una vez efectuada la descomposición, la integración es inmediata pues: Ak dx = ln x − a k + c x − ak

∫ y por lo tanto:

∫

P ( x) dx = Q( x)

∫

A1 dx + x − a1

∫ Q( x) dx = ln x − a P ( x)

1

Ejemplo 1. Calcular

∫x

2

∫

A2 dx + x − a2

∫

A3 dx + ... + x − a3

∫

An dx x − an

+ ln x − a 2 + ln x − a3 + ... + ln x − a n + c

dx −16

Solución: En este ejemplo Q(x) = x2 -16 = (x-4) (x+4).

La descomposición en fracciones parciales sería: 1 A B = + , x − 16 x + 4 x − 4 2

en la que bastará determinar las dos constantes A y B para poder encontrar nuestra integral. Procederemos a la determinación de las constantes, efectuando la suma del lado derecho: 1 A( x − 4) + B( x + 4) Ax − 4 A + Bx + 4 B x( A + B) + (4 B − 4 A) = = = , ( x + 4)( x − 4) ( x + 4)( x − 4) ( x + 4)( x − 4) x − 16 2

Observamos que la primera y la última fracción son iguales y tienen el mismo denominador, por lo que sus numeradores forzosamente son iguales, es decir: 1 = x(A+B) + (4B-4A) o bien 0x +1 = x(A+B) + (4B-4A) de donde obtenemos el siguiente sistema de dos ecuaciones lineales con dos incógnitas: A+B = 0 4B -4A = 1 que resolviéndolo nos queda 4A+4B = 0 4B -4A = 1 8B = 1 por lo que B = 1/8, y sustituyendo en la primera ecuación, A = -B = -1/8. Una vez determinadas nuestras constantes A y B, las sustituimos en la descomposición inicial, obteniendo: 1 A B 1/ 8 1/ 8 = + = − , x − 16 x + 4 x − 4 x + 4 x − 4 2

quedando finalmente la integración:

∫

dx = x − 16 2

∫

1/ 8 dx − x+4

∫

1/ 8 1 1 dx = ln x + 4 − ln x − 4 + c x−4 8 8

o bien , utilizando las propiedades de los logaritmos:

∫x

2

dx 1 x+4 = ln +c − 16 8 x − 4

Observación: Esta integral es un caso particular de la fórmula presentada sin demostración en el método de cambio de variable

∫

du 1 a−u = ln +c 2 2a a + u a −u 2

la cual puede ahora probarse con el método de fracciones parciales como un ejercicio. Ejemplo 2. Calcular

∫x

2

x+2 dx − 2 x − 15

Solución: En este ejemplo, Q(x) = x2 -2x - 15 = (x-5) (x+3).

La descomposición en fracciones parciales sería: A B x+2 , = + x − 2 x − 15 x − 5 x + 3 2

y siguiendo el procedimiento del ejemplo anterior x+2 A B A( x + 3) + B( x − 5) x( A + B) + (3 A − 5B) = + = = , ( x − 5)( x + 3) ( x − 5)( x + 3) x − 2 x − 15 x − 5 x + 3 2

igualando coeficientes, obtenemos el sistema: A+B=1 3A -5B = 2 que al resolverlo nos da: 5A + 5B = 5 3A -5B = 2 8A = 7 obteniendo el valor de A = 7/8. Para encontrar B, la despejamos en la primera ecuación B = 1 - A = 1 - 7/8 = 1/8 Así pues, la descomposición en fracciones parciales es: 7 / 8 1/ 8 x+2 , = + x − 2 x − 15 x − 5 x + 3 2

y nuestra integral:

∫

x+2 dx = x − 2 x − 15 2

∫

7/8 dx + x−5

∫

1/ 8 7 1 dx = ln x − 5 + ln x + 3 + c x+3 8 8

Observación: En cada uno de los casos de este método se afirma que se puede dar una descomposición en fracciones parciales, lo cual es un resultado del álgebra y que por lo tanto debería probarse algebraicamente, ya que podría surgir la duda de que en una de estas descomposiciones se produjera un sistema de ecuaciones sin solución. No daremos aquí la demostración pero veremos que por lo menos en el primer caso siempre será posible encontrar las constantes, es decir los sistemas resultantes si tendrán solución.

Otro método para determinar las constantes: Tratemos de "despejar" la constante A de la descomposición deseada:

Multiplicamos en ambos lados de la ecuación por (x-5) x+2 A B = + ( x − 5)( x + 3) x − 5 x + 3 obteniendo: x+2 B ( x − 5) = A+ x+3 x+3

despejamos a la constante A A=

x + 2 B ( x − 5) − x+3 x+3

evaluamos en x = 5 y obtenemos A =7/8

Obsérvese que estos pasos para determinar A se pueden comprimir en uno solo: Determinando las constantes por otro método: De la expresión a descomponer en fracciones parciales, se elimina del denominador el factor lineal correspondiente a esta constante y finalmente se evalúa en el punto donde este factor eliminado se anula.

Es decir A =

x+2 evaluado en x = 5 , resultando A = 7/8. x+3

Similarmente para obtener el valor de B, multiplicamos en ambos lados de la ecuación original por (x+3), despejamos B y evaluamos en x = -3, obteniendo: B=

x+2 evaluado en x = -3 x−5

B = 1/8. Ejemplo 3. Calcular

∫

2 x 2 − 3x + 1 dx x 3 − 6x 2 + 8x

Solución: En este ejemplo, Q(x) = x3 -6x2 + 8x = x(x-4)(x-2).

La descomposición en fracciones parciales sería: 2 x 2 − 3x + 1 A B C = + + , x( x − 4)( x − 2) x x − 4 x − 2 siendo los valores de las constantes: A=

2 x 2 − 3x + 1 ( x − 4)( x − 2)

evaluado en x = 0 ⇒ A = 1/8

B=

2 x 2 − 3x + 1 x( x − 2)

evaluado en x = 4 ⇒ B = 21/8

C=

2 x 2 − 3x + 1 x( x − 4)

evaluado en x = 2

⇒ C = -3/4

Así pues

∫

2 x 2 − 3x + 1 1 dx 21 dx 3 dx = + − 3 2 8 x 8 x−4 4 x − 6 x + 8x

∫

∫

∫

dx x−2

es decir:

∫ Segundo caso.

2 x 2 − 3x + 1 1 21 3 dx = ln x + ln x − 4 − ln x − 2 + c 3 2 8 8 4 x − 6x + 8x

[Q(x) tiene todas sus raíces reales pero puede haber repetidas] Cuando la factorización del polinomio Q(x) es en factores lineales no necesariamente distintos, es decir: Q( x) = ( x − a1 ) m1 ( x − a2 ) m2 ( x − a3 ) m3 ...( x − a n ) mn

Por cada factor lineal aparecerán tantas fracciones parciales como multiplicidad tenga este factor, por ejemplo para el factor (x-ak)mk habrá mk fracciones parciales: Amk A1 A2 + + ... + ( x − a k ) ( x − ak ) 2 ( x − ak ) mk donde A1, A2, A3,... Amk son constantes reales. De nuevo como en el caso anterior la integración de las fracciones parciales es sencilla y se reduce a calcular integrales de la forma:

∫ ( x − a) dx

n

las cuales, para n > 1, se resuelven por un sencillo cambio de variable. Ejemplo 4. Calcular

∫x

3

3x + 8 dx − 4x 2 + 4x

Solución: En este ejemplo, Q(x) = x3 -4x2 + 4x = x(x - 2)2.

La descomposición en fracciones parciales sería: 3x + 8 A B C = + + 2 x x − 2 ( x − 2)2 x( x − 2) Al desarrollar e igualar los polinomios del numerador, como en los ejemplos anteriores, obtendremos las constantes de resolver un sistema de tres ecuaciones con tres incógnitas. Si observamos con detalle la igualdad anterior nos daremos cuenta que la constante B no puede determinarse por el método "corto", pero sí las otras dos, es decir del sistema de tres por tres ya habremos determinado dos de las incógnitas y de cualquiera de las ecuaciones en que aparezca B la despejamos. A=

3x + 8 evaluado en x = 0 nos da A = 2 ( x − 2) 2

C=

3x + 8 evaluado en x = 2 nos da C = 7 x

Efectuando las operaciones y factorizando x2 y x, tenemos: 3x + 8 A B C x 2 ( A + B ) + x(−4 A − 2 B + C ) + 4 A = + + = ... = x( x − 2) 2 x x − 2 ( x − 2)2 x( x − 2) 2 igualando los coeficientes de los numeradores, obtenemos el siguiente sistema de ecuaciones: A+B = 0 -4A -2 B + C = 3 4A = 8 Como sólo falta determinar la constante B, la despejamos de la primera ecuación, obteniendo B = -2. Sustituyendo e integrando: 3x + 8

∫ x( x − 2)

2

dx =

3x + 8

∫ x ( x − 2) Ejemplo 5. Calcular

∫

2

−2

∫ x dx + ∫ x − 2 dx + ∫ (x − 2) 2

dx = 2 ln x − 2 ln x − 2 −

7

2

dx

7 +c x−2

x +8 dx x 6 − 2x 4 + x 2

Solución: En este ejemplo, Q(x) = x6 -2x4 + x2 = x2(x4 -2x2 + 1) = x2(x2 -1)2 Q(x) = x2(x +1)2(x +1)2 La descomposición en fracciones parciales sería:

x+8 A B C D E F = + 2 + + + + 2 2 2 x x x + 1 ( x + 1) x − 1 ( x − 1)2 x ( x + 1) ( x − 1) 2

Por el método corto podemos fácilmente encontrar que B = 8, D = 7/4 y F = 9/4.

Para determinar el resto de las constantes tenemos que plantear el sistema de ecuaciones: x+8 A( x 5 − 2 x 3 + x) + B( x 4 − 2 x 2 + 1) + C ( x 5 − x 4 − x 3 + x 2 ) = + x 2 ( x 2 − 1) 2 x 2 ( x 2 − 1) 2

+

D( x 4 + 2 x 3 + x 2 ) + E ( x 5 + x 4 − x 3 − x 2 ) + F ( x 4 + 2 x 3 + x 2 ) x 2 ( x 2 − 1) 2

conduciéndonos al siguiente sistema de 6 ecuaciones con 6 incógnitas A+C+E=0 B-C+D+E+F=0 -2A - C + 2D - E + 2F = 0 -2B + C + D - E + F = 0 A=1 B=8 Como ya tenemos los valores A = 1, B = 8, D = 7/4 y F = 9/4, sustituyéndolos en las primeras dos ecuaciones, encontraremos los valores de C y E resolviendo el sistema: C + E = -1 -C + E = -12 cuya solución es C = 11/2 y E = -13/2. El valor de la integral, entonces será:

∫x

6

x+8 8 11 13 9 dx = ln x − + ln x + 1 − ln x − 1 − +c 4 2 x 2 2 4( x − 1) − 2x + x

Tercer caso. [Q(x) tiene raíces complejas distintas] Cuando en la factorización del polinomio Q(x) aparecen factores cuadráticos de la forma

ax2 + bx + c con b2 - 4ac < 0

a cada uno de estos factores le corresponderá una fracción parcial de la forma Ax + B ax + bx + c 2

donde A y B son constantes reales. Ejemplo 6. Calcular

∫x

3

3x + 1 dx + 2x 2 + 5x

Solución: En este ejemplo, Q(x) = x3 +2x2 + 5x = x(x2 +2x + 5)

Con b2 - 4ac = 4-20 = -16 < 0 La descomposición en fracciones parciales sería: 3x + 1 A Bx + C A( x 2 + 2 x + 5) + x( Bx + C ) = + = x( x 2 + 2 x + 5) x x 2 + 2 x + 5 x( x 2 + 2 x + 5)

el sistema a resolver: A+B=0 2A + C = 3 5A = 1 y la solución: A = 1/5, B = -1/5 y C = 13/5

∫x

3

3x + 1 1 dx = 2 5 + 2 x + 5x

∫ x −5∫ x dx

1

1 1 = ln x − 5 10

2

∫x

x − 13 1 dx = 5 + 2x + 5

∫ x −5∫

( 2 x + 2) 14 dx + 5 + 2x + 5

2

dx

∫x

1

2

1 (2 x + 2) − 13 − 1 2 dx = x 2 + 2x + 5

dx = + 2x + 5

∫

1 1 14 dx = = ln x − ln x 2 + 2 x + 5 + 5 10 5 ( x + 1) 2 + 4

=

1 1 14  1  x + 1 ln x − ln x 2 + 2 x + 5 +  arctan   + c 10 5 2 5  2 

Cuarto caso. [Q(x) tiene raíces complejas repetidas] Cuando en la factorización del polinomio Q(x) aparecen factores cuadráticos repetidos de la forma

(ax2 + bx + c)n con b2 - 4ac < 0 a cada uno de estos factores le corresponderán n fracciones parciales de la forma A1 x + B1 ax + bx + c 2

+

A2 x + B2 ( ax + bx + c) 2

2

+ ... +

An x + Bn (ax 2 + bx + c ) n

donde Ak y Bk son constantes reales para k = 1,2 ... n.

Ejemplo 7. Calcular

∫

x2 dx x 4 + 2x 2 + 1

Solución: En este ejemplo, Q(x) = x4 +2x2 + 1 = (x2 +1)2

Con b2 - 4ac < 0 La descomposición en fracciones parciales sería: x2

( x 2 + 1) 2

=

Ax + B x2 +1

+

Cx + D

( x 2 + 1) 2

=

Ax 3 + Bx 2 + Ax + B + Cx + D

planteándose el sistema de ecuaciones: A=0 B=1 A+C=0 B+D=0

Con solución A = 0, B = 1, C = 0 y D = -1 Así pues la integral

( x 2 + 1) 2

∫x

x2 4

+ 2x + 1 2

dx =

∫x

dx 2

+1

−

∫ (x

dx 2

+ 1) 2

donde la primera integral es la inversa de la tangente y la segunda se resuelve mediante el segundo caso de sustitución trigonométrica.

Regresar al índice

!

" # $

!

" %

!

&'

())*

!"

# $

% • & • ' •

(

) "

"

"

) "

!!!"# ! ""

"! " "!

&

! * +

-

.

,

/

(

! ! +

*

0 00

,

10" &

2

!

) !

3,

* +

, .

4

$

% 5

& 10 26

* + , 0 2 00 2

! .

5 " (

0 + 00 $ 2

100

+ 10

) 78

!

&

1

!

= 100

78 )

9

-(

6

*

"

5 "

!

+ 6

,/

.

=1

=

6

=6

) 78

)

0(1 ) + 00( ) + 10(6) = 100 :0 + 00 +

0 = 100

100 = 100 (

;1 )

"$

<

$

"

"

)

%

2

)

∈

!

% ;- ) ;;-

" 9

;6

) 7 8"

"

9

;

)

/ /

"

) ) /

2

" ) 6

= = """ =

(

5 )

%

8* &

" =

≠0

)

!

"

=

(

)

"""

−

+

"""

7

8

2

)

) )" (

%

0

+ 00

+ 10

0

= 100 − 00 − 10 = 0−> − 6

6

= 100

( 6

1

=

6

=6

= 0 − >( ) − (6) = 0 − 0 − ? = 1 ,

)

=1

=

6

&

=6

) )"

(

)

0−> − 5

)

) 78 8 @ " )

0

+0

+ """ + 0

=0

(

) )"

8@ "

)

0

+0

+ """ + 0

=

≠0

>

5 )A

)

!"# ! ""

)

)"

"! " "!

&

* + %

= 2

6

)

0

+

−

6

=0

""""7 8

*

) 78

7 8"

)

)

)

7 8" ,

0(1 ) +

( ) − (6) = 0 +

( ,

? ! )

0(? ) + 00( ) + 10( 0(?) + (

≠0

*

+

0 + 00 + :0 = 100

( )− ( ) = 0 + 7?

0

)=

−6 = −

+ 00

− =0

8

+ 10

) 6

= 100 ?

+

0

−

6

=0 )

"

9 )

)%

9

) 2

,

)

+

+ """ +

=

+

+ """ +

=

""""""""""""""""""""""""""""""""""""""""""""" """"""""""""""""""""""""""""""""""""""""""""" +

+ """ +

&

= """

"""

∈,

& ) ) %

9

)

=

""" =

B

+

+ """ +

=

+

+ """ +

=

""""""""""""""""""""""""""""""""""""""""""""" """"""""""""""""""""""""""""""""""""""""""""" + <

+ """ +

=

) )

+

=

+

=6

)

2

5

6" * -

/"

&

) -

%

/"

!"# !& # '( " ! ""

"! " "!

:

$

7

)8

< 7)

& , 7

)8

)8 7

)

!$ #

"!""#"

)8

"!

, -

/" )

A " $

% "

"

" '

)

" '

5

"

) )

5 " C

%

6 − $+ # =. − $ + 6# = ? − #= 1 &

7&08

&0 )

− $ + 6# = 6 − $+ # =. ? − #= 1

7% 8

&0" &

) %

%

)

%

− $ + 6# = 6 − $+ # =−

7& 8

6$ − # = &

) )

&

D6

5 ) % 0

− $ + 6# = 1 $ − : # = −1

7&68

6$ − # = $

&0 & &

&6 "

A

" ) &

)

+

+

+

+

+

%

=

+

= 7&8

&

+

&

+ ≤

+

+

+

+

≥&≤ A

&

=

&

=

&E )

&A

+

+

+

(

+

)

&

+

+

=

+

+

=

+

+(

+

+

+

&

)

=

+

&

=

+

&

= 7&E8

&

(

=

=

)

) &E

2

& )

)

(

+

&

)

+

+(

(

&

+ &

+

&

+

) +

+

+

+

)

&

)

= &

=

"""7 8 &

"""7 8

+

+

+

=

"""768

768 7 8

(

+

(

+(

+

=

< &E

(

)

&

=

+

)

&

=

+

)

&

) 7 E8"

(

!

)

)

) 7 E8A

+

&

)

+(

+

+

&

)

=

+

)

+

+

+ 78

&

( & &E

+

+

&

"""7 8

7&E8

=

+

=

"""7 8

78

+

&

+

)

+

&

=

&

) 78 " 6

*

(

"+

!! )

F ) )

)

-

/" ( )

6

+

+

6

= 6

+1

+

6

=−

−1

−

− (

"

6

7&08

= 0

) )

" *!

+

)

'

6

= 6

+

− >2 6 = − 0 −

−1

−

6

7& 8

= 0 )

+

+

=

6

6

− >2 6 = − 0 −

+6

6

=

7& 8

? 1

" (

) ) -

)

/" * !

) )

+

+

=

6

6

− >2 6 = − 0 .B <

6

=− 1 %

)

=

6

7&68

− 1 = −B

( )

&6

− >(

!

)= −

0

)

= − 0+ 0 = 0

( 5 )

&6

+ (0 ) +

( )=6 >

= 6− 1 = − ( ;

) ) 7.

0

; .

;0

&6A )

8

&0

" &

)

7. )

0

&6

5 ; ", ;0

;0 ;.

) ,

5

&6A

)

8 ;

;

5

&6" )

) " G ) )

"(

%

+

6 >

−

6

=1

+

6

=?

78

6 > 0

−

1 ?

78 G

)

" $

?

-

/" , !

( 9 78

5

" "$ 7 8" $

7!

8 ) )"

$

1 −>

+

6

+B −

− 0

1

=>

+ 1

1

=0

7&08

=:

6 1

=

1 −>

− 0 >

B

'0;

0 0

0

1

0

−

0

:

0

0

* F

"

6 −

+

+

6

= 6

+1

+

6

=−

−1

−

6

7&08

= 0

%

6 '0; 6

−

1 −1 −

− 0

B

$ 6× 1 " <

& &

&6

6 −> − 0

'; 0

−

−1

−

0 6

−> − 0

'; 0

0 −

6

? 6

−> − 0

'6; 0

0 0 −B − 1

$

'0 "

-

)/ 8 8

%

" ' 8 '

) )

5 5 5

)

"

" $ 5

7'68 " &

5 ) ) " :

(

−1

0

0

6

−

0

0

−

6 0 0 > −

>

0

0 0 0 6 0 0

1 > ? 6

0 0 0

0 0 1

0 0 0

0 0 0

0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 H

F " %

6 −

+6

−

6

+

1

+1

+

+

6

−

1−

−

+

6

−6

1

−>

>

= 1

>

=

>

= −6

1

1

(

6 −

6

−

'0;

−

−

−

−6 −> −6

'

( )

7

8 " C

'0

− 6 −

6

';

−

−

1

−

1

−6 −> −6

$ *

) )

)" D6

)

)

− ' ; 0 0 −1

− B

B

1 −B −B −

0 0 $ )

−

−

'6; 0 0 − 1

B

B

0 0

0

0 0

0

)

)

0

+0

+

+0

"

=0

'6

+

+ −1

6 6

− +B

1

−

1 +B

>

=

>

=

7& 8

0

< )

) 5

&

A )

("

)

−1

6

6

B =− + 1 1

= −B

1

+

B 1

1

−B

>

78

>

&

)

+ + =

B + − + 1 1 6 − 1+ 1 1 > − 1

B 1 > = > 1 6 + 1− > 1 1 1

+

>

−

1

−

>

&

= 78

) 2> 2 26

78

78 2

2 21

> − 1 =

=

+

B =− + 1 1 1 = 1

6

>

=

1

1

+

1

−

6 1

B 1

>

>

768

>

-

)

/

&0

" (

(

) 2 2 1 2 >"

%

=

6

1

=

1

>

= )

2

26

> 6 − 6 + (1 ) − (− ) = 0 1 1 1 B B = − + (1 ) + (− ) = > 1 1 1

= 6

(− 0

6 > 1 .

)

)

&

= 1

=

>

=

0

&0"

768

> 6 − + (1 ) − = 1 1 1 B 6 =− + = 1 1

= 6

6

−

0

)

&0"

!

-

/ ) )

768

" (

2

%

> 6 − + − 1 1 1 2 = =

B B = − + + 6 1 1 1 21 =

768

2> = "

+ $

# 6# − + $ − 1# 62 + +

= = − = 1 = .

6

− 0 − 6

− 0 − 6

6 − −1 1 −

−

−

6 − 0 −1 > −1 0 −1 → → −1 1 0 1 −> > 0 0 − 0 −1 > −1 0 0

5

)

0

+0

+

+0

> −1 0 0 0 )

=

≠0

(

)A

& ) )

) 5

"

1

&

<

−

) )

7 )

8 )

2

"

>

2.

MATRICES

1.1. Conceptos Generales Las matrices nos permiten representar, en forma tabular, un sistema de ecuaciones lineales, y facilitar con ello el uso de transformaciones elementales. Las matrices son entes matemáticos con existencia propia, independiente de los sistemas de ecuaciones lineales; aunque encuentran en éstos sus propias aplicaciones. Se definirá la manera cómo las matrices pueden sumarse, multiplicarse y multiplicarse por escalares; analizando las principales consecuencias de dichas definiciones. Desde el punto de vista algebraico, las matrices rompen con la monotonía establecida por los diversos sistemas numéricos, ya que la multiplicación viola una de las leyes que tradicionalmente se habían cumplido en dichos sistemas; la ley de conmutatividad. Esto trae como consecuencia que, en algunos aspectos, las matrices se separen del conocido comportamiento algebraico de los números. 1.2. Matrices y operaciones matriciales Una matriz se puede definir como una “tabla” o arreglo rectangular de elementos que, usualmente, son números reales o complejos. El concepto de matriz, sin embargo, puede generalizarse al caso en que los elementos sean polinomios, funciones, operadores o cualquier otro tipo de “entes matemáticos”; conservando validez la mayoría de los conceptos y propiedades que se presentarán en este tema, en el cual se considera a la matriz como un arreglo de números.

Definición Una matriz de m × n con elementos en C es un arreglo de la forma

donde a11 , a12 ,

a11

a12

a1n

a 21

a 22

a2n

a m1

am 2

a mn

, amn ∈ C y m, n ∈ Z .

Una matriz de m × n (léase m por n) se dice también que es de “orden” m × n .

La definición anterior de matriz se puede expresar como

[a ] ij

donde i=1, 2, ..., m y j=1, 2, ..., n Renglones y columnas

Al arreglo horizontal

[a11

a12

a1n ]

se le conoce como el primer renglón de la matriz, al arreglo

[a 21

a 22 a 2n ] como el segundo renglón, y en general al arreglo horizontal

[ai1

ai 2

ain ]

se le conoce como el i-ésimo renglón de la matriz En forma análoga, al arreglo vertical

a1 j a2 j a mj se le conoce como la j-ésima columna. Así, en una matriz de m × n pueden distinguirse m renglones (i=1, 2, ..., m) y n columnas (j=1, 2, ..., n), en particular si m=n se dice que la matriz es “cuadrada” de orden n. Comúnmente se representa a las matrices con letras mayúsculas y a sus elementos con letras minúsculas. Como ejemplo de matrices tenemos las siguientes

A=

1− i

2

− 3i

0

4i

7

− 1 1 − 2i −2

0

i

-1 2 4 1 - 3i 1 1 ; B= 0 − ;C = ;D = 3 1 1 3 2 4 3 2 −1 0 5 0

Donde A es una matriz de 4x3, B es una matriz de 1x3 (conocida como “matriz renglón” o “vector renglón”), C es una matiz de 4x1 (conocida como “matriz columna” o “vector columna”), y D es una matriz cuadrada de orden 3.

Igualdad de matrices

Dos matrices son iguales cuando tienen los mismos elementos, y éstos se encuentran dispuestos de la misma manera en ambos renglones. Esta idea puede expresarse en términos más precisos con la ayuda del símbolo aij , que representa el elemento que se encuentra en la posición correspondiente al renglón i y a la columna j de la matriz A. Así, por ejemplo, para la matriz A, B, C y D citadas anteriormente se tiene que

a 23

=

a32

=

7

c33

1 − 2i 1 = − 3 no existe

d 33

= 0 , etc.

b13

En consecuencia, la igualdad de matrices se define como sigue: Definición

[ ]

[ ]

Sean A = aij y B = bij dos matrices de m × n con elementos en C. Diremos que A y B son iguales, lo que representaremos con A=B si :

aij = bij ; para i = 1, 2, ..., m y j = 1, 2, ..., n Así, por ejemplo, las matrices

A=

−i 2 1 3

i

0

y B=

−i 2 1 3

0 i

no son iguales, a pesar de son del mismo orden y tienen los mismos elementos, ya que, aunque se cumplen las igualdades

a11

= b11

a12

= b12

a13

= b13

a 21

= b21

a 22 y a 23

≠ b22

Se tiene además que

≠ b23

por lo que A y B no satisfacen la condición de igualdad establecida. Para las siguientes matrices

x

2

M = 3

0

0 −4

1

−1

−5 y N = 3 z

0

2

1

y

−5

−4

w

la igualdad M = N se cumple si y sólo si x = -1, y y = 0 y z = w 1.3. Reglas de la aritmética matricial Adición de matrices

La adición de matrices sólo puede efectuarse cuando las matrices son del mismo orden y el resultado se obtiene sumando los elementos correspondientes de ambas matrices, de acuerdo con la siguiente definición.

Definición

Sean A = [aij ] y B = [bij ] dos matrices de m × n con elementos en C. La suma A + B es una matriz S = [S ij ], de m × n , definida por

S ij = aij + bij para i = 1,2, , m y j = 1,2, Así, por ejemplo, para las matrices −5 A = 2 1+ i − 2i 4 3

1

, n.

2

B = −2 −i 3 −4

y C=

−1

5 2i

7+i 0

3

se tiene que

3 +1

−5+2 4 −3 A + B = 0 + (−2) 1 + i + (−1) = − 2 1 − 2i + 3 4 + (−4) 3 − 2i 0 mientras que la adición de A y C no puede efectuarse, ya que las matrices no son del mismo orden. Se dice por ello que A y C “no son conformables” para la adición y, en consecuencia, la suma A+C no existe. La adiciones de matrices satisface las siguientes propiedades Teorema

Si A, B, C, son matrices de m x n cuyos elementos son números complejos, entonces i) ii) iii)

A + (B+C) = (A+B) + C A + B =B + A Existe una matriz 0 de m x n tal que

asociatividad conmutatividad

iv)

A+0=A idéntico Existe una matriz –A de m x n tal que A + (-A) = 0 inversos

elemento elementos

Demostración

Se demostrará la propiedad ii) Sean A = aij y B = bij dos matrices de m × n con elementos en C. Se tiene que

A + B = [Sij ] = [aij + bij ]

B + A = [Tij ] = [bij + aij ]

Como aij y bij son números complejos ∀ i, j; por conmutatividad t ij = bi j + ai j + aij + bij = sij ; ∀ i, j

por lo que de la definición de adición de matrices

A+ B = B + A iii) Sea A = aij una matriz de mxn con elementos en C. Si definimos la matriz 0 = [0 ij ] como 0ij = 0 (cero) para i = 1,2,..., m y j=1,2,,...,n; entonces

[ = [a

A + 0 = aij + 0i j ij

+ 0i j

= [aij ]

] ]

Por definición de la adición de matrices Por definición de 0 Por elemto idéntico

A+0 = A

iv) Sea A = aij una matriz de mxn con elementos en C. Si definimos la matriz − A = [vij ] como vij = − ai j ∀ i, j; entonces

[

( )] = [a + (− a )]

A + (− A) = aij + vi j ij

ij

= [0ij ], ∀ i, j

A + (− A) = 0

Por definición de la adición de matrices Por definición de - A Por elemto idéntico Por definición de 0

A la matriz –A, que es una matriz de mxn cuyos elementos son los simétricos de los elementos de A, se le conoce como la “simétrica de A” o la “negativa de A”. Sustracción de matrices

La resta o sustracción de matrices puede definirse a partir de la adición de matrices y de los teoremas con los que cumple la adición de matrices. Definición

Sean A = aij y B = bij dos matrices de m × n con elementos en C. La diferencia A-B se define como: A − B = A + (− B )

De acuerdo con esta definición, para obtener la diferencia A-B bastará con restar a los elementos de la matriz A los elementos correspondientes de la matriz B, puesto que

A − B = A + (− B ) = [aij + (− bij )] = [aij − bij ] Por ejemplo, para las matrices

3 −5 A = 0 1+ i − 2i 4

1 2 B = −2 −i 3 −4

y C=

− 1 5 2i 7+i 0 3

Que vimos anteriormente, se tiene

3 −1 2 −5−2 −7 A − B = 0 − (− 2 ) 1 + i − (− i ) = 2 1 + 2i − 2i − 3 4 − (− 4 ) − 3 − 2i 8 mientras que la diferencia A-C no existe. De la definición de la sustracción de matrices se tiene que dos matrices son conformables para la resta si y sólo si son del mismo orden. La multiplicación por un escalar

En ocasiones, y particularmente desde el punto de vista de las aplicaciones, se requiere multiplicar una matriz por un número, al que genéricamente se le conoce como “escalar”. Esta operación,

denominada “multiplicación formalmente como sigue:

por

un

escalar”,

se

define

Definición

Sean A = aij una matriz de mxn con elementos en C y α ∈ C. El productoαA es una matriz E = [eij ] de mxn, definida por:

eij = αaij

; para i = 1,

, m y j = 1,

,n

Así, por ejemplo, A=

−i

i

0

1

− 3 1+ i

es la matriz

αA = (2i )

=

2

−i

i 0

0

1

− 3 1+ i

=

(2i )(− i ) (2i )(0) (2i )(1) (2i )(i ) (2i )(− 3) (2i )(1 + i )

2i

− 2 − 6i − 2 + 2i

La multiplicación por un escalar satisface las siguientes propiedades Teorema Si A y B son matrices de mxn con elemntos en C y α, β ∈ C, entonces; i) α ( A + B ) = αA + αB ii) (α + β ) A = αA + βA iii) α (βA) = (αβ ) A

Demostración

Se demostrará la propiedad i). i)

Sean A = aij y B = bij dos matrices de m × n con elementos en C y α un escalar de C, entonces:

[

( )]

A + B = aij + bi j

α (A + B) = [α (aij + bij )]

= [αaij + αbij ]

Por igualdad de matrices Por definición de multiplicación por un escalar Por distributividad

= [αaij ] + [αbij ] Por definición de adición de matrices

α ( A + B ) = αA + αB

Por definición de multiplicación por un escalar

Multiplicación de matrices

Considerando nuevamente el sistema de ecuaciones lineales 20 x1 + 100 x 2 + 40 x3 = 400 0 x1 +

x2 −

x3 =

0

(1)

Con los coeficientes las ecuaciones formamos la matriz que llamaremos A; otra con las incógnitas, a la que llamaremos X, y una tercera con los términos independientes, a la que llamaremos B. Esto es:

20 100 40 A= 0 1 −1

x1 X = x2 x3

B=

400 0

Con ayuda de estas matrices podemos representar al sistema de ecuaciones (1) mediante la expresión

AX = B

(2)

siempre y cuando tengamos una definición adecuada para el producto AX. Las condiciones que establece el sistema (1) son equivalentes por los teoremas que cumplen las matrices para la adición, a la siguiente igualdad entre matrices.

AX =

20 x1 100 x2 0 x1 x2

40 x3 400 = − x3 0

de donde se sigue que la expresión (2) representará al sistema (1) si sólo si

AX =

20 x1 100 x 2 0 x1 x2

40 x3 − x3

Veamos ahora cómo podemos obtener la matriz AX a partir de las matrices A y X. El primer elemento de AX; es decir, el que se encuentra en el primer renglón y primera columna de dicha matriz, se obtiene sumando los productos de los elementos del primer renglón de A por sus elementos correspondientes en la primera columna de X. En forma esquemática:

[20 x1 + 100 x 2 + 40 x3 ] x1 x2 x3

[20

100 40]

Análogamente, el elemento que se encuentra en el segundo renglón y primera columna de AX se obtiene sumando los productos de los elementos del segundo renglón de A por los de la primera columna de X. Así

x1 x2

=

0x1 + 1X 2 + (- 1)x3

x3

[0

− 1]

1

En general, si A y B son dos matrices tales que el número de columnas de A coincide con el número de renglones de B, el elemento que se encuentra en la posición correspondiente al renglón i y la columna j de la matriz producto AB, se obtiene sumando los productos de los elementos renglón i de la matriz A por sus elementos correspondientes en la columna j de la matriz B. Así, si A y B son las matrices

a11 a 21 . A= a11 . a m1

a12 a 22 . a11 . am2

. .

a1n a2n . a3n . a mn

B=

b11 b 21 . . b n1

b12 b 22 . . b n2

. .

b1 j b2 j . . bnj

. .

b1q b2 q . . b nq

de mxn y nxq respectivamente, el elemento ubicado en el renglón i y columna j de la matriz producto AB, al que representamos como Pij, será

Pij = ai1b1 j + ai 2 b2 j +

+ ain bnj

que, en forma compacta, puede expresarse como

Pi j = Formalmente, se tiene la multiplicación de matrices.

n k =1

aik bkj

siguiente

definición

para

la

Definición

Sean A = [aij ] y B = [bij ] dos matrices con elementos en C, de mxn y nxq respectivamente. El producto AB es una matriz P = pij , de mxq, definida por

[ ]

Pij =

n k =1

aik bkj ; para i = 1,

, m y j = 1,

, q.

A manera de ejemplo, para las matrices

5 3 -1 0 1 -3 A= -2 0 1 1 -1 3

[ ]

2 0 B = -3 4 -1 3

C=

-1 2 0 3 0 -3 1 -4

se tiene que AB = pij es una matriz de 4x2, donde

p11 =

3

k =1

a1k bk1 = a11b11 + a12b21 + a13b31 =

= 5(2 ) + (3)(− 3) + (− 1)(− 1) = 10 − 9 + 4 = 2 p12 =

3

k =1

a1k bk 2 = a11b12 + a12b22 + a13b32 =

= 5(0 ) + (3)(4) + (− 1)(3) = 0 + 12 − 3 = 9 y de manera similar se calculan

P 21 = (0 )(2) + (1)(− 3) + (− 3)(− 1) = 0 − 3 + 3 = 0 P 22 = (0 )(0) + (1)(4) + (− 3)(3) = 0 + 4 − 9 = −5

P 31 = (− 2)(2 ) + (0 )(− 3) + (1)(− 1) = −4 + 0 − 1 = −5 P 32 = (− 2)(0 ) + (0 )(4) + (1)(3) = 0 + 0 + 3 = 3

P 41 = (1)(2 ) + (− 1)(− 3) + (3)(− 1) = 2 + 3 − 3 = 2 P 42 = (1)(0 ) + (− 1)(4 ) + (3)(3) = 0 − 4 + 9 = 5 por lo que

AB =

2

9

0

−5

−5

3

2

5

El producto AC no puede obtenerse, porque el número de columnas de A no es igual al numero de renglones de C. Se dice entonces que las matrices A y C “ no son conformables para el producto AC”. Sin embargo, estas mismas matrices sí resultan conformables para el producto CA. −2 −4 4 CA = −6 1 −2

De lo anterior se concluye que la multiplicación de matrices no es conmutativa; es decir, no puede establecerse que para dos matrices A y B (conformables para el producto AB) se tenga que AB=BA. Puesto que AB y BA representan, en general, matrices diferentes, es importante hacer énfasis en el orden en que se multiplican. Así en el producto AB se dice que la matriz A “premultiplica” a la matriz B; mientras que en el producto BA se dice que A “postmultiplica” a B. En algunos casos, como el del ejemplo anterior, la multiplicación puede efectuarse en un sentido, digamos AB, pero no en el otro, es decir BA. En otros casos la multiplicación puede efectuarse tanto en un sentido como en el otro, pero los resultados pueden ser diferentes o iguales según las matrices de que se trate. Cuando dos matrices A y B son tales que AB=BA se dice que son “permutables” (también suele decirse que “conmutan”). Por ejemplo, para las matrices A=

0 −1 3 −1

y B=

1 2 3 4

se tiene que: AB =

−3 −4

0

2

y BA =

6

−3

12 − 7

por lo que A y B no son permutables; mientras que para A=

0 −1 3 −1

y C=

−3

1

−3 −2

se tiene que AC =

3

2

−6 5

y CA =

3

2

−6 5

La multiplicación de matrices satisface la ley asociativa que establece el siguiente enunciado. Teorema

Sean A, B y C matrices mxn, nxq y pxq, respectivamente, cuyos elementos son números complejos, entonces:

A(BC ) = ( AB )C Demostración

Sean A = [aij ], B = [bij ] y C = [cij ] matrices de mxn, nxp y pxq, respectivamente. Entonces, por definición de multiplicación de matrices:

BC =

P k =1

b ik ckj

donde BC es una matriz de nxq. Entonces

n

A( BC ) =

h =1

aih

k =1

p

n

=

p

=

Por distibutividad

aih bhk ckj

Puesto que se puede sumar en culaquer orden

aih bhk ckj

Por distibutividad

n

k =1 h =1 p

=

n

k =1 h =1

Por definición de multiplicación de matrices

aih bhk ckj

h =1 k =1 p

bhk ckj

A(BC) = (AB)C

Por definición de multiplicación de matrices

Para verificar el teorema anterior en un caso particular, se consideran las siguientes matrices

A=

3

2

B=

−1 0

1

−1 2 1

3

y C = −2

1 0

3

0 1 −2

Se obtendrá primero el producto de

BC =

−1 2 1 3

1 0

1

0

−2

1

3

−2

−2 0

=

1

1

y, posteriormente, se premultiplicará éste por A, con lo que se obtiene: A(BC ) =

3

2 −2 0

−1 0

1

1

=

−4 2

2

0

Por otra parte, se obtendrá el producto de

AB =

2 −1 2 1

3

−1 0

3

1 0

=

3

8

3

1 − 2 −1

y, a continuación, se postmultiplica por C, con lo que se obtiene

( AB )C =

3

8

3

1 − 2 −1

1

0

−2

1

3

−2

=

−4 2 2

0

se llego al mismo resultado, y se cumple el teorema A(BC)=(AB)C. Con fundamento en dicho teorema se puede escribir simplemente ABC

Ya que no importa cual de los productos (AB o BC) se efectúe primero. Consideradas simultáneamente, la adición y la multiplicaión de matrices tiene las propiedades que se enuncian a continuación, conocidas como las leyes distributivas de la multiplicación sobre la adición. Teorema

Sean A, B y C matrices de mxn, nxp y nxp, respectivamente, y D, E y F matrices de mxn, mxn y nxp, respectivamente, cuyos elementos son números complejos; entonces: i) ii) Demostración

A(B+C)=AB+AC (D+E)F=DF+EF

Se demostrará a continuación la distibutividad por la izquierda (propiedad i). Sea A = [aij ], B = [bij ] y C = [cij ] matrices de mxn, nxp y nxp, respectivamente; entonces

B + A = [Bij + cij ]

A(B + C ) =

n k =1

= = =

Por definición de adición de matrices

aik (bkj + ckj )

n k =1 n k =1 n k =1

Por definición de multiplicaión de matrices

(aik bkj + aik ckj ) aik bkj +

n k =1

aik bkj +

A(B + C ) = AB + AC

aik ckj n

k =1

aik ckj

Por distributividad Por asociatividad y conmutatividad Por definición de adición de matrices

Por definición de multiplicación de matrices

Matriz Identidad

Se conoce como “matriz identidad” de orden n a una matriz cuadrada de orden n que es de la forma 1 0 0 0

0 1 0 0 0 1 . . . . . . 0 0 0

0 0 . . 1

La matriz identidad está formada con unos y ceros únicamente. Los elementos iguales a uno son aquellos que coinciden el

número de renglón y el de la columna donde se encuentran, y todos los demás elementos son cero. Lo anterior permite establecer la siguiente definición para la matriz identidad. Definición

Se llama matriz identidad de orden n a la matriz cuadrada de orden n I n = [δ ij ], tal que

δ ij = 1, si i = j y δ ij = 0, si i ≠ j Al símbolo δ ij de la definición anterior se le conoce como “delta de Kronecker”. La matriz identidad juega un papel muy importante en el álgebra de matrices, ya que constituye un elemento idéntico para la multiplicación. Por ejemplo, si se premultiplicamos la matriz

3 −1 A = − 2i 4 7 0 por la matriz identidad de orden tres se tendrá

1 0 0 3 −1 3 −1 I 3 A = 0 1 0 − 2i 4 = − 2i 4 = A 0 0 1 7 0 7 0 Si ahora postmultiplicamos dicha matriz por I2 se tendrá también

3 −1 3 −1 1 0 AI 2 = − 2i 4 = − 2i 4 = A 0 1 7 0 7 0 En general, se tiene el siguiente teorema Teorema

Si A es una matriz de mxn con elementos en C, entonces: i) ii)

ImA=A AIn=A

Demostración

Se demostrará la parte i) del teorema. i) Sea A = [aij ] una matriz de mxn con elementos en C y sea

I m = [δ ij ] Im A =

m

δ ik akj

k =1

= [δ ii aij ] = [1 ⋅ aij ] = [aij ] Im A = A

Inversa de una matriz

Por definición de multiplicación de matrices Por definición de matriz identidad Por definición de matriz identidad Por elemnto idéntico

En ciertos casos, para una matriz A es posible hallar una matriz X tal que XA=I=AX Por, ejemplo, para la matriz A=

3 1 5 2

Se tiene que la matriz X =

2

−1

−5

3

es tal que

XA = AX =

2 −5 3 1

−1 3 1 3

5 2 −1

2

5 2 −5

3

= =

1 0 0 1 1 0 0 1

Se dice entonces que X es “inversa” de la matriz A y se representa como A-1 Definición

Sea A una matriz de nxn con elementos en C. Una matriz X se dice que es inversa de A si -1

Y se representa con A .

XA=In=AX

Cabe hacer notar que la igualdad XA=AX sólo es posible cuando A yX son matrices cuadradas del mismo orden; en consecuencia,

para que una matriz A tenga inversa es condición necesaria que será cuadrada. Además, la inversa ( en caso de existir) sea única. La definición de matriz inversa establece lo que deberá entenderse por matriz cuadrada, pero no dice que todas matriz cuadrada tenga inversa, ni que dicha inversa (en caso de existir) sea única. En lo que se refiere al primer punto, se puede demostrar, mediante un ejemplo, que no todas las matrices cuadradas tienen inversa. En efecto, para la matriz 3 0

0 0

x11

x12

x 21

x 22

A =

una matriz

X =

tal que XA=I deberá cumplir con

x11

x12

x 21

x 22 0 0

3 0

=

1 0 0 1

esto es

3 x11

0

3x 21

0

=

1 0 0 1

igual que, como puede verse, no se satisface para ningún valor de los elementos x11, x12, x21, x22. Luego, no existe inversa para la matriz propuesta.

A las matrices que tienen inversa se les llama “no singulares” y a las que no tienen inversa “singulares”. Definición

Sea A una matriz de nxn con elementos en C. Se dice que A es no singular si existe A-1, en caso contrario se dice que A es singular. En lo que se refiere a la unicidad, se puede demostrar que la inversa de una matriz cuadrada (si existe) es única, como lo establece el siguiente teorema, en el que se enuncian además otras propiedades importantes de la inversa. Teorema

Si A y B son dos matrices no singulares del mismo orden y λ ∈ C, entonces: i) ii) iii) iv)

A-1 es única (A-1)-1=A (AB)-1=B-1A-1 1 (λA)-1= A −1 , si λ ≠ 0

λ

Demostración

Se demuestran a continuación i) y iii). i)

Sea A una matriz de nxn no singular, y sean X, Y dos inversas de A; entonces, por definición de inversa de una matriz XA = I n AX

y YA = I n = AY

Por otra parte X=XIn =X(AY) =(XA)Y matrices =InY X=Y matrices

Por el teorema de matriz identidad Por hipótesis Por teorema de multiplicación de Por hipótesis Por i) del teorema de identidad de

Y en consecuencia la inversa es única. ii) Sean A y B dos matrices de nxn no singulares. Por definición de inversa existen A-1 y B-1 y puede formarse el producto. Para el cual se tiene que (B-1A-1)(AB)= (B-1A-1)[(A)(B)] =[(B-1A-1)A]B matrices =[B-1(A-1A)]B matrices =(B-1In)B =B-1B (B-1A-1)(AB)=In

Por teorema de multiplicación de Por teorema de multiplicación de Por definición de matriz inversa Por teorema de matriz identidad Por definición de matriz inversa

En forma análoga puede demostrarse que (AB)(B-1A-1)= In y, en consecuencia, de la definición de matriz inversa se tiene que B-1A-1 es la inversa de AB; esto es B-1A-1=(AB)-1 Como se quería.

Cabe hacer notar que de la expresión anterior se sigue que el producto de dos matrices no singulares es una matriz no singular. Cálculo de la inversa por transformaciones elementales

Existen matrices que tienen inversa y hay otras que no la tienen; y para determinar si una matriz tiene inversa o no la tiene. Un primer procedimiento consiste en plantear una matriz desconocida X, cuyos elementos Xij queremos determinar. Multiplicar dicha matriz por A y obtener los valores de Xij que hacen posible las igualdades XA=I=AX Este procedimiento, que se fundamenta directamente en la definición de inversa, conduciría a un sistema de n2 ecuaciones con n2 incógnitas, que para valores grandes de n resulta muy arduo resolver. En su lugar se propone un método más práctico que se basa en el empleo de las transformaciones elementales por renglón. El método consiste en aplicar una sucesión de transformaciones elementales a la matriz A hasta obtener la matriz identidad, y aplicar esta misma sucesión de transformaciones a la matriz In con lo que se obtiene A-1. Si no es posible transformar la matriz A en la matriz identidad entonces no existe A-1. Con el propósito de fundamentar teóricamente este método introduciremos a continuación el concepto de matriz elemental y estableceremos algunos resultados que nos permitirán concluir la validez del método. Matrices elementales

Consideramos la matriz

1 2 −1

3

A= 3 5

6

7

0 1

4

−2

y apliquemos la transformación elemental (T1)que consiste en intercambiar los renglones segundo y tercero; se obtiene entonces la matriz

1 2 −1

3

A1 = 0 1

4

−2

3 5

6

7

Esta matriz puede obtenerse también como resultado de una multiplicación. Si se premultiplica A por la matriz

1 0 0 E1 = 0 0 1 0 1 0 se tendrá

1 0 0 1 2 −1 E1 A = 0 0 1 0 1

4

0 1 0 3 5

6

3

1 2 −1

−2 = 0 1 7

3 5

4 6

3 − 2 = A1 7

La matriz E1 recibe el nombre de “matriz elemental” y, como puede verse, se obtiene a partir de la matriz identidad efectuando

en ella la transformación correspondiente (en este caso el intercambio de los renglones 2 y 3). Se obtiene así el equivalente algebraico de “aplicar una transformación elemental” que es “premultiplicar por una matriz elemental”. Existen tres tipos de matrices elementales, correspondientes a los tres tipo de transformaciones elementales.

Definición

Una matriz elemental es aquella que se obtiene aplicando a In una transformación elemental y se representa con:

I n(i , j ) si se obtiene intercambiando los renglones i y j de In I nk (i ) si se obtiene multiplicando por un número k≠0 el renglón i de In I nk (i , j ) si se obtiene multiplicando por k el renglón i de In y sumando el resultado al renglón j. De acuerdo con esta notación, a la matriz E1 del ejemplo anterior le corresponde el símbolo I 3(2,3 ) Teorema

Si es una matriz de mxn con elementos en C, entonces:

i) los

I m(i , j ) A

I ii) por k el

k (i ) m

A

k (i , j ) m

iii) I A renglón j de la

es la matriz que se obtiene intercambiando renglones i y j de la matriz A es la matriz que se obtiene multiplicando renglón i de la matriz A es la matriz que se obtiene sumando al matriz A el renglón i multiplicado por k.

Demostración

Se demuestra a continuación la proposición i), las proposiciones ii) y iii) se pueden de manera similar. Puesto que I m(i , j ) = [erc ] es una matriz identidad con los renglones i y j intercambiamos, se tiene que Para r≠i, j; erc=δrc Para r=i; eic=

Para r=j; ejc=

1, si c=j 0, si c≠j 1, si c=j 0, si c≠j

Sea I m(i , j ) A = B = [brc ] (1)

Para r≠i, j se tiene que

brc =

m k =1

erk a kc =

m k =1

δ rk a kc =δ rr a rc = 1 ⋅ a rc = a rc ∀ C

por lo que el renglón r de B es igual al renglón r de A. (2)

Para r=i se tiene que

bcr = bic =

m k =1

eik a kc =eij a jc = 1 ⋅ a jc = a jc ∀ C

por lo que el renglón i de B es igual al renglón r de A. (3)

Para r=j se tiene que

brc = b jc =

m k =1

e jk akc =e ji aic = 1 ⋅ aic = aic

por lo que en el renglón j de B es igual al renglón i de A. En consecuencia, de (1), (2) y (3) la matriz B se obtiene intercambiando los renglones i y j de la matriz A. De acuerdo con el teorema anterior, cuando una matriz se premultiplica por I n(i , j ) se intercambian sus renglones i y j. En particular, si es la misma I n(i , j ) la que se premultiplica por dicha matriz, tomando en cuenta que I n(i , j ) se obtiene intercambiando los renglones i y j de In, se tendrá que

I n(i , j ) I n(i , j ) = I n por lo que I n(i , j ) tiene inversa, que la misma I n(i , j ) .

Razonando de manera similar se puede concluir que la inversa de I nk (i )

es I

1 (i ) k n

, y que la inversa de

I nk (i )

es

I n− k (i , j ) .

En consecuencia se puede establecer que

Teorema(a)

Las matrices elementales son no singulares. Y, tomando en cuanta el teorema de las matrices singulares se tiene que: Teorema(b)

El producto de matrices elementales es una matriz no singular Justificación del método

Se justificará el método para obtener una matriz mediante transformaciones elementales. Sea A una matriz de nxn con elementos en C y i)

Supongamos que existe una sucesión (finita) de transformaciones elementales T1, T2, ... ,Tk

que aplicada a la matriz A la transforma en la matriz identidad de orden n; esquemáticamente: T1

A →

A1

T2

→

Ak −1

Tk

→ In

Entonces, existe una sucesión(finita) de matrices elementales E1, E2, ... , Ek tales que Ek(...(E2(E1A))...)=In Por lo que (Ek ... E2E1)A=In Si llamamos P al producto Ek ... E2E1, se tendrá que PA=In Por otra parte, como P es un p7roducto de matrices elementales, de el teorema de el producto de matrices elementales se sigue que P es no singular y existe P-1; por tanto

P = Ek

E 2 E1

P = Ek (

(E2 (E1 I n )) )

P = (E k

E 2 E1 )I n

tal que podemos concluir que P se obtiene aplicando a In la sucesión de transformaciones elementales T1, T2, ... , Tk. Lo anterior sugiere, para propósito de cálculo, el empleo de un arreglo formado por dos matrices de nxn.

Inicialmente el arreglo tiene del lado izquierdo a la matriz A y del lado derecho a la matriz identidad In. Se efectúan entonces (en ambas matrices simultáneamente) las transformaciones necesarias para obtener en el lado izquierdo la matriz In, y al finalizar el proceso se obtiene en el lado derecho de la matriz A-1.

En forma esquemática T1 [A I n ] →

[

→ In

Tk

A −1

]

Para ilustrar lo anterior mediante un ejemplo consideremos la matriz

A=

1

3 0

2

6

1

−1 − 4 2 cuya inversa deseamos obtener. Se debe formar primero el arreglo [ A I 3 ] y se efectúa a continuación las trasformaciones necesarias para obtener en el lado izquierdo una matriz escalonada (como en el método de Gauss)

1

3 0

2

6

1 0 0

1 0

1 0 → 0

−1 − 4 2 0 0 T2 1

3 0

1

1 0

3 0 0

1

→ 0 −1 2 1 0 0 0 0 1 −2 1 1

1 0 0

1 −2

0 −1 2

1

T1

1 0

1 0

1

y una vez que se ha obtenido ésta se continúa con el proceso hasta obtener en el lado izquierdo la matriz identidad

1

T3 3 0 1

0 0

T4 0 0 16 − 6 3

1

→ 0 −1 0 5 − 2 1 → 0 −1 0 5 −2 1 0 0 1 −2 1 0 0 0 1 −2 1 0

1 0 0 0

T5

16 − 6

1 0 −5

0 0 1 −2

3

1 −1 1

0

[

]

con lo que se llega al arreglo I 3 A −1 y, en consecuencia, para la matriz A en cuestión se tiene que

16 − 6 A −1 = − 5 −2

3

1 −1 1

0

ii) Supongamos ahora que la matriz A no puede ser transformada en la matriz identidad mediante una sucesión de transformaciones elementales. Se tiene entonces una sucesión de transformaciones elementales T1, T2, ... ,Tr que aplicada a la matriz A la transforma en una matriz C que tiene un renglón de ceros; y existe por tanto un sucesión de matrices elementales.

E1, E2, ... , Er tales que (Er ... E2E1)A=C si llamamos Q al producto Er ... E2E1, se tendrá que

QA=C Por el teorema de multiplicación de matrices elementales Q es una matriz no singular, y si A fuese también no singular por iii) del teorema de matriz no singular; sin embargo, C es singular puesto que tiene un renglón de ceros y para cualquier matriz M el producto MC tiene un renglón de ceros, es decir que no existe M tal que MC=I. En consecuencia la matriz A es singular y no existe A-1. Como ejemplo consideraremos la matriz

A=

1

3 0

2

6

1

−1 − 3 2 Formemos el arreglo [ A I 3 ] y tratamos de obtener en el lado izquierdo la matriz identidad

1

3 0

2

6

1 0 0

1 0

1 0 → 0 0

−1 − 3 2 0 0 1 3 0 1 → 0 0 1 −2 0 0 0

1 3 0

1 0 0 1 0

5 −2 1

1 0 0

1 −2

0 0 2

1 0

1 0

1

como se ve, en el lado izquierdo del último arreglo se ha obtenido una matriz con un renglón de ceros, por lo que la matriz A es singular y no tiene inversa. 1.4. Ecuaciones con matrices Consideramos ahora las matrices

A=

5 4 3 8

y B=

4

0 −2

1 −3

−1

¿Existe una matriz X que satisfaga la siguiente relación? AX + B = 3 X

Con lo que se ha planteado una ecuación entre matrices, donde la matriz X es la incógnita. En ciertos casos estas ecuaciones, conocidas como ecuaciones matriciales, pueden resolverse siguiendo el mismo procedimiento que se emplea para resolver ecuaciones planteadas con números; esto es, tratando de “despejar” la incógnita en términos de los otros elementos que intervienen en la ecuación. Sin embargo, las propiedades de las operaciones con matrices presentan, como hemos visto, algunas diferencias respecto a las propiedades de las operaciones con números, por lo que se debe tener especial cuidado en que los “pasos” efectuados en el despeje sean válidos en el álgebra de matrices. Volviendo al ejemplo, para “pasar” la matriz B al miembro derecho de la ecuación se procederá de la siguiente manera: Por elemento inverso (iv) del teorema de adición de matrices existe –B, por lo que, de la expresión original

(AX+B)+(-B)=3X+(-B)

en consecuencia

AX+[B+(-B)]=3X+(-B) AX+0=3X+(-B) AX=3X+(-B)

por asociatividad (i)) del teorema de adición de matrices por elemento inverso (iv)) del teorema de adición de matrices por elemento idéntico (iii)) del teorema de adición de matrices

Para “pasar” ahora la matriz 3X al miembro izquierdo de la ecuación: Por elemento inverso existe –(3X), y de la expresión anterior -(3X)+AX=-(3X)+[3x+(-B) de donde -(3X)+AX=[-(3X)+3X]+(-B)

por asociatividad (i)) del teorema de adición de matrices -(3X)+AX=0+(-B) por elemento inverso (iv)) del teorema de adición de matrices -(3X)+AX=-B por elemento idéntico (iii)) del teorema de adición de matrices

Ahora, para “factorizar” a X se procede como sigue: Probamos primero que

− (αX ) = (−α ) X por lo que podemos escribir simplemente − αX . En efecto, si α es un escalar de C y X una matriz de mxn con elementos en C:

αX + [(− α ) X ] = [α + (− α )]X Por ii) del teorema de multiplicación de matrices por un escalar Por elemento inverso

= 0⋅ X = αX + (− α ) X = 0 de donde

(− α )X

= −(αX )

Por iv) del teorema de adición de matrices

Llevando este resultado al desarrollo anterior se puede escribir

(− 3)X + AX = − B [(− 3)I ]X + AX = − B (− 3I )X + AX = − B (− 3I + A) X = − B

Por i) de Teorema de matriz identidad

Por ii) de Teorema de multiplicación de matrices

Finalmente, para despejar X premultiplicamos por la inversa de (3I+A), lo cual es válido sólo si dicha matriz es no singular. Así: Si ∃ (-3I+A)-1, se tiene que

(− 3I + A)−1 [(− 3I + A)X ] = (− 3I + A)−1 (− B )

y en consecuencia

[(− 3I + A)

−1

(− 3I + A)]X = (− 3I + A)−1 (− B)

IX = (− 3I + A)

−1

(− B )

X = (− 3I + A) (− B) −1

Por el teorema de la ley asociativa de la multiplicación de matrices Por definición de matriz inversa Por i) del teorema de matriz identidad

con lo que sea ha expresado a X en términos de las matrices A y B y del escalar 3 que aparece en la ecuación. Ejemplo: − 3I + A = −3

1 0 0

1

+

5 4 3 8

=

2 4 3 5

para calcular la inversa de esta matriz se procede de la siguiente manera

1 1 1 2 0 2 4 1 0 1 2 0 2 → → 2 3 3 5 0 1 2 5 0 1 0 −1 − 1 2 1 5 0 1 0 − 2 2 → 3 3 0 −1 − 1 0 1 2 2 1

2

por lo que

2 −1

X = (− 3I + A)

−1

(− B ) =

−

5 2 3 2

2 −4 0 2 8 6 −3 = 2 −5 −3 −1 −1 3 1

es la matriz que satisface la ecuación propuesta. Representación matricial de un sistema de ecuaciones lineales

Otro ejemplo de ecuación matricial, de uso frecuente en las aplicaciones, lo constituye la llamada representación matricial de un sistema de ecuaciones. Con base en las definiciones de igualdad y de la multiplicación de matrices, un sistema de m ecuaciones lineales con n incógnitas puede representarse con la expresión: AX=B donde A es una matriz mxn que se conoce como “matriz de coeficientes” del sistema, X es una matriz de nx1 conocida como “vector de incógnitas” y B es una matriz de mx1 conocida como “vector de términos independientes” Esta ecuación puede resolverse premultiplicando por A-1 cuando A sea una matriz no singular.

Si ∃ A -1 , se tienen que:

A −1 ( AX ) = A −1 B

(A A)X = A −1

−1

B

IX = A −1 B X = A −1 B Así, por ejemplo, el sistema de ecuaciones lineales

X1 +

3X 3 = 2

X 2 − 2 X 3 = −1 X1 + X 2 + 2X 3 = 3 puede expresarse en forma matricial como AX=B, donde

3

X1

1 −2

X = X2

1 0

A= 0

1 1

2 B = −1

y

X3

2

3

Para determinar si existe A-1 y obtenerla se procede como sigue

1 0

3 1 0 0

0

1 -2 0

0

1

1 0 0

1 0

1 0 → 0

2 0 0

1

0

3

1 -2 1

1 0 0 0

1 0

-1 -1 0

1

0 0

1 -2

0

1 0 → 0 1 0 − 2 −1

1 -1 −1 1

por lo que

4

3 3

A −1 = − 2 − 1 2 −1 −1 1

0 0 1

4

3 −3

3

0 0

1 0 0

1

−1 −1

2 1

y en consecuencia

4

3 3

2

−4

X = A −1 B = − 2 − 1 2 − 1 = −1 −1 1

3

3 2

es la solución del sistema; es decir

X 1 = 4,

X 2 = 3,

X3 = 2

Diferencia entre el álgebra de números y el álgebra de matrices

1) La diferencia más general consiste en que podemos sumar o multiplicar dos números cualesquiera, mientras que no siempre podemos hacerlo con las matrices, puesto que éstas deben ser conformables para la operación a efectuar. Como consecuencia de ello se puede presentar que la ecuación matricial esté “mal planteada”, en el sentido de que no puedan efectuarse operaciones propuestas. Por ejemplo, si para las matrices A y B mencionadas anteriormente. XA + B = 3 X

se tendrá que, como A es de 2x2, la matriz X deberá ser de mx2 para que exista el producto XA, y en tales circunstancias XA será también de mx2 por lo que no podrá sumarse con B. Luego, no existe matriz X alguna que permita efectuar las operaciones propuestas en el miembro izquierdo de la ecuación.

Las diferencias más significativas, sin embargo, son las relacionadas con la multiplicación; entre las cuales se cuentan las siguientes. 2) La multiplicación de números es conmutativa, mientras que la multiplicación de matrices no lo es. Como consecuencia de ello se tiene que, para los números

b=c

ab = ac

y también

b=c

ab = ca

mientras que las matrices B=C

AB = AC

pero B=C

/ AB= CA

Así por ejemplo, al despejar la incógnita X de una ecuación matricial AX = B

se premultiplican ambos miembros por A -1 con lo que se obtiene

X = A -1B resultado que, en general, difiere de

BA −1

que se obtiene premultiplicando por A-1 en el miembro izquierdo y postmultiplicando por dicha matriz el miembro derecho. 3) El producto de dos números diferentes de cero es diferente de cero, mientras que el producto de dos matrices diferentes de la matriz cero puede ser igual a la matriz cero. Por ejemplo, para las matrices A=

− 3 −1 9

3

se tiene que A ≠ 0,

y

B=

1

−2

−3

6

B ≠ 0 y AB = 0

4) La ley cancelativa para la multiplicación tiene una aplicación más restringida en el caso de las matrices. En efecto, para los números se tiene que

si a ≠ 0 entonces ab = ac

b=c

lo cual no es válido para las matrices ya que, por ejemplo, para las matrices A y B citadas anteriormente se tiene que A≠0 y

AB = A0

sin embargo, esto no implica que B=0; es decir, no podemos “cancelar” la matriz A en la expresión anterior. Para las matrices, la ley cancelativa puede enunciarse de la siguiente manera Si A es no singular entonces AB = AC

B=C

Hay ecuaciones matriciales, del tipo que se han planteado, las cuales no pueden resolverse empleando el procedimiento descrito y que, sin embargo, tienen solución. Para estos casos queda el recurso de plantear un sistema de ecuaciones lineales equivalentes y resolverlo por el método de Gauss.

3.

Determinantes

3.1. Cálculo de determinantes Regla de Sarrus El método más sencillo es el que se conoce como “ regla de Sarrus”, el cual se emplea para determinantes de segundo y tercer orden.

a11

a12

a 21

a 22

= a11 a 22 − a 21 a12

1 3 5 3 det A = a11

a12

a13

a21

a22

a23 =

a31

a32

a33

a11

a12

a13

a21 a22

a23

1 3 5 3

= 7 − 15 = −8

= a11a22 a33 + a21a32 a13 + a31a12 a23 − a21a12 a33 − a11a32 a23 − a31a22 a13

1 4

5

A= 3 2

5

1 4 −1

1 4

5

det A = 3 2

5 =

1 4 −1 1 4 5 3 2 5 = (1)(2)(− 1) + (3)(4 )(5) + (1)(4 )(5) − (1)(2 )(5) − (1)(4)(5) − (3)(4 )(− 1) = -2 + 60 + 20 - 10 - 20 + 12 = 92 - 32 = 60

La regla de Sarrus sólo se aplica a determinantes de segundo y tercer orden.

Desarrollo por cofactores

a11

a12

a13

A = a 21

a 22

a 23

a31

a32

a33

det A = a11 (− 1)

1 +1

a22 a32

1+ 2 a a23 21 + a12 (− 1) a33 a31

21 a23 a 22 1+ 3 a + a13 (− 1) a33 a 31 a 32

Menor de a13 cofactor c13

Definición Sea A=[aij] una matriz de nxn con elementos en C

i) Se llama menor del elemento aij y representa con Mij al determinante de la matriz que se obtiene suprimiendo en A el renglón i y la columna j. ii) Se llama cofactor del elemento aij, y representa con Cij, al producto (-1)i+1Mij. Teorema Si A=[aij] es una matriz de nxn con elementos en C y r es un número entero tal que 1 ≤ r ≤ n , entonces i)

detA=

ii)

detA=

n j =1 n

i =1

a rj crj

air cir

Ejemplo:

3 1 0 Sea A = − 2 − 4 3 5 4 −2 Calcular det(A) usando el método de cofactores

det( A) = 3

−4

3

4 −2

+ (−1)

−2

5 −2

= 3(8 − 2 ) − 1(4 − 15) + 0 = 3(− 4) − 1(− 11) + 0

= (− 12 + 11) = −1

det(A)=a11c11+a12c12+a13c13

3

+0

−2 −4 5

4

=

Método de condensación Este método se basa en lo siguiente 1) 2) 3) 4)

Elegir una línea que contenga el mayor número de ceros posibles. Elegir un elemento no nulo de dicha línea (de preferencia un 1 ó –1) y aplicar reiteradamente la propiedad v) hasta reducir a ceros todos los demás elementos de la línea. Desarrollar por cofactores según dicha línea. Repetir los tres pasos anteriores hasta obtener un determinante de tercer orden (o de segundo) y obtener su valor por medio de la regla de Sarrus.

Teorema Sea A=[aij] una matriz de nxn con elementos en C i) ii) iii) iv) v)

Si los elementos de una línea A (renglón o columna) son todos nulos, entonces detA=0 Si B se obtiene de A multiplicando los elementos de una de sus líneas por un elemento λ ∈ C, entonces detB=λdetA Si B se obtiene de A intercambiando líneas paralelas (dos renglones o dos columnas), entonces detB=-detA Si dos líneas paralelas, entonces detA=0 Si B se obtiene de A sumando a los elementos de una línea los elementos de una línea paralela multiplicados por un número λ ∈, entonces detB=detA

Ejemplo: Calcular el determinante de la matriz

−1

1 −5 −2 2

1

0 −1

1 −1

2

1

0

2

1

3 −1

1

2

4

0

3 A=

3 0 1

Seleccionamos la cuarta columna para efectuar el desarrollo y para “pivote” el tercer elemento de dicha columna. Se multiplica por 2 y –3 el renglón tres y se suma a los renglones uno y cuatro, respectivamente.

−1

1 −1

3

2

1

0 −1

1 −1

2

1

0

2

1

3 −1

1

2

4

0

3 det A =

1 −5 −2

3

0=

2

1 −1 −3

1

1

−1 0

3

1 0 −1 2

1

0

5 − 5 0 −1 2

4 0

1

Desarrollo por cofactores la cuarta columna:

1 −1 7 ( 1 )( − 1 ) Det(A)=

3 −3 1

2

−1

3

1 −1

5 − 5 −1 2

4

1

Para desarrollar este determinante se escoge el primer renglón para el desarrollo y el elemento de la primera columna como pivote.

1 −1 det A = (− 1)

3

*

3

1 −1

2

−3 1

−1

5 − 5 −1

(1)

2

4

= (−1)

1

3 5

4 − 10

−3 2 −8 5

0 8 −2

4 − 10

det A = (− 1)(1)(− 1) = 2 − 8 2

3

0

1 3

(1) (− 3) 5

1 0

8

5

2

Se selecciona el segundo renglón para el desarrollo y el primer elemento como pivote

5

4 − 10

det A = (− 1) 2 − 8 3

5 24 − 30

8 = (1) 2 −4

5

0

0

3 17

− 14

* (4 )(− 4 )

det A = (− 1)(2)(− 1)

3

24 − 30 17

− 14

= 2(− 336 + 510)

det A = 348 Algunas Aplicaciones

Cálculo de la inversa por medio de la adjunta Se conoce como adjunta de una matriz cuadrada A a la transpuesta de la matriz que se obtiene reemplazando los elementos de A por sus respectivos cofactores.

Definición

Sea A=[aij] una matriz de nxn con elementos en C, y sea cij el cofactor del elemento aij. Se llama adjunta A a la matriz AdjA=[bij], donde bij=cji Por ejemplo, para obtener la adjunta de la matriz

1 2 3 A= 1 2 4

1 6 4 se calculan los cofactores de todos sus elementos

c11 =

2 4 6 4

c12 = 2(−1)

c13 =

1 2 1 6

c 21 = (− 1)

c 22 =

= 8 − 24 = −16

1 4 1 4

= (6 − 2) = 4

2 3 6 4

1 3 1 4

=0

= −(8 − 18) = 10

= (4 − 3) = 1

1 2 c 23 = (− 1) = −(6 − 2) = −4 1 6

c31 =

2 3 2 4

=8−6 = 2

1 c 32 = (− 1 ) 1 c33 =

1 2 1 2

= 2−2 = 0

− 16 AdjA =

3 = − (4 − 3 ) = − 1 4

10

0

2

1 −1

4 −4

0

1 2 3 − 16

A( AdjA) = 1 2 4 1 6 4

10

2

0 1 −1 = 4 −4 0

−4

0

0

0 −4 0 = −4 0 1 0 0 0 −4 0 0 1

Cual es la relación de –4 con la matriz A si calculamos

1 2 3 det A = 1 2 4 = −4 1 6 4 es decir A(AdjA)=(detA)I3

1 0 0

Teorema

Si A es una matriz de nxn con elementos en C, entonces A-1 existe si y sólo si detA≠0 Si detA≠0, entonces

A −1 =

1 ( AdjA) det A

Si ∃ A −1 entonces det A−1 =

1 det A

Ejemplo Calcular la inversa de A =

1 2 1 4

Utilizando la adjunta C11=4

c12=-1

C21=-2

c22=1

AdjA =

det A =

A

−1

4 −2 −1

1

4 −2 −1

1

= 4−2= 2

2 −1 1 1 1 = − 2 2 2

Regla de Cramer

Sea

a11 x1 + a12 x 2 +

+ a1n x n = b1

a 21 x1 + a 22 x2 +

+ a 2 n x n = b2

a n1 x1 + a n 2 x 2 +

+ a nn x n = bn

un sistema de n ecuaciones con n incógnitas, y sea A=[aij] su matriz de coeficientes Si det(A)≠0 entonces xk =

det Ak , det A

(k = 1, 2,

donde Ak=[Cij] es tal que

, n) aij, para j≠k cij bi, para j=k

Ejemplo Resolver el siguiente sistema de ecuaciones utilizando la Regla de Cramer 3x1 − 4 x 2 = −5 2 x1 + x2 = 4

det A =

3 −4 2

det A1 = det A2 = ∴

x1 =

1

= 3 − (−8) = 11

−5 −4 4

1

3 −5 2

4

11 = 1; 11

= −5 − (− 16 ) = 11

= 12 − (− 10) = 22 x2 =

22 =2 11

Curso propedéutico de matemáticas

Probabilidad y estadística Conceptos básicos de estadística

M. en C. Héctor Arnoldo López Zamorano Facultad de Ingeniería, UNAM

julio de 2006

I. Conceptos básicos de estadística

Objetivo Al finalizar el tema, el alumno conocerá lo que es la estadística y algunos de los conceptos básicos relacionados con ella: Población, muestra, eventos, tipos de datos, tipos de errores, etc.

a definición de estadística no es fácil de establecer a pesar de que parece que la usamos a cada instante. Cuando establecemos una cita, acudimos a ella confiando en que ocurrirá o dudando de que se lleve a cabo porque tenemos información que nos indica que la persona es muy cumplida o bastante irresponsable. En otras palabras, hemos recopilado datos que nos describen a nuestra contraparte y nos hacen prever un posible resultado. Lo anterior describe de manera gruesa el uso de la estadística aunque no la define, porque tal punto parece depender de su utilización, como veremos en el apartado siguiente.

L

Estadística Dicen Jonson y Kuby en su libro estadística elemental que “la estadística es el lenguaje universal de la ciencia… Es un campo de magia en el que una persona con conocimientos supera a las demás”. Terminan diciendo que la estadística es la “ciencia de recolectar, describir e interpretar datos”. En el libro Estadística de R. R. Pagano encontramos que la estadística estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos de analizar una población o una parte de ella para hacer inferencias.

Figura 1: En todos los campos de las ciencias siempre necesitamos hacer representaciones adecuadas de información para facilitar su análisis.

Como en los dos casos anteriores, hay siempre similitudes pero también diferencias en la definición de tal ciencia, dependiendo de los autores y de las necesidades. Cada uno puede definir esta ciencia que busca los mejores métodos para: establecer de manera precisa un problema que se estudiará en una población bien limitada, determinar que aspectos se evaluarán y a quién se le preguntará (recopilación de datos), encontrar cómo se acomodarán o distribuirán los datos encontrados, descubrir valores que describen a la población y deducir o inferir comportamientos que probablemente ocurran. Como se puede interpretar en el párrafo anterior, la estadística tiene dos grandes papeles; el primero, de describir a la población que se está estudiando, y el segundo, hacer suposiciones de posibles respuestas de la población cuando se le estimula. La seguridad con que esperaremos tales respuestas estará con fundamento en el retrato hecho, de aquí que la estadística no sólo debe describir sino que debe ser útil para ver hacia el futuro. Antes de hacer un estudio estadístico es importante definir con la mayor claridad posible qué es lo que se pretende estudiar, cuál es la hipótesis que se busca confirmar o desechar, o cuál es el objetivo que se persigue. Si no hay una idea bien establecida, la información que se reúna no tendrá utilidad y las inferencias carecerán de calidad. Una vez que se sabe lo que se desea, se define quién será la población de estudio; este es otro punto de esencial cuidado en la estadística.

Conceptos básicos Pero, ¿qué es la Población? Es el conjunto más grande o completo de individuos, objetos, observaciones o datos concebibles de un fenómeno determinado que puede ser analizado por el investigador o interesado en el estudio. Como la población puede ser muy grande, en ocasiones se toma una pequeña porción de esa población. Esa pequeña porción se conoce como muestra; dicha muestra se selecciona de tal forma que es representativa de la población; es decir, los resultados arrojados por la muestra son muy similares a los que se obtendrían si fuera posible obtener los datos de toda la población. Como se sabe cuál es el objetivo del estudio, se conoce qué es lo que interesa medir en la muestra; esa propiedad o característica de interés que puede tener diversos valores en diferentes instantes o circunstancias se conoce como variable. La variable puede ser una variable independiente en el experimento si puede ser controlada de forma sistemática por el investigador. Si la variable que se mide en el experimento es una consecuencia o efecto de la variable independiente entonces hablamos de una variable dependiente. Las variables pueden ser cualitativas o cuantitativas; las primeras clasifican, dan atributos o categorías nominales u ordinales a los elementos de la población o muestra, las segundas asignan un valor numérico continuo o discreto. En el caso de variables de valor nominal no se aplican las operaciones aritméticas ni se pueden ordenar; un ejemplo típico de este tipo de variable es la pregunta sobre el sexo del individuo: hombre o mujer. En el caso de variables ordinales es posible hacer una clasificación ordenada porque se tienen respuestas del tipo, “muy satisfecho”, “satisfecho”, “medianamente satisfechos”, etc. que sí pueden ser convertidos en números y analizados. Las variables cuantitativas son probablemente las más comunes en el campo de la ingeniería, porque es muy común que midamos temperaturas o presión en

un proceso, o que midamos unidades de producción; estos son ejemplos de variables numéricas continuas y discretas.

Figura 2: Siempre que llevamos a cabo experimentos es necesario registrar los resultados que se obtienen de las mediciones hechas sobre las variables de interés. Las medidas recolectadas en el experimento o asociadas a las distintas variables para cada uno de los elementos de la muestra son conocidas como datos. El dato, al estar relacionado con la variable, puede ser un número, una palabra o varias o un símbolo. Los datos se obtienen al desarrollar el experimento de interés para el estudio; el experimento es la realización de la actividad planeada para producir un conjunto de datos, el experimento incluye el cómo seleccionar a la muestra de la población estudiada y también, cómo obtener los datos que se revisarán. Con base en los datos obtenidos del experimento realizado sobre la muestra, producimos valores numéricos o nominales que los resumen; esto es, producimos una estadística. Si el valor numérico o nominal resume los datos de la población completa entonces se le llama parámetro. Ejemplifiquemos los párrafos anteriores. Supongamos que el director de la compañía en la que usted trabaja está interesado en saber cuántas horas, en promedio, le dedican sus subalternos a actividades de aprendizaje y superación para mejorar sus actividades profesionales y provocar un cambio positivo en el comportamiento de la organización. El experimento implica definir exactamente qué es lo que el director de la empresa quiere saber; cómo se realizará el muestreo, es decir, cómo se seleccionará la muestra para que pueda ser representativa de la población, y cómo se obtendrá y analizará la información que permita contestar la interrogante del jefe. La población serán todos los colaboradores de la compañía. Si la compañía es muy grande, entrevistarlos a todos será difícil. Por tanto, se eligen por algún método determinados miembros de los distintos departamentos de la empresa, esa es la muestra.

La variable será el tiempo dedicado a actividades de aprendizaje y superación. Si se le preguntara a los empleados cuántas horas dedican a su formación tendremos una variable numérica continua. Si se les preguntara si estudian “mucho”, “poco”,… tendríamos una variable ordinal. Un dato sería las horas de estudio de uno de los empleados. Por ejemplo, la señorita X estudia 2 horas. Los datos son el conjunto de valores recogidos para la variable al preguntarle a todos los elementos de la muestra: {2,1,3, 2, 0,...,1} Si obtenemos el promedio de los datos obtenidos de la muestra, ese es una estadística. Si el promedio de horas de formación obtenido de la muestra es representativo de todos los empleados de la compañía entonces tenemos un parámetro.

Población y muestra El diseño del experimento estadístico es una tarea bastante difícil. Mediante una delineación adecuada se busca reducir la variación en el experimento y obtener una cantidad específica de información de calidad con un costo mínimo. Uno de los aspectos considerados en el diseño es la selección adecuada de la muestra para obtener buenos datos. Los datos producidos por la muestra son de calidad cuando la información obtenida de ellos de verdad describen a la población; en otras palabras, la muestra es insesgada, sin sesgo o sin diferencia notable con respecto a la población. La muestra es sesgada o se tiene un muestreo sesgado cuando se producen valores que difieren sistemáticamente del comportamiento de la población estudiada. A menudo este sesgo se debe a que se hacen muestreos por conveniencia o de voluntarios. Un muestreo por conveniencia sería suponer que el suministro de energía eléctrica en todos los hogares de la región donde usted vive es siempre el adecuado porque en su casa y la de sus conocidos no hay fallas. Un muestreo de voluntarios está compuesto por resultados recolectados de un grupo de personas que por iniciativa propia acuden a decir que en su casa el suministro eléctrico tiene ciertas características; lo que probablemente ocurra es una mayoría de quejas por el servicio. Para evitar problemas como los anteriores se han diseñado diversas formas de determinar la muestra con base en un marco muestral de la población, es decir, una lista de todos los elementos que pertenecen a la población en estudio. La manera de elegir a los elementos de una muestra puede ser por juicio o por probabilidad. En las muestras de juicio los elementos de la muestra se eligen con base en el hecho de que son típicas. En las muestras probabilísticas todos los elementos de la población tienen la misma probabilidad de ser elegidos para ser parte de la muestra. Uno de los muestreos más usados es el muestreo aleatorio simple, en el cual cada uno de los elementos de la población posee la misma probabilidad de ser elegido. Otra manera es mediante la selección sistemática de la muestra, en esta técnica se elige un elemento del marco muestral cada i-ésimo elemento, empezando por elegir de manera

aleatoria al primer elemento; por ejemplo, se puede elegir primero al tercer miembro de la lista, luego el noveno, después el 14º, y así sucesivamente.

Figura 3: La población conforma el conjunto más grande de interés en el estudio. La muestra es un subconjunto que se espera sea representativa de la población. Si la población presenta demasiadas diferencias, el ingreso económico de la familia por ejemplo, se puede emplear el muestreo aleatorio estratificado, donde se divide a la población en estratos y se elige una cantidad de elementos de cada estrato para la muestra. Si se elige la misma cantidad de miembros de cada estrato se tiene un muestreo proporcional. Si sólo de algunos de los estratos se obtienen elementos para la muestra tendremos un muestreo por conglomerados. Al intentar recolectar datos de la muestra se espera que estos puedan ser medidos. Como se anota antes, los datos pueden ser nominales, ordinales o numéricos. Cuando se está al cuidado de la calidad de una línea de producción de circuitos eléctricos, podemos establecer que el circuito funciona o no funciona; estos son datos nominales. Si queremos analizar si la línea de producción nos da circuitos mal hechos “muy frecuentemente, “frecuentemente”, “con poca frecuencia” o “nunca”, tendremos datos ordinales. Si procesamos cuántos circuitos defectuosos nos produce cada hora esa línea, tendremos datos numéricos. En el campo de la ingeniería es más común tener datos numéricos continuos o discretos, mientras que en el campo de las ciencias sociales se encuentran con frecuencia los tres tipos de dato. Al recolectar datos numéricos podemos emplear instrumentos de medición que presentarán variaciones en su medición. Cuando se realiza la medición de algún factor como puede ser temperatura, presión, flujo, longitud, tiempo, etc. con un instrumento que siempre produce el mismo resultado, pueden estar ocurriendo una o ambas cosas de las que a continuación se anotan: el instrumento no sirve o no está calibrado con una unidad suficientemente pequeña. En cualquier medición se presenta siempre variación, ya sea al medir un mismo factor con distintos instrumentos o utilizar un solo instrumento para medir el mismo factor en distintos instantes. La variabilidad puede conducir a errores en el análisis estadístico.

Tipos de errores Cuando buscamos la información para determinar parámetros o estadísticas que describan una población o una muestra podemos cometer dos tipos de errores: errores muestrales o errores no muestrales.

Los errores muestrales se deben a que, al seleccionar la muestra de la población, aquella no es un buen descriptor de esta última. La manera de eliminar o disminuir este error es seleccionando de manera adecuada a la muestra. Los errores no muestrales están relacionados con la necesidad de obtener o medir la magnitud de alguna propiedad. Cuando medimos, por diversas razones, cometemos errores y tenemos incertidumbres. El error ( e ) es la diferencia entre la magnitud real de la propiedad ( mreal ) y el valor encontrado en la medición ( mmed ). = e mreal − mmed El error relativo ( E ) es la razón del error entre el valor de la magnitud real; si al cociente se le multiplica por cien tenemos el error relativo porcentual ( E % ). E=

= E%

e mreal e ×100 mreal

Dado que no conocemos la medida real de la propiedad no es posible determinar el error de la medida; lo que sí podemos hacer es establecer un límite superior razonable del error, esto es la incertidumbre ( I ). Con esta información podemos advertir que una medida es de magnitud m con incertidumbre I del siguiente modo

m±I es decir, el valor real de la medida está contenido en el intervalo anterior representado gráficamente en el siguiente esquema.

La incertidumbre relativa indica la tasa de precisión de la medida I . mmed La precisión aumenta conforme disminuye la incertidumbre. No es posible conocer el valor verdadero de la propiedad que se está revisando, mas lo que sí se puede hacer es disminuir la incertidumbre disminuyendo el tamaño del error. Para reducir el efecto del error es importante saber de qué tipo es; las clasificaciones son: Errores sistemáticos: Se deben a factores no considerados que alteran de manera significativa el resultado; debido a los dispositivos o métodos de medición como pueden ser errores de calibración, sensibilidad del instrumento, modificación de resultados como consecuencia de la introducción del instrumento al sistema investigado, etc. Los errores sistemáticos son sesgados en una sola dirección; es decir, todas las medidas hechas son superiores al valor real o todas son menores.

Errores de precisión: Todo aparato de medición tiene limitaciones en la precisión. Una regla escolar, por ejemplo, tiene hasta milímetros en la escala, entonces, al medir el ancho de una hoja de papel puede quedar la orilla entre dos líneas de la escala, automáticamente habrá que elegir por uno de ellos, la línea más cercana, y estaremos dando origen a un error. La incertidumbre, en casos como el aquí descrito, será la mitad de la mínima división de la escala. 216 ± 0.5mm

Figura 4: Cuando llevamos a cabo mediciones es difícil que el indicador coincida con una cota exacta, en consecuencia aproximamos la medida; esto implica tener un error inevitable. Errores de observación: Estos errores se deben a que el operador no actúa de manera adecuada durante la obtención de las lecturas; por ejemplo, puede que antes de llevar a cabo las operaciones de medición no haya calibrado el aparato, tiene problemas de reacción cuando se requieren acciones inmediatas para parar un conteo, no observa la escala desde un ángulo adecuado, etc. Estos errores se pueden eliminar o limitar.

Errores estadísticos o aleatorios: En todo proceso de obtención de medidas se tendrán fuentes no controladas de errores que modifican aleatoriamente el valor de la medida. Estos errores no se pueden eliminar pero se pueden disminuir sus efectos repitiendo muchas veces la medida. Al repetir la medición provocamos de manera aleatoria que en algunas ocasiones el valor medido sea mayor que el valor real y otras tantas veces sea menor. Ya que no es posible conocer el valor real de una medición lo que nos queda es encontrar el valor más probable de la propiedad de interés, para tal fin requeriremos determinar valores promedios. Esta y otras medidas de tendencia central y sus dispersiones se estudian en las siguientes secciones.

Bibliografía de consulta recomendada Robert Jonson y Patricia Kuby, Estadística elemental. Thomson Learning, 2004, México. Robert R.Pagano, Estadística para las ciencias del comportamiento. Thomson Learning, 2006, México. J.Susan Milton y Jesse C. Arnold, Probabilidad y estadística con aplicaciones para ingeniería y ciencias computacionales. McGraw Hill, 2004, México.

Curso propedéutico de matemáticas

Probabilidad y estadística Medidas de tendencia central y de dispersión

M. en C. Héctor Arnoldo López Zamorano Facultad de Ingeniería, UNAM

julio de 2006

II. Medidas de tendencia central y de dispersión Objetivo Al finalizar el tema, el alumno conocerá las formas de ordenar representar la información producida en un experimento y sabrá cómo obtener las medidas de tendencia central y de dispersión para datos sin agrupar y agrupados.

os datos producidos durante las mediciones en un experimento, normalmente, resultan estar sin un orden específico; son difíciles de interpretar y analizar. Por lo anterior se vuelve indispensable buscar la mejor manera de ordenar la información y darle la mejor representación para que pueda “decirnos algo”. El análisis de los datos y su calidad justifica la obtención de medidas de tendencia central que describan a la muestra o a la población y de medidas de dispersión para conocer que tan consistentes son los datos.

L

Representación gráfica de la información estadística Cuando llevamos a cabo tareas de medición, éstas las realizamos de manera individual y las registramos en algún lugar como puede ser una hoja simple de papel, una bitácora, una tarjeta de adquisición de datos, una hoja de cálculo de algún programa computacional, etc. Una vez concluida la etapa de recolección de información hacemos su ordenamiento para facilitar la interpretación y uso de tales datos, un arreglo bastante común son las tablas de distribución de frecuencias que presentan los valores de las mediciones y la frecuencia con que se registraron. Por ejemplo, las temperaturas máximas, en ºC, registradas en distintas regiones del país son: 24, 27, 32, 24, 42, 45, 28, 27, 32, 35, 39, 38, 37, 42, 47, 28, 45, 33, 30, 27, 32, 45, 27, 35, 25, 37, 39, 41, 38, 36, 29, 28, 43, 37, 32, 41, 38, 27, 30, 35, 39, 32, 36, 42, 25, 29, 30, 27, 41, 37. Estas cifras las podemos ordenar en una tabla de frecuencias de menor a mayor temperatura: Tabla 1: Tabla de frecuencias (frec en la tabla) de temperaturas en ºC (TºC en la tabla). T ºC

frec

T ºC

frec

T ºC

frec

T ºC

frec

24

2

31

0

38

3

45

3

25

2

32

5

39

3

46

0

26

0

33

1

40

0

27

6

34

0

41

3

28

3

35

3

42

3

29

2

36

2

43

1

30

3

37

4

44

0

47

1

Datos totales N=50

Cuando la cantidad de datos es muy grande podemos emplear intervalos para agruparlos y facilitar su manejo. Para construir una tabla de frecuencias agrupadas seguimos los pasos: 1. Encontrar el rango ( R ) de datos, es decir, encontrar la diferencia entre el valor mayor ( Vmayor ) y el valor menor ( Vmenor ) del ordenamiento;

R = Vmayor − Vmenor = 47 − 24 = 23 2. Determinar la amplitud del intervalo constante ( I ). Podemos definir un número ( n ) adecuado de intervalos para tener

R 23 = ≈ 3.8 (Se considera que seis intervalos son adecuados. Cuando n 6 el intervalo tiene decimales se redondea al número inmediato inferior o superior con las mismas cifras significativas que los datos, I = 4 .) = I

Otra opción es elegir el número de intervalos ( n = 6 ) y el ancho del intervalo de clase ( I = 4 ) de modo que nI ≥ R , con números ( 4 )( 6 ) ≥ 21 . 3. Construir una tabla donde coloquemos los intervalos y las frecuencias de datos para cada uno. Considere, al establecer el límite inferior, éste debe contener al dato mínimo y debe ser divisible entre el intervalo. Observe que el dato más pequeño es 24, este puede ser nuestro límite inferior ya que es divisible entre el intervalo Vmenor 24 = entero = = 6 I 4 Tabla 2: Tabla de frecuencias agrupadas para los datos utilizados en la tabla 1. Intervalo de clase

24 − 27 28 − 31 32 − 35 36 − 39 40 − 43 44 − 47

Límites reales

23.5 − 27.5 27.5 − 31.5 31.5 − 35.5 35.5 − 39.5 39.5 − 43.5 43.5 − 47.5

Marca de clase 25.5 29.5 33.5 37.5 41.5 45.5

Frecuencia

Frecuencia acumulada

Frecuencia relativa (%)

Frecuencia relativa acumulada (%)

10 8 9 12 7 4

10 18 27 39 46 50

20 16 18 24 14 8

20 36 54 78 92 100

La frecuencia acumulada indica la cantidad de datos que están por debajo del límite real superior de cada intervalo. La primera fila de la frecuencia acumulada registra el mismo valor que en la frecuencia porque no hay valores menores, en la segunda fila ya se le ha sumado el siguiente valor de la frecuencia (10 + 8 = 18 ), en la tercera fila hacemos lo mismo (18 + 9 = 27 ), y así sucesivamente.

La frecuencia relativa porcentual ( fi % ) es la razón entre la frecuencia del intervalo ( fi ) y la cantidad total de datos ( N ) 10 fi % = ×100 =20% 50

18 fi % = ×100 =16% (los demás datos se tratan igual) 50 La frecuencia relativa acumulada se construye del mismo modo que la frecuencia acumulada, la diferencia estriba en que utilizamos la columna de frecuencias relativas. Toda la información que se ha manejado hasta aquí la podemos representar mediante diversos gráficos. A partir de la tabla 1 podemos construir una gráfica o diagrama de barras (figura 5). Diagrama de barras 6

Frecuencia

5 4 3 2 1 0 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 Temperatura en ºC

Figura 5: Diagrama de barras donde se muestra para cada temperatura con qué frecuencia se registró (de la tabla 1). Diagrama de barras para datos agrupados 14

Frecuencia

12 10 8 6 4 2 0 24-27

28-31

32-35

36-39

40-43

44-47

Intervalos

Figura 6: Diagrama de barras donde se muestra para cada intervalo de temperatura con qué frecuencia se registró (de la tabla 2).

En lugar de diagramas de barras podemos emplear polígonos de frecuencia como en la figura 7, que los datos de la tabla 2 son representados mediante un polígono de frecuencia y un polígono de frecuencias acumuladas. Polígono de frecuencias 14

60

12

50

10

Frecuencia

40 8 30

Frecuencias Frecuencias acumuladas

6 20 4

10

2

0

0 29.5

25.5

33.5

37.5

41.5

45.5

Punto medio del intervalo

Figura 7: Se muestran los polígonos de frecuencias y de frecuencias acumuladas para los datos de la tabla 2. Con las frecuencias relativas podemos construir gráficas de pastel, como el de la figura 8. Gráfica de pastel

44-47 8%

24-27 20%

40-43 14%

28-31 16% 36-39 24% 32-35 18%

Figura 8: Gráfica de pastel para las frecuencias relativas de la tabla 2, se indica el intervalo y el porcentaje de datos para cada uno de ellos.

Medidas de tendencia central y dispersión Con los datos acomodados del mejor modo, como en la sección anterior, podemos determinar estadísticas que nos permitan describir a la muestra y, como consecuencia, a la población en análisis. Vamos a determinar primero las medidas

de tendencia central como la media aritmética o promedio, la media geométrica, la media armónica, la mediana y la moda; posteriormente aprenderemos a obtener medidas de dispersión como la varianza y la desviación estándar. Las medidas de tendencia central tratan de indicar con un solo valor representativo los datos recogidos, como es muy poco común que los datos coincidan con la media podemos indicar que tan lejos quedan los datos de la media mediante una medida de la dispersión. La media aritmética o promedio es la medida de tendencia central más calculada, la encontramos sumando todos los datos y dividiendo el resultado entre la totalidad de datos. n

X=

∑x f

i i

i =1

N

Para los datos de la tabla 1 tendremos = X

( 24 )( 2 ) + ( 25)( 2 ) + ( 26 )( 0 ) + ... + ( 47= )(1) 50

1715 = 34.3 50

Para los datos de la tabla 2 nos quedarán

( 25.5)(10 ) + ( 29.5)(8) + ( 33.5)( 9 ) + ( 37.5)(12 ) + ( 41.5)( 7 ) + ( 45.5 )( 4 ) =

1714.16 = 34.292 50 50 Podemos ver que para datos del mismo origen hay una pequeña diferencia entre la media para datos individuales y para datos agrupados, esto es bastante normal. Siempre se presenta un sesgo al hacer el cálculo con los datos agrupados

= X

La media aritmética, y para cualquier otro tipo de media puede hacerse un razonamiento similar, puede interpretarse como el centro de gravedad de un cuerpo conformado por todos los datos obtenidos. Si imaginamos, como en la figura 9, que los datos son unos pequeños cuerpos con peso en proporción de su magnitud colocados sobre una tabla, la media será el punto donde tanto a la izquierda como a la derecha nos queda el mismo peso, es decir, la media actúa como el soporte de una balanza en equilibrio.

Figura 9: Representación simbólica de lo que significa la media de un conjunto de datos numéricos.

Cuando la media aritmética no es una buena estadística o parámetro probablemente tengamos una mejor representación empleando lo que se conoce como media geométrica. La media geométrica está dada por la fórmula n

X G = N ∏ xifi i =1

Para los datos {2,5,3, 4,8} la media geométrica es = XG

= ( 2 )( 5)( 3)( 4 )(8) 3.949

5

Para los datos de la tabla 2 tendremos = ( 25.5) ( 29.5) ( 33.5) ( 37.5) ( 41.5) ( 45.5) 33.72 10

50

XG

8

9

12

7

4

Observe como la media geométrica es menor que la media aritmética. Esto siempre se presenta cuando para los mismos datos se obtienen la media aritmética y la media geométrica. La media armónica para una colección de datos se obtiene aplicando la fórmula XA =

N n

fi

i =1

i

∑x

Para los datos con que calculamos la primera media geométrica tendremos = XA

5 = 3.55 1 1 1 1 1 + + + + 2 5 3 4 8

Para los datos de la tabla 2 tendremos como media armónica XA

50 = 33.14 10 8 9 12 7 4 + + + + + ( 25.5) ( 29.5) ( 33.5) ( 37.5) ( 41.5) ( 45.5)

Aquí también puede observarse que la media armónica es menor que la media geométrica. En general, al comparar las distintas medias se cumple la desigualdad X A < XG < X La mediana ( Med ) es un valor que divide a los datos en dos subconjuntos de cardinalidad igual, esto es, la mitad de los datos es menor que la mediana y la otra mitad es mayor. Para obtener la mediana de una colección de magnitudes seguimos los pasos anotados a continuación. 1. Debemos ordenar los datos de menor a mayor o de mayor a menor.

2. Para encontrar la mediana de datos no agrupados necesitamos calcular la posición del valor mediano o profundidad de la mediana ( p ) utilizando la fórmula

p=

N +1 2

3. el valor mediano es el dato de la colección ordenada que deje sobre él la misma cantidad de valores que debajo de él. Si la cantidad de magnitudes es impar, es decir , N es impar, el valor de p es un entero e indica la posición del valor mediano en los datos ordenados. Si p no es un entero porque N es par entonces la mediana es el promedio de los dos datos centrales de la colección ordenada. Por ejemplo, para los datos {5,3,8,9,11, 6,5} que ordenados de menor a mayor quedan: Posición Dato

1 3

2 5

3 5

4 6

5 8

6 9

7 11

La profundidad la obtenemos de sustituir N = 7 , que es la cardinalidad del conjunto de datos, en la ecuación del punto 2 p =

7 +1 = 4 2

Como p es un entero entonces la mediana es el dato de la posición 4: Med = 6 Podemos ver que hay tres valores menores que seis, {3,5,5} , y tres mayores,

{8,9,11} . Para el conjunto de datos {5,3,8,9,11, 6,5, 4} tendremos el orden Posición

1

2

3

4

5

6

7

8

Dato

3

4

5

5

6

8

9

11

Tendremos que= p

N +1 8 +1 = = 4.5 2 2

Como p no es un entero, para determinar la mediana, tomaremos los datos de las posiciones 4 y 5 para obtener su promedio: Med =

5+6 = 5.5 2

Podemos ver por que tenemos el conjunto de valores menores que 5.5 {3, 4,5,5} y el conjunto de magnitudes mayores que 5.5 {6,8,9,11} ; ambos conjuntos son de cardinalidad cuatro. Si los datos están agrupados, como en la tabla 3 que copiamos de la tabla 2, la manera de determinar la mediana requiere más información. Tabla 3. Tabla de datos agrupados para el cálculo de la mediana Límites reales Intervalo de clase

24 − 27 28 − 31 32 − 35 36 − 39 40 − 43 44 − 47

xinf − xsup 23.5 − 27.5 27.5 − 31.5 31.5 − 35.5 35.5 − 39.5 39.5 − 43.5 43.5 − 47.5

Marca de clase

xi

25.5 29.5 33.5 37.5 41.5 45.5

Frecuencia

Frecuencia acumulada

fi 10 8 9 12 7 4

i f acum 10 18 27 39 46 50

Frecuencia relativa acumulada (%)

f %iacum

20 36 54 78 92 100

Dado que hay N = 50 datos, la profundidad de la mediana estará en

= p

N + 1 50 + 1 = = 25.5 2 2

Esto quiere decir que la mediana nos dejará 25 datos superiores a ell y 25 valores menores, pero al estar agrupados solamente sabemos que está en el intervalo 32 − 35 porque la frecuencia acumulada llega en ese intervalo a 27. Para determinar la mediana emplearemos la fórmula Med = xinf +

i −1 I ( f p − f acum )

fi

Utilizando la información disponible: xinf = 31.5 (Límite inferior real del intervalo que contiene a la mediana) I = 4 (Amplitud del intervalo)

f p = 25 (Frontera de la mediana o cardinalidad de los subconjuntos de los elementos mayores y menores) i −1 f acum = 18 (Frecuencia acumulada para el intervalo inmediato anterior al que contiene la mediana)

fi = 9 (Frecuencia del intervalo que contiene a la mediana) Entonces

( 4 )( 25 − 18) = Med = 31.5 + 34.6 9 Puede notarse que la mediana está muy cerca del límite superior del intervalo 32 − 35 , la razón de que eso ocurra se debe a que la frecuencia acumulada apenas llega a 27 mientras que la mediana debiera estar entre los elementos 25 y 26. Si observa la tabla 1 verá que la mediana es de 35 debido a que en este valor se completan los 25 valores menores que la mediana y 25 mayores. Sin embargo, el valor determinado con la fórmula no es muy distinto. La moda ( Mod ) es el dato o intervalo de mayor frecuencia, para la tabla 3 el intervalo modal es el intervalo 36 − 39 . Normalmente la media, la mediana y la moda nos darán valores distintos a menos que la distribución sea unimodal y simétrica. Para los cálculos aquí mostrados no se tiene igualdad en los valores porque, como se puede en las figuras 6 y 7, se tiene una distribución sesgada o no simétrica. Cuando el sesgo es hacia la izquierda se presenta la desigualdad (figura 10) Mod < Med < X

Cuando el sesgo es hacia la derecha se tiene la desigualdad (figura 10) X < Med < Mod

Figura 10: Comparación de estadísticos cuando hay sesgo en la distribución. Las medidas de dispersión nos dicen qué tan cerca están los datos de la muestra del valor encontrado para describirla. La primera medida de dispersión que se analiza es el rango de dispersión, posteriormente analizaremos la desviación estándar y la varianza, quizá los valores más utilizados para describir la dispersión de los datos. Una manera rápida de revisar la precisión de una medida es el rango ( R ), cuanto menor es éste mayor es la precisión o la repetición de las medidas. El rango es la diferencia entre el valor mayor y el valor menor de los datos:

= R Vmayor − Vmenor Para los datos {5,3, 7,3,9,10, 2, 7,11} el rango es R = Vmayor − Vmenor = 11 − 2 = 9 La desviación estándar la podemos determinar para una muestra ( s ) o para una población ( σ ). Consideremos una serie de mediciones del voltaje eléctrico que suministran dos compañías llamadas CEFITO y FORZITO: CEFITO 125 FORZITO 130

120 112

128 108

126 124

127 135

130 133

124 138

Si obtenemos la media aritmética para el voltaje de la compañía CEFITO tenemos

V CEFITO =

V ∑ = N

125 + 120 + 128 + 126 + 127 + 130 + 124 = 125.7V 7

Mientras que para la compañía FORZITO resulta V ∑ =

V FORZITO =

N

130 + 112 + 108 + 124 + 135 + 133 + 138 = 125.7V 7

Como se puede ver los promedios son muy similares pero si se observa con cuidado la figura 11 se puede notar que una colección es más dispersa que la otra.

Dispersión de voltajes medidos 140 135 Voltaje

130 125 120 115 110 105 CEFITO

FORZITO

Figura 11: Comparación de la dispersión de los datos.

Ya que el promedio no indica que compañía suministra un voltaje más o menos constante se necesita evaluar la variación de las medidas, para ello se calculará la desviación estándar. Esta desviación es un buen parámetro porque cuando se comparan, las medidas más constantes proporcionan desviaciones estándar menores que aquellas más dispersas; la razón de esa diferencia es porque la desviación estándar es una especio promedio modificado de las diferencias entre los datos y su media aritmética. La fórmula para determinar la desviación estándar de una muestra es

∑(x − X ) N

s=

i =1

2

i

N −1

Y la desviación estándar de una población es

∑(x − X ) N

σ=

i =1

2

i

N

La diferencia entre la fórmulas se debe a que la desviación estándar de una muestra casi siempre subestima la desviación estándar de la población de estudio, de ahí que para disminuir el error para s la división se realice entre N −1 . En la tabla 4 se muestran los cálculos para la determinación de desviaciones estándar. Tabla 4. Valores para el cálculo de las desviaciones estándar para los voltajes medidos para las compañías CEFITO Y FORZITA. CEFITO

FORZITO xi

xi − X

(x − X )

0.49

130

4.3

18.49

-5.7

32.49

112

-13.7

187.69

128

2.3

5.29

108

-17.7

313.29

126

0.3

0.09

124

-1.7

2.89

127

1.3

1.69

135

9.3

86.49

130

4.3

18.49

133

7.3

53.29

124

-1.7

2.89

138

12.3

151.29

xi

xi − X

(x − X )

125

-0.7

120

Suma

i

61.43

2

Suma

2

i

813.43

Utilizando los resultados de la tabla 4, que N = 7 y la fórmula para la desviación estándar se tiene sCEFITO =

= sFORZITO

61.43 = 3.2 7 −1

813.43 = 11.64 7 −1

(Las unidades para la desviación estándar son las mismas que las de la variable o de los datos.) Los resultados muestran, al igual que le gráfico o el rango de dispersión, que en el caso de la compañía FORZITO hay más variación en los datos recogidos. La varianza de la muestra o de la población es el cuadrado de su respectiva desviación estándar. Para el ejemplo las varianzas son: = Varianza CEFITO

= 3.2 ) ( sCEFITO ) (=

Varianza= FORZITO

2

2

10.24

= = ( sFORZITO ) (11.64 ) 2

2

135.49

Fórmulas alternas para el cálculo de las desviaciones estándar son las siguientes: 2

= s

 N  2 N  ∑ xi  N  N  2 2 i =1   N ∑ xi −  ∑ xi  xi − ∑ N =i 1 = i1  i =1 = N −1 N ( N − 1) 2

= σ

 N  2 N  ∑ xi  N  N  2 2 i =1   N ∑ xi −  ∑ xi  xi − ∑ N =i 1 = i1  i =1 = N N2

Si los datos son agrupados las fórmulas a emplear en los cálculos son las que se anotan a continuación.

∑ ( n

s=

i =1

fi xi − X N −1

O también

)

∑ f (x − X ) n

2

σ=

i =1

i

i

N

2

2

s

 n  2 n  ∑ fi xi  n  n  2 2 i =1   N ∑ fi xi −  ∑ fi xi  fi xi − ∑ N =i 1 = i1  i =1 = N −1 N ( N − 1) 2

σ

 n  2 n  ∑ fi xi  n  n  2 2 i =1   N ∑ fi xi −  ∑ fi xi  fi xi − ∑ N =i 1 = i1  i =1 = N N2

Si se retoma la tabla 3 y se le modifica un poco para adaptarlo a las nuevas necesidades y al empleo de las fórmulas dadas antes de este párrafo entonces se tiene la tabla 5. Tabla 5. Acomodo de información para el cálculo de la desviación estándar de una muestra de datos agrupados.

Intervalo de clase

Frecuencia Marca de clase

24 − 27 28 − 31 32 − 35 36 − 39 40 − 43 44 − 47

xi

fi 10 8 9 12 7 4

25.5 29.5 33.5 37.5 41.5 45.5

fi xi 255 236 301.5 450 290.5 182 1715

Sumas La aplicación de la fórmula da n 2 i i =i 1 =i 1

s

2

  N ∑ f x −  ∑ fi xi    = N ( N − 1) n

La varianza es s 2 = 39.82

( 50 )( 60776.5) − (1715) = ( 50 )( 49 ) 2

6.31

fi xi2 6502.5 6962 10100.25 16875 12055.75 8281 60776.5

Bibliografía de consulta recomendada Robert R.Pagano, Estadística para las ciencias del comportamiento. Thomson Learning, 2006, México. J.Susan Milton y Jesse C. Arnold, Probabilidad y estadística con aplicaciones para ingeniería y ciencias computacionales. McGraw Hill, 2004, México. William W. Hines y Douglas C. Montgomery, Probabilidad y estadística para ingenieros. CECSA, 2000, México

Curso propedéutico de matemáticas

Probabilidad y estadística Distribuciones discretas y continuas

M. en C. Héctor Arnoldo López Zamorano Facultad de Ingeniería, UNAM

Julio de 2006

III. Distribuciones discretas y continuas Objetivo Al finalizar el tema, el alumno conocerá algunas de las distribuciones discretas y continuas más comunes y aprenderá a utilizarlas para hacer estimaciones, principalmente se enfatizará en la distribución normal.

n las secciones estudiadas antes se han descrito algunos conceptos útiles en la estadística y el tratamiento que se le puede dar a los datos. Se dio la definición de variable y los tipos de datos que esta recoge: valores discretos o valores continuos. En esta sección vamos a trabajar con funciones que utilizan a las variables discretas y continuas.

E

Densidades de probabilidad de funciones de variables discretas Cuando el conjunto de valores que puede tomar una variable es finito o infinito pero contable se está trabajando con una variable aleatoria discreta (figura 3.1). Cuando se realiza un experimento estadístico no basta con determinar sus valores posibles, también se requiere determinar la probabilidad de que tal valor ocurra; dicha probabilidad viene dada por una expresión matemática conocida como función o densidad de probabilidad discreta, que formalmente se define La función dada por

f= ( x ) P= [ X x ] es la función de densidad de

probabilidad discreta para que la variable discreta X tome el valor x .

Figura 3.1. El conteo de vehículos que pasan por alguna calle es una variable aleatoria discreta. Toda función de probabilidad requiere que se cumplan dos condiciones:

1.

f ( x) ≥ 0

2.

∑ f ( x) = 1 ∀x

Las condiciones anteriores establecen que no hay probabilidades negativas y la suma de todas las probabilidades de los valores de X debe ser uno. También se puede deducir de la última condición que no cualquier expresión matemática puede ser una función de probabilidad. Para la función = f ( x)

144 = , x 1, 2,3, 4. 205 x 2

Se puede determinar si es o no una función de densidad de probabilidad construyendo una tabla de probabilidades como la de la tabla 3.1 donde sustituimos el valor de la variable x en la función f ( x ) : Tabla 3.1. Tabla de probabilidades para la función = f ( x) 1 144 205 144 205

x f ( x)

F ( x)

2 36

205 180 205

144 = , x 1, 2,3, 4. 205 x 2

3 16

205 196 205

4 9

205 1

La probabilidad de que la variable x tome el valor de 1 es de 144 matemáticamente f (1) = 144

, 205 ; del mismo modo se pueden interpretar los

205 demás valores. En la tercera fila de la tabla 3.1 añadimos lo que se conoce como la función de densidad acumulada que se define mediante la expresión F ( x0 )= P [ X ≤ x0 ]=

∑ f ( x) .

x ≤ x0

Podemos ver que la suma de todas las probabilidades definidas en la segunda fila es uno, que es el último valor de la tercera fila. Así, la probabilidad de que X tome un valor de tres o menor que tres es 196 obtenido de hacer F ( 3)= P [ X ≤ 3]=

144

∑ 205 x x ≤3

2

=

144 36 16 196 + + = . 205 205 205 205

205

Otro concepto importante es el de valor esperado o esperanza, E W ( x )  , de una variable aleatoria discreta W ( x) que se define como

E W ( X )  = ∑ W ( x ) f ( x ) ∀x

Por tanto, el valor esperado o esperanza para el caso W [ X ] = X es E ( X ) = ∑ xf ( x ) ∀x

Esta última esperanza es el valor promedio o media aritmética que se espera se obtenga al recopilar los datos producidos en la realización del experimento. Para el 144 caso planteado con la función = f ( x) = , x 1, 2,3, 4 se tendrá la esperanza 205 x 2

(

E ( X ) = 1 144

205

) + 2 (36 205) + 3 (16 205) + 4 ( 9 205) =

60 41

Es decir, se espera que el promedio de resultados esté entre 1 y 2, 60 específicamente , porque estos son más probables de ocurrir que los otros 41 valores de la variable. La varianza está dada por 2 2 = σ= VarX E ( X − µ )   

si conocemos la media de la población, µ . Si tal media es desconocida, como en la mayoría de los casos ocurre, se puede aplicar la expresión 2 = σ= VarX E  X 2  − ( E [ X ])

2

Para el caso anterior la esperanza de la variable al cuadrado es

(

2 E  X 2  =∑ x 2 f ( x ) =(1) 144 ∀x

576 + ( 2 ) ( 36 + ( 3) (16 + ( 4) ( 9 = ) ) ) ) 205 205 205 205 205 2

2

2

Como ya se conoce la esperanza de la variable, entonces la varianza es 2

576  60  5616 VarX = −   = 205  41  8405 La desviación estándar es la raíz cuadrada de la varianza = σ

= VarX

σ2

Entonces la desviación estándar para el caso aquí revisado es = σ

5616 = 0.81742 . 8405

I. Ejercicios 1. Dé un ejemplo de una variable aleatoria discreta finita y de una variable aleatoria discreta infinita. 2. Una agencia de renta de automóviles recibe 0, 1, 2, 3, 4 ó 5 autos que le 1 1 1 1 1 1 , , , , y , regresan cada día, con probabilidades de 12 6 6 3 12 6 respectivamente. Compruebe que las razones o probabilidades dadas de verdad son una función de densidad, determine la esperanza de la variable o sea la media y encuentre la desviación estándar. 3. Determine el valor de la constante k que hace que la expresión 3 = f ( x) = , x 1, 2,3, 4,5, 6 sea una función de densidad. Construya una kx tabla de densidad y densidad acumulada. Indique cuáles son los valores de f ( 4 ) y de F ( 4 ) , ¿son iguales? ¿por qué? Determine la media, la varianza y la desviación estándar de la variable. 4. Una mano de póker de cinco cartas puede contener de 0 a 4 ases (la baraja es de 52 cartas). Si X es la variable aleatoria discreta que denota el número de ases en la mano, ¿Cuáles son las probabilidades asociadas con cada valor posible de X ? ¿Cuáles son los valores de la media y la desviación estándar?

Distribución binomial Esta distribución tiene las siguientes propiedades 1. El experimento consiste de una cantidad fija n de ensayos que dan solamente uno de dos posibles resultados “éxito” o “fracaso”. 2. La probabilidad de “éxito”, p , es constante. La probabilidad de “fracaso”, q , es q = 1 − p . 3. La variable aleatoria discreta X representa el número de éxitos obtenidos en los n ensayos. La función de distribución binomial está definida por n  n  x n− x n− x = f ( x )   p x (1 − = p) , x 0,1, 2,3,..., n; 0 < p < 1  p q =  x  x y además

E[X= ] µ= np VarX = npq n n! Donde =   =  x  x !( n − x ) !

n

Cx

Figura 2. El lanzamiento de una moneda es un experimento de Bernoulli porque sólo hay dos posibles resultados (cara o revés). Varios lanzamientos de moneda son un experimento binomial. La distribución binomial acumulativa es = F ( x)

x

n

∑  l  p (1 − p ) l =0

l

n −l

 

Para un experimento en que se realizan 8 ensayos con una probabilidad de éxito en cada uno de ellos de 0.30 tendremos la función de densidad 8 x 8− x = f ( x )   ( 0.30 ) (1 − 0.30 )  x Que nos producirá la tabla de densidades x

f ( x)

0

1

2

3

4

5

6

7

8

0.0576 0.1976 0.2965 0.2541 0.1361 0.0467 0.0100 0.0012 0.0001

F ( x ) 0.0576 0.2552 0.5517 0.8058 0.9419 0.9886 0.9986 0.9998 0.9999

La esperanza será de = E [ X ] 8= ( 0.30 ) 2.4

y la varianza será de VarX = 8 ( 0.30 )(1 − 0.30 = ) 1.68 con una desviación estándar de

σ = 1.2961 Con base en la tabla podemos decir que la probabilidad de tener tres éxitos es P ( X= 3= ) f ( 3=) 0.2541 y la probabilidad de tener menos de cuatro éxito es P ( X < 4= ) P ( X ≤ 3=) F ( 3=) 0.8058 La probabilidad de tener cinco o más éxitos es P ( X ≥ 5 ) =1 − P ( X < 5 ) =1 − P ( X ≤ 4 ) =1 − F ( 4 ) =1 − 0.9419 =0.0581

Los valores obtenidos aquí se pueden encontrar también en tablas de distribución binomial que encontramos comúnmente en libros de probabilidad y estadística. II. Ejercicios 1. Se ha observado que un instrumento de medición de temperaturas ubicado en una instalación remota reporta de manera correcta el 90% de las lecturas hechas. Si cada mes se realizan diez monitoreos, construya la tabla de densidad y de densidad acumulada para el instrumento. Calcule la probabilidad de que al menos ocho lecturas sean correctas. Encuentre la probabilidad de que más de cinco lecturas sean correctas. Determine la media y la desviación estándar de operación del instrumento. 2. Se planean seis pruebas para un equipo industrial. La probabilidad de que el equipo funcione de manera adecuada es de 0.95. ¿Cuál es la probabilidad de que el equipo funcione de manera exitosa al menos en cuatro ocasiones? 3. En el control de calidad de la fabricación de circuitos electrónicos se ha determinado que en cada lote de 100 circuitos se encuentran dos defectuosos. Si de la línea de producción se toman 15 circuitos cuál es la probabilidad de que cuando mucho tres de ellos fallen. Determine la probabilidad de que al menos diez de ellos funcionen correctamente.

Distribución hipergeométrica Esta distribución tiene las siguientes propiedades

1. Se tienen N objetos que conforman la población con la que se hará el estudio. En esta población se tienen r objetos con una particularidad que interesa analizar. 2. De la población se toma una muestra de tamaño n , que se espera sea representativa. Al extraer la muestra no hay remplazo. 3. La variable aleatoria X representa a la cantidad de objetos en la muestra que tienen la particularidad de interés. Tener el objeto particular es un éxito, no tenerlo se considera fracaso, es decir X es el número de éxitos. En la figura 3 se representan estas condiciones.

Figura 3. Contexto del análisis de una distribución hipergeométrica. La función que describe esta distribución de probabilidades es  r  N − r     x n − x   sujeta a la condición máx 0, n − ( N − r )  ≤ x ≤ mín ( n, r ) f ( x) = N   n Donde N , r y n son números naturales. La esperanza E [ X ] para esta distribución está dada por la fórmula  r  E[X ] = n  N Y la varianza es  r  N − r  N − n  VarX = n       N   N   N −1 

La condición debe interpretarse del siguiente modo: x está entre el valor mayor que resulta de comparar 0 y n − ( N − r ) y el valor menor que se encuentra al contrastar n con r . La función y las condiciones se analizan en el siguiente ejemplo. Considere que en el almacén de una compañía eléctrica se tienen 19 interruptores y que 6 de ellos son inservibles, pero esta característica no se nota a simple vista. Si se toman 10 de los interruptores para emplearlos en instalaciones eléctricas, la función de densidad, considerando como éxito tener un interruptor defectuoso, para N = 19 , r = 6 , n = 10 , será

 r   N − r   6   19 − 6   6   13           x   n − x   x  10 − x   x  10 − x   = f ( x) = = 92378 N 19      n 10  Para la condición hacemos n − ( N − r ) = −3 y al comparar con 0 10 − (19 − 6 ) = tomamos como límite inferior a 0 por ser mayor que −3 . Al comparar n con r tomamos el límite superior de x como 6. Entonces la función y su condición es  6   13     x  10 − x   con x = 0,1, 2,..., 6 f ( x) = 92378 La probabilidad de instalar exactamente cinco interruptores defectuosos es  6   13   6  13        5 10 − 5   5   5  = = f ( 5 )   = 92378 92378

( 6= )(1287 ) 92378

27 323

La probabilidad de colocar al menos tres interruptores inservibles es 6

P ( x ≥ 3) =∑ f ( x ) =1 − P ( x < 3) =1 − F ( 2 ) x =3

  6   13   6  13   6  13             0 10 1 9 2 8 479 P ( x ≥ 3) =1 −  f ( 0 ) + f (1) + f ( 2 )  =1 −      +     +      =  92378 92378 92378  646     La esperanza de la variable discreta será  r   6  60 E = [ X ] n=   10=   N  19  19 Y la varianza resultará

 r  N − r  N − n   6   19 − 6   19 − 10  390 = VarX n=     10 =     N   N   N −1   19   19   19 − 1  361 III. Ejercicios 1. Encuentre los posibles valores de la variable discreta cuando N = 15 , r = 12 y n = 10 . Determine la esperanza y la desviación estándar de la variable. 2. Encuentre los posibles valores de la variable discreta cuando N = 20 , r = 12 y n = 15 . Encuentre f (10 ) y F (10 ) . Determine la esperanza y la desviación estándar de la variable. 3. Un lote de 25 cinescopios de televisión se somete a un procedimiento de calidad para su aceptación. El procedimiento consiste en extraer cinco tubos al azar, sin remplazo, y probarlos. Si dos o menos tubos fallan, los restantes se aceptan. De otro modo el lote se rechaza. Suponga que el lote contiene cuatro tubos defectuosos. ¿Cuál es la probabilidad de que el lote se acepte? 4. Los trabajadores de una línea de ensamblaje arman 15 automóviles cada hora. Durante una de las horas de análisis se producen 5 automóviles con defecto. Se eligen tres automóviles al azar para revisar que no tengan fallas en su armado. Indique cuál es el éxito en el experimento y construya la densidad de probabilidades de la variable discreta. Determine cuál es la probabilidad de elegir cuando mucho un automóvil con defecto. Indique la probabilidad de seleccionar al menos un automóvil defectuoso. Cuál es la esperanza y la varianza de la variable.

Distribución de Poisson Cuando se estudian eventos discretos en un intervalo de análisis continuo se está trabajando con procesos de Poisson, como por ejemplo el número de baches (cantidad discreta) en una calle (intervalo continuo) o el número de retiros de la red eléctrica de una planta de generación durante un año. Para resolver problemas de probabilidad relacionados con procesos de Poisson debemos, primero, determinar la unidad de medición básica que se va a emplear; en seguida se encuentra el número promedio de casos que ocurren por unidad de medición ( λ ); después, se define el tamaño o número de periodos de observación ( n ), y al final, calculamos la distribución de probabilidad mediante la expresión f ( x) =

e− k k x x!

Donde k = nλ y la variable aleatoria X es el número de ocurrencias del evento en el periodo de observación. La esperanza de la función es E[X ] = k

Y la varianza es VarX = k .

Figura 4. En los procesos de Poisson se analiza una variable discreta (el número de esferas negras) contenida en un espacio continuo (volumen de la caja). Consideremos que una planta nucleoeléctrica libera cantidades detectables de gases radiactivos dos veces por mes, en promedio. Para determinar la probabilidad de que ocurran a lo sumo cuatro de esas emisiones en un mes se siguen las etapas siguientes: 1. La unidad continua de medición puede ser un mes o, dado que se emiten dos veces en promedio los gases, podemos considerar periodos de 15 días. Tomemos los periodos de 15 días como la unidad. 2. Como se tiene un promedio de dos emisiones mensuales entonces, cada 15 días se realiza una liberación de gases, esto es, λ = 1 . 3. Como interesa la probabilidad de que se emitan cuando mucho cuatro emisiones en un mes, entonces tenemos dos periodos de 15 días con lo que n = 2 . 4. La función de probabilidad, con = k n= λ −2 e− k k x e ( 2 ) f ( x) = = x! x!

( 2 )(1=)

2 , está dada por

x

5. La probabilidad de que se emitan cuando mucho cuatro emisiones en un mes es

P ( X ≤ 4= ) F ( 4=)

4

∑ x =0

e −2 ( 2 ) e −2 ( 2 ) e −2 ( 2 ) e −2 ( 2 ) e −2 ( 2 ) + + + + = 0.9473 f ( x= ) 0! 1! 2! 3! 4! 0

1

2

3

4

Este resultado lo podemos encontrar empleando una tabla típica de distribución de Poisson disponible en libros de probabilidad y estadística como la que se muestra, en parte, a continuación: e− k k x x! x =0 k = nλ 4.0 0.018 0.092 0.238 0.433 0.629 0.785 0.889  0.999  t

F [t ] = ∑ t

↓ 0 1 2 3 4 5 6  11



0.5 0.607 0.910 0.986 0.998 1.000 1.000 1.000  1.000 

1.0 0.368 0.736 0.920 0.981 0.996 0.999 1.000  1.000 

2.0 0.135 0.406 0.677 0.857 0.947 0.983 0.995  1.000 

3.0 0.050 0.199 0.423 0.647 0.815 0.916 0.966  1.000 

5.0 0.007 0.040 0.125 0.265 0.440 0.616 0.762  0.995 

6.0 0.002 0.017 0.062 0.151 0.258 0.446 0.606  0.980 

7.0 0.001 0.007 0.030 0.082 0.173 0.301 0.450  0.947 

8.0 0.000 0.003 0.014 0.042 0.100 0.191 0.313  0.888 

Si se detectaran 12 o más emisiones durante un periodo trimestral, ¿habría razón para dudar de la cifra promedio indicada? Para determinar esta probabilidad se pueden considerar periodos de tres meses, se tendrá un periodo de observación con seis emisiones en promedio con lo que = k n= λ (1)( 6= ) 6 ; de la tabla podemos observar para valores menores que 12, es decir, acumulado hasta 11 se tiene P ( x ≥ 12 ) = 1 − P ( x < 12 ) = 1 − 0.980 = 0.02 Ahora bien, si la probabilidad de que se emitan 12 o más emisiones es de 0.02 , que es una probabilidad pequeña, entonces tener 12 o más descargas implicaría un error en el promedio indicado. IV. Ejercicios (emplee la función de densidad para resolverlos o utilice una tabla) 1. Para eventos de Poisson con k = 8 determine f ( x ) , encuentre f ( 5 ) , halle F (4) , calcule P ( X ≥ 3) , encuentre la esperanza y la desviación estándar

de la variable. 2. Alrededor de una planta industrial se instalan sensores activables por movimiento. Si debido a la calibración se enciende la alarma por animales pequeños un promedio de 0.75 veces por semana ¿Cuál es la cantidad

promedio de veces que se esperaría el disparo de la alarma por tales especies en tres semanas? ¿Cuál es la probabilidad de que la alarma se active cuando mucho 2 veces durante tres semana? ¿Cuál es la probabilidad de que la alarma suene al menos una vez en la semana? 3. La probabilidad de que un vehículo tenga una accidente en un crucero es de 0.0001 . Si por el crucero circulan 10 000 vehículos diariamente ¿cuál es la probabilidad de que no ocurran accidentes? ¿cuál es la probabilidad de que ocurran dos o más accidentes? 4. Si en una industria la probabilidad de que un obrero esté implicado en un accidente de trabajo es de 0.019, ¿cuál es la probabilidad de tener dos o más accidentes durante un periodo de cinco años?

Densidades de probabilidad de funciones de variables continuas Cuando el conjunto de valores que puede tomar la variable aleatoria no es un conjunto finito ni contable entonces se tiene que la variable aleatoria es continua. Ejemplos de este tipo de variable pueden ser la longitud de un cable, el tiempo de duración del parado de una industria por mantenimiento, la demanda energética de una ciudad, etc. Aún cuando el instrumento de medición puede proporcionarnos valores exactos, lo cierto es que si aumentamos la precisión del equipo se producirán lecturas diferentes. Así que una variable aleatoria continua puede asumir cualquier valor en uno o más intervalos de números reales y la probabilidad de que asuma un valor específico es nula. La función de densidad de una variable aleatoria continua f= ( x ) P= ( X x ) cumple con las propiedades 1.

f ( x) ≥ 0 para todo valor real de la variable aleatoria continua X . ∞

2.

∫ f ( x ) dx = 1

−∞

b

3. P ( a ≤ X ≤ b ) = ∫ f ( x ) dx a

Las dos primeras propiedades son condiciones necesarias y suficientes para que una función sea una densidad continua. La función de distribución acumulativa será F ( x0 )= P ( X ≤ x0 )=

x0

∫ f ( x ) dx

−∞

Consideremos una variable aleatoria continua X con función de densidad 1.4427 , 0.5 ≤ x ≤ 2 . Podemos demostrar que es una función de densidad f ( x) = x +1

porque para cualquier valor de x la función resulta positiva y, además, 2 1.4427 ∫0.5 x + 1 dx = 1 . Podemos determinar la probabilidad de que la variable tome valores entre 1 y 1.5 haciendo ≤ 1.5] P [1 ≤ X=

1.5

∫ 1

1.5 1.4427 = +1 1 dx 1.4427 ln x= 0.3219 x +1

La probabilidad de que x ≤ 1.7 será 1.7

1.7 1.4427 = dx 1.4427 ln x += 1 0.5 0.8480 x +1 0.5

P [ X ≤= 1.7 ]

∫

La probabilidad de que x > 1 será P= [ X > 1]

2

2 1.4427 = dx 1.4427 ln= x + 1 1 0.5850 x +1 1

∫

o también P [ X > 1] =1 − P [ X ≤ 1] =1 −

1

1 1.4427 dx =1 − 1.4427 ln x + 1 0.5 =1 − 0.4150 =0.5850 x +1 0.5

∫

Para una variable aleatoria X con función de densidad f ( x ) , la esperanza de la variable aleatoria H ( x ) , E  H ( X )  , es E  H ( X )  =

∞

∫ H ( x ) f ( x ) dx

−∞

Entonces, si H ( X ) = x = E[X ]

∞

xf ( x ) dx ∫=

µ

−∞

que es la media de la variable aleatoria continua. La varianza está dada por = VarX E  X 2  − ( E [ X ]) . 2

Para la función anotada antes

2

2 1.4427 x = + − + = dx x x 1.4427 1 ln 1 1.1640   ) (   ∫0.5 x + 1 0.5

= E[X ]

Para calcular la varianza obtenemos primero 2

1.4427 x 2 = ∫ x + 1 dx 1.5410 0.5

= E  X 2 

Con lo que la varianza resulta se VarX = 1.5410 − (1.1640 ) = 0.1861 2

V. Ejercicios 1. Determine el valor de la constante k que hace que la expresión k ( x − 1) sea una función de densidad en el intervalo 0 ≤ x ≤ 5 . Determine la media y la desviación estándar de la variable aleatoria continua. Encuentre las probabilidades P ( X ≤ 3) , P (1 < X < 4 ) , P ( X > 2 ) y P ( X ≥ 2 ) . 2. La expresión f ( x ) = ke

−x

8

, x > 0 es la función de densidad de una variable

aleatoria continua que representa la duración en minutos de una conversación telefónica, deduzca el valor de k . Determine la probabilidad de que una llamada dure menos de cinco minutos, dure exactamente cinco minutos, dure más de cinco minutos. ¿Sería inusual una llamada de entre 30 segundos y dos minutos? Calcule la media y la desviación estándar.

Distribución gama La distribución gama tiene su fundamento teórico en la función gama. Esta distribución permite definir dos familias de variables aleatorias continuas bastante útiles en las aplicaciones estadísticas. La función de distribución gama tiene la forma f ( x) =

1

Γ (α ) β

α

xα −1e

−x

β

donde x > 0, α > 0, β > 0. α y β son parámetros de la función. Cuando α = 1 la distribución es conocida como distribución exponencial: f ( x) =

1

β

−x

e

β

Si β = 2 y α =

γ

, donde γ es un entero positivo conocido como grados de 2 libertad; la función de distribución es conocida como distribución ji cuadrada o χγ2 y tiene la forma

χγ2 =

1

( 2)

Γ γ

x

γ

2

(γ 2 )−1e− x 2

2

Distribución normal Existen varias distribuciones de variable continua, sin embargo, una de las más populares en su uso es la distribución normal cuya expresión matemática es ( x − µ ) σ  2

− 1 f ( x) = e 2πσ

2

con −∞ < x < ∞, − ∞ < µ < ∞, σ > 0 . Que tiene una gráfica conocida como campana de Gauss (figura 5) que limita un x−µ área de tamaño unitario entre el eje normal z = y la curva que tiene una

σ

longitud infinita, aunque entre −3.5σ (tres y media veces la desviación estándar en el lado negativo del eje) y 3.5σ (tres y media veces la desviación estándar en el lado positivo del eje) está prácticamente toda el área unitaria. Se puede ver también que la gráfica es simétrica con respecto al eje z = 0 , que se ubica exactamente en el valor de la media µ .

Figura 5. Forma de la gráfica de la función de distribución normal. El área entre la curva infinita y el eje normal Z es de 1. Debido a la complejidad de la fórmula es muy común utilizar tablas de distribución normal para resolver los problemas que se plantean, en lugar de resolver las integrales que necesariamente surgen en distribuciones de variable continua. Para hacer la lectura de la información en la tabla es necesario normalizar o estandarizar a la variable mediante la expresión

z=

x−µ

σ

donde z → Variable normal estándar

µ → Media de la población σ → Desviación estándar de la población Si utilizamos una tabla de distribución normal típica (Tabal 1) podemos determinar fácilmente algunas probabilidades. 

La probabilidad de que la variable normal sea menor o igual que 1.85 : P ( Z ≤ 1.85 )

Como la tabla acumula el área desde el extremo izquierdo más lejano hasta llegar al valor de z = 1.85 (el área sombreada) entonces en la tabla buscamos el 1.8 en la columna de z y nos desplazamos a la derecha sobre la fila de 1.8 hasta llegar a la columna de 0.05, ahí encontramos el valor del área sombreada bajo la curva que corresponde a la probabilidad buscada: 0.9678. z  −2 −1.9  1.7 1.8  

0.00  0.0228 0.0287  0.9554 0.9641 

0.01  0.0222 0.0281  0.9564 0.9649 

0.02  0.0217 0.0274  0.9573 0.9656 

0.03  0.0212 0.0268  0.9582 0.9664 

0.04  0.0207 0.0262  0.9591 0.9671 

0.05  0.0202 0.0256  0.9599 0.9678 

…  … …  … … 

0.09  0.0183 0.0233  0.9633 0.9706 

La probabilidad de que la variable normal sea mayor o igual que 1.85: P ( Z ≥ 1.85 )

El área que interesa es la de color naranja, pero la tabla no da valores a la derecha de la variable normal, sólo a la izquierda; entonces, dado que el área bajo toda la curva es 1 , para encontrar la probabilidad de interés debemos restarle a la totalidad el área a la izquierda de la frontera con lo que nos queda el área a la derecha: P ( Z ≥ 1.85 ) = 1 − P ( Z < 1.85 ) = 1 − 0.9678 = 0.0322 

La probabilidad del intervalo P ( −2 < z < 1.72 )

El área de P ( Z < 1.72 ) es el área sombreada de naranja y gris porque la probabilidad viene desde −∞ . Como sólo interesa el intervalo −2 < z < 1.72 , habrá que quitar la sección gris P ( −2 < Z < 1.72= = 0.9345 ) P ( Z < 1.72 ) − P ( Z < 2.0=) 0.9573 − 0.0228 Consideremos que se producen laminillas de metal. Sea X la variable aleatoria continua que representa el espesor de las laminillas y su comportamiento de variación del espesor del producto tiene distribución normal con una media aritmética µ = 0.05 mm y desviación estándar σ = 0.01 mm . Podemos determinar la probabilidad de que una muestra seleccionada aleatoriamente tenga un espesor menor que 0.0673 mm ; para ello primero normalizamos la variable = z

x − µ 0.0673 − 0.05 = = 1.73 σ 0.01

entonces

P ( X < 0.0673) = P ( Z < 1.73) = 0.9582 Para encontrar la probabilidad de que el espesor del lote esté entre 0.0305 mm y 0.0679 mm hacemos z1 = = z2

x−µ

σ

=

0.0305 − 0.05 = −1.95 0.01

x − µ 0.0679 − 0.05 = = 1.79 σ 0.01

P ( 0.0305 < X < 0.0679= ) P ( −1.95 < Z < 1.79=) P ( Z < 1.79 ) − P ( Z < −1.95) = 0.9633 − 0.0256 = 0.9377 VI. Ejercicios (Utilice una tabla de distribución normal) 1. Utilice la tabla de distribución normal para encontrar las probabilidades P ( Z < −1.15 ) , P ( Z > −1.93) , P ( Z < 2.44 ) , P ( Z > 0.14 ) , P ( Z = 0 ) , P ( −1.54 ≤ Z < 2.21) , P ( 0 < Z ≤ 1.88 ) . Construya las gráficas de la campana

de Gauss de la distribución normal y señale el área calculada. 2. La vida útil de una batería seca se distribuye normalmente con una vida media útil de 14400 horas de uso continuo y desviación estándar de 1440 ¿Qué fracción de esas baterías durarían más de 680 días de uso continuo? ¿Qué porcentaje de baterías se esperaría que fallaran antes de 11700 horas de uso? 3. En una clase de matemáticas las calificaciones de los alumnos están normalmente distribuidas con una calificación promedio de 67 y una desviación estándar de 10. ¿Qué porcentaje de alumnos reprueba la materia? ¿Qué fracción de alumnos tienen un promedio superior a ocho? ¿Qué porcentaje de alumnos tienen una calificación entre siete y nueve? 4. Suponga que el nivel del agua, en pies, de una represa tiene distribución normal durante la época de lluvias, con media de 980 pies y desviación estándar de 40 pies. ¿Cuál es la probabilidad de que el nivel de agua esté entre 910 y 1080 pies? Considere que la represa se desborda cuando el nivel es mayor que 1100 pies, ¿cuál es la probabilidad de que eso ocurra? ¿Es normal que el nivel del agua esté por debajo de 905 pies?

Inferencia estadística A partir de los parámetros encontrados mediante la utilización de los datos producidos por una muestra podemos inferir conclusiones sobre toda la población origen de la muestra. Las técnicas de inferencia estadística se dividen en dos grandes grupos principales: estimación de parámetros y pruebas de hipótesis. Podemos estar interesados en determinar la resistencia a la tensión de cables empleados en líneas de alta tensión o, también, puede interesarnos la variabilidad de la resistencia.

Estimación Algunos de los problemas de estimación que ocurren con más frecuencia son la determinación de la media de una sola población para lo cual empleamos la media de la muestra (véase la sección de medidas de tendencia central y dispersión); la varianza de la población para lo que recurrimos a la varianza de la muestra; la proporción de artículos con una característica distintiva en una población para lo x que empleamos la ecuación p = , donde x es el número de objetos con la n característica particularizante en un muestra de tamaño n ; la diferencia entre las medias de dos poblaciones que puede estimarse usando las medias de dos muestras obtenidas de las poblaciones respectivas, etc. La particularidad de los estimadores radica en que deben estar “cerca” del valor verdadero de la estadística desconocida. Normalmente el estimador está muy cerca del valor verdadero, es decir el estimador es insesgado, cuando las muestras son de gran tamaño. En muchas ocasiones, debido a que las muestras no son tan grandes, tener un estimador no resulta de gran importancia, sin embargo, estimar un intervalo de la forma Linf ≤ µ ≤ Lsup puede resulta más útil. Para construir un estimador de intervalo del parámetro desconocido θ debemos encontrar dos estadísticas Linf y Lsup tales que

P ( Linf ≤ θ ≤ Lsup ) =1 − α Donde Linf ≤ θ ≤ Lsup se conoce como intervalo de confianza con un coeficiente de confianza de 1 − α o

nivel de confianza de 100 (1 − α ) % para el parámetro

estudiado. El intervalo de confianza definido antes es un intervalo de confianza de dos lados o de dos colas.

Intervalo de confianza sobre la media conocida

σ

Si conocemos la varianza de la población y desconocemos la media puede obtenerse un intervalo de confianza de 100 (1 − α ) por ciento en µ considerando que la distribución de muestreo de la variable aleatoria X es normal o casi normal, de acuerdo con el teorema del límite central que establece que para una muestra grande de elementos, de tamaño n , X es aproximadamente normal con media µ y varianza

Z=

σ2 n

y también

X −µ σ n

es aproximadamente normal estándar.

La distribución se muestra en la figura 6. La sección naranja, que es el intervalo de confianza normalizado, es de tamaño 1 − α , y como se tienen dos lados o colas de “desconfianza” cada sección tiene un área de α . 2 Así que

(

P − Zα ≤ Z ≤ Zα 2

pero como Z =

2

) =1 − α

X −µ

σ

tendremos

n

  X −µ  ≤ Zα  = P  − Zα ≤ 1−α σ 2 2   n   con lo que reacomodando queda  =1 − α P  X − Zα σ ≤ µ ≤ X + Zα σ  2 2 n n  y el intervalo de confianza de dos lados de tamaño 100 (1 − α ) % es X − Zα σ 2

n

≤ µ ≤ X + Zα σ 2

n

Figura 6. La distribución normal indicando el intervalo de confianza de dos lados. Consideremos, por ejemplo, que nos describen un nuevo método para medir la conductividad térmica de un material en particular. Al hacer diez mediciones de Btu conductividad térmica en se obtuvieron los valores 41.60, 41.48, 42.34, hr ⋅ pie⋅º F 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04; supongamos que se conoce la

Btu y que la conductividad se distribuye hr ⋅ pie⋅º F normalmente. Tomemos un nivel de confianza del 95% para determinar el intervalo de confianza de dos lados del siguiente modo desviación estándar σ = 0.10

∑x

= X

= n

∀x

41.60 + 41.48 + ... + 42.04 = 41.924 10

α

1 − α= 0.95 ⇒ α= 0.05 ⇒ = 0.025 2 = Zα Z= 1.96 , es el valor de Z donde el área bajo la curva es 1 − 0.025 = 0.975 0.025 2

Linf = X − Zα σ

 41.862 = 41.924 − (1.96 )  0.10 = n 10  

Lsup = X + Zα σ

= = 41.924 + (1.96 )  0.10  41.986 n 10  

2

2

Entonces, con el 95% de seguridad podemos decir que la media está en el intervalo

41.862 ≤ µ ≤ 41.986 . VII. Ejercicios (Utilice una tabla de distribución normal) 1. Al medir la capacidad térmica, en cal / g ⋅º C , del etilenglicol líquido a presión constante y 80 ºC de temperatura se obtuvieron los valores 0.645, 0.654, 0.640, 0.627, 0.626, 0.649, 0.629, 0.631, 0.643, 0.633, 0.646, 0.630, 0.634, 0.631, 0.651, 0.659, 0.638, 0.645, 0.655, 0.624. La experiencia indica σ = 0.01 y se considera que la variable tiene distribución normal. Encuentre el intervalo de confianza de 95% para la media. Determine el intervalo con una seguridad del 98%. 2. Es habitual la manifestación tardía de lesiones después de la exposición a dosis suficientes de radiación. Se midió la cantidad de días que transcurren entre la exposición y la aparición del enrojecimiento de la piel en varios pacientes: 16, 12, 14, 16, 13, 9, 15, 7, 20, 19, 11, 14, 9, 13, 11, 3, 8, 21, 16, 16, 12, 16, 14, 20, 7, 14, 18, 14, 18, 13, 11, 16, 18, 16, 11, 13, 14, 16, 15, 15. Suponga que σ = 4 para encontrar el intervalo de confianza del 95% para la media de tiempo para la aparición del enrojecimiento. ¿Le sorprendería la afirmación de que µ = 17 días? Explique su respuesta.

Intervalo de confianza sobre la diferencia de dos medias conocidas σ Consideremos dos variables aleatorias X 1 y X 2 con varianzas conocidas σ 1 y σ 2 y medias µ1 y µ2 desconocidas. Si X 1 y X 2 son normales o casi normales, entonces Z=

(X

1

)

− X 2 − ( µ1 − µ2 )

σ 12 n1

+

σ 22 n2

es también normal. De la figura 6 deducimos que

(

P − Zα ≤ Z ≤ Zα 2

2

) =1 − α

    X 1 − X 2 − ( µ1 − µ2 )  O también P  − Zα ≤ ≤ Zα  = 1 − α , de donde 2 2 2 2 σ σ 1   + 2   n n 1 2  

(

)

 σ 12 σ 22 σ 12 σ 22  + ≤ µ1 − µ2 ≤ X 1 − X 2 + Zα + P  X 1 − X 2 − Zα 1−α =   2 2 n n n n 1 2 1 2  

(

)

(

)

Con lo que el intervalo de confianza del 100 (1 − α ) % para µ1 − µ2 es

(

)

X 1 − X 2 − Zα

σ 12 2

n1

+

σ 22 n2

(

)

≤ µ1 − µ2 ≤ X 1 − X 2 + Zα

σ 12 2

n1

+

σ 22 n2

Como ejemplo consideremos que se realizan pruebas de resistencia a la tensión de cables de características similares de dos compañías fabricantes. Los resultados de las pruebas se muestran en la tabla anotada a continuación Fabricante

Tamaño de la muestra

Resistencia (kg/mm2)

Desviación estándar

A

nA = 12

X A = 89.45

σ A = 1.1

nB = 15 X B = 77.32 σ B = 1.9 Determinemos el intervalo de confianza con una seguridad del 97%. B

α

Entonces 1 − α= 0.97 ⇒ α= 0.03 ⇒ = 0.015 lo que implica que debemos buscar 2 el valor de Z que hace que bajo la curva quede un área de 1 − 0.015 =, 0.985 que nos da Zα = 2.17 , con lo que los límites son 2

(

)

Linf = X 1 − X 2 − Zα

(

)

Lsup = X 1 − X 2 + Zα

σ 12 2

n1

σ 12 2

n1

+

σ 22

+

σ 22

n2

n2

= ( 89.45 − 77.32 ) − ( 2.17 )

= ( 89.45 − 77.32 ) + ( 2.17 )

(1.1)

2

12

(1.1) 12

(1.9 ) +

2

= 10.8619

15

2

(1.9 ) + 15

2

= 13.3981

Con un 97% de confianza podemos decir que el intervalo es 10.8619 ≤ µ A − µ B ≤ 13.3981 VIII. Ejercicios (Utilice una tabla de distribución normal) 1. Dos muestras aleatorias independientes de tamaño n1 = 18 y n2 = 20 se toman de dos poblaciones normales. Las medias de las muestras son x1 = 200 y x2 = 190 . Se sabe que sus varianzas son σ 12 = 15 y σ 22 = 12 . Encuentre un intervalo de confianza del 90% para la diferencia de medias µ1 − µ2 . Determine un intervalo de confianza del 95% para la misma diferencia. 2. Se está investigando el voltaje de salida de dos tipos de transformadores diferentes. Diez transformadores de cada tipo se seleccionan al azar y se mide el voltaje encontrando los siguientes resultados x1 = 12.13V y x2 = 12.05V , además se sabe que σ 12 = 0.7 y σ 22 = 0.8 . Construya un intervalo de confianza del 97% para la diferencia de medias.

Intervalo de confianza sobre la media, desconocida (Uso de la prueba T de Student)

σ

Normalmente en el trabajo estadístico no se conoce la varianza de la población, es necesario hacer una estimación de ella para poder construir intervalos de confianza. Se puede demostrar el siguiente teorema: Consideremos una muestra aleatoria con distribución normal, X 1 , X 2 , …, X n , con media µ y varianza σ 2 . La variable aleatoria grados de libertad.

X −µ tiene distribución T con n − 1 S/ n

La gráfica de la curva de distribución T es una trayectoria simétrica en forma de campana centrada en 0 , que se aproxima a la curva normal estándar conforme crece la cantidad de grados de libertad (figura 7).

Figura 7. La curva de distribución t es semejante a la distribución normal. Conforme aumentan los grados de libertad de t se incrementa la similitud de las curvas. Dada la semejanza entre la variable aleatoria normal, Z =

X −µ , y la variable σ n

X −µ , podemos argumentar que un intervalo de S/ n confianza de 100 (1 − α ) % , conocida µ , está dado por

aleatoria de la T de Student, T =

X ± tα S

n.

2

Por ejemplo, en una región cercana a una central de generación que utiliza combustible fósil se cuantificó la concentración de dióxido de azufre, en microgramos por metro cúbico, y se encontraron los siguientes valores: 52.7, 43.9, 41.7, 71.5, 47.6, 55.1, 50.0, 70.0, 56.4, 60.7, 44.4, 46.1, 38.6, 52.4, 45.3, 62.2, 56.5, 63.4, 53.9, 33.4, 61.8, 54.3, 66.6, 65.5. Haciendo los cálculos necesarios encontramos que x = 53.917

s = 10.074

Para determinar el intervalo necesitamos conocer tα , para ello debemos 2

establecer el tamaño del intervalo de confianza, consideremos 95%. A partir de una tabla de distribución T podemos encontrar el valor de tα = 2.069 . Es necesario 2

buscar en la tabla la probabilidad 0.975 porque esta es la suma de 0.95 mas 0.025 que está en el extremo izquierdo de la gráfica, porque la tabla es de distribuciones acumuladas desde la izquierda hacia la derecha.

P [Tn −1 ≤ t ] n-1  4 5  23 24 

.6  0.271 0.267  0.256 0.256 

0.75  0.741 0.727  0.685 0.685 

0.9  1.533 1.476  1.319 1.318 

0.95  2.132 2.015  1.714 1.711 

0.975  2.776 2.571  2.069 2.064 

0.99  3.747 3.365  2.500 2.492 

0.995  4.604 4.032  2.807 2.797 

0.999  7.173 5.893  3.485 3.467 

El intervalo es entonces

µ= X ± tα S 2

n= 53.917 ± ( 2.069 )(10.074 ) / 24 = 53.917 ± 4.255

[ 49.662 ≤ µ ≤ 58.172] El resultado anterior indica que existe un 95% de confianza de que la media de concentración esté en el intervalo dado. Además, si existiera un estudio de una región en la cual no hay una planta de generación similar a la que está en la zona estudiada y la concentración del óxido resultara menor indicaría que la planta está ocasionando el valor mayor de concentración. IX. Ejercicios (Utilice una tabla de distribución t) 1. Un ingeniero civil está probando la resistencia compresiva de concreto. Realiza la prueba con 16 especímenes y obtiene los siguientes datos: 2216, 2237, 3349, 2204, 2225, 2301, 2281, 2263, 2318, 2255, 2275, 2295, 2250, 2238, 2300, 2217. (a) Construya un intervalo de confianza de dos lados del 95% respecto a la resistencia media, (b) Construya un intervalo de confianza inferior del 95% respecto a la resistencia media. 2. Un ingeniero de control de calidad midió el espesor de la pared de 25 botellas de vidrio de dos litros. La media de la muestra fue 4.05 mm y la desviación estándar de la muestra 0.08 mm. Determine un intervalo de confianza inferior del 90% respecto del espesor de pared medio.

3. Un ingeniero industrial está interesado en estimar el tiempo requerido para ensamblar una tarjeta de circuito impreso. ¿Qué tan grande debe ser la muestra si el ingeniero desea tener una confianza del 95% de que el error en la estimación de la media es menor que 0.25 min? La desviación estándar del tiempo de ensamble es 0.45 min. 4. Una muestra aleatoria de tamaño 15 de una población normal tiene media de 550 varianza 49. Determine (a) un intervalo de confianza de dos lados del 95% respecto de la media, (b) Un intervalo de confianza inferior del 95% respecto de la media, (c) Un intervalo de confianza superior del 95% respecto de la media.

Pruebas de hipótesis Cuando se pone a prueba una hipótesis se tiene una idea preconcebida acerca del parámetro que se desea comprobar. Lo anterior implica la existencia de dos posibles resultados o hipótesis: la que propone el investigador y su negación. La hipótesis propuesta por el investigador se conoce como hipótesis alternativa y es representada por H1 , y la negación de esta hipótesis es la hipótesis nula que se representa con H 0 . Cuando se prueba una hipótesis la declaración de igualdad siempre se incluye en H0 . La prueba implica que, partiendo de datos sobre el experimento, se acepta una de las hipótesis y se rechaza la otra. Sin embargo, puede ocurrir que debido a la información que se posee se tome como verdadera una de las hipótesis cuando en realidad es falsa. Se comete el error tipo I cuando se rechaza la hipótesis nula H 0 y esta en realidad debiera aceptarse. Se comete el error tipo II cuando se rechaza la hipótesis alternativa H1 y esta en realidad debiera aceptarse. Existen tres formas de expresar las hipótesis para la media de una distribución: H 0 : µ ≤ µ0

H 0 : µ = µ0

H1 : µ > µ 0 Prueba de cola derecha H 0 : µ ≥ µ0

H1 : µ > µ 0 Prueba de cola derecha H 0 : µ = µ0

H1 : µ < µ 0 Prueba de cola izquierda H 0 : µ = µ0 H1 : µ ≠ µ 0 Prueba de dos colas

o

o

H1 : µ < µ 0 Prueba de cola izquierda

Las mismas formas se emplean para evaluar otros estadísticos. Para aceptar o rechazar la hipótesis nula debemos observar donde se distribuyen los datos (figuras 8, 9 y 10).

Figura 8. Prueba de cola derecha. Si los datos se distribuyen en la zona azul se rechaza la hipótesis nula H 0 .

Figura 9. Prueba de la cola izquierda. Si los datos se distribuyen en la zona azul se rechaza la hipótesis nula H 0 .

Figura 10. Prueba de dos colas. Si los datos se distribuyen en la zona azul se rechaza la hipótesis nula H 0 . Consideremos el ejemplo siguiente: Uno de los factores que afecta el funcionamiento de las señales reflejantes en las autopistas es la alineación correcta de los faros de los automóviles. Se cree que más del 50% de los vehículos tiene los faros mal alineados. Si tal afirmación puede sustentarse estadísticamente se pondrá en marcha un estricto programa de inspección. Se seleccionan aleatoriamente una muestra de 20 automóviles para verificar sus faros. Se aceptará H1 y se rechazará H 0 si hay 14 o más automotores con los faros mal alineados, ¿cuál es la probabilidad de cometer el error tipo I? Sea p la proporción de vehículos que tienen los faros mal alineados. Puesto que se pretende sustentar la afirmación de que p > 0.50 , esta se considera como la hipótesis alternativa, H1 . La hipótesis nula será la negación de H1 , es decir, que p ≤ 0.50 . Entonces H 0 : p ≤ 0.50 H1 : p > 0.50 Como n = 20 , E [ X= = ] np

( 20 )( 0.50=)

10 (caso binomial)

P ( X ≥ 14 p = 0.50 ) = 1 − P ( X < 14 p = 0.50 ) = 1 − P ( X ≤ 13 p = 0.50 ) = 1 − 0.9423 = 0.0577

Lo anterior implica que si se encuentran 13 o menos vehículos con los faros mal alineados no debe aprobarse el proyecto de revisión por que hay 5% de probabilidades de cometer el error tipo I. X. Ejercicios 1. Se requiere que la resistencia al rompimiento de una fibra utilizada en la tela de ropa de uso industrial no sea menor que 160psi. La experiencia indica que la desviación estándar de la resistencia al rompimiento es de 3psi. Se prueba una muestra aleatoria de cuatro especímenes y se encuentra que la resistencia promedio al rompimiento es 158psi. (a) ¿Debe considerarse aceptable la fibra con α = 0.05 , (b) ¿Cuál es la probabilidad de aceptar H 0 : µ ≤ 160 si la fibra tiene una resistencia al rompimiento verdadera de 165psi? 2. Se sabe que la varianza (en porcentaje) del rendimiento de un proceso químico es de 5. Los últimos días de operación de la planta han tenido un rendimiento (en porcentaje) de 91.6, 88.75, 90.8, 89.95 y 91.3; (a) ¿Hay razón para creer que el rendimiento es menor que 90%? (b) ¿Qué tamaño de muestra se requeriría para detectar un rendimiento medio verdadero de 85% con probabilidad de 0.95?

Regresión lineal Buscamos construir un modelo de recta lineal de la forma

= y mx + b Donde m representa la pendiente de la recta y b la ordenada al origen. Dicha recta será una aproximación de una colección de puntos que se distribuirán alrededor de ella (figura 11).

Figura 11. Línea de regresión que aproxima a los puntos distribuidos alrededor de ella. Dado que la recta no pasa sobre todos los puntos sino que hay separaciones (errores) entre ella y los puntos el modelo exacto sería Yi =A + Bxi + ε i Donde A es la estimación de la ordenada al origen, B es la estimación de la pendiente y ε i es la diferencia entre la ordenada Yi estimada con el modelo y la ordenada real del punto en análisis. El modelo estimación por regresión lineal por el método de mínimos cuadrados busca que la suma de las diferencias al cuadrado sea mínima. Así que dicha suma está dada por la ecuación

SSE =

n

∑ ε=i2

n

∑ ( y − A − Bx )

=i 1 =i 1

i

2

i

Derivando con respecto a A y a B n ∂SSE = −2∑ ( yi − A − Bxi ) ∂A i =1 n ∂SSE = −2∑ ( yi − A − Bxi )xi ∂B i =1

Igualando a cero para encontrar el mínimo n

n

nA + B ∑ xi = ∑ yi =i 1 =i 1 n

n

n

A∑ xi + B ∑ xi2 = ∑ xi yi

=i 1

=i 1 =i 1

Que resolviendo simultáneamente producen n  n  n  n∑ xi yi −  ∑ xi   ∑ yi   i 1=  i 1  = i1 = B= 2 n n   n∑ xi2 −  ∑ xi  =i 1 = i1 

A= y − Bx Con lo que la ecuación lineal que representa a los datos es y= A + Bxi i La evaluación de la calidad de la aproximación, esto es la determinación de si entre las variables existe una relación lineal, se realiza obteniendo el factor de correlación de Pearson

ρ=

Cov ( X , Y )

(VarX )(VarY )

Donde Cov (= X , Y ) E [ XY ] − E [ X ] E [Y ] El coeficiente de correlación varía en el intervalo [ −1,1] , teniendo una buena aproximación lineal cuando el coeficiente de correlación está cercano a −1 o a 1 . Se estudia la relación del consumo de energía eléctrica con el ingreso familiar y se obtienen los datos sobre el ingreso familiar X (en unidades de $1000/año) y el consumo de energía Y (en 108 BTU/año) Consumo de energía Y 1.8 3.0 4.8 5.0

Ingreso familiar X 20.0 30.5 40.0 55.1

Consumo de energía Y 6.5 7.0 9.0 9.1

Ingreso familiar X 60.3 74.9 88.4 95.2

Para el cálculo de los coeficientes podemos construir la tabla siguiente xi

yi

xi yi

20.0

1.8

36.00

xi2 400.00

n=8

y = 5.78

∑

30.5 40.0 55.1 60.3 74.9 88.4 95.2 464.40

3.0 4.8 5.0 6.5 7.0 9.0 9.1 46.20

91.50 192.00 275.50 391.95 524.30 795.60 866.32 3173.17

930.25 1600.00 3036.01 3636.09 5610.01 7814.56 9063.04 32089.96

x = 58.05

Por lo tanto tendremos n  n  n  n∑ xi yi −  ∑ xi   ∑ yi  ) − ( 464.40 )( 46.20 ) 0.0957 = i 1  i 1=   i 1  8 ( 3173.17 = = B= 2 2 n 8 ( 32089.96 ) − ( 464.40 )  n  2 n∑ xi −  ∑ xi  =i 1 = i1 

A =y − Bx =5.78 − 0.0957 ( 58.05 ) =0.22 Por tanto, el modelo es = y 0.22 + 0.0957 x La buena aproximación la comprobamos determinando el coeficiente de correlación = ρ

Cov ( X , Y ) = 0.98 (VarX )(VarY )

Que indica que el modelo matemático aproxima de muy buena manera a los puntos distribuido en la tabla, tal como se puede ver en la gráfica de la figura 12.

Prueba de hipótesis en la regresión lineal Para probar la hipótesis respecto a la pendiente y la ordenada al origen del modelo de regresión lineal, debemos considerar que el error ε= yi −  yi , donde yi es la i aproximación mediante el modelo de regresión y  y es el dato registrado en la i

tabla para hacer la aproximación, es una variable normal e independientemente distribuida con media cero y varianza σ 2 , NID ( 0, σ 2 ) . Si deseamos probar que la pendiente es diferente de una constante, la prueba de dos colas o lados será

Recta de aproximación 9.5 7.5 5.5 3.5 1.5 15

65 Ingreso familiar

Figura 12. Distribución de los puntos alrededor de la recta construida empleando el modelo de regresión lineal. H 0 : B = B0 H1 : B ≠ B0 y como resultado de la suposición de normalidad estadística tendremos t0 =

B − B0

(

   ∑ yi − y i  n−2  

)

    

2

∑ ( x − x)

2

i

que sigue la distribución t con n − 2 grados de libertad. Rechazamos la hipótesis nula si t0 > tα 2,n − 2 . El intervalo de confianza es

(

B0 − tα 2,n − 2

   ∑ yi − y i  n−2  

)

∑ ( x − x) i

2

2

     ≤ B ≤ B +t 0 α 2, n − 2

(

   ∑ yi − y i  n−2  

)

∑ ( x − x)

2

    

2

i

Se puede hacer una prueba de hipótesis para la ordenada al origen,

H 0 : A = A0 H1 : A ≠ A0 Para la cual t0 =

A − A0

(

   ∑ yi − y i  n−2  

)

2

() ( )

2  x  1 +  n  ∑ xi − x 

  2   

Se rechaza la hipótesis nula si t0 > tα 2,n − 2 . El intervalo de confianza es

A0 − tα 2,n − 2

(

   ∑ yi − y i  n−2  

)

2

() ( )

2  x  1  n +  ∑ xi − x 

  ≤ A≤ A +t α 2, n − 2 0 2   

(

   ∑ yi − y i  n−2  

)   1 + ( x ) 2

 n  

∑(

  2  xi − x   2

)

XI. Ejercicios 1. En una prueba de automóviles de distintas marcas del rendimiento en millas recorridas por galón de gasolina ( y ) y el cilindraje del motor o desplazamiento en pulgadas cúbicas ( x ) se encontraron los siguientes datos: y 18.90 17.0 20.0 18.25 20.07

x 350 350 250 351 225

y 11.20 22.12 21.47 30.40 16.50

x 440 231 262 96.9 350

y 14.39 16.50 19.73 13.90 16.50

x 500 400 318 351 350

a. Ajuste un modelo de regresión que relaciones las millas recorridas con el cilindraje del motor. b. Pruebe la significación, α , de la regresión. c. Encuentre un intervalo de confianza del 90% en la pendiente y en la ordenada al origen. 2. La resistencia del papel utilizado en la manufactura de cajas de cartón, y , se relaciona con el porcentaje de la concentración de madera dura en la pulpa original, x . y

x

y

x

y

x

101.4 117.4 117.1 106.2 131.9

1 1.5 1.5 1.5 2

146.9 146.8 133.9 111.4 123

2 2.2 2.4 2.5 2.5

125.1 145.2 134.3 144.5 143.7

2.8 2.8 3 3 3.2

a. Ajuste un modelo de regresión lineal simple a los datos. b. Pruebe la falta de ajuste y la significancia de la regresión.

Análisis de varianza El análisis de varianza se emplea para cuando deseamos comparar el resultado de una variable estadística obtenida por medio de distintos tratamientos. Consideremos que en cinco vetas de carbón de una región se presentan los siguientes contenidos de azufre en distintas muestras Veta 1 1.51 1.92 1.08 2.04 2.14 1.76 1.17

Veta 2 1.69 0.64 0.90 1.41 1.01 0.84 1.28 1.59

Veta 3 1.56 1.22 1.32 1.39 1.33 1.54 1.04 2.25 1.49

Veta 4 1.30 0.75 1.26 0.69 0.62 0.90 1.20 0.32

Veta 5 0.73 0.80 0.90 1.24 0.82 0.72 0.57 1.18 0.54 1.30

Suma promedios de las últimas filas

Sumas

S1 = 11.62

S 2 = 9.36

S3 = 13.14

S 4 = 7.04

S5 = 8.8

ST = 49.96

Promedios

Y 1 = 1.66

Y 2 = 1.17

Y 3 = 1.46

Y 4 = 0.88

Y 5 = 0.88

Y T = 1.189

Dadas las diferencias en los valores de las medias, debemos averiguar si tales diferencias son significativas o las medias en realidad son iguales. Las hipótesis son

µ= µ= µ= µ5 H 0 : µ= 1 2 3 4 H1 : µ1 ≠ µ2 ≠ µ3 ≠ µ4 ≠ µ5 La tabla de análisis de varianza tiene la forma Fuente de variación

Grados de libertad

Suma de cuadrados

Cuadrado medio

k −1

Si2 ST2 − ∑ N i =1 ni

ST k −1

k

Tratamiento

Parámetro para la prueba F

F( N − k )( k −1)

ST = k −1 SC

N −k N −1

Error o residuo Totales

SC N −k

SC

Donde: k es el número de tratamientos (vetas en el ejemplo) N es el número total de datos de todos los tratamientos (o vetas) ni es el número de datos en cada tratamiento  k ni S2   k S2 S2  = SC  ∑∑ Yij2 − T  −  ∑ i − T  N  =i 1 ni N  =i 1 =j 1

Si2 ST2 − ∑ N i =1 ni k

= ST

Para el problema aquí analizado tendríamos k =5 n1 = 7 , n2 = 8 , n3 = 9 , n4 = 8 y n5 = 10 , de donde N = 42 . S 2 ST2 = ∑ i −= ST N i =1 ni k

(11.62 )

2

7

( 9.36 ) + 8

2

(8.8) + ... + 10

2

( 49.96= ) − 2

42

3.935

2  k ni 2 ST2   k Si2 ST2   49.96 )  ( 2 2 2 SC =  ∑∑ Yij −  −  ∑ −  = (1.51) + (1.92 ) + ... + (1.30 ) −  − 3.935 = 4.497 42  N  =i 1 ni N   =i 1 =j 1

Fuente de variación

Grados de libertad

Suma de cuadrados

Tratamiento

5 − 1 =4

3.935

Error o residuo

42 − 5 = 37

4.497

Totales

41

8.432

Cuadrado medio

3.935 = 0.984 4 4.497 = 0.122 37

Parámetro para la prueba F

F= ( 4 )( 37 )

0.984 = 8.066 0.122

Para hacer la evaluación de si son iguales o diferentes las medias necesitamos leer en una tabla de distribución F con la probabilidad adecuada y sus respectivos grados de libertad.

k −1 → N −k ↓

1

2

P  F( N − k )( k −1) ≤ f  = 0.95 3 4 5 6

7

8

 4 5  37 38 

 7.707 6.608  4.105 4.098 

 6.944 5.786  3.252 3.245 

 6.591 5.409  2.859 2.852 

 6.388 5.192  2.626 2.619 

 6.256 5.050  2.470 2.463 

 6.163 4.950  2.356 2.349 

 6.094 4.876  2.270 2.262 

 6.041 4.818  2.201 2.194 

De la tabla obtenemos que f(37 )( 4) = 2.626 . Como F(37 )( 4) ≥ f(37 )( 4) , 8.066 ≥ 2.626 , rechazamos la hipótesis nula y podemos decir que al menos dos de las medias de las vetas son diferentes con 5% de posibilidades de equivocarnos o 95% de seguridad. XII. Ejercicios 1. Se sabe que un material tóxico vertido en un río llega a un área de pesca. Se mide la concentración del tóxico, en partes por millón, ostras extraídas de tres sitios diferentes presentan las concentraciones del tóxico siguientes: Sitio 1 15 26 20 20 29 28 21 26

Sitio 2 Sitio 3 19 22 15 26 10 24 26 26 11 15 20 17 13 24 15 18 a. Verifique si existe una diferencia significativa en el promedio de partes por millón del material tóxico encontrado en las ostras extraídas en los tres sitios. Use α = 0.05 . b. ¿Diferirían significativamente las medias con el nivel de significación de 0.01?

Bibliografía de consulta recomendada J.Susan Milton y Jesse C. Arnold, Probabilidad y estadística con aplicaciones para ingeniería y ciencias computacionales. McGraw Hill, 2004, México. William W. Hines y Douglas C. Montgomery, Probabilidad y estadística para ingenieros. CECSA, 2000, México

Curso propedéutico de matemáticas

Recommend Stories

Story Transcript

Get in touch

Social