Atribución-NoComercial-SinDerivadas 4.0 Internacional Esta licencia es la más restrictiva de las seis licencias principales Creative Commons, permitiendo a otras solo descargar sus obras y compartirlas con otras siempre y cuando den crédito, pero no pueden cambiarlas de forma alguna ni usarlas de forma comercial. http://creativecommons.org/licenses/by-nc-nd/4.0 http://creativecommons.org/licenses/by-nc-nd/4.0/ http://creativecommons.org/licenses/by-nc-nd/4.0/ UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA” DE ICA FACULTAD DE CIENCIAS ESCUELA PROFESIONAL DE MATEMÁTICA E INFORMÁTICA “EL TEOREMA DE LA FUNCIÓN INVERSA EN ESPACIOS EUCLIDIANOS Y SUS APLICACIONES” TESIS PARA OPTAR EL TÍTULO PROFESIONAL DE LICENCIADO EN MATEMÁTICA E INFORMÁTICA AUTOR Bach. YANCE GUERRA ALEX OSWALDO ASESOR Mag. VARGAS MAYA NÉSTOR MANUEL ICA – PERÚ 2019 MANTA LLAQ ICA HATUN YACHAY HUASI L L A Q T A T A P A Q U N IV E R S ID A D N ACIO NAL “SAN LU IS G O N Z A G A ” Dedicatoria A Dios todopoderoso A mi madre, Marleny A mi padre, Oswaldo A mis hermanos, Lissette y Walter Agradecimientos  A la Universidad Nacional “San Luis Gonzaga” de Ica, por acogerme en sus aulas de la Facultad de Ciencias, cuando era estudiante de pre – grado.  A mis profesores de pre – grado, por sus enseñanzas dentro del transcurso de mi formación académica.  A mi asesor, el Mag. Néstor Manuel Vargas Maya, por su valiosa contribución en el presente trabajo de tesis.  A la comisión evaluadora, por su labor en la revisión de la presente tesis. Índice Resumen ……………..................................................................................i Abstract……………………………………………………………………........ii Introducción……………………………………………………………….......iii Antecedentes………………………………………………………………..…iv Material y Métodos.………………………………………………………..…vi Resultados ………………………………………………………………..........1 A. Breve Marco Teórico………………………………………..…………1 Capítulo 1. Nociones Básicas de la Teoría de Conjuntos…..........1 1.1 Producto Cartesiano de Conjuntos…….………...…...........…..1 1.2 Relación………………………………………………………….....2 1.3 Función…………………………...…………………………..…….3 1.4 Tipos de Funciones………………………………………………..5 1.5 Función Inversa...…………………………….…………………...7 Capítulo 2. Elementos de Topología en la recta Real……...…….9 2.1 Topología.…………………………………………………………..9 2.2 Conjunto Abierto y Conjunto Cerrado.………...………….....10 2.3 Conjunto Acotado y Conjunto Compacto …………..……......12 2.4 Punto de Acumulación …………………………..…..……....…13 Capítulo 3. Límite, Continuidad y Diferenciabilidad de Funciones Reales de Variable Real………………………………..14 3.1 Límite……………………………………………………..............14 3.2 Continuidad.…………………………………………………..….15 3.3 Diferenciabilidad.…………………………………………..…....16 3.4 Función Diferenciable en un Intervalo……………………….18 3.5 Teorema de la Función Inversa en ℝ.……………………..….19 Capítulo 4. Fundamentos del Álgebra Lineal....………………...21 4.1 Espacio Vectorial….……………………………..………….…...21 4.2 Base y Dimensión………………………………………………..23 4.3 Transformación Lineal………………………………………….26 4.4 Matriz Asociada a una Transformación Lineal……………..30 Capítulo 5. Espacio Euclidiano…………………………………….31 5.1 El Espacio Vectorial ℝn……..………………………………..…31 5.2 Norma, Producto Interno y Distancia en ℝ𝑛………………...32 5.3 Elementos de Topología en ℝ𝑛…………………………….......35 5.4 Sucesión y Límite en ℝ𝑛……………………………….............37 Capítulo 6. Aplicaciones entre Espacios Euclidianos…………..39 6.1 Funciones Continuas…………….….…………….…………….39 6.2 Aplicaciones Continuas…………………………………………40 6.3 Funciones y Aplicaciones Diferenciables…….......................41 6.4 Aplicaciones de Clase 𝐶1(𝑈)…………………………………....43 B. Resultados Obtenidos Resultado 1……….…………………………………………..…….....47 Resultado 2……….………………………………………………..….49 Resultado 3……….………………………………………………..….53 Resultado 4……….……………………………………………..…….54 Resultado 5……….………………………………………………..….57 Resultado 6……….…………………………………………………...59 Resultado 7…………………………………………………………....63 Discusión………………………………………………………………………67 Conclusiones………………………………………………….………......…..68 Recomendaciones…………………………...……………...…….………..…69 Fuentes de Información……………………………………………………..70 i Resumen En la presente tesis se estudió la posibilidad de demostrar una versión del teorema de la función inversa para funciones definidas entre espacios euclidianos. En nuestra hipótesis afirmamos que era factible realizar esta demostración y nuestro objetivo fue generalizar esta versión. Mediante los métodos de demostración, directo e indirecto, se probó que si 𝑓 es una función definida entre espacios euclidianos con derivada 𝑓′(𝑐) no nula en 𝑐, entonces, localmente, posee una inversa 𝑓−1 confirmándose nuestra hipótesis. Asimismo, se demuestra que esta inversa hereda, localmente, las propiedades de 𝑓. Palabras Claves:  Teorema de la Función Inversa  Espacio Euclidiano  Vecindad  Biyectiva ii Abstract In the present thesis the possibility of demonstrating a version of the theorem of the inverse function for defined functions between Euclidean spaces was studied. In our hypothesis we affirmed that it was feasible to carry out this demonstration and our objective was to generalize this version. Through the methods of demonstration, direct and indirect, it was proved that if f is a function defined between Euclidean spaces with derivative 𝑓′(𝑐) not null in 𝑐, then, locally, it has an inverse 𝑓−1 confirming our hypothesis. Likewise, it is demonstrated that this inverse inherits, locally, the properties of 𝑓. Keywords:  Inverse Function Theorem  Euclidean Space  Neighborhood  Bijective iii Introducción La investigación está asociada con el Teorema de la Función Inversa en Espacios Euclidianos. El objetivo de esta tesis es dar una presentación rigurosa y detallada del Teorema de la Función Inversa estableciendo las condiciones que garantizan la validez del teorema, se brinda un enfoque local del teorema estudiado. Antes de presentar los resultados de esta investigación, con la pretensión de que esta tesis tenga una lectura autosuficiente, se considera un marco teórico que contiene resultados y conceptos previos necesarios para comprender esta versión general del Teorema de la Función Inversa. Este breve marco teórico consta de seis capítulos. La tesis consta de un breve marco teórico donde yacen seis capítulos. En el capítulo 1, se presentan con los conceptos y propiedades básicas de la teoría de conjuntos; en el capítulo 2, se introduce la topología de la recta real; en el capítulo 3, se desarrolla la noción de límite, continuidad y diferenciabilidad de las funciones reales de variable real; se presentan sus propiedades básicas; en el capítulo 4, se presenta conceptos y propiedades relacionadas con el álgebra lineal que se usan en esta tesis; en el capítulo 5, se hace una introducción de los espacios euclidianos presentando su topología; el capítulo 6, se dedica a las aplicaciones entre espacios euclidianos. Finalmente se presentan los resultados obtenidos en esta investigación tanto sobre el Teorema de la Función Inversa en Espacios Euclidianos como de sus aplicaciones en distintas disciplinas de la matemática. iv Antecedentes El matemático francés Joseph Louis Lagrange (1736-1813) formuló un teorema que, en esencia, es el Teorema de la Función Inversa, relacionado con el Teorema de la Función Implícita. Agustín Louis Cauchy (1789-1716) puso su atención en el teorema y sus generalizaciones ([1]). Justamente a este último se le atribuye el Teorema de la Función Inversa junto a Jacques Salomon Hadamard (1865-1963) ([11]). En el siglo XIX, el matemático italiano Ulisse Dini (1845-1918) presentó la primera prueba (por inducción) del Teorema de la Función Inversa para un sistema con varias ecuaciones y varias variables reales; después aplicó este teorema en la geometría diferencial. Durante esa época las diferencias entre el análisis real y complejo eran profundas ([8]). Luego Ralph Tyrell Rockafellar (1935) trabajó este teorema en espacios de dimensión finita ([2]). Mientras que Jean-Pierre Aubin y Halina Frankowska (1984) en uno de sus artículos probaron varias generalizaciones del Teorema de la Función Inversa que aplican a la Teoría de Optimización (propiedades Lipschitz de mapas definidos por restricciones) y a la controlabilidad local de ecuaciones diferenciales. Las generalizaciones se refieren principalmente a teoremas de función inversa para mapas uniformes definidos en subconjuntos cerrados y para mapas de valores establecidos ([2]). En 1990, José de Jesús Ayala aplicando el Teorema de la Función Inversa demostró el Teorema de la Variedad Invariante y su utilidad alcanza niveles importantes dentro de las ecuaciones diferenciales avanzadas ([3]). Félix Ricardo Villanueva Santos (2010) demostró el Teorema de la Función Inversa para aplicaciones Multivaluadas y también la relación de este teorema con el Principio de la Aplicación Abierta Uniforme ([28]). Finalmente, Tezoto Leandro (2014) presentó la demostración del Teorema de la Función Inversa, así como algunas aplicaciones sobre la Existencia de Solución para Ecuaciones. La demostración del Teorema de la Función Inversa está dado por un Teorema de Perturbación de la Identificación, que es una consecuencia del Teorema del Punto Fijo de Banach ([27]). Es por estos antecedentes que se tomó la decisión de estudiar este Teorema de la Función Inversa en Espacios Euclidianos. Por otro lado, en el análisis matemático de las funciones reales de variable real, se probó que si 𝑓′(𝑎) ≠ 0 , entonces 𝑓 posee una v inversa local en 𝑎; es decir, existen vecindades 𝑉(𝑎, 𝛿) de 𝑎 y 𝑉(𝑓(𝑎), 𝜀) de 𝑓(𝑎) tales que 𝑓: 𝑉(𝑎, 𝛿) → 𝑉(𝑓(𝑎), 𝜀) es biyectiva con inversa continua. Asimismo, se probó que, si 𝑓 es de clase 𝐶1 en 𝑎 con 𝑓′(𝑎) ≠ 0, entonces 𝑓−1 es localmente de clase 𝐶1 en 𝑓(𝑎). También se probó que si 𝑓 es de clase 𝐶𝑘 con 𝑓′(𝑐) ≠ 0, entonces 𝑓−1 es de clase 𝐶𝑘. Teniendo en cuenta estos resultados es coherente preguntarse si estos resultados se pueden generalizar para aplicaciones definidas entre espacios euclidianos. vi Materiales y Métodos Materiales Conceptos y propiedades de la teoría de funciones, de la topología en la recta real, de la continuidad y diferenciabilidad de una función real de variable real, de álgebra lineal, de espacios euclidianos y de las aplicaciones entre espacios euclidianos. Método La investigación corresponde al área del Análisis Real de la Matemática, que es una ciencia básica formal, de manera que para analizar la información utilizamos el método inductivo – deductivo y, para demostrar la validez del Teorema de la Función Inversa en espacios euclidianos, teniendo como referencia la versión del mismo teorema para funciones reales de variable real, aplicamos los métodos directo e indirecto de demostración; estos mismos métodos los usamos en la demostración de las aplicaciones del teorema del que nos hemos ocupado. 1 Resultados A. Breve Marco Teórico Capítulo 1 Nociones Básicas de la Teoría de Conjuntos Creada a finales del siglo XIX por el matemático George Cantor, la Teoría de Conjuntos es imprescindible en la actualidad, puesto que los conjuntos están presentes implícita o explícitamente en todo estudio científico y, muy en particular, en el matemático. Nuestro tratamiento de la teoría de conjuntos es deliberadamente ingenuo, sin preocuparnos, por lo tanto, en fundamentarlo rigurosamente. Aquí se presentan algunos conceptos orientados a sostener el tema de fondo de la presente tesis. 1.1 Producto Cartesiano de Conjuntos. Definición 1.1.1 El producto cartesiano de los conjuntos no vacíos 𝐴 y 𝐵, es el conjunto denotado por 𝐴 × 𝐵 y definido por: 𝐴 × 𝐵 = {(𝑎, 𝑏): 𝑎 ∈ 𝐴 y 𝑏 ∈ 𝐵}; El conjunto 𝐴 × 𝐵 se lee: (conjunto) producto cartesiano de 𝐴 y 𝐵. (𝑎, 𝑏) ∈ 𝐴 × 𝐵 ⇔ 𝑎 ∈ 𝐴 y 𝑏 ∈ 𝐵. El autor Gonçalvez A. enuncia una definición similar en [13], pág.11. Ejemplo: Sean 𝐴 = {𝑎, 𝑏} y 𝐵 = {𝑐, 𝑑} tenemos los siguientes conjuntos 𝐴 × 𝐵 = {(𝑎, 𝑐), (𝑎, 𝑑), (𝑏, 𝑐), (𝑏, 𝑑)} y 𝐵 × 𝐴 = {(𝑐, 𝑎), (𝑐, 𝑏), (𝑑, 𝑎), (𝑑, 𝑏)}. Aquí vemos que generalmente no se cumple la igualdad 𝐴 × 𝐵 = 𝐵 × 𝐴. 2 Proposición 1.1.2 Sean 𝐴, 𝐵, 𝐶, y 𝐷 conjuntos cualesquiera. Se cumplen las propiedades siguientes: 1) 𝐴 × (𝐵 ∪ 𝐶) = (𝐴 × 𝐵) ∪ (𝐴 × 𝐶); 2) 𝐴 × (𝐵 ∩ 𝐶) = (𝐴 × 𝐵) ∩ (𝐴 × 𝐶); 3) 𝐴 × (𝐵 − 𝐶) = (𝐴 × 𝐵) − (𝐴 × 𝐶); 4) Si 𝐴 ⊂ 𝐵 y 𝐶 ⊂ 𝐷, entonces 𝐴 × 𝐶 ⊂ 𝐵 × 𝐷; 5) 𝐴 × 𝐵 = ∅ si y solo si 𝐴 = ∅ o 𝐵 = ∅. Estas propiedades se encuentran demostradas en el libro de Chávez C. ([7], pág.56). 1.2 Relación. Definición 1.2.1 Una relación entre elementos de un conjunto 𝐴 y de un conjunto 𝐵 es todo subconjunto ℛ de 𝐴 × 𝐵 (ℛ ⊂ 𝐴 × 𝐵). El autor Gonçalvez A. presenta una definición similar en [13], pág.11. Nota: Si ℛ es una relación entre los elementos del conjunto 𝐴 y del conjunto 𝐵, diremos que “ℛ es una relación entre los elementos de 𝐴 y 𝐵” para indicar esta situación en forma breve. Dominio de una Relación. Definición 1.2.2 Sea ℛ una relación entre los elementos de 𝐴 y 𝐵, es decir, ℛ ⊂ 𝐴 × 𝐵; se define el dominio de ℛ, denotado por Dom(ℛ), como el conjunto: Dom(ℛ) = {𝑎 ∈ 𝐴: existe 𝑏 ∈ 𝐵 y (𝑎, 𝑏) ∈ ℛ}; Es decir: 𝑎 ∈ Dom(ℛ) ⇔ existe 𝑏 ∈ 𝐵 tal que (𝑎, 𝑏) ∈ ℛ. Podemos encontrar una definición similar enunciada por Chávez C. en [7], pág.59. Proposición 1.2.3 Sean ℛ1, ℛ2 relaciones entre los elementos de 𝐴 y 𝐵; entonces: 1) Dom(ℛ1 ∪ ℛ2) = Dom(ℛ1) ∪ Dom(ℛ2); 2) Dom(ℛ1 ∩ ℛ2) ⊂ Dom(ℛ1) ∩ Dom(ℛ2); 3) Dom(ℛ1) − Dom(ℛ2) ⊂ Dom(ℛ1 − ℛ2). El autor Figueroa R. expone una prueba para esta proposición en [12], pág.136 – 137. 3 Rango de una Relación. Definición 1.2.4 Sea ℛ una relación entre 𝐴 y 𝐵, es decir ℛ ⊂ 𝐴 × 𝐵 se define el rango de ℛ, denotado por Ran(ℛ), como el conjunto: Ran(ℛ) = {𝑏 ∈ 𝐵: existe 𝑎 ∈ 𝐴 y (𝑎, 𝑏) ∈ ℛ}; Es decir: 𝑏 ∈ Ran(ℛ) ⇔ existe 𝑎 ∈ 𝐴 tal que (𝑎, 𝑏) ∈ ℛ. Podemos ubicar una definición similar dada por Chávez C. en [7], pág.59. Proposición 1.2.5 Sean ℛ1, ℛ2 relaciones entre los elementos de 𝐴 y 𝐵; entonces: 1) Ran(ℛ1 ∪ ℛ2) = Ran(ℛ1) ∪ Ran(ℛ2); 2) Ran(ℛ1 ∩ ℛ2) ⊂ Ran(ℛ1) ∩ Ran(ℛ2); 3) Ran(ℛ1) − Ran(ℛ2) ⊂ Ran(ℛ1 − ℛ2). El autor Figueroa R. expone una prueba para esta proposición en [12], pág.136 – 137. 1.3 Función. Definición 1.3.1 Llamamos función del conjunto 𝐴 en el conjunto 𝐵 o función de 𝐴 en 𝐵 a toda relación que a cada elemento de su dominio le hace corresponder una ÚNICA imagen. El autor Hefez A. presenta una definición similar en [15], pág.13. Notación: 1. Para denotar que 𝑓 es una función de 𝐴 en 𝐵, se escribe 𝑓:𝐴 → 𝐵. 2. Para denotar que todo elemento 𝑎 ∈ 𝐴 tiene una única imagen 𝑏 se escribe 𝑓(𝑎) = 𝑏; entonces una función se representa por: 𝑓: 𝐴 → 𝐵 𝑎 → 𝑓(𝑎) = 𝑏; 𝑓(𝑎) es la imagen de 𝑎 por 𝑓. 3. Toda función es una relación, entonces toda función es un subconjunto de 𝐴 × 𝐵; luego denotamos a este conjunto por 𝑓. Una función goza de la siguiente propiedad: Si (𝑎, 𝑏) ∈ 𝑓 y (𝑎, 𝑐) ∈ 𝑓, entonces 𝑏 = 𝑐. 4 𝐵 𝐴 𝑓 Representación Gráfica de una Función. Una función se puede representar gráficamente mediante un diagrama sagital. Pero sí queremos mostrar las una características geométricas de la función es ideal hacer su gráfica en el diagrama cartesiano (o plano cartesiano cuando se trata de funciones reales de variable real). Dominio y Rango de una Función. Definición 1.3.2 Sea 𝑓:𝐴 → 𝐵 una función: i. El conjunto Dom(𝑓) = {𝑎 ∈ 𝐴: existe un único 𝑏 ∈ 𝐵,𝑏 = 𝑓(𝑎)} ⊂ 𝐴 se llama dominio de la función 𝑓; nótese que: 𝑎 ∈ Dom(𝑓) ⇔ existe un único 𝑏 ∈ 𝐵 tal que 𝑏 = 𝑓(𝑎). ii. El conjunto Ran(𝑓) = {𝑏 ∈ 𝐵: existe 𝑎 ∈ 𝐴, 𝑏 = 𝑓(𝑎)} ⊂ 𝐵, se llama rango de la función 𝑓; obsérvese que: 𝑏 ∈ Ran(𝑓) ⇔ existe 𝑎 ∈ 𝐴 tal que 𝑏 = 𝑓(𝑎). El autor Chávez C. enuncia una definición similar en [7], pág.71. Imagen Directa e Imagen Inversa. Definición 1.3.3 Sea 𝑓: 𝐴 → 𝐵 una función y 𝐷 ⊂ 𝐴; se define la imagen directa de 𝐷 por 𝑓, como el conjunto: 𝑓(𝐷) = {𝑏 ∈ 𝐵: existe 𝑎 ∈ 𝐷 y 𝑏 = 𝑓(𝑎)} ⊂ 𝐵; Es decir: 𝑏 ∈ 𝑓(𝐷) ⇔ existe 𝑎 ∈ 𝐷 tal que 𝑏 = 𝑓(𝑎). El autor brasileño Hefez A. presenta esta definición en [15], pág.16. Proposición 1.3.4 Sea 𝑓: 𝐴 → 𝐵 una función y 𝐷 ⊂ 𝐴; entonces: 1) Si 𝐷 ⊂ 𝐶 ⊂ 𝐴, entonces 𝑓(𝐷) ⊂ 𝑓(𝐶); 2) Si 𝐷 ⊂ 𝐴 y 𝐶 ⊂ 𝐴, entonces 𝑓(𝐷 ∪ 𝐶) = 𝑓(𝐷) ∪ 𝑓(𝐶); 3) Si 𝐷 ⊂ 𝐴 y 𝐶 ⊂ 𝐴, entonces 𝑓(𝐷 ∩ 𝐶) ⊂ 𝑓(𝐷) ∩ 𝑓(𝐶). El autor Chávez C. expone una prueba en [7], pág.73 – 74. 𝑎 𝑓(𝑎) = 𝑏 5 Definición 1.3.5 Sea 𝑓: 𝐴 → 𝐵 una función y 𝑀 ⊂ 𝐵; se define la imagen inversa de 𝑀 por 𝑓, como el conjunto: 𝑓−1(𝑀) = {𝑎 ∈ 𝐴: 𝑓(𝑎) ∈ 𝑀} ⊂ 𝐴; Es decir: 𝑎 ∈ 𝑓−1(𝑀) ⇔ 𝑓(𝑎) ∈ 𝑀. El autor Hefez A. enuncia esta definición en [15], pág.16. Proposición 1.3.6 Sea 𝑓: 𝐴 → 𝐵 una función y 𝐷 ⊂ 𝐴; entonces: 1) Si 𝑀 ⊂ 𝑁 ⊂ 𝐵, entonces 𝑓−1(𝑀) ⊂ 𝑓−1(𝑁); 2) Si 𝑀 ⊂ 𝐵 y 𝑁 ⊂ 𝐵, entonces 𝑓−1(𝑀 ∪ 𝑁) = 𝑓−1(𝑀) ∪ 𝑓−1(𝑁); 3) Si 𝑀 ⊂ 𝐵 y 𝑁 ⊂ 𝐵, entonces 𝑓−1(𝑀 ∩ 𝑁) = 𝑓−1(𝑀) ∩ 𝑓−1(𝑁). Podemos encontrar una prueba de esta proposición en [7], pág.73. 1.4 Tipos de Funciones. Definición 1.4.1 Sea 𝑓:𝐴 → 𝐵 una función; se dice que 𝑓 es inyectiva si y solo si para todo 𝑎1,𝑎2 ∈ 𝐴, 𝑓(𝑎1) = 𝑓(𝑎2) implica que 𝑎1 = 𝑎2. Definición 1.4.2 Sea 𝑓:𝐴 → 𝐵 una función; se dice que 𝑓 es sobreyectiva si y solo si para todo 𝑏 ∈ 𝐵, existe 𝑎 ∈ 𝐴 tal que 𝑏 = 𝑓(𝑎). Definición 1.4.3 Sea 𝑓:𝐴 → 𝐵 una función; se dice que 𝑓 es biyectiva si 𝑓 es inyectiva y sobreyectiva. El autor brasileño Hefez A. expone estas definiciones en [15], pág.18. Definición 1.4.4 Sea 𝑓:𝐴 → 𝐵 una función y 𝑈 ⊂ 𝐴. Se dice que 𝑔:𝑈 → 𝐵 es la función restricción de 𝑓 al conjunto 𝑈 si y solamente si 𝑓(𝑎) = 𝑔(𝑎), para todo 𝑎 ∈ 𝐴; se denota por 𝑓|𝑈. Es decir: para todo 𝑎 ∈ 𝐴, 𝑓|𝑈(𝑎) = 𝑓(𝑎). El autor Hefez A. enuncia una definición similar en [15], pág.14. Definición 1.4.5 Dadas las funciones 𝑓: 𝐴 → 𝐵 y 𝑔: 𝐵 → 𝐶 se llama función compuesta de 𝑔 con 𝑓, denotada por 𝑔 ∘ 𝑓, a la función 𝑔 ∘ 𝑓: 𝐴 → 𝐶 definida por (𝑔 ∘ 𝑓)(𝑎) = 𝑔(𝑓(𝑎)), para todo 𝑎 ∈ 𝐴. Podemos apreciar una definición similar en [15], pág.15. Proposición 1.4.6 Sean las funciones 𝑓:𝐴 → 𝐵, 𝑔: 𝐵 → 𝐶 y ℎ: 𝐶 → 𝐷; entonces: 1) ℎ ∘ (𝑔 ∘ 𝑓) = (ℎ ∘ 𝑔) ∘ 𝑓; 2) 𝑓 ∘ 𝐼𝐴 = 𝐼𝐴 ∘ 𝑓 = 𝑓. La validez de dichas propiedades de la composición de funciones se demuestra en [15], pág.15 – 16. 6 𝑓 Y X L 𝑥 𝑦 = 𝑓(𝑥) Definición 1.4.7 Si 𝐴 = ℝ y 𝐵 = ℝ, a la función 𝑓: ℝ → ℝ una función la llamaremos función real de variable real y la denotaremos por 𝑓 = {(𝑥, 𝑦) ∈ ℝ × ℝ:𝑦 = 𝑓(𝑥)}. El autor Figueroa R. enuncia esta definición en [12], pág.359. Definición 1.4.8 Sean 𝑋 ⊂ ℝ y 𝑓:𝑋 → ℝ una función. i. Se dice que 𝑓 es estrictamente creciente, si para todo 𝑥1,𝑥2 ∈ 𝑋 con 𝑥1 < 𝑥2, se satisface 𝑓(𝑥1) < 𝑓(𝑥2). ii. Se dice que 𝑓 es estrictamente decreciente, si para todo 𝑥1,𝑥2 ∈ 𝑋 con 𝑥1 < 𝑥2, se cumple 𝑓(𝑥1) > 𝑓(𝑥2). iii. Se dice que 𝑓 es creciente, si para todo 𝑥1,𝑥2 ∈ 𝑋 con 𝑥1 < 𝑥2, se verifica 𝑓(𝑥1) ≤ 𝑓(𝑥2). iv. Se dice que 𝑓 es decreciente, si para todo 𝑥1,𝑥2 ∈ 𝑋 con 𝑥1 < 𝑥2, se tiene 𝑓(𝑥1) ≥ 𝑓(𝑥2). A todas estas funciones se les conoce como funciones monótonas. Podemos encontrar esta definición en [12], pág.421. Caracterización Geométrica de una Función Real de Variable Real. Una función se reconoce geométricamente cuando toda recta perpendicular al eje 𝑋 corta a su gráfica en un único punto. (𝑓𝑖𝑔. 1) Representación Cartesiana de una función real de variable real 7 𝐴 𝐵 𝑓 𝑓−1 1.5 Función Inversa. Definición 1.5.1 Sea 𝑓:𝐴 → 𝐵 una función. i. Se dice que la función 𝑔: 𝐵 → 𝐴 es una inversa a izquierda de 𝑓, si 𝑔 ∘ 𝑓 = 𝐼𝐴; ii. Se dice que la función 𝑔: 𝐵 → 𝐴 es una inversa a derecha de 𝑓, si 𝑓 ∘ 𝑔 = 𝐼𝐵; iii. Se dice que la función 𝑓:𝐴 → 𝐵 posee inversa si y solo si existe una función 𝑔:𝐵 → 𝐴 la cual es inversa a derecha e izquierda de 𝑓; es decir, tal que 𝑔 ∘ 𝑓 = 𝐼𝐴 y 𝑓 ∘ 𝑔 = 𝐼𝐵. Podemos encontrar estas definiciones en [15], pág.19 – 20. Notación: Para denotar que 𝑔 es inversa de 𝑓, escribiremos 𝑔 = 𝑓−1. Dominio y Rango de una Función Inversa. Definición 1.5.2 Sean 𝑓: 𝐴 → 𝐵 una función y 𝑓−1: 𝐵 → 𝐴 su función inversa. Entonces: i. Dom(𝑓−1) = {𝑏 ∈ 𝐵: existe un único 𝑎 ∈ 𝐴 y 𝑎 = 𝑓−1(𝑏)} ⊂ 𝐵, es el dominio de la función inversa 𝑓−1; obsérvese que: 𝑏 ∈ Dom(𝑓−1) ⇔ existe un único 𝑎 ∈ 𝐴 tal que 𝑎 = 𝑓−1(𝑏). ii. Ran(𝑓−1) = {𝑎 ∈ 𝐴: existe 𝑏 ∈ 𝐵 y 𝑎 = 𝑓−1(𝑏)} ⊂ 𝐴, es el rango de la función inversa 𝑓−1; nótese que: 𝑎 ∈ Ran(𝑓−1) ⇔ existe 𝑏 ∈ 𝐵 tal que 𝑎 = 𝑓−1(𝑏). El autor Figueroa R. expone una definición similar en [12], pág.166. Representación Gráfica de una Función Inversa. Asimismo una función inversa se puede representar gráficamente mediante un diagrama sagital. 𝑎 = 𝑓−1(𝑏) 𝑏 8 𝑦 X Y L 𝑦 = 𝑥3 𝒙 0 𝑦 Y X 𝒙𝟏 𝒙𝟐 L Caracterización Geométrica de una Función Real de Variable Real que posee Inversa que es Función. Una función 𝑓 cuya inversa 𝑓−1 es función se caracteriza porque toda recta horizontal trazada por cada punto perteneciente a su rango, corta a su gráfica en un único punto. (𝑓𝑖𝑔. 2) Función con inversa que ES función. (𝑓𝑖𝑔. 3) Función con inversa que NO es función. 𝑦 = 𝑥2 9 𝐴1 𝐴2 𝐴𝑖 Capítulo 2 Elementos de Topología en la Recta Real A mediados del siglo XIX comenzó a desarrollarse la Topología, esta disciplina estudia las propiedades de las figuras geométricas que subsisten aun cuando estas se someten a deformaciones tan radicales que las hagan perder todas sus propiedades métricas y proyectivas. Johann Listing, alumno de Gauss, fue el primer matemático en utilizar el término “topología” (del griego topos, “lugar”) en su tratado Lecciones de topología. 2.1 Topología. Definición 2.1.1 Sea 𝑋 un conjunto. Una topología en 𝑋 es una familia 𝒜 de subconjuntos en 𝑋, tal que cumple con los siguientes axiomas: i. ∅ ∈ 𝒜, 𝑋 ∈ 𝒜; ii. Si {𝐴𝑖}𝑖∈𝐼 ⊆ 𝒜, 𝐼 arbitrario, entonces ⋃ 𝐴𝑖𝑖∈𝐼 ∈ 𝒜; iii. Si {𝐴𝑖}𝑖∈𝐼 ⊆ 𝒜, 𝐼 finito, entonces ⋂ 𝐴𝑖𝑖∈𝐼 ∈ 𝒜. El autor Prieto C. enuncia esta definición en [25], pág.43. Observaciones: 1. A la pareja (𝑋,𝒜) se le denomina espacio topológico, al cual denotaremos solo por 𝑋. 2. Al conjunto 𝑋 llamaremos el conjunto subyacente del espacio topológico. 3. A los subconjuntos de 𝑋 llamaremos abiertos. (𝑓𝑖𝑔. 1) Topología 10 2.2 Conjunto Abierto y Conjunto Cerrado. Definición 2.2.1 Sean 𝑋 ⊆ ℝ y 𝑝 ∈ ℝ. i. El punto 𝑝 es interior de 𝑋 si y solamente si existe un 𝜀 > 0 tal que 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ 𝑋. Al conjunto 𝑉(𝑝, 𝜀) = 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 se le llama vecindad de centro 𝑝 y radio 𝜀 del punto 𝑝. ii. El conjunto 𝑖𝑛𝑡𝑋 = {𝑝 ∈ ℝ: 𝑝 es punto interior de 𝑋} se llama conjunto interior de 𝑋. El autor Lima E. enuncia estas definiciones en [21], pág.163. Ejemplo: Los intervalos abiertos 〈𝑎, 𝑏〉, 〈−∞, 𝑏〉, 〈𝑎,+∞〉 son conjuntos abiertos. Proposición 2.2.2 Sean 𝑋, 𝑌 ⊂ ℝ; entonces: 1) 𝑖𝑛𝑡𝑋 ⊂ 𝑋; 2) Si 𝑋 ⊂ 𝑌, entonces 𝑖𝑛𝑡𝑋 ⊂ 𝑖𝑛𝑡𝑌. En el libro de Lima E. (véase [21], pág.163) se encuentra probado que las propiedades mencionadas son absolutamente ciertas. Conjunto Abierto. Definición 2.2.3 Sea 𝑋 ⊆ ℝ, se dice que 𝑋 es un conjunto abierto si y solo si 𝑖𝑛𝑡𝑋 = 𝑋. Es decir, todo elemento de 𝑋 es punto interior de 𝑋. Podemos apreciar una definición similar en [21], pág.164, libro del autor Lima E. Proposición 2.2.4 Si 𝑋 es un intervalo abierto, entonces 𝑋 es un conjunto abierto. El autor brasileño Lima E. (véase [21], pág.165) prueba que la propiedad mencionada es verdadera. Teorema 2.2.5 1) El conjunto vacío y ℝ son conjuntos abiertos. 2) Sea {𝐴𝜆}𝜆∈𝐿 una colección arbitraria de conjuntos abiertos; entonces ⋃ 𝐴𝜆𝜆∈𝐿 es un conjunto abierto. 3) La intersección finita de conjuntos abiertos es un conjunto abierto. Demostración 1) a. Probaremos que ∅ es conjunto abierto. Supongamos que ∅ no es abierto, es decir el 𝑖𝑛𝑡∅ ≠ ∅, entonces existe un 𝑝 ∈ ℝ tal que 𝑝 ∈ 𝑖𝑛𝑡∅; luego existe 𝜀 > 0 tal que 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ ∅, lo cual contradice a 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ≠ ∅. Por lo tanto, ∅ es conjunto abierto. 11 b. Probaremos que ℝ es conjunto abierto (ℝ ⊂ 𝑖𝑛𝑡ℝ). Efectivamente, sea 𝑝 ∈ ℝ; entonces podemos construir una vecindad de 𝑝, es decir existe 𝜀 > 0 tal que 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ ℝ, vemos que 𝑝 es un punto interior de ℝ, en consecuencia 𝑝 ∈ 𝑖𝑛𝑡ℝ. Por lo tanto, ℝ es conjunto abierto. 2) Probaremos que la unión arbitraria de conjuntos abiertos es un conjunto abierto. Efectivamente, sea 𝑝 ∈ ⋃ 𝐴𝜆𝜆∈𝐿 ; entonces para algún 𝜆0 ∈ 𝐿, 𝑝 ∈ 𝐴𝜆0 ; como 𝐴𝜆0 es un conjunto abierto, implica que existe 𝜀 > 0 tal que 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ 𝐴𝜆0 y además 𝐴𝜆0 ⊆ ⋃ 𝐴𝜆𝜆∈𝐿 ; en consecuencia existe 𝜀 > 0 tal que 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ ⋃ 𝐴𝜆𝜆∈𝐿 . Por lo tanto, ⋃ 𝐴𝜆𝜆∈𝐿 es un conjunto abierto. 3) Probaremos que la intersección finita de conjuntos abiertos es un conjunto abierto. Efectivamente, sea 𝑝 ∈ ⋂ 𝐴𝑖 𝑛 𝑖=1 ; entonces para todo 𝑖 = 1,⋯ , 𝑛; 𝑝 ∈ 𝐴𝑖; como 𝐴𝑖 es un conjunto abierto, implica que 𝑝 es punto interior de todos los 𝐴𝑖, es decir existen 𝜀𝑖 > 0 tal que 〈𝑝 − 𝜀𝑖 , 𝑝 + 𝜀𝑖〉 ⊂ 𝐴𝑖, para todo 𝑖 = 1,⋯ , 𝑛. Consideremos cierto 𝜀 = 𝑚𝑖𝑛{𝜀𝑖; 𝑖 = 1,⋯ , 𝑛} > 0, entonces 𝜀 ≤ 𝜀𝑖, 𝑖 = 1,⋯ , 𝑛; luego, existe 𝜀 > 0 tal que 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ 𝐴𝑖, para todo 𝑖 = 1,⋯ , 𝑛; esto implica que existe 𝜀 > 0 tal que para todo 𝑖 = 1,⋯ , 𝑛, 〈𝑝 − 𝜀, 𝑝 + 𝜀〉 ⊂ ⋂ 𝐴𝑖 𝑛 𝑖=1 . Por lo tanto, ⋂ 𝐴𝑖 𝑛 𝑖=1 es un conjunto abierto. En el libro de Lima E. (véase [21], pág.165) se encuentra probado la validez del teorema expuesto. De este teorema, los conjuntos abiertos de ℝ constituyen una topología para ℝ. Conjunto Cerrado. Definición 2.2.6 Sea 𝑋 ⊂ ℝ; se dice que 𝑋 es un conjunto cerrado si y solo si el complemento de 𝑋 es un conjunto abierto. Simbólicamente: 𝑋 es cerrado ⇔ ℝ − 𝑋 es abierto. Podemos apreciar esta definición en [21], pág.171. Ejemplo: El intervalo cerrado [𝑎, 𝑏] y cualquier conjunto finito 𝑋 = {𝑥1,⋯ , 𝑥𝑛} subconjunto de ℝ son conjuntos cerrados. 12 Teorema 2.2.7 1) El conjunto vacío y ℝ son conjuntos cerrados. 2) La unión finita de conjuntos cerrados es un conjunto cerrado. 3) Sea {𝐴𝜆}𝜆∈𝐿 una colección arbitraria de conjuntos cerrados; entonces ⋂ 𝐴𝜆𝜆∈𝐿 es un conjunto cerrado. El autor Lima E. (véase [21], pág.171 – 172) prueba que el teorema mencionado es absolutamente cierto. Este teorema es llamado teorema dual topológico. 2.3 Conjunto Acotado y Conjunto Compacto. Definición 2.3.1 Sea 𝑋 ⊂ ℝ, se dice que 𝑋 es un conjunto acotado si y solo si existe una constante real positiva 𝑘 tal que |𝑥| ≤ 𝑘, para todo 𝑥 ∈ 𝑋. Simbólicamente: 𝑋 es acotado ⇔ existe 𝑘 > 0 tal que |𝑥| ≤ 𝑘, para todo 𝑥 ∈ 𝑋; ⇔ existe 𝑘 > 0 tal que 𝑥 ∈ 𝑉(0, 𝑘), para todo 𝑥 ∈ 𝑋. Ejemplo: El intervalo cerrado [𝑎, 𝑏] es un conjunto acotado. Definición 2.3.2 Sea 𝐾 ⊂ ℝ; se dice que 𝐾 es un conjunto compacto si y solamente si 𝐾 es cerrado y acotado. El autor Bartle R. expone esta definición en [5], pág.387. Ejemplo: El intervalo cerrado [𝑎, 𝑏] y cualquier conjunto finito son conjuntos compactos. Teorema 2.3.3 La unión finita y la intersección arbitraria de conjuntos compactos es un conjunto compacto. El autor Lima E. expone una demostración de este teorema en [21], pág.387. 13 2.4 Punto de Acumulación. Definición 2.4.1 Sea 𝑋 ⊆ ℝ. i. Decimos que 𝑎 ∈ ℝ es un punto de acumulación de 𝑋 cuando toda vecindad 𝑉 de centro 𝑎 contiene algún punto de 𝑋 diferente de 𝑎. Es decir, el punto 𝑎 es un punto de acumulación de 𝑋 si y solo si para todo 𝜀 > 0 tal que 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 ∩ (𝑋 − {𝑎}) ≠ ∅. ii. Un punto que no es de acumulación se llama punto aislado; iii. El conjunto 𝑋′ = { 𝑎 ∈ ℝ: 𝑎 es punto de acumulación de 𝑋} se llama conjunto derivado de 𝑋; iv. El punto 𝑎 ∈ 𝑋 es un punto aislado de 𝑋 si y solamente si existe 𝜀 > 0, 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 ∩ 𝑋 = {𝑎}; v. Decimos que 𝑋 es un conjunto discreto si y solo si todos sus puntos son aislados. Todas estas definiciones son enunciadas por Lima E. en [21], pág.175. Ejemplo: El intervalo 𝑋 = [𝑎, 𝑏⟩, en consecuencia su conjunto derivado de 𝑋 es [𝑎, 𝑏] y si 𝑌 es un conjunto finito, entonces su conjunto derivado de 𝑌 es el conjunto vacío. Teorema 2.4.2 Todo punto de un conjunto abierto 𝑋 es punto de acumulación de 𝑋. Demostración Sabemos que 𝑎 ∈ 𝑋 y 𝑋 es un conjunto abierto, entonces existe 𝑟 > 0 tal que 〈𝑎 − 𝑟, 𝑎 + 𝑟〉 ⊂ 𝑋. Sea 𝜀 > 0, arbitrario; entonces 1) 𝜀 > 𝑟 2) 𝜀 < 𝑟 3) 𝜀 = 𝑟 Para 3) es inmediata. Para 2) si 𝜀 < 𝑟, tenemos 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 ∩ (𝑋 − {𝑎}) = 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 ≠ ∅ Para 1) si 𝜀 > 𝑟, tenemos 〈𝑎 − 𝑟, 𝑎 + 𝑟〉 ⊂ 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 implica que 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 ∩ (𝑋 − {𝑎}) ⊃ 〈𝑎 − 𝑟, 𝑎 + 𝑟〉 − {𝑎} ≠ ∅, en consecuencia tenemos 〈𝑎 − 𝜀, 𝑎 + 𝜀〉 ∩ (𝑋 − {𝑎}) ≠ ∅. Lo que demuestra la validez del teorema. Podemos apreciar una demostración similar en [21], pág.190. 14 Capítulo 3 Límite, Continuidad y Diferenciabilidad de Funciones Reales de Variable Real La noción de función continua es uno de los conceptos centrales de la Topología. Aunque el concepto de diferenciabilidad fue planteado mucho antes que el de continuidad, debido a que se formuló en el siglo XVII por Fermat y otros, fue el descubrimiento efectuado por Newton y Leibniz lo que dio inicio al desarrollo del cálculo diferencial. 3.1 Límite. Definición 3.1.1 Sea 𝑓:𝑋 → ℝ una función, donde 𝑋 ⊆ ℝ y 𝑎 ∈ 𝑋′. Se dice que 𝐿 ∈ ℝ es el límite de la función 𝑓 en 𝑎 si y solo si para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y 0 < |𝑥 − 𝑎| < 𝛿, entonces |𝑓(𝑥) − 𝐿| < 𝜀. En este caso se usa la notación lím 𝑥→𝑎 𝑓(𝑥) = 𝐿. Simbólicamente, lím 𝑥→𝑎 𝑓(𝑥) = 𝐿 ⇔ para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y 0 < |𝑥 − 𝑎| < 𝛿, entonces |𝑓(𝑥) − 𝐿| < 𝜀. Esta definición es enunciada por Lima E. en [19], pág.62. Teorema 3.1.2 Sean 𝑋 ⊆ ℝ, 𝑓, 𝑔: 𝑋 → ℝ, 𝑎 ∈ 𝑋′, lím 𝑥→𝑎 𝑓(𝑥) = 𝐿 y lím 𝑥→𝑎 𝑔(𝑥) = 𝑀. Si 𝐿 < 𝑀, entonces existe 𝛿 > 0 tal que 𝑓(𝑥) < 𝑔(𝑥), para todo 𝑥 ∈ 𝑋 con 0 < |𝑥 − 𝑎| < 𝛿. El autor Lima E. en [19], pág.63 presenta una demostración para este teorema. Teorema 3.1.3 (Teorema de Sandwich o de Compresión) Sean 𝑋 ⊆ ℝ, 𝑓, 𝑔, ℎ: 𝑋 → ℝ, 𝑎 ∈ 𝑋′, y lím 𝑥→𝑎 𝑓(𝑥) = lím 𝑥→𝑎 ℎ(𝑥) = 𝐿. Si 𝑓(𝑥) ≤ 𝑔(𝑥) ≤ ℎ(𝑥) para todo 𝑥 ∈ 𝑋 − {𝑎}, entonces lím 𝑥→𝑎 𝑔(𝑥) = 𝐿. El autor Lima E. expone una demostración para este teorema en [19], pág.63 – 64. 15 Proposición 3.1.4 Sean 𝑋 ⊆ ℝ, 𝑓, 𝑔: 𝑋 → ℝ, 𝑎 ∈ 𝑋′. Si lím 𝑥→𝑎 𝑓(𝑥) = 𝐿 y lím 𝑥→𝑎 𝑔(𝑥) = 𝑀, entonces: 1) lím 𝑥→𝑎 (𝑓(𝑥) + 𝑔(𝑥)) = 𝐿 + 𝑀; 2) lím 𝑥→𝑎 (𝑓(𝑥) − 𝑔(𝑥)) = 𝐿 − 𝑀; 3) lím 𝑥→𝑎 (𝑓(𝑥) ⋅ 𝑔(𝑥)) = 𝐿 ⋅ 𝑀; 4) lím 𝑥→𝑎 (𝛼 ⋅ 𝑓(𝑥)) = 𝛼 ⋅ 𝐿, 𝛼 ∈ ℝ; 5) lím 𝑥→𝑎 ( 1 𝑓(𝑥) ) = 1 𝐿 , si 𝐿 ≠ 0; 6) lím 𝑥→𝑎 ( 𝑓(𝑥) 𝑔(𝑥) ) = 𝐿 𝑀 , si 𝑀 ≠ 0. En el libro de Toribio M. y Medina R. (véase [26], pág.125 – 128) se demuestra la validez de las propiedades de límite de funciones enunciadas. 3.2 Continuidad. Definición 3.2.1 Sea 𝑓: 𝑋 → ℝ una función, donde 𝑋 ⊆ ℝ. Se dice que 𝑓 es continua en el punto 𝑎 ∈ 𝑋 si y solo si para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y |𝑥 − 𝑎| < 𝛿, entonces |𝑓(𝑥) − 𝑓(𝑎)| < 𝜀. Simbólicamente: 𝑓 es continua en 𝑎 ⇔ para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y |𝑥 − 𝑎| < 𝛿, entonces |𝑓(𝑥) − 𝑓(𝑎)| < 𝜀. Una función 𝑓: 𝑋 → ℝ se dice continua sobre 𝑋, si es continua en cada punto de 𝑋. Esta definición es expuesta por Lima E. en [19], pág.74. Ejemplos: a. Sea 𝑓: ℝ → ℝ, la función constante definida 𝑓(𝑥) = 𝑐, para todo 𝑥 ∈ ℝ; la función constante es continua en todo ℝ. b. Sea 𝑔:ℝ → ℝ, definida por 𝑔(𝑥) = |𝑥|, para todo 𝑥 ∈ ℝ; esta es la función valor absoluto la cual es continua en todo ℝ. Proposición 3.2.2 Sean 𝑓, 𝑔: 𝑋 → ℝ funciones continuas en el punto 𝑎 ∈ 𝑋; entonces 1) 𝑓 + 𝑔 es continua en 𝑎; 2) 𝑓 − 𝑔 es continua en 𝑎; 3) 𝑓 ⋅ 𝑔 es continua en 𝑎; 4) 𝑓 𝑔 es continua en 𝑎, si 𝑔(𝑎) ≠ 0. 16 La demostración de estas propiedades es consecuencia inmediata de la teoría de límites. En el libro de Martínez C. y Sanz M. (véase [22], pág.182) se encuentra probada esta proposición. Lema 3.2.3 Si 𝑓: 𝑋 → ℝ es continua en el intervalo 𝑋, entonces 𝑓(𝑋) es un intervalo. El autor Lima E. expone una demostración para este lema en [19], pág.77. Lema 3.2.4 Sea 𝑓: 𝑋 → ℝ una función monótona definida en un intervalo 𝑋. Si la imagen 𝑓(𝑋) es un intervalo, entonces 𝑓 es continua. El autor Lima E. presenta una demostración de este teorema en [19], pág.220. Teorema 3.2.5 (Teorema de la Inversa Continua) Sean 𝑋 ⊂ ℝ, un intervalo, 𝑓: 𝑋 → ℝ estrictamente monótona y continua en 𝑋; entonces la función 𝑔 inversa de 𝑓 es estrictamente monótona y continua en 𝑌 = 𝑓(𝑋). Demostración a) Supongamos que 𝑓 sea continua en 𝑋, entonces, por el Lema 3.2.3, el conjunto 𝑌 = 𝑓(𝑋) es un intervalo. b) Sea 𝑓: 𝑋 → ℝ estrictamente monótona y continua en 𝑋, consideremos 𝑓: 𝑋 → 𝑓(𝑋) = 𝑌, entonces 𝑓 es inyectiva y sobreyectiva. Por lo tanto, es biyectiva, podemos definir su inversa 𝑔:𝑌 → 𝑋 que es monótona (pues 𝑓 es monótona). Además, el conjunto 𝑔(𝑌) = 𝑔(𝑓(𝑋)) = (𝑔 ∘ 𝑓)(𝑋) = 𝐼𝑑(𝑋) = 𝑋. Como la imagen 𝑔(𝑌) = 𝑋 es un intervalo, entonces por el Lema 3.2.4, tenemos que 𝑔 es continua en 𝑌. El autor Lima E. expone una demostración para este teorema en [19], pág.79 – 80. 3.3 Diferenciabilidad. Definición 3.3.1 Sean 𝑋 ⊂ ℝ; 𝑓:𝑋 → ℝ una función y 𝑎 ∈ 𝑋 un punto de acumulación de 𝑋 (𝑎 ∈ 𝑋′). La derivada de la función 𝑓 en el punto 𝑎 es el límite: lím 𝑥→𝑎 𝑓(𝑥) − 𝑓(𝑎) 𝑥 − 𝑎 = lím ℎ→0 𝑓(𝑎 + ℎ) − 𝑓(𝑎) ℎ , el cual es representando por 𝑓′(𝑎), cuando este existe. Esta definición es enunciada por Lima E. en [19], pág.90 – 91. 17 X Y 𝑎 𝑎 + ℎ (𝑎, 𝑓(𝑎)) T X 𝑎 (𝑎, 𝑓(𝑎)) T Y 𝑓 𝑓 Observación: 1. Cuando existe 𝑓′(𝑎), se dice que 𝑓 es derivable en el punto 𝑎. 2. Cuando existe la derivada 𝑓′(𝑥) en todos los puntos 𝑥 ∈ 𝑋 ∩ 𝑋′ se dice que la función 𝑓:𝑋 → ℝ es derivable en el conjunto 𝑋 y se obtiene una nueva función, 𝑓′: 𝑋 ∩ 𝑋′ → ℝ 𝑥 → 𝑓′(𝑥), llamada función derivada de 𝑓. 3. Sea 𝑓: [𝑎, 𝑏] → ℝ una función derivable en 〈𝑎, 𝑏〉; entonces se puede definir la función derivada 𝑓′: 〈𝑎, 𝑏〉 → ℝ, mediante (𝑓)′(𝑥) = 𝑓′(𝑥). Representación Geométrica de la Derivada. La derivada 𝑓′(𝑎) de la función 𝑓(𝑥) en el punto 𝑎, es la pendiente (inclinación) de la recta 𝑇 tangente a la gráfica de la función 𝑓 en el punto (𝑎, 𝑓(𝑎)). (𝑓𝑖𝑔. 1) (𝑓𝑖𝑔. 2) Ejemplos: a. Sea 𝑓 la función constante. Entonces 𝑓′(𝑎) = 0, para todo 𝑎 ∈ ℝ. b. Sea 𝑔 la función valor absoluto. Entonces para 𝑥 ≠ 0, se tiene que 𝑓(𝑥)−𝑓(0) 𝑥−0 = |𝑥| 𝑥 = ±1 (+1 si 𝑥 > 0 y −1 si 𝑥 < 0). Sigue que existen 𝑓′ + (0) = 1 y 𝑓′ − (0) = −1 más no existe 𝑓′(0). Para 𝑎 ≠ 0 existe 𝑓′(𝑎) que vale 1 si 𝑎 > 0 y −1 si 𝑎 < 0. 18 Proposición 3.3.2 Sean 𝑓, 𝑔: 𝑋 → ℝ derivables en el punto 𝑎 ∈ 𝑋 ∩ 𝑋′; entonces: 1) 𝑓 + 𝑔 es derivable en 𝑎 con (𝑓 + 𝑔)′(𝑎) = 𝑓′(𝑎) + 𝑔′(𝑎); 2) 𝑓 − 𝑔 es derivable en 𝑎 con (𝑓 − 𝑔)′(𝑎) = 𝑓′(𝑎) − 𝑔′(𝑎); 3) 𝑓 ⋅ 𝑔 es derivable en 𝑎 con (𝑓 ⋅ 𝑔)′(𝑎) = 𝑓′(𝑎) ⋅ 𝑔(𝑎) + 𝑓(𝑎) ⋅ 𝑔′(𝑎); 4) ( 𝑓 𝑔 ) ′ es derivable en 𝑎 con ( 𝑓 𝑔 ) ′ (𝑎) = 𝑓′(𝑎)⋅𝑔(𝑎)−𝑓(𝑎)⋅𝑔′(𝑎) (𝑔(𝑎)) 2 , si 𝑔(𝑎) ≠ 0. Los autores Martínez C. y Sanz M. en [22], pág.248 – 249 exponen las pruebas de estas proposiciones. 3.4 Función Diferenciable en un Intervalo. Teorema 3.4.1 Sea 𝑓: [𝑎, 𝑏] → ℝ continua con 𝑓(𝑎) = 𝑓(𝑏). Si 𝑓 es derivable en 〈𝑎, 𝑏〉, entonces existe 𝑐 ∈ 〈𝑎, 𝑏〉 tal que 𝑓′(𝑐) = 0. Podemos encontrar una demostración de este teorema en [22], pág.235. Lema 3.4.2 (Teorema de Valor Medio o de Lagrange) Sea 𝑓: [𝑎, 𝑏] → ℝ continua en [𝑎, 𝑏]. Si 𝑓 es derivable en 〈𝑎, 𝑏〉, entonces existe 𝑐 ∈ 〈𝑎, 𝑏〉 tal que 𝑓′(𝑐) = 𝑓(𝑏)−𝑓(𝑎) 𝑏−𝑎 . El autor Lima E. expone la demostración de este lema en [19], pág.98. Teorema 3.4.3 Sea 𝑓: [𝑎, 𝑏] → ℝ una función continua en [𝑎, 𝑏] y derivable en 〈𝑎, 𝑏〉. 1) Si 𝑓′(𝑥) > 0, para todo 𝑥 ∈ 〈𝑎, 𝑏〉, entonces 𝑓 es creciente en [𝑎, 𝑏]. 2) Si 𝑓′(𝑥) < 0, para todo 𝑥 ∈ 〈𝑎, 𝑏〉, entonces 𝑓 es decreciente en [𝑎, 𝑏]. Demostración 1) Sean 𝑥1,𝑥2 ∈ [𝑎, 𝑏] con 𝑥1 < 𝑥2. Definamos el intervalo [𝑥1, 𝑥2], se verifica que 𝑓 es continua en [𝑥1, 𝑥2] y que es derivable en 〈𝑥1, 𝑥2〉. Por el Lema 3.4.2 (en [𝑥1, 𝑥2]), existe 𝑐 ∈ 〈𝑥1, 𝑥2〉 tal que 𝑓′(𝑐) = 𝑓(𝑥2)−𝑓(𝑥1) 𝑥2−𝑥1 , luego 𝑓(𝑥2) − 𝑓(𝑥1) = 𝑓′(𝑐)(𝑥2 − 𝑥1). Como para todo 𝑥 ∈ 〈𝑎, 𝑏〉 se cumple 𝑓′(𝑥) > 0, en particular 𝑓′(𝑐) > 0 y 𝑥2 − 𝑥1 > 0, implica que 𝑓′(𝑐)(𝑥2 − 𝑥1) > 0, en consecuencia 𝑓(𝑥2) − 𝑓(𝑥1) > 0; de aquí se tiene que 𝑓(𝑥1) < 𝑓(𝑥2). Por lo tanto, 𝑓 es creciente en [𝑎, 𝑏]. Para la parte 2) la prueba es similar; por lo tanto, 𝑓 es decreciente en [𝑎, 𝑏]. Podemos ubicar una demostración similar en [19], pág.99. 19 3.5 Teorema de la Función Inversa en ℝ. Sea 𝑋 ⊂ ℝ un conjunto abierto y 𝑎 ∈ 𝑋. Si 𝑓:𝑋 → ℝ es diferenciable con continuidad en 𝑋 y 𝑓′(𝑎) ≠ 0, entonces existen vecindades 𝑉(𝑎, 𝛿) de centro 𝑎 y 𝑉(𝑏, 𝜀) de centro 𝑏 = 𝑓(𝑎) tal que 𝑓: 𝑉(𝑎, 𝛿) → 𝑉(𝑏, 𝜀) posee inversa 𝑓−1: 𝑉(𝑏, 𝜀) → 𝑉(𝑎, 𝛿) la cual es diferenciable con continuidad en 𝑏 y además (𝑓−1)′(𝑏) = 1 𝑓′(𝑓−1(𝑏)) . Demostración Como 𝑓 es diferenciable en 𝑋, entonces que 𝑓 es continua en 𝑋 y en particular 𝑓 es continua en el punto 𝑎 ∈ 𝑋. Por la definición de continuidad en un punto, tenemos que para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y |𝑥 − 𝑎| < 𝛿, entonces |𝑓(𝑥) − 𝑓(𝑎)| < 𝜀; expresado de otra manera, para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y 𝑥 ∈ 𝑉(𝑎, 𝛿), entonces 𝑓(𝑥) ∈ 𝑉(𝑓(𝑎), 𝜀)… (1) De la parte (1) se tiene una restricción para la función 𝑓. Definamos la función restricción 𝑓: 𝑉(𝑎, 𝛿) → ℝ. a) Si 𝑓′ es continua en 𝑎 y 𝑓′(𝑎) > 0, entonces 𝑓′(𝑥) > 0, para todo 𝑥 ∈ 𝑉(𝑎, 𝛿). b) Análogamente, cuando 𝑓′ es continua en 𝑎 y 𝑓′(𝑎) < 0, entonces 𝑓′(𝑥) < 0, para todo 𝑥 ∈ 𝑉(𝑎, 𝛿). En consecuencia, si 𝑓: 𝑉(𝑎, 𝛿) → ℝ es continua en 𝑉(𝑎, 𝛿) y derivable en el interior de 𝑉(𝑎, 𝛿), entonces se tiene dos casos: a) Si 𝑓′(𝑥) > 0, para todo 𝑥 ∈ 𝑉(𝑎, 𝛿), entonces 𝑓 es creciente en 𝑉(𝑎, 𝛿). b) Si 𝑓′(𝑥) < 0, para todo 𝑥 ∈ 𝑉(𝑎, 𝛿), entonces 𝑓 es decreciente en 𝑉(𝑎, 𝛿). (véase [26], pág.237). Como 𝑉(𝑎, 𝛿) es un intervalo, 𝑓: 𝑉(𝑎, 𝛿) → ℝ es estrictamente monótona y continua en 𝑉(𝑎, 𝛿); entonces la función 𝑓−1, inversa de 𝑓, es estrictamente monótona y continua en 𝑉(𝑏, 𝜀), en virtud del Teorema de la Inversa Continua (véase [5], pág.195 – 196). Probaremos que 𝑓−1 es diferenciable en 𝑏. Efectivamente, sabemos que 𝑓′(𝑎) ≠ 0; y como 𝑓−1 es continua en 𝑏, se tiene: lím 𝑦→𝑏 𝑓−1(𝑦) = 𝑓−1(𝑏) [ 𝑏 = 𝑓(𝑎), entonces 𝑓−1(𝑏) = 𝑓−1(𝑓(𝑎)) = 𝑎]. Por la inyectividad de la función 𝑓−1, vemos que 𝑓−1(𝑦) ≠ 𝑎 con 𝑦 ∈ 𝑉(𝑏, 𝜀) − {𝑏}. Luego lím 𝑦→𝑏 𝑓−1(𝑦)−𝑓−1(𝑏) 𝑦−𝑏 = lím 𝑦→𝑏 𝑓−1(𝑦)−𝑎 𝑓(𝑓−1(𝑦))−𝑓(𝑎) = lím 𝑦→𝑏 [ 𝑓(𝑓−1(𝑦))−𝑓(𝑎) 𝑓−1(𝑦)−𝑎 ] −1 20 𝑓 Y X 𝑎0 𝑓(𝑎0) = 𝑏0 𝑓′(𝑎0) = 0 𝑎 < 𝑓(𝑎) = 𝑏 𝑓′(𝑎) ≠ 0 < < > = [lím 𝑦→𝑏 𝑓(𝑓−1(𝑦))−𝑓(𝑎) 𝑓−1(𝑦)−𝑎 ] −1 = [lím 𝑦→𝑏 𝑓(𝑥)−𝑓(𝑎) 𝑥−𝑎 ] −1 = [𝑓′(𝑎)]−1, pues 𝑓 es derivable en 𝑎. Si 𝑦 = 𝑓(𝑥), entonces 𝑓−1(𝑦) = 𝑥; sabemos que 𝑦 tiende a 𝑏, entonces por la continuidad de 𝑓−1, lím 𝑦→𝑏 𝑓−1(𝑦) = 𝑓−1(𝑏) = 𝑎. Por lo tanto, 𝑥 tiende a 𝑎, cuando 𝑦 se aproxima a 𝑏. Y, en consecuencia, existe (𝑓−1)′(𝑏) y (𝑓−1)′(𝑏) = 1 𝑓′(𝑓−1(𝑏)) . Representación Geométrica del Teorema de la Función Inversa en ℝ. 21 Capítulo 4 Fundamentos de Álgebra Lineal El Álgebra Lineal es el estudio de los espacios vectoriales y de las transformaciones lineales definidas entre ellos. Cuando los espacios tienen dimensiones finitas, las transformaciones lineales están asociadas con las matrices. Son numerosas y bastante variadas las situaciones, en matemática y sus aplicaciones, en las que estos objetos están presentes. De ahí la importancia central del Álgebra Lineal en la enseñanza de la matemática. En nuestro caso es fundamental para los propósitos de la tesis. 4.1 Espacio Vectorial. Definición 4.1.1 Un espacio vectorial, sobre el campo 𝐾, es un conjunto no vacío 𝐸 en el cual están definidas dos operaciones: + ∶ 𝐸 × 𝐸 → 𝐸 donde (𝑢, 𝑣) → 𝑢 + 𝑣 ⋅ ∶ 𝐾 × 𝐸 → 𝐸 donde (𝛼, 𝑢) → 𝛼 ⋅ 𝑢, llamadas adición y multiplicación por un escalar, que satisfacen las siguientes propiedades: i. Para todo 𝑢,𝑣 ∈ 𝐸, 𝑢 + 𝑣 ∈ 𝐸; ii. Para todo 𝑢,v,𝑤 ∈ 𝐸, 𝑢 + (𝑣 + 𝑤) = (𝑢 + 𝑣) + 𝑤; iii. Existe 0 ∈ 𝐸, 𝑢 + 0 = 𝑢, para todo 𝑢 ∈ 𝐸; iv. Para todo 𝑢 ∈ 𝐸, existe −𝑢 ∈ 𝐸 tal que 𝑢 + (−𝑢) = 0; v. Para todo 𝑢,𝑣 ∈ 𝐸, tal que 𝑢 + 𝑣 = 𝑣 + 𝑢; vi. Para todo 𝑢 ∈ 𝐸, para todo 𝛼,𝛽 ∈ 𝐾, que (𝛼 + 𝛽) ⋅ 𝑢 = 𝛼 ⋅ 𝑢 + 𝛽 ⋅ 𝑢; vii. Para todo 𝑢,𝑣 ∈ 𝐸, para todo 𝛼 ∈ 𝐾, 𝛼 ⋅ (𝑢 + 𝑣) = 𝛼 ⋅ 𝑢 + 𝛼 ⋅ 𝑣; viii. Para todo 𝑢 ∈ 𝐸, para todo 𝛼,𝛽 ∈ 𝐾, 𝛼 ⋅ (𝛽 ⋅ 𝑢) = (𝛼 ⋅ 𝛽) ⋅ 𝑢; ix. Para todo 𝑢 ∈ 𝐸, existe 1 ∈ 𝐾 tal que 1 ⋅ 𝑢 = 𝑢 ⋅ 1 = 𝑢. Podemos encontrar esta definición en el texto de Lima E. en [18], pág.1. Observación: A los elementos de un espacio vectorial se les llama vectores. También denotaremos a un espacio vectorial sobre el campo 𝐾, por (𝐸, +,⋅, 𝐾). Nota: Para más profundidad puede encontrar la definición de campo en el libro de Gonçalvez pág.34 – 35, aquí solo diremos que 𝐾 campo 22 es una estructura algebraica y además el campo fijado para nuestro estudio será el campo real ℝ. Ejemplo: Una matriz real de orden 𝑚 × 𝑛 es un arreglo rectangular de 𝑚 × 𝑛 números reales de la forma [ 𝑎11 ⋯ 𝑎1𝑛 ⋮ ⋱ ⋮ 𝑎𝑚1 ⋯ 𝑎𝑚𝑛 ] Los números 𝑎𝑖𝑗, 1 ≤ 𝑖 ≤ 𝑚 y 1 ≤ 𝑗 ≤ 𝑛 se llaman términos de la matriz. Las matrices se representan por letras mayúsculas en la forma 𝐴𝑚×𝑛 o también por [𝑎𝑖𝑗]𝑚×𝑛 ; cuando no haya necesidad de indicar el orden, solamente se representan por 𝐴, 𝐵, etc. El conjunto de todas las matrices reales de orden 𝑚 × 𝑛 se representan por 𝑀(𝑚 × 𝑛) y se convierte en un espacio vectorial cuando en él se define la suma de las matrices 𝐴 = [𝑎𝑖𝑗] y 𝐵 = [𝑏𝑖𝑗] como 𝐴 + 𝐵 = [𝑎𝑖𝑗 + 𝑏𝑖𝑗] y el producto de la matriz 𝐴 por el número real α como α ⋅ A = [α ⋅ 𝑎𝑖𝑗]. Subespacio Vectorial. Definición 4.1.2 Sea (𝐸,+,⋅, 𝐾) un espacio vectorial y 𝐹 un subconjunto no vacío de 𝐸. Se dice que 𝐹 es un subespacio vectorial de 𝐸 si y solo si se cumple las siguientes propiedades: i. 0 ∈ 𝐹; ii. Si 𝑢,𝑣 ∈ 𝐹, entonces 𝑢 + 𝑣 ∈ 𝐸; iii. Si 𝑢 ∈ 𝐹 y 𝛼 ∈ 𝐾 , entonces 𝛼 ⋅ 𝑢 ∈ 𝐹. El autor brasileño Lima E. enuncia esta definición en [18], pág.10. Observación: El conjunto {0} y 𝐹 son subespacios vectoriales de 𝐸 llamados triviales. Ejemplo: El conjunto de las matrices simétricas 𝑆(𝑛 × 𝑛) y el conjunto de las matrices antisimétricas 𝐴(𝑛 × 𝑛) son subespacios vectoriales del espacio vectorial 𝑀(𝑛 × 𝑛). Nota: La intersección, unión y diferencia de subespacios se definen idénticamente a las operaciones básicas con los conjuntos. 23 Suma de Subespacios. Definición 4.1.3 Sean 𝐹1 y 𝐹2 dos subespacios de un espacio vectorial, la suma de los subespacios 𝐹1 y 𝐹2 se define del siguiente modo 𝐹1 + 𝐹2 = {𝑢 ∈ 𝐹1,𝑣 ∈ 𝐹2: 𝑢 + 𝑣 ∈ 𝐹1 + 𝐹2}. El autor Pita C. enuncia esta definición en [24], pág.209. Observaciones: 1. En general 𝐹1 + 𝐹2 ≠ 𝐹1 ∪ 𝐹2, pues 𝐹1 ∪ 𝐹2 no siempre es un subespacio. 2. 𝐹1 + 𝐹2 es el menor subespacio que contiene a 𝐹1 ∪ 𝐹2. Suma Directa de Subespacios. Definición 4.1.4 Sea (𝐸,+,⋅, 𝐾) un espacio vectorial, 𝐹1 y 𝐹2 dos subespacios de 𝐸. Si, además, en la suma de los subespacios 𝐹1 y 𝐹2 (𝐹1 + 𝐹2) se cumple que los subespacios 𝐹1 y 𝐹2 tienen en común solo el elemento nulo 0, diremos que es la suma directa de 𝐹1 y 𝐹2; denotaremos esta situación por 𝐹1 ⊕ 𝐹2. Simbólicamente: 𝐹1 ⊕ 𝐹2 = {𝑢 + 𝑣: 𝑢 ∈ 𝐹1,𝑣 ∈ 𝐹2,𝐹1 ∩ 𝐹2 = {0}}. Podemos encontrar una definición similar en [18], pág.14. Subespacios Suplementarios. Definición 4.1.5 Sean 𝐹1 y 𝐹2 dos subespacios de 𝐸. Si además en la suma directa de los subespacios 𝐹1 y 𝐹2 (𝐹1 ⊕ 𝐹2) se cumple que su suma es igual al espacio vectorial 𝐸, denotaremos 𝐹1 ⊕ 𝐹2 = 𝐸 y diremos que 𝐹1 y 𝐹2 son subespacios suplementarios. El autor Pita C. presenta una definición similar en [24], pág.214. Ejemplo: Los subespacios 𝑆(𝑛 × 𝑛) y 𝐴(𝑛 × 𝑛) son suplementarios en el espacio de matrices de orden 𝑛 × 𝑛, pues se cumple 𝑆(𝑛 × 𝑛) ⊕ 𝐴(𝑛 × 𝑛) = 𝑀(𝑛 × 𝑛). 4.2 Base y Dimensión. Definición 4.2.1 Se llama combinación lineal de los vectores 𝑣1,𝑣2,…,𝑣𝑛 de 𝐸 a toda suma de la forma 𝛼1 ⋅ 𝑣1 + 𝛼2 ⋅ 𝑣2 + ⋯+ 𝛼𝑛 ⋅ 𝑣𝑛, donde 𝛼1,𝛼2,…,𝛼𝑛 son escalares pertenecientes a 𝐾. El autor Chávez C. enuncia una definición similar en [6], pág.24. Definición 4.2.2 Sea 𝐸 un espacio vectorial y 𝑋 = {𝑣1, ⋯ , 𝑣𝑛} ⊂ 𝐸. Se dice que 𝑋 es linealmente independiente si ningún vector 𝑣 ∈ 𝑋 es combinación lineal de otros vectores de 𝑋. 24 Podemos ubicar esta definición en el libro de Lima E. [18], pág.25. Teorema 4.2.3 Sea 𝐸 un espacio vectorial y 𝑋 = {𝑣1, ⋯ , 𝑣𝑛} ⊂ 𝐸. Entonces: 𝑋 es linealmente independiente si y solo si ∑ 𝛼𝑖 𝑛 𝑖=1 ⋅ 𝑣𝑖 = 0 implica que 𝛼𝑖 = 0, para todo 𝑖 = 1,⋯ , 𝑛. En el libro de Lima E. (véase [18], pág.25 – 26) se encuentra demostrado este teorema. Definición 4.2.4 Sea 𝐸 un espacio vectorial sobre 𝐾. Se dice que 𝑋 = {𝑣1, ⋯ , 𝑣𝑛} genera a 𝐸 (o es un conjunto generador de 𝐸) si y solo si para todo vector 𝑣 ∈ 𝐸, existen escalares 𝛼1,𝛼2,…,𝛼𝑛 ∈ 𝐾 tales que 𝑣 = 𝛼1 ⋅ 𝑣1 + 𝛼2 ⋅ 𝑣2 + ⋯+ 𝛼𝑛 ⋅ 𝑣𝑛. El autor Pita C. enuncia esta definición en [24], pág.208. Definición 4.2.5 Sean 𝑣1,𝑣2,…,𝑣𝑛 vectores de un espacio vectorial 𝐸. Definimos el espacio generado por estos vectores por 𝑆({𝑣1, 𝑣2,⋯ , 𝑣𝑛}) = {𝑣 ∈ 𝐸: 𝑣 = 𝛼1 ⋅ 𝑣1 + 𝛼1 ⋅ 𝑣2 + ⋯+ 𝛼𝑛 ⋅ 𝑣𝑛 , 𝛼𝑖 ∈ 𝐾}. El autor Chávez C. expone una definición similar en [6], pág.24. Nota: 𝑆({𝑣1, 𝑣2,⋯ , 𝑣𝑛}) es el espacio generado por el conjunto {𝑣1, 𝑣2, ⋯ , 𝑣𝑛}; representa al conjunto de combinaciones lineales de los vectores 𝑣1,𝑣2,…,𝑣𝑛. Base de un Espacio Vectorial. Definición 4.2.6 Sea 𝐸 un espacio vectorial y ℬ = {𝑣1,⋯ , 𝑣𝑛} ⊂ 𝐸. Se dice que ℬ es una base de 𝐸 si se cumple lo siguiente: i. ℬ es linealmente independiente en 𝐸; ii. ℬ es conjunto generador de 𝐸. En el libro de Lima E. se encuentra enunciada esta definición ([18], pág.27). Dimensión de un Espacio Vectorial. Definición 4.2.7 Se dice que el espacio vectorial 𝐸 tiene dimensión finita 𝑛 (dim𝐸 = 𝑛) si admite una base ℬ = {𝑣1, 𝑣2, ⋯ , 𝑣𝑛} ⊂ 𝐸 con 𝑛 vectores. Notación: Para denotar que el espacio vectorial 𝐸 es de dimensión finita escribiremos dim𝐸 < ∞. Para 𝐸 = {0} se define dim𝐸 = 0. Podemos encontrar una definición similar en [6], pág.34. 25 Ejemplo: Consideremos el espacio vectorial 𝑀(𝑛 × 𝑛); se verifica fácilmente que el conjunto ℬ = {[ 1 0 ⋯ 0 0 0 ⋯ 0 ⋮ 0 ⋮ 0 ⋱ ⋮ ⋯ 0 ] , [ 0 1 ⋯ 0 0 0 ⋯ 0 ⋮ 0 ⋮ 0 ⋱ ⋮ ⋯ 0 ] ,⋯ , [ 0 ⋯ 0 0 0 ⋯ 0 0 ⋮ 0 ⋱ 0 ⋮ ⋮ 0 1 ]} es base de 𝑀(𝑛 × 𝑛); entonces la dimensión de 𝑀(𝑛 × 𝑛) es 𝑛 × 𝑛. Lema 4.2.8 Sea 𝑋 un subconjunto linealmente independiente del espacio vectorial 𝐸. Supongamos que el vector 𝑣 ∈ 𝐸 no pertenece al espacio generado por 𝑋 (esto es, 𝑣 ∉ 𝑆(𝑋)), entonces 𝑋 ∪ {𝑣} es linealmente independiente. El autor Pita C. expone una demostración para este lema en [24], pág.236. Teorema 4.2.9 (Teorema de la Completación de Base) Sea 𝐸 un espacio vectorial con dim𝐸 = 𝑛 y 𝑋 = {𝑣1, 𝑣2,⋯ , 𝑣𝑘} un conjunto linealmente independiente de 𝐸 con 𝑘 < 𝑛. Entonces existen vectores 𝑣𝑘+1,𝑣𝑘+2,…,𝑣𝑛 ∈ 𝐸 tales que ℬ = {𝑣1, 𝑣2, ⋯ , 𝑣𝑘 , 𝑣𝑘+1, 𝑣𝑘+2,⋯ , 𝑣𝑛} es una base de 𝐸. Demostración a) Sea dim𝐸 = 𝑛; si 𝑋 genera a 𝐸, es decir 𝑆(𝑋) = 𝐸, entonces 𝑋 es una base en 𝐸. b) Caso contrario, si 𝑋 no genera a 𝐸, esto es 𝑆(𝑋) ≠ 𝐸, entonces existe 𝑣𝑘+1 ∈ 𝐸 tales que 𝑣𝑘+1 ∉ 𝑆(𝑋), entonces 𝑋 ∪ {𝑣𝑘+1} = 𝑋1 es linealmente independiente, en virtud del Lema 4.2.7. Si 𝑋1 genera a 𝐸, es decir 𝑆(𝑋1) = 𝐸, entonces 𝑋1 es una base de 𝐸. Si 𝑋1 no genera a 𝐸, esto es 𝑆(𝑋1) ≠ 𝐸, entonces existe 𝑣𝑘+2 ∈ 𝐸 tales que 𝑣𝑘+2 ∉ 𝑆(𝑋); entonces 𝑋1 ∪ {𝑣𝑘+2} = 𝑋2 es linealmente independiente, debido al Lema 4.2.7. Si 𝑋2 es un generador, es la base buscada si no lo es, repetimos el proceso hasta llegar a un conjunto ℬ = 𝑋𝑚 = 𝑋𝑚−1 ∪ {𝑣𝑘+𝑚}, es decir ℬ = {𝑣1, 𝑣2, ⋯ , 𝑣𝑘 , 𝑣𝑘+1, 𝑣𝑘+2,⋯ , 𝑣𝑘+𝑚}, donde 𝑘 + 𝑚 = 𝑛 que además de ser linealmente independiente, será un generador de 𝐸 y por lo tanto, es una base de 𝐸. Podemos ubicar una demostración similar en [24], pág.236 – 237. 26 4.3 Transformación Lineal. Definición 4.3.1 Sean 𝐸 y 𝐹 espacios vectoriales sobre el campo 𝐾. Una función 𝑇:𝐸 → 𝐹 se llama transformación lineal, si se cumple lo siguiente: i. Para todo 𝑢,𝑣 ∈ 𝐸, 𝑇(𝑢 + 𝑣) = 𝑇(𝑢) + 𝑇(𝑣); ii. Para todo 𝑢 ∈ 𝐸, para todo 𝛼 ∈ 𝐾, 𝑇(𝛼 ⋅ 𝑢) = 𝛼 ⋅ 𝑇(𝑢). El autor Pita C. enuncia esta definición en [24], pág.278. Ejemplo: El conjunto de todas las transformaciones lineales es un espacio vectorial con las operaciones suma de transformaciones y multiplicación de una transformación lineal por un escalar, denotado por ℒ(𝐸, 𝐹) = {𝑇: 𝐸 → 𝐹 tal que 𝑇 es una transformación lineal}. Proposición 4.3.2 Sea 𝑇: 𝐸 → 𝐹 una transformación lineal; entonces: 1) 𝑇(0) = 0; 2) Para todo 𝑢 ∈ 𝐸, 𝑇(−𝑢) = −𝑇(𝑢); 3) Para todo 𝑢,𝑣 ∈ 𝐸, 𝑇(𝑢 − 𝑣) = 𝑇(𝑢) − 𝑇(𝑣); 4) Para todo 𝑢1,𝑢2 ∈ 𝐸, para todo 𝛼1,𝛼2 ∈ 𝐾, 𝑇(𝛼1 ⋅ 𝑢1 + 𝛼2 ⋅ 𝑢2) = 𝛼1 ⋅ 𝑇(𝑢1) + 𝛼1 ⋅ 𝑇(𝑢2); 5) Sean 𝑢1,…,𝑢𝑛 ∈ 𝐸 y 𝛼1,…,𝛼𝑛 ∈ 𝐾; entonces 𝑇 (∑ 𝛼𝑖 𝑛 𝑖=1 ⋅ 𝑢𝑖) = ∑𝛼𝑖 ⋅ 𝑇(𝑢𝑖) 𝑛 𝑖=1 . La prueba se puede encontrar en los [4], [24]. Definición 4.3.3 Sea 𝑇: 𝐸 → 𝐹 una transformación lineal, i. 𝑇 es un monomorfismo si 𝑇 es una función inyectiva. ii. 𝑇 es un epimorfismo si 𝑇 es una función sobreyectiva. iii. 𝑇 es un isomorfismo si es inyectiva y sobreyectiva. Podemos encontrar esta definición en [6], pág.70. Núcleo e Imagen de una Transformación Lineal. Definición 4.3.4 Sea 𝑇: 𝐸 → 𝐹 una transformación lineal. i. El conjunto 𝑁(𝑇) = {𝑢 ∈ 𝐸: 𝑇(𝑢) = 0} se llama núcleo de 𝑇, es decir, 𝑢 ∈ 𝑁(𝑇) ⇔ 𝑇(𝑢) = 0; ii. El conjunto 𝐼𝑚(𝑇) = {𝑤 ∈ 𝐹: existe 𝑢 ∈ 𝐸 y 𝑇(𝑢) = 𝑤} se llama imagen de 𝑇, es decir, 𝑤 ∈ 𝐼𝑚(𝑇) ⇔ existe 𝑢 ∈ 𝐸 tal que 𝑇(𝑢) = 𝑤. Estas definiciones se enuncian en [6], pág.69 – 70. 27 Proposición 4.3.5 Sea 𝑇: 𝐸 → 𝐹 una transformación lineal; entonces: 1) 𝑁(𝑇) es un subespacio de 𝐸; 2) 𝐼𝑚(𝑇) es un subespacio de 𝐹. El autor Pita C. expone una prueba de esta proposición en [24], pág.289 – 290. Lema 4.3.6 Una transformación lineal 𝑇:𝐸 → 𝐹 es inyectiva si y solamente si 𝑁(𝑇) = {0}. Demostración (⇒) Probaremos que 𝑁(𝑇) = {0}. Efectivamente, la demostración será por doble inclusión. a) 𝑁(𝑇) ⊂ {0}. Supongamos que 𝑢 ∈ 𝑁(𝑇); por la definición de núcleo, tenemos que 𝑇(𝑢) = 0 y, por la Proposición 4.3.5 (parte 1), que 𝑇(0) = 0; entonces 𝑇(𝑢) = 𝑇(0), por la inyectividad de 𝑇 se concluye que 𝑢 = 0. Luego, 𝑢 ∈ {0}. b) {0} ⊂ 𝑁(𝑇). Es inmediata; por la Proposición 4.3.5 (parte 1), tenemos que 𝑁(𝑇) es subespacio de 𝐸, lo cual nos dice 0 ∈ 𝑁(𝑇), entonces {0} ⊂ 𝑁(𝑇). Vemos que la parte a) y la parte b) son verdaderas. Por lo tanto, se concluye que 𝑁(𝑇) = {0}. (⇐) Probaremos que 𝑇 es inyectiva. Efectivamente, dados 𝑢,𝑣 ∈ 𝐸 tal que 𝑇(𝑢) = 𝑇(𝑣), se tiene que 𝑇(𝑢) − 𝑇(𝑣) = 0 y, como 𝑇 es transformación lineal, 𝑇(𝑢 − 𝑣) = 0; entonces por la definición de núcleo tenemos que 𝑢 − 𝑣 ∈ 𝑁(𝑇); como por hipótesis 𝑁(𝑇) = {0}, entonces 𝑢 − 𝑣 ∈ {0}; es decir 𝑢 − 𝑣 = 0 y sigue que 𝑢 = 𝑣. Por lo tanto, 𝑇 es inyectiva. Podemos encontrar una demostración similar en [18], pág.63. Teorema 4.3.7 (Teorema de la Dimensión) Sean 𝐸 y 𝐹 espacios vectoriales de dimensión finita. Para toda transformación lineal 𝑇:𝐸 → 𝐹 se cumple: dim𝐸 = dim𝑁(𝑇) + dim𝐼𝑚(𝑇). Demostración El teorema se puede expresar de la siguiente manera si {𝑣1, 𝑣2, ⋯ , 𝑣𝑞} una base de 𝑁(𝑇) y {𝑇(𝑎1), 𝑇(𝑎2),⋯ , 𝑇(𝑎𝑝)} es una base de 𝐼𝑚(𝑇). Probaremos que ℬ = {𝑣1, 𝑣2, ⋯ , 𝑣𝑞 , 𝑎1, 𝑎2,⋯ , 𝑎𝑝} es una base de 𝐸 (esto probará la igualdad dim𝐸 = dim𝑁(𝑇) + dim𝐼𝑚(𝑇)). a) ℬ es linealmente independiente. 28 𝐸 𝐹 Supongamos que: 𝛼1 ⋅ 𝑣1 + ⋯ + 𝛼𝑞 ⋅ 𝑣𝑞 + 𝛽1 ⋅ 𝑎1 + ⋯+ 𝛽𝑝 ⋅ 𝑎𝑝 = 0… (1) Aplicando 𝑇, en ambos miembros, resulta 𝑇(𝛼1 ⋅ 𝑣1 + ⋯+ 𝛼𝑞 ⋅ 𝑣𝑞 + 𝛽1 ⋅ 𝑎1 + ⋯+ 𝛽𝑝 ⋅ 𝑎𝑝) = 𝑇(0) = 0 𝛼1 ⋅ 𝑇(𝑣1) + ⋯+ 𝛼𝑞 ⋅ 𝑇(𝑣𝑞) + 𝛽1 ⋅ 𝑇(𝑎1) + ⋯+ 𝛽𝑝 ⋅ 𝑇(𝑎𝑝) = 0…(2) Como 𝑣1, 𝑣2, ⋯ , 𝑣𝑞 ∈ 𝑁(𝑇), entonces 𝑇(𝑣1) = ⋯ = 𝑇(𝑣𝑞) = 0. Reemplazando en (2), obtenemos 𝛽1 ⋅ 𝑇(𝑎1) + ⋯+ 𝛽𝑝 ⋅ 𝑇(𝑎𝑝) = 0 Como {𝑇(𝑎1), 𝑇(𝑎2),⋯ , 𝑇(𝑎𝑝)} es linealmente independiente en el conjunto 𝐼𝑚(𝑇), entonces 𝛽1 = ⋯ = 𝛽𝑝 = 0. Reemplazando los valores de 𝛽𝑖; 𝑖 = 1,⋯ , 𝑝, en la ecuación (1) se tiene 𝛼1 ⋅ 𝑣1 + ⋯+ 𝛼𝑞 ⋅ 𝑣𝑞 = 0 Como {𝑣1, 𝑣2,⋯ , 𝑣𝑞} es linealmente independiente en 𝑁(𝑇), entonces 𝛼1 = ⋯ = 𝛼𝑞 = 0. Por lo tanto, ℬ es linealmente independiente. b) ℬ es conjunto generador. Sea 𝑣 ∈ 𝐸 un vector arbitrario, se tiene 𝑇(𝑣) ∈ 𝐼𝑚(𝑇). Como {𝑇(𝑎1), 𝑇(𝑎2),⋯ , 𝑇(𝑎𝑝)} es una base de 𝐼𝑚(𝑇), entonces: 𝑇(𝑣) = 𝛽1 ⋅ 𝑇(𝑎1) + ⋯+ 𝛽𝑝 ⋅ 𝑇(𝑎𝑝) por la linealidad 𝑇 resulta 𝑇(𝑣) = 𝑇(𝛽1 ⋅ 𝑎1 + ⋯ + 𝛽𝑝 ⋅ 𝑎𝑝) es decir, 𝑇(𝑣) − 𝑇(𝛽1 ⋅ 𝑎1 + ⋯+ 𝛽𝑝 ⋅ 𝑎𝑝) = 0 𝑇(𝑣 − (𝛽1 ⋅ 𝑎1 + ⋯ + 𝛽𝑝 ⋅ 𝑎𝑝)) = 0. Por la definición de núcleo, se tiene 𝑣 − (𝛽1 ⋅ 𝑎1 + ⋯+ 𝛽𝑝 ⋅ 𝑎𝑝) ∈ 𝑁(𝑇). Como {𝑣1, 𝑣2,⋯ , 𝑣𝑞} es una base de 𝑁(𝑇), entonces 𝑣 − (𝛽1 ⋅ 𝑎1 + ⋯ + 𝛽𝑝 ⋅ 𝑎𝑝) = 𝛼1 ⋅ 𝑣1 + ⋯+ 𝛼𝑞 ⋅ 𝑣𝑞. De allí 𝑣 = 𝛼1 ⋅ 𝑣1 + ⋯+ 𝛼𝑞 ⋅ 𝑣𝑞 + 𝛽1 ⋅ 𝑎1 + ⋯+ 𝛽𝑝 ⋅ 𝑎𝑝, para todo vector 𝑣 ∈ 𝐸. Por lo tanto, ℬ es conjunto generador. El autor Lima E. expone una demostración similar en [18], pág.68 – 69. {𝑣1, 𝑣2, ⋯ , 𝑣𝑞} {𝑇(𝑎1), 𝑇(𝑎2),⋯ , 𝑇(𝑎𝑝)} 𝑇 𝑁(𝑇) 𝐼𝑚(𝑇) {0} 29 𝐸 𝐹 = 𝑇(𝐸) Teorema 4.3.8 Sean 𝐸 y 𝐹 espacios vectoriales tales que dim𝐸 = dim𝐹. Una transformación lineal 𝑇:𝐸 → 𝐹 es inyectiva si y solamente si es sobreyectiva y por tanto es un isomorfismo. Demostración (⇒) Supongamos que 𝑇: 𝐸 → 𝐹 es inyectiva; entonces 𝑁(𝑇) = {0}; de aquí tenemos que dim𝑁(𝑇) = 0. Por el Teorema de la Dimensión, obtenemos que dim𝐸 = dim𝑁(𝑇) + dim𝐼𝑚(𝑇); en consecuencia dim𝐸 = dim𝐼𝑚(𝑇) y de esto sigue que dim𝐼𝑚(𝑇) = dim𝐸 = dim𝐹; entonces dim𝐼𝑚(𝑇) = dim𝐹 e 𝐼𝑚(𝑇) ⊂ 𝐹. Por lo tanto, 𝑇 es sobreyectiva. (⇐) Supongamos que 𝑇 sea sobreyectiva; entonces 𝐼𝑚(𝑇) = 𝐹; de aquí obtenemos que dim𝐼𝑚(𝑇) = dim(𝐹). Por el Teorema de la Dimensión, tenemos que dim𝐸 = dim𝑁(𝑇) + dim𝐼𝑚(𝑇); esto implica que dim𝐸 = dim𝑁(𝑇) + dim𝐹; luego, como dim𝐸 = dim𝐹, se concluye que dim𝑁(𝑇) = 0 y en consecuencia 𝑁(𝑇) = {0}. Por lo tanto, 𝑇 es inyectiva. Podemos ver una demostración similar expuesta por el autor Lima E. en [18], pág.69. 𝑇 𝑇−1(𝑏) = 𝑎 𝑇(𝑎) = 𝑏 30 4.4 Matriz Asociada a una Transformación Lineal. Sea 𝑇: 𝐸 → 𝐹 una transformación lineal donde dim𝐸 = 𝑚 y dim𝐹 = 𝑛. Supongamos que ℬ = {𝑢1, 𝑢2,⋯ , 𝑢𝑚} y ℬ′ = {𝑣1, 𝑣2,⋯ , 𝑣𝑛} son bases para 𝐸 y 𝐹 respectivamente. Para cada 𝑖 = 1,⋯ , 𝑚, el vector 𝑇(𝑢𝑖) ∈ 𝐹, se puede escribir como combinación lineal de la base ℬ′ = {𝑣1, 𝑣2, ⋯ , 𝑣𝑛} de 𝐹; es decir, 𝑇(𝑢1) = 𝛼11 ⋅ 𝑣1 + ⋯+ 𝛼1𝑛 ⋅ 𝑣𝑛 ⋮ ⋮ ⋮ 𝑇(𝑢𝑚) = 𝛼𝑚1 ⋅ 𝑣1 + ⋯+ 𝛼𝑚𝑛 ⋅ 𝑣𝑛 . Entonces podemos escribir, [ 𝑇(𝑢1) ⋮ 𝑇(𝑢𝑚) ] = [ 𝛼11 ⋅ 𝑣1 + ⋯ +𝛼1𝑛 ⋅ 𝑣𝑛 ⋮ ⋮ ⋮ 𝛼𝑚1 ⋅ 𝑣1 + ⋯ +𝛼𝑚𝑛 ⋅ 𝑣𝑛 ] = [ 𝛼11 ⋯ 𝛼1𝑛 ⋮ ⋮ ⋮ 𝛼𝑚1 ⋯ 𝛼𝑚𝑛 ] ⋅ [ 𝑣1 ⋮ 𝑣𝑛 ] Luego se obtiene una matriz [𝑇]ℬ ℬ′ = [ 𝛼11 ⋯ 𝛼1𝑛 ⋮ ⋮ ⋮ 𝛼𝑚1 ⋯ 𝛼𝑚𝑛 ] 𝑡 = [ 𝛼11 ⋯ 𝛼𝑚1 ⋮ ⋮ ⋮ 𝛼1𝑛 ⋯ 𝛼𝑚𝑛 ] = [𝛼𝑖𝑗] Por lo tanto, la transformación lineal 𝑇:𝐸 → 𝐹, junto con las bases ℬ ⊂ 𝐸 y ℬ′ ⊂ 𝐹, determinan una matriz [𝑇]ℬ ℬ′ = [𝛼𝑖𝑗]; se prueba que esta matriz es única. Definición 4.4.1 La matriz [𝑇]ℬ ℬ′ se llama matriz asociada a la transformación lineal 𝑇 respecto a las bases ℬ de 𝐸 y ℬ′ de 𝐹. Podemos encontrar una definición similar en [24], pág.301 – 302. Ejemplo: Determinar la matriz asociada a la transformación lineal 𝑇: ℝ2 → ℝ2 definida por 𝑇(𝑥, 𝑦) = (𝑥1 − 2𝑥2, 4𝑥1 + 𝑥2); respecto de las bases canónicas en ambos espacios vectoriales. Sabiendo que la base canónica de ℝ2 es ℬ = {(1,0), (0,1)}. Entonces podemos escribir, [ 𝑇(1,0) 𝑇(0,1) ] = [ 1(1,0) + 4(0,1) −2(1,0) + 1(0,1) ] = [ 1 4 −2 1 ] ⋅ [ (1,0) (0,1) ] Luego obtiene una matriz [𝑇]ℬ ℬ = [ 1 4 −2 1 ] 𝑡 = [ 1 −2 4 1 ] = [𝛼𝑖𝑗]; esta es la matriz asociada a la transformación lineal 𝑇 respecto a las bases canónicas de ℝ2. 31 Capítulo 5 Espacio Euclidiano El concepto de espacio vectorial surgió como una generalización del espacio de los vectores geométricos; la abstracción, que entonces se efectuó, solo tomó como punto de partida las propiedades de dichos vectores geométricos que provenían de la suma de vectores y producto de un vector por un escalar, dando de esta forma una axiomática para el concepto abstracto de espacio vectorial. Se trata ahora de introducir, en un espacio vectorial, dos nuevas estructuras norma y producto interno que permitan hablar de ángulos y distancias en estas estructuras. 5.1 El Espacio Vectorial ℝ𝐧. Definición 5.1.1 El conjunto ℝ𝑛 es definido como la colección de todas las 𝑛 – uplas 𝑥 = (𝑥1, 𝑥2, ⋯ , 𝑥𝑛) de números reales, donde 𝑛 ∈ ℕ; es decir: ℝ𝑛 = {𝑥 = (𝑥1, 𝑥2,⋯ , 𝑥𝑛): 𝑥𝑖 ∈ ℝ, 1 ≤ 𝑖 ≤ 𝑛}. Una definición similar es enunciada por Lima E. en [22], pág.1. Definición 5.1.2 Sean 𝑥 = (𝑥1, 𝑥2, ⋯ , 𝑥𝑛), 𝑦 = (𝑦1, 𝑦2, ⋯ , 𝑦𝑛) elementos de ℝ𝑛. Decimos que 𝑥 = 𝑦 si y solo si 𝑥𝑖 = 𝑦𝑖, para todo 𝑖 = 1,2,⋯ , 𝑛. Podemos encontrar una definición similar en [22], pág.1. Definición 5.1.3 Sean 𝑥 = (𝑥1, 𝑥2, ⋯ , 𝑥𝑛), 𝑦 = (𝑦1, 𝑦2, ⋯ , 𝑦𝑛) ∈ ℝ𝑛 y 𝛼 ∈ ℝ. Definimos la suma de los vectores 𝑥 e 𝑦, denotada por 𝑥 + 𝑦, y el producto de un vector 𝑥 por el escalar 𝛼, denotada por 𝛼 ⋅ 𝑥, como; 𝑥 + 𝑦 = (𝑥1 + 𝑦1, 𝑥2 + 𝑦2, ⋯ , 𝑥𝑛 + 𝑦𝑛) 𝛼 ⋅ 𝑥 = (𝛼 ⋅ 𝑥1, 𝛼 ⋅ 𝑥2,⋯ , 𝛼 ⋅ 𝑥𝑛), respectivamente. La suma de vectores determina una operación interna llamada adición de vectores y el producto de un vector por un escalar una operación externa llamada multiplicación de un vector por un escalar. El autor brasileño Lima E. enuncia esta definición en [22], pág.1. 32 Teorema 5.1.4 El conjunto ℝ𝑛 con las operaciones adición de vectores y multiplicación de un vector por un escalar, es un ℝ – espacio vectorial de dimensión 𝑛. En el libro de Lima E. (véase [22], pág.1) se encuentra este teorema. Observaciones: 1. El vector cero será denotado por 𝜃 = (0,0,⋯ ,0); 2. El opuesto aditivo del vector 𝑥 será denotado por −𝑥; −𝑥 = (−𝑥1, −𝑥2, ⋯ ,−𝑥𝑛); 3. Los vectores canónicos 𝑒1, 𝑒2,…, 𝑒𝑛 ∈ ℝ𝑛, definidos por 𝑒1 = (1,0,⋯ ,0), 𝑒2 = (0,1,⋯ ,0),…, 𝑒𝑛 = (0,0,⋯ ,1) forman una base en ℝ𝑛, la cual es llamada base canónica de ℝ𝑛. Varios conceptos geométricos que aparecen en el plano y el espacio (tales como ángulo, proyección, perpendicularidad, etc.), pueden ser generalizados a dimensiones mayores. El concepto de norma es fundamental para el espacio vectorial ℝ𝑛. 5.2 Norma, Producto Interno y Distancia en ℝ𝒏. Definición 5.2.1 La función ‖⋅‖:ℝ𝑛 → ℝ definida por ‖𝑥‖ = √∑𝑥𝑖 ⋅ 𝑥𝑖 𝑛 𝑖=1 = √∑𝑥𝑖 2 𝑛 𝑖=1 se llama norma euclidiana en ℝ𝑛. El número ‖𝑥‖ se llama la norma del vector 𝑥. Podemos ver esta definición expuesta por el autor Lima E. en [22], pág.4. Proposición 5.2.2 Para todo 𝑥,𝑦 ∈ ℝ𝑛 y para todo 𝛼 ∈ ℝ, se cumplen las siguientes propiedades: 1) ‖𝑥‖ ≥ 0; 2) ‖𝑥‖ = 0 si y solamente si 𝑥 = 𝜃; 3) ‖𝑥 + 𝑦‖ ≤ ‖𝑥‖ + ‖𝑦‖ (Desigualdad Triangular); 4) ‖𝛼 ⋅ 𝑥‖ = |𝛼| ⋅ ‖𝑥‖. La proposición 5.2.2 nos dice que el par (ℝ𝑛 , ‖⋅‖) es un espacio normado. El autor Lima E. presenta la prueba de esta proposición en [22], pág.5. 33 Ejemplo: Sobre el espacio vectorial ℒ(ℝ𝑚 , ℝ𝑛) definamos la función ‖⋅‖: ℒ(ℝ𝑚 , ℝ𝑛) → ℝ mediante ‖𝑇‖ = sup { ‖𝑇(𝑥)‖ ‖𝑥‖ : 𝑥 ∈ ℝ𝑚 , 𝑥 ≠ 𝜃}. Entonces: 1) Claramente ‖⋅‖ es una norma. 2) Para todo 𝑥 ∈ ℝ𝑚, se verifica la desigualdad ‖𝑇(𝑥)‖ ≤ ‖𝑇‖‖𝑥‖. Para todo 𝑥 ∈ ℝ𝑚 no nulo, de la definición se tiene; ‖𝑇(𝑥)‖ ‖𝑥‖ ≤ ‖𝑇‖; entonces ‖𝑇(𝑥)‖ ≤ ‖𝑇‖‖𝑥‖… (∗) Si 𝑥 = 𝜃, también se cumple (∗). Por lo tanto, para todo 𝑥 ∈ ℝ𝑚; ‖𝑇(𝑥)‖ ≤ ‖𝑇‖‖𝑥‖. Producto Interno en ℝ𝒏. Definición 5.2.3 Sean 𝑥 = (𝑥1, 𝑥2, ⋯ , 𝑥𝑛), 𝑦 = (𝑦1, 𝑦2, ⋯ , 𝑦𝑛) ∈ ℝ𝑛. El producto interno de 𝑥 e 𝑦, denotado por 〈𝑥, 𝑦〉, es el número real definido como: 〈𝑥, 𝑦〉 = ∑ 𝑥𝑖 𝑛 𝑖=1 ⋅ 𝑦𝑖 . El autor brasileño Lima E. enuncia esta definición en [22], pág.3. Obsérvese de inmediato que ‖𝑥‖ = √〈𝑥, 𝑥〉. Proposición 5.2.4 Para todo 𝑥,𝑦,𝑧 ∈ ℝ𝑛 y para todo 𝛼 ∈ ℝ, se cumplen las siguientes propiedades: 1) 〈𝑥, 𝑥〉 ≥ 0; 2) 〈𝑥, 𝑥〉 = 0 si y solamente si 𝑥 = 𝜃; 3) 〈𝑥, 𝑦〉 = 〈𝑦, 𝑥〉; 4) 〈𝑥, 𝑦 + 𝑧〉 = 〈𝑥, 𝑦〉 + 〈𝑥, 𝑧〉; 5) 〈𝛼 ⋅ 𝑥, 𝑦〉 = 𝛼 ⋅ 〈𝑥, 𝑦〉. Podemos encontrar la prueba de la proposición en [22], pág.3. Proposición 5.2.5 (Desigualdad de Cauchy – Schwartz) Para cualquiera 𝑥,𝑦 ∈ ℝ𝑛; entonces |〈𝑥, 𝑦〉| ≤ ‖𝑥‖ ⋅ ‖𝑦‖. El autor Lima E. expone la prueba de esta proposición en [22], pág.4. Definición 5.2.6 El ángulo 𝜆 entre dos vectores no nulos 𝑥 e 𝑦 es definido por cos 𝜆 = 〈𝑥,𝑦〉 ‖𝑥‖⋅‖𝑦‖ . Los autores Hasser N., LaSalle J. y Sullivan J. enuncian una definición similar en [14], pág.57. 34 𝑥 𝑦 Definición 5.2.7 Sean 𝑥,𝑦 ∈ ℝ𝑛; se dice que 𝑥 es ortogonal a 𝑦 si y solo si 〈𝑥, 𝑦〉 = 0. Se escribe 𝑥 ⊥ 𝑦 para indicar que 𝑥 es ortogonal a 𝑦. Podemos ver esta definición enunciada por el autor Lima E. en [22], pág.4. Observaciones: 1. Los vectores canónicos son ortogonales entre sí. 2. Cualquier vector de ℝ𝑛 es ortogonal a 𝜃, es decir; 〈𝑥, 𝜃〉 = ∑𝑥𝑖 ⋅ 0 = 0 𝑛 𝑖=1 . Distancia en ℝ𝒏. Definición 5.2.8 La función 𝑑: ℝ𝑛 × ℝ𝑛 → ℝ definida por 𝑑(𝑥, 𝑦) = ‖𝑥 − 𝑦‖ se llama distancia en ℝ𝑛. El número 𝑑(𝑥, 𝑦) se llama distancia de 𝑥 a 𝑦. El autor Lima E. enuncia esta definición en [22], pág.7. 𝑓𝑖𝑔. 1 Distancia de 𝑥 a 𝑦. Observación: Para todo 𝑥 ∈ ℝ𝑛, 𝑑(𝑥, 𝜃) = ‖𝑥 − 𝜃‖ = ‖𝑥‖. Proposición 5.2.9 Para todo 𝑥,𝑦,𝑧 ∈ ℝ𝑛, se cumplen las siguientes propiedades: 1) 𝑑(𝑥, 𝑦) ≥ 0; 2) 𝑑(𝑥, 𝑦) = 0 si y solo si 𝑥 = 𝑦; 3) 𝑑(𝑥, 𝑦) = 𝑑(𝑦, 𝑥); 4) 𝑑(𝑥, 𝑧) ≤ 𝑑(𝑥, 𝑦) + 𝑑(𝑦, 𝑧). La proposición 5.2.9 nos dice que el par (ℝ𝑛 , 𝑑) es un espacio métrico. En el libro de Lima E. expone una prueba de la proposición en [22], pág.7. 𝑑(𝑥, 𝑦) 35 5.3 Elementos de Topología en ℝ𝐧. Bolas en ℝ𝒏. Definición 5.3.1 Sea 𝑐 ∈ ℝ𝑛 y 𝑟 > 0. i. La bola abierta de centro 𝑐 y radio 𝑟, es el conjunto definido por: 𝐵(𝑐, 𝑟) = {𝑥 ∈ ℝ𝑛: ‖𝑥 − 𝑐‖ < 𝑟}; Nótese que: 𝑥 ∈ 𝐵(𝑐, 𝑟) ⇔ ‖𝑥 − 𝑐‖ < 𝑟. ii. La bola cerrada de centro 𝑐 y radio 𝑟, es el conjunto definido por: �̅�(𝑐, 𝑟) = {𝑥 ∈ ℝ𝑛: ‖𝑥 − 𝑐‖ ≤ 𝑟}; Obsérvese que: 𝑥 ∈ �̅�(𝑐, 𝑟) ⇔ ‖𝑥 − 𝑐‖ ≤ 𝑟. iii. La esfera de centro 𝑐 y radio 𝑟, es el conjunto definido por: 𝑆(𝑐, 𝑟) = {𝑥 ∈ ℝ𝑛: ‖𝑥 − 𝑐‖ = 𝑟}; Nótese que: 𝑥 ∈ 𝑆(𝑐, 𝑟) ⇔ ‖𝑥 − 𝑐‖ = 𝑟. El autor Lima E. expone estas definiciones en [22], pág.10 – 11. Observación: Para todo 𝑐 ∈ ℝ𝑛 y 𝑟 > 0; �̅�(𝑐, 𝑟) = 𝐵(𝑐, 𝑟) ∪ 𝑆(𝑐, 𝑟). Conjunto Acotado. Definición 5.3.2 Sea 𝑋 ⊂ ℝ𝑛 , se dice que 𝑋 es un conjunto acotado si y solo si existe una constante real positiva 𝑘 tal que ‖𝑥‖ ≤ 𝑘, para todo 𝑥 ∈ 𝑋. Simbólicamente: 𝑋 es acotado ⇔ existe 𝑘 > 0 tal que ‖𝑥‖ ≤ 𝑘, para todo 𝑥 ∈ 𝑋; ⇔ existe 𝑘 > 0 tal que 𝑥 ∈ �̅�(𝜃, 𝑘), para todo 𝑥 ∈ 𝑋. El autor Lima E. enuncia esta definición en [22], pág.39. Interior de un Conjunto y Conjunto Abierto. Definición 5.3.3 Sea 𝑋 ⊂ ℝ𝑛 y 𝑐 ∈ ℝ𝑛. i. El punto 𝑐 es interior de 𝑋 si y solo si existe 𝜀 > 0 tal que 𝐵(𝑐, 𝜀) ⊂ 𝑋; ii. El conjunto 𝑖𝑛𝑡(𝑋) = {𝑐 ∈ ℝ𝑛: 𝑐 es punto interior de 𝑋} se llama conjunto interior de 𝑋; iii. El conjunto 𝑋 es un conjunto abierto si y solo si 𝑖𝑛𝑡(𝑋) = 𝑋. El autor Lima E. expone estas definiciones en [22], pág.34. Observación: Para todo 𝑋 ⊂ ℝ𝑛, 𝑖𝑛𝑡(𝑋) ⊂ 𝑋. Efectivamente, sea 𝑐 ∈ 𝑖𝑛𝑡(𝑋); entonces 𝑐 es punto interior de 𝑋, es decir; existe 𝜀 > 0 tal que 𝐵(𝑐, 𝜀) ⊂ 𝑋. Entonces 𝑐 ∈ 𝐵(𝑐, 𝜀) ⊂ 𝑋. Por lo tanto 𝑐 ∈ 𝑋. Proposición 5.3.4 Sean 𝑋,𝑌 ⊂ ℝ𝑛; entonces: 1) Si 𝑋 ⊂ 𝑌, entonces 𝑖𝑛𝑡𝑋 ⊂ 𝑖𝑛𝑡𝑌; 2) El conjunto 𝑖𝑛𝑡𝑋 es un conjunto abierto. 36 El autor Lima E. expone una prueba en [22], pág.35. Proposición 5.3.5 Para 𝑐 ∈ ℝ𝑛 y 𝑟 > 0; 𝐵(𝑐, 𝑟) y ℝ𝑛 − �̅�(𝑐, 𝑟) son conjuntos abiertos. El autor Lima E. presenta una prueba en [22], pág.34 – 35. Teorema 5.3.6 1) El conjunto vacío y ℝ𝑛 son conjuntos abiertos. 2) La intersección de una familia finita de conjuntos abiertos es un conjunto abierto. 3) Sea {𝐴𝜆}𝜆∈𝐴 una colección arbitraria de conjuntos abiertos; entonces ⋃ 𝐴𝜆𝜆∈𝐴 es un conjunto abierto. Podemos encontrar una demostración del teorema en [22], pág.36. Conjunto Cerrado. Definición 5.3.7 Sea 𝑋 ⊂ ℝ𝑛 , se dice que 𝑋 es un conjunto cerrado si y solamente si el complemento de 𝑋 es un conjunto abierto. Simbólicamente: 𝑋 es cerrado ⇔ ℝ − 𝑋 es abierto. El autor Del Castillo F. enuncia una definición similar en [9], pág.17. Teorema 5.3.8 1) El conjunto vacío y ℝ𝑛 son conjuntos cerrados. 2) La unión de una familia finita de conjuntos cerrados es un conjunto cerrado. 3) Sea {𝐴𝜆}𝜆∈𝐴 una colección arbitraria de conjuntos cerrados; entonces ⋂ 𝐴𝜆𝜆∈𝐴 es un conjunto cerrado. El autor Del Castillo F. expone una demostración en [9], pág.18. Conjunto Compacto. Definición 5.3.9 Sea 𝐾 ⊂ ℝ𝑛, se dice que 𝐾 es un conjunto compacto si y solo si 𝐾 es cerrado y acotado. El autor Del Castillo F. enuncia una definición similar en [9], pág.123. Ejemplo: La bola cerrada �̅�(𝑐, 𝑟) y cualquier conjunto finito son conjuntos compactos en ℝ𝑛. 37 Teorema 5.3.10 La intersección de una familia finita de conjuntos compactos es un conjunto compacto. Demostración La intersección de una familia finita de conjuntos cerrados es un conjunto cerrado, en virtud del Teorema 5.3.8 (parte 3). Faltaría probar que la intersección finita de conjuntos acotados es un conjunto acotado; sea 𝑥 ∈ ⋂ 𝐴𝑖 𝑛 𝑖=1 , entonces para todo 𝑖 = 1,⋯ , 𝑛; 𝑥 ∈ 𝐴𝑖, como los conjuntos 𝐴𝑖 son acotados, entonces que existen constantes 𝑘𝑖 > 0 tal que ‖𝑥‖ ≤ 𝑘𝑖, para todo 𝑖 = 1,⋯ , 𝑛. Tomando 𝑘 = min {𝑘𝑖; 𝑖 = 1,⋯ , 𝑛} > 0, entonces existe 𝑘 > 0 tal que ‖𝑥‖ ≤ 𝑘, para todo 𝑥 ∈ 𝐴𝑖. Por lo tanto, ⋂ 𝐴𝑖 𝑛 𝑖=1 es acotado. Esto completa la demostración del teorema. 5.4 Sucesión y Límite en ℝ𝐧. Definición 5.4.1 Una sucesión en ℝ𝑛 es una función 𝑥:ℕ → ℝ𝑛 que a cada número natural 𝑝 se le asocia el vector 𝑥(𝑝) = 𝑥𝑝 ∈ ℝ𝑛 llamado 𝑝 – término de la sucesión. Podemos encontrar una definición similar en [22], pág.13. Definición 5.4.2 Sea (𝑥𝑝) ⊂ ℝ𝑛 se dice que 𝑐 ∈ ℝ𝑛 es límite de la sucesión 𝑥𝑝 cuando 𝑝 tiende al infinito si y solo si para todo 𝜀 > 0, existe 𝑝0 ∈ ℕ tal que si 𝑝 ∈ ℕ, con 𝑝 ≥ 𝑝0, entonces ‖𝑥𝑝 − 𝑐‖ < 𝜀. Simbólicamente, lím 𝑝→∞ 𝑥𝑝 = 𝑐 ⇔ para todo 𝜀 > 0, existe 𝑝0 ∈ ℕ tal que si 𝑝 ∈ ℕ con 𝑝 ≥ 𝑝0, entonces ‖𝑥𝑝 − 𝑐‖ < 𝜀. Nota: Sea (𝑥𝑝) ⊂ ℝ𝑛 se dice que 𝑥𝑝 es una sucesión convergente si y solamente si existe 𝑐 ∈ ℝ𝑛 tal que lím 𝑝→∞ 𝑥𝑝 = 𝑐. El autor Del Castillo F. presenta una definición similar en [9], pág.25. Definición 5.4.3 Sea (𝑥𝑝) una sucesión en ℝ𝑛. Se dice que (𝑥𝑝) es una sucesión de Cauchy, si para todo 𝜀 > 0, existe 𝑝0 ∈ ℕ tal que si 𝑝,𝑞 ∈ ℕ, con 𝑝,𝑞 ≥ 𝑝0, entonces ‖𝑥𝑝 − 𝑥𝑞‖ < 𝜀. Simbólicamente, (𝑥𝑝) es de Cauchy ⇔ para todo 𝜀 > 0, existe 𝑝0 ∈ ℕ tal que si 𝑝, 𝑞 ∈ ℕ, con 𝑝,𝑞 ≥ 𝑝0, entonces ‖𝑥𝑝 − 𝑥𝑞‖ < 𝜀. Podemos encontrar una definición similar en [9], pág.25. 38 𝑎 Definición 5.4.4 Sea (𝑥𝑝) ⊂ ℝ𝑛 y 𝑘:ℕ → ℕ una función creciente. La composición 𝑥 ∘ 𝑘: ℕ → ℝ𝑛 que a cada número natural 𝑝 le asocia el punto (𝑥 ∘ 𝑘)𝑝 = 𝑥𝑘𝑝 es llamada subsucesión de (𝑥𝑝) ⊂ ℝ𝑛. Notación: (𝑥𝑘𝑝) ⊂ (𝑥𝑝) significara “(𝑥𝑘𝑝) es una subsucesión de (𝑥𝑝)”. El autor Lima E. enuncia una definición similar en [9], pág.25. Nota: (ℝ𝑛 , ‖⋅‖) es un espacio completo. Si TODA sucesión de Cauchy es converge. Definición 5.4.5 Sea 𝑋 ⊂ ℝ𝑛 . Decimos que 𝑎 ∈ ℝ𝑛 es un punto de acumulación de 𝑋 cuando toda bola 𝐵 de centro 𝑎 contiene algún punto de 𝑋 diferente de 𝑎. Es decir, el punto 𝑎 es un punto de acumulación de 𝑋 si y solo si para todo 𝜀 > 0, 𝐵(𝑎, 𝜀) ∩ (𝑋 − {𝑎}) ≠ ∅. Podemos encontrar esta definición en [9], pág.14. 𝑓𝑖𝑔. 2 El punto 𝑎 es de acumulación de 𝑋. Definición 5.4.6 Sea 𝑓:𝑋 → ℝ𝑛 una función, donde 𝑋 ⊂ ℝ𝑚 y 𝑎 es punto de acumulación de 𝑋. Se dice que 𝐿 ∈ ℝ𝑛 es el límite de la función 𝑓 en 𝑎 si y solo si para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y 0 < ‖𝑥 − 𝑎‖ < 𝛿, entonces ‖𝑓(𝑥) − 𝐿‖ < 𝜀. En este caso se usa la notación lím 𝑥→𝑎 𝑓(𝑥) = 𝐿. Simbólicamente, lím 𝑥→𝑎 𝑓(𝑥) = 𝐿 ⇔ para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑋 y 0 < ‖𝑥 − 𝑎‖ < 𝛿, entonces ‖𝑓(𝑥) − 𝐿‖ < 𝜀. Esta definición es enunciada por Lima E. en [9], pág.33. 𝑋 39 Capítulo 6 Aplicaciones entre Espacios Euclidianos En este capítulo desarrollaremos los conceptos de continuidad y diferenciabilidad de las aplicaciones entre espacios euclidianos. Los conceptos de diferenciabilidad y de continuidad son de los que más han influido en el desarrollo de la matemática, pero fue en siglo XIX cuando el análisis le dio la firmeza y la claridad que goza en la actualidad. 6.1 Funciones Continuas. Definición 6.1.1 Sea 𝑓:𝑈 → ℝ𝑛 una aplicación definida en el conjunto 𝑈 ⊂ ℝ𝑚, tal que a cada punto 𝑥 ∈ 𝑋 le asocia su imagen 𝑓(𝑥) = (𝑓1(𝑥),⋯ , 𝑓𝑛(𝑥)). Las funciones reales 𝑓𝑖 : 𝑈 → ℝ, para cada 𝑖 = 1,⋯ , 𝑛, son llamadas funciones coordenadas de 𝑓. Se escribe entonces 𝑓 = (𝑓1, 𝑓2, ⋯ , 𝑓𝑛). El autor Lima E. enuncia esta definición en [20], pág.19. Definición 6.1.2 Sean 𝑓: ℝ𝑚 → ℝ𝑛 una función y 𝑎 ∈ Dom(𝑓); se dice que 𝑓 es continua en 𝑐 si y solo si para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑈 y ‖𝑥 − 𝑐‖ < 𝛿, entonces ‖𝑓(𝑥) − 𝑓(𝑐)‖ < 𝜀. Simbólicamente: 𝑓 es continua en 𝑐 ⇔ para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑈 y ‖𝑥 − 𝑐‖ < 𝛿, entonces ‖𝑓(𝑥) − 𝑓(𝑐)‖ < 𝜀. El autor Bartle R. enuncia esta definición en [4], pág.162. Teorema 6.1.3 Si 𝑓 es continua en 𝑐 y 𝑔 es continua en 𝑧 = 𝑓(𝑐), entonces la compuesta 𝑔 ∘ 𝑓 es continua en 𝑐. El autor Bartle R. expone una demostración para este teorema en [4], pág.168 – 169. Teorema 6.1.4 Sean 𝑈 ⊆ ℝ𝑚 , 𝑓:𝑈 → ℝ𝑛 y 𝑐 ∈ 𝑈. Son equivalentes: 1) 𝑓 es continua en 𝑐; 2) Para todo (𝑥𝑘) ⊂ 𝑈 tal que lím 𝑘→∞ 𝑥𝑘 = 𝑐, lím 𝑘→∞ 𝑓(𝑥𝑘) = 𝑓(𝑐). 40 El autor Lang S. presenta una demostración para este teorema en [17], pág.126 – 127. Teorema 6.1.5 (Teorema del Valor Máximo y Mínimo) Sea 𝐾 ⊆ Dom(𝑓) compacto en ℝ𝑚 y sea 𝑓 función continua de valor real; entonces existen puntos 𝑥∗,𝑥∗ en 𝐾 tales que 𝑓(𝑥∗) = sup{𝑓(𝑥): 𝑥 ∈ 𝐾} y 𝑓(𝑥∗) = inf{𝑓(𝑥): 𝑥 ∈ 𝐾}. El autor Bartle R. expone una demostración para este teorema en [4], pág.180 – 181. Corolario 6.1.6 Sea 𝑓: ℝ𝑚 → ℝ𝑛 una transformación lineal. Entonces 𝑓 es inyectiva si y solo si existe 𝑚 > 0 tal que ‖𝑓(𝑥)‖ ≥ 𝑚‖𝑥‖, para todo 𝑥 ∈ ℝ𝑚. El autor Bartle R. presenta una demostración para este teorema en [4], pág.181. 6.2 Aplicaciones Continuas. Definición 6.2.1 Diremos que 𝑓:𝑈 → ℝ𝑛 es una aplicación continua en el conjunto 𝑈 ⊂ ℝ𝑚 cuando 𝑓 es continua en todos los puntos 𝑐 ∈ 𝑈. Podemos encontrar esta definición en [20], pág.20. Teorema 6.2.2 Sea 𝐾 ⊂ ℝ𝑚 un conjunto compacto y 𝑓: 𝐾 → ℝ𝑛 una aplicación continua; entonces 𝑓(𝐾) es un conjunto compacto. Demostración Supongamos que (𝑦𝑘) ⊂ 𝑓(𝐾); entonces existe (𝑥𝑘) ⊂ 𝐾 tal que 𝑦𝑘 = 𝑓(𝑥𝑘), para todo 𝑘 ∈ ℕ pues (𝑦𝑘 ∈ 𝑓(𝐾), Como (𝑥𝑘) ⊂ 𝐾 y 𝐾 compacto, entonces existe (𝑥𝑗𝑘) ⊆ (𝑥𝑘) tal que lím 𝑘→∞ 𝑥𝑗𝑘 = 𝑥 ∈ 𝐾. Como 𝑓 es continua en 𝐾, entonces lím 𝑘→∞ 𝑓(𝑥𝑗𝑘) = 𝑓(𝑥) ∈ 𝑓(𝐾) y 𝑥 ∈ 𝐾 en virtud del Teorema 6.1.4. Haciendo 𝑦𝑗𝑘 = 𝑓(𝑥𝑗𝑘) e 𝑦 = 𝑓(𝑥), hallamos que existe una subsucesión (𝑦𝑗𝑘) ⊆ (𝑦𝑘) para la cual lím 𝑘→∞ 𝑦𝑗𝑘 = 𝑦 ∈ 𝑓(𝐾). Por lo tanto 𝑓(𝐾) es un conjunto compacto. Podemos encontrar una demostración similar en [17], pág.142. Definición 6.2.3 Una aplicación 𝑓:𝑈 → ℝ𝑛 dice uniformemente continua en el conjunto 𝑈 ⊆ ℝ𝑚 cuando para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥1,𝑥2 ∈ 𝑈 y ‖𝑥1 − 𝑥2‖ < 𝛿, entonces ‖𝑓(𝑥1) − 𝑓(𝑥2)‖ < 𝜀. El autor Lang S. enuncia una definición similar en [17], pág.142. 41 Teorema 6.2.4 Toda aplicación continua 𝑓:𝐾 → ℝ𝑛, definida en el conjunto compacto 𝐾 ⊂ ℝ𝑚 , es uniformemente continua. Demostración Supongamos que 𝑓 no es uniformemente continua, es decir existe 𝜀 > 0 tal que para todo 𝛿 > 0, existen 𝑥𝛿,𝑥′𝛿 ∈ 𝐾 con ‖𝑥𝛿 − 𝑥′𝛿‖ < 𝛿 y ‖𝑓(𝑥𝛿) − 𝑓(𝑥′𝛿)‖ ≥ 𝜀. Tomando 𝛿 = 1 𝑘 , 𝑘 ∈ ℕ; (denotando 𝑥𝛿 = 𝑥1 𝑛 = 𝑥𝑛 y 𝑥′𝛿 = 𝑥′1 𝑛 = 𝑥′𝑛), existen 𝑥𝑘,𝑥′𝑘 ⊂ 𝐾 con ‖𝑥𝑘 − 𝑥′𝑘‖ < 1 𝑘 (∗) y ‖𝑓(𝑥𝑘) − 𝑓(𝑥′𝑘)‖ ≥ 𝜀, para todo 𝑘 ∈ ℕ. Como 𝐾 es compacto, existen (𝑥𝑗𝑘) ⊂ (𝑥𝑘) y (𝑥′𝑗𝑘) ⊂ (𝑥′𝑘) tales que lím 𝑘→∞ 𝑥𝑗𝑘 = 𝑥 ∈ 𝐾 y lím 𝑘→∞ 𝑥′𝑗𝑘 = 𝑥′ ∈ 𝐾. Luego ‖𝑥 − 𝑥′‖ = ‖ lím 𝑘→∞ 𝑥𝑗𝑘 − lim 𝑘→∞ 𝑥′𝑗𝑘‖ = ‖ lím 𝑘→∞ 𝑥𝑗𝑘 −𝑥′𝑗𝑘‖ = 0, (por (∗)). Si ‖𝑥 − 𝑥′‖ = 0, entonces 𝑥 = 𝑥′. Como 𝑓 es continua, se tiene lím 𝑘→∞ 𝑓(𝑥𝑗𝑘) = 𝑓(𝑥) y lím 𝑘→∞ 𝑓(𝑥′𝑗𝑘) = 𝑓(𝑥′) = 𝑓(𝑥), pues [𝑥 = 𝑥′] (∗∗) Luego 𝜀 ≤ lím 𝑘→∞ ‖𝑓(𝑥𝛿) − 𝑓(𝑥′ 𝛿)‖ = ‖ lím 𝑘→∞ 𝑓(𝑥𝑗𝑘) − lím 𝑘→∞ 𝑓(𝑥′ 𝑗𝑘)‖ = 0, (por (∗∗)). Entonces 𝜀 ≤ 0, lo cual es una contracción, pues 𝜀 > 0. Esto demuestra la validez del teorema. El autor Lang S. expone una demostración en [17], pág.142 – 143. Definición 6.2.5 Un homeomorfismo en el conjunto 𝑈 ⊂ ℝ𝑚 sobre el conjunto 𝑉 ⊂ ℝ𝑛 es una biyección continua 𝑓: 𝑈 → 𝑉 cuya inversa 𝑓−1: 𝑉 → 𝑈 también es continua. El autor brasileño Lima E. enuncia esta definición en [20], pág.26. Teorema 6.2.6 Sea 𝐾 ⊂ ℝ𝑛 compacto; entonces toda aplicación continua inyectiva 𝑓:𝐾 → ℝ𝑛 es un homeomorfismo sobre su imagen 𝐿 = 𝑓(𝐾) (compacto). Podemos ubicar una demostración para el teorema en [20], pág.27. 6.3 Funciones y Aplicaciones Diferenciables. Definición 6.3.1 Sea 𝑓: 𝑈 → ℝ𝑛 una función definida en el abierto 𝑈 ⊂ ℝ𝑚 , sea 𝑐 ∈ 𝑈 y sea 𝑥 ∈ ℝ𝑚 cualquiera. Se dice que un vector 𝜕𝑓(𝑐) 𝜕𝑥 ∈ ℝ𝑛 es la derivada parcial de 𝑓 en 𝑐 con respecto a 𝑥 si para todo 𝜀 > 0, existe 𝛿 > 0 tal que para todo 𝑡 ∈ ℝ y 0 < |𝑡| < 𝛿 se verifica la desigualdad ‖ (𝑓(𝑐+𝑡𝑥)−𝑓(𝑐)) 𝑡 − 𝜕𝑓(𝑐) 𝜕𝑥 ‖ ≤ 𝜀. 42 Observaciones: 1. La derivada parcial 𝜕𝑓(𝑐) 𝜕𝑥 esta determinada de manera única cuando existe. 2. Se define 𝜕𝑓(𝑐) 𝜕𝑥 como el límite lím 𝑡→0 𝑓(𝑐+𝑡𝑢)−𝑓(𝑐) 𝑡 , o como la derivada en 𝑡 = 0 de la función 𝐹 definida por 𝐹(𝑡) = 𝑓(𝑐 + 𝑡𝑢), para |𝑡| suficientemente pequeña y con valores en ℝ𝑛. El autor Bartle R. enuncia esta definición en [4], pág.381. Definición 6.3.2 Sea 𝑈 ⊂ ℝ𝑚 un conjunto abierto. Diremos que una aplicación 𝑓: 𝑈 → ℝ𝑛 es diferenciable en 𝑐 ∈ 𝑈 si y solamente si existe una transformación lineal 𝑇: ℝ𝑚 → ℝ𝑛 tal que para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ ℝ𝑚 y ‖𝑥 − 𝑐‖ ≤ 𝛿, entonces 𝑥 ∈ 𝑈 y ‖𝑓(𝑥) − 𝑓(𝑐) − 𝑇(𝑥 − 𝑐)‖ ≤ 𝜀‖𝑥 − 𝑐‖. Se puede reformular de la siguiente manera: Para todo 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑢 ∈ ℝ𝑚 y ‖𝑢‖ ≤ 𝛿, entonces ‖𝑓(𝑐 + 𝑢) − 𝑓(𝑐) − 𝑇(𝑢)‖ ≤ 𝜀‖𝑢‖, que, además, se puede escribir como lím ‖𝑢‖→0 ‖𝑓(𝑐+𝑢)−𝑓(𝑐)−𝑇(𝑢)‖ ‖𝑢‖ = 0. Podemos encontrar esta definición en [4], pág.382. Observaciones: 1. La aplicación lineal 𝑇 se llama derivada de 𝑓 en 𝑐 y se denota por 𝑓′(𝑐). 2. Una función 𝑓: 𝑈 ⊂ ℝ𝑚 → ℝ𝑛 se dice diferenciable sobre 𝑈, si es diferenciable en cada punto de 𝑈. 3. La función 𝑓′: 𝑈 → ℒ(ℝ𝑚 , ℝ𝑛), que a cada 𝑐 ∈ 𝑈 le hace corresponder una transformación lineal 𝑓′(𝑐):ℝ𝑚 → ℝ𝑛, se llama función derivada. Matriz Jacobiana. Definición 6.3.3 Sean 𝑓:𝑈 → ℝ𝑛 diferenciable en 𝑐 ∈ 𝑈 ⊂ ℝ𝑚 y 𝑒𝑗 el 𝑗 – ésimo vector de la base canónica de ℝ𝑚. Entonces 𝑓′(𝑐) ⋅ 𝑒𝑗 = lím 𝑡→0 𝑓(𝑐+𝑡𝑒𝑗)−𝑓(𝑐) 𝑡 ∈ ℝ𝑛. El límite anterior es usualmente llamado 𝑗 – ésima derivada parcial de 𝑓 en el punto 𝑐, y es indicado por 𝑓′(𝑐) ⋅ 𝑒𝑗 = 𝜕𝑓 𝜕𝑥𝑗 (𝑐). De la Definición 6.1.1, si 𝑓1,⋯ , 𝑓𝑛: 𝑈 → ℝ son las funciones coordenadas de 𝑓, entonces 𝜕𝑓 𝜕𝑥𝑗 (𝑐) = ( 𝜕𝑓𝑛 𝜕𝑥𝑗 (𝑐),⋯ , 𝜕𝑓𝑛 𝜕𝑥𝑗 (𝑐)). 43 Podemos expresar la matriz de la transformación lineal 𝑓′(𝑐):ℝ𝑚 → ℝ𝑛 asociada a las bases canónicas de ℝ𝑚 y ℝ𝑛, llamada matriz jacobiana de 𝑓 en el punto 𝑐, cuyo orden es 𝑛 × 𝑚. El elemento (𝑖, 𝑗) de esta matriz es la 𝑖 – ésima coordenada del vector 𝑓′(𝑐) ⋅ 𝑒𝑗, y por lo tanto: 𝐽𝑓(𝑐) = [ 𝜕𝑓1 𝜕𝑥1 (𝑐) 𝜕𝑓1 𝜕𝑥2 (𝑐) ⋯ 𝜕𝑓1 𝜕𝑥𝑚 (𝑐) 𝜕𝑓2 𝜕𝑥1 (𝑐) 𝜕𝑓2 𝜕𝑥2 (𝑐) ⋯ 𝜕𝑓2 𝜕𝑥𝑚 (𝑐) ⋮ 𝜕𝑓𝑛 𝜕𝑥1 (𝑐) ⋮ 𝜕𝑓𝑛 𝜕𝑥2 (𝑐) ⋮ ⋯ ⋮ 𝜕𝑓𝑛 𝜕𝑥𝑚 (𝑐)] . Cuando 𝑚 = 𝑛, el determinante de la matriz 𝐽𝑓(𝑐) se llama el determinante Jacobiano o simplemente el Jacobiano de 𝑓 en el punto 𝑐, se denota con 𝐽(𝑓(𝑐)). El autor brasileño Lima E. expone esta definición en [20], pág.98. Definición 6.3.4 Sean 𝑈 ⊂ ℝ𝑚 , 𝑉 ⊂ ℝ𝑛 abiertos. Una aplicación 𝑓:𝑈 → 𝑉 es un difeomorfismo entre 𝑈 y 𝑉 cuando es una biyección diferenciable cuya inversa, 𝑔 = 𝑓−1: 𝑉 → 𝑈, también es diferenciable. El autor Lima E. enuncia esta definición en [20], pág.111. 6.4 Aplicaciones de Clase 𝑪𝟏(𝑼). Definición 6.4.1 Sean 𝑈 ⊂ ℝ𝑚 un conjunto abierto. La aplicación 𝑓:𝑈 → ℝ𝑛 se dice que es de “clase 𝐶1(𝑈)” si, i. 𝑓 es diferenciable en 𝑈; ii. 𝑓′: 𝑈 → ℒ(ℝ𝑚 , ℝ𝑛) es continua. Podemos encontrar esta definición en [4], pág.409. Teorema 6.4.2 Sean 𝑈 ⊂ ℝ𝑚 un conjunto abierto, 𝑓:𝑈 → ℝ𝑛 una función diferenciable en 𝑈. Entonces: 𝑓 es de clase 𝐶1(𝑈) si y solo si las derivadas parciales 𝜕𝑓𝑖 𝜕𝑥𝑗 son continuas en 𝑈; 1 ≤ 𝑖 ≤ y 1 ≤ 𝑗 ≤ 𝑚. Demostración (⇐) Supongamos que las derivadas parciales 𝜕𝑓𝑖 𝜕𝑥𝑗 son continuas en 𝑈, para todo 1 ≤ 𝑖 ≤ 𝑛 y 1 ≤ 𝑗 ≤ 𝑚, sea 𝑐 ∈ 𝑈; dado 𝜀 > 0, existe 𝛿𝑖𝑗 > 0 tal que si 𝑥 ∈ 𝑈 y ‖𝑥 − 𝑐‖ ≤ 𝛿𝑖𝑗, entonces | 𝜕𝑓𝑖 𝜕𝑥𝑗 (𝑥) − 𝜕𝑓𝑖 𝜕𝑥𝑗 (𝑐)| < 𝜀 2√𝑚𝑛 . 44 Consideremos 𝛿 = min{𝛿𝑖𝑗: 1 ≤ 𝑖 ≤ 𝑛, 1 ≤ 𝑗 ≤ 𝑚} > 0. Entonces hemos hallado un 𝛿 > 0 tal que si 𝑥 ∈ 𝑈 y ‖𝑥 − 𝑐‖ < 𝛿, se verifica que | 𝜕𝑓𝑖 𝜕𝑥𝑗 (𝑥) − 𝜕𝑓𝑖 𝜕𝑥𝑗 (𝑥)| < 𝜀 2√𝑚𝑛 , para todo 1 ≤ 𝑖 ≤ y 1 ≤ 𝑗 ≤ 𝑚. Por hipótesis, existen 𝑓′(𝑥), 𝑓′(𝑐) las cuales se pueden representar por sus matrices jacobianas. [ 𝜕𝑓1 𝜕𝑥1 (𝑥) 𝜕𝑓1 𝜕𝑥2 (𝑥) ⋯ 𝜕𝑓1 𝜕𝑥𝑚 (𝑥) 𝜕𝑓2 𝜕𝑥1 (𝑥) 𝜕𝑓2 𝜕𝑥2 (𝑥) ⋯ 𝜕𝑓2 𝜕𝑥𝑚 (𝑥) ⋮ 𝜕𝑓𝑛 𝜕𝑥1 (𝑥) ⋮ 𝜕𝑓𝑛 𝜕𝑥2 (𝑥) ⋮ ⋯ ⋮ 𝜕𝑓𝑛 𝜕𝑥𝑚 (𝑥)] y [ 𝜕𝑓1 𝜕𝑥1 (𝑐) 𝜕𝑓1 𝜕𝑥2 (𝑐) ⋯ 𝜕𝑓1 𝜕𝑥𝑚 (𝑐) 𝜕𝑓2 𝜕𝑥1 (𝑐) 𝜕𝑓2 𝜕𝑥2 (𝑐) ⋯ 𝜕𝑓2 𝜕𝑥𝑚 (𝑐) ⋮ 𝜕𝑓𝑛 𝜕𝑥1 (𝑐) ⋮ 𝜕𝑓𝑛 𝜕𝑥2 (𝑐) ⋮ ⋯ ⋮ 𝜕𝑓𝑛 𝜕𝑥𝑚 (𝑐)] , respectivamente. Recordemos que si 𝑇:ℝ𝑚 → ℝ𝑛 es transformación lineal, entonces ‖𝑇‖ = sup {‖𝑇(𝑥)‖: ‖𝑥‖ ≤ 1} y, además, para todo 𝑥 ∈ ℝ𝑚, ‖𝑇(𝑥)‖ ≤ ‖𝑇‖‖𝑥‖. Luego, ‖𝑓′(𝑥) − 𝑓′(𝑐)‖ = sup {‖(𝑓′(𝑥) − 𝑓′(𝑐))𝑦‖: ‖𝑦‖ ≤ 1} Como (𝑓′(𝑥) − 𝑓′(𝑐))𝑦 = [( 𝜕𝑓1 𝜕𝑥1 (𝑥) − 𝜕𝑓1 𝜕𝑥1 (𝑐))𝑦1 + ( 𝜕𝑓1 𝜕𝑥2 (𝑥) − 𝜕𝑓1 𝜕𝑥2 (𝑐)) 𝑦2 +⋯ + ( 𝜕𝑓1 𝜕𝑥𝑚 (𝑥) − 𝜕𝑓1 𝜕𝑥𝑚 (𝑐))𝑦𝑚 ,⋯ , ( 𝜕𝑓𝑛 𝜕𝑥1 (𝑥) − 𝜕𝑓𝑛 𝜕𝑥1 (𝑐))𝑦1 + ( 𝜕𝑓𝑛 𝜕𝑥2 (𝑥) − 𝜕𝑓𝑛 𝜕𝑥2 (𝑐))𝑦2 + ⋯+ ( 𝜕𝑓𝑛 𝜕𝑥𝑚 (𝑥) − 𝜕𝑓𝑛 𝜕𝑥𝑚 (𝑐))𝑦𝑚], entonces ‖(𝑓′(𝑥) − 𝑓′(𝑐))𝑦‖ ≤ [∑( 𝜕𝑓𝑖 𝜕𝑥𝑗 (𝑥) − 𝜕𝑓𝑖 𝜕𝑥𝑗 (𝑐)) 2 𝑖,𝑗 ] 1 2 ‖𝑦‖ < [∑( 𝜀 2√𝑚𝑛 )) 2 𝑖,𝑗 ] 1 2 ‖𝑦‖ ≤ (𝑚𝑛 𝜀2 4𝑚𝑛 ) 1 2 = 𝜀 2 . Luego ‖(𝑓′(𝑥) − 𝑓′(𝑐))𝑦‖ < 𝜀 2 , para todo 𝑦 ∈ ℝ𝑚 con ‖𝑦‖ ≤ 1; este resultado implica que sup{‖(𝑓′(𝑥) − 𝑓′(𝑐))𝑦‖: ‖𝑦‖ ≤ 1} ≤ 𝜀 2 < 𝜀; por lo tanto se sigue que ‖𝑓′(𝑥) − 𝑓′(𝑐)‖ < 𝜀. Así, 𝑓′ es continua en 𝑐. 45 (⇒) Sea 𝑐 ∈ 𝑈 tal que 𝑓′ es continua en 𝑐. Dado 𝜀 > 0, existe 𝛿 > 0 tal que si 𝑥 ∈ 𝑈 y ‖𝑥 − 𝑐‖ ≤ 𝛿 entonces ‖𝑓′(𝑥) − 𝑓′(𝑐)‖ < 𝜀; luego tenemos que ‖(𝑓′(𝑥) − 𝑓′(𝑐))𝑦‖ ≤ ‖𝑓′(𝑥) − 𝑓′(𝑐)‖, para todo 𝑦 ∈ ℝ𝑚 con ‖𝑦‖ ≤ 1. Para 𝑦 = (1,0,0,⋯ ,0) ∈ ℝ𝑚 , en particular, la doble desigualdad ‖( 𝜕𝑓1 𝜕𝑥1 (𝑥) − 𝜕𝑓1 𝜕𝑥1 (𝑐),⋯ , 𝜕𝑓𝑛 𝜕𝑥1 (𝑥) − 𝜕𝑓𝑛 𝜕𝑥1 (𝑐))‖ ≤ ‖𝑓′(𝑥) − 𝑓′(𝑐)‖ < 𝜀, implica que | 𝜕𝑓𝑖 𝜕𝑥1 (𝑥) − 𝜕𝑓𝑖 𝜕𝑥1 (𝑐)| < 𝜀, para todo 1 ≤ 𝑖 ≤ 𝑛. Así queda demostrado que las derivadas parciales 𝜕𝑓𝑖 𝜕𝑥1 son continuas en 𝑐, para todo 1 ≤ 𝑖 ≤ 𝑛. Análogamente, para 𝑦 = (0,1,0,⋯ ,0) ∈ ℝ𝑚, la doble desigualdad ‖( 𝜕𝑓1 𝜕𝑥2 (𝑥) − 𝜕𝑓1 𝜕𝑥2 (𝑐),⋯ , 𝜕𝑓𝑛 𝜕𝑥2 (𝑥) − 𝜕𝑓𝑛 𝜕𝑥2 (𝑐))‖ ≤ ‖𝑓′(𝑥) − 𝑓′(𝑐)‖ < 𝜀, implica que | 𝜕𝑓𝑖 𝜕𝑥2 (𝑥) − 𝜕𝑓𝑖 𝜕𝑥2 (𝑐)| < 𝜀, para todo 1 ≤ 𝑖 ≤ 𝑛. Así también queda demostrado que las derivadas parciales 𝜕𝑓𝑖 𝜕𝑥2 son continuas en 𝑐, para todo 1 ≤ 𝑖 ≤ 𝑛. Repetimos este proceso hasta demostrar que todas las derivadas parciales 𝜕𝑓𝑖 𝜕𝑥𝑗 son continuas en 𝑐, para todo 1 ≤ 𝑖 ≤ 𝑛 y todo 1 ≤ 𝑗 ≤ 𝑚. Por lo tanto, las derivadas parciales 𝜕𝑓𝑖 𝜕𝑥𝑗 son continuas en cualquier punto de 𝑈, pues 𝑐 es arbitrario. El autor Bartle R. presenta una demostración similar en [4], pág.409 – 410. Lema 6.4.3 Sean 𝑈 ⊂ ℝ𝑚 un conjunto abierto, 𝑓: 𝑈 → ℝ𝑛 diferenciable en 𝑈, 𝑥0 ∈ 𝑈 y 𝑆 = {(1 − 𝑡)𝑎 + 𝑡𝑏: 0 ≤ 𝑡 ≤ 1} ⊂ 𝑈. Entonces ‖𝑓(𝑏) − 𝑓(𝑎) − 𝑓′(𝑥0)(𝑏 − 𝑎)‖ ≤ ‖𝑏 − 𝑎‖sup {‖𝑓′(𝑥) − 𝑓′(𝑥0)‖: 𝑥 ∈ 𝑆}. El autor Bartle R. expone una demostración para este teorema en [4], pág.410. 46 Lema 6.4.4 (Lema de Aproximación) Sean 𝑈 ⊂ ℝ𝑚 un conjunto abierto, 𝑓: 𝑈 → ℝ𝑛 de clase 𝐶1(𝑈), 𝑥0 ∈ 𝑈 y 𝜀 > 0. Entonces existe 𝛿 = 𝛿(𝜀) > 0 tal que si 𝑥1,𝑥2 ∈ 𝑈 con ‖𝑥1 − 𝑥0‖ ≤ 𝛿 y ‖𝑥2 − 𝑥0‖ ≤ 𝛿, entonces ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑥0)(𝑥1 − 𝑥2)‖ ≤ 𝜀‖𝑥1 − 𝑥2‖. Demostración Supongamos que 𝑓 es de clase 𝐶1(𝑈). Entonces, existe 𝑓′: 𝑈 → ℒ(ℝ𝑚 , ℝ𝑛), la cual es continua en 𝑈. Sea 𝑥0 ∈ 𝑈; entonces para todo 𝜀 > 0, existe 𝛿1 > 0 tal que si 𝑥 ∈ 𝑈 y ‖𝑥 − 𝑥0‖ ≤ 𝛿1, entonces ‖𝑓′(𝑥) − 𝑓′(𝑥0)‖ < 𝜀 … (∗) Como 𝑥0 ∈ 𝑈, entonces existe 𝛿2 > 0 tal que 𝐵[𝑥0, 𝛿2] ⊂ 𝑈 … (∗∗) Tomemos 𝛿 = min{𝛿1, 𝛿2} > 0; dados 𝑥1,𝑥2 ∈ 𝑈 con ‖𝑥1 − 𝑥0‖ ≤ 𝛿 y ‖𝑥2 − 𝑥0‖ ≤ 𝛿. a) Como ‖𝑥1 − 𝑥0‖ ≤ 𝛿1 y ‖𝑥2 − 𝑥0‖ ≤ 𝛿1, entonces ‖𝑓′(𝑥1) − 𝑓′(𝑥0)‖ < 𝜀 y ‖𝑓′(𝑥2) − 𝑓′(𝑥0)‖ < 𝜀, por (∗). b) Como ‖𝑥1 − 𝑥0‖ ≤ 𝛿2 y ‖𝑥2 − 𝑥0‖ ≤ 𝛿2, entonces 𝑥1 ∈ 𝐵[𝑥0, 𝛿2] ⊂ 𝑈 y 𝑥2 ∈ 𝐵[𝑥0, 𝛿2] ⊂ 𝑈. Así el segmento de recta que une 𝑥1 con 𝑥2 se encuentra en 𝑈. Por el Lema 6.4.3, sabemos que ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑥0)(𝑥1 − 𝑥2)‖ es menor o igual a ‖𝑥1 − 𝑥2‖ sup{‖𝑓′(𝑥) − 𝑓′(𝑥0)‖: 𝑥 ∈ 𝑆}. Para cada 𝑥 = (1 − 𝑡)𝑥1 + 𝑡𝑥2, 𝑡 ∈ [0,1] se tiene, ‖𝑥 − 𝑥0‖ = ‖[(1 − 𝑡)𝑥1 + 𝑡𝑥2] + [(1 − 𝑡)𝑥0 + 𝑡𝑥0]‖ = ‖(1 − 𝑡)(𝑥1 − 𝑥0) + 𝑡(𝑥2 − 𝑥0)‖ ≤ (1 − 𝑡)‖𝑥1 − 𝑥0‖ + 𝑡‖𝑥2 − 𝑥0‖ ≤ (1 − 𝑡)𝛿 + 𝑡𝛿 = 𝛿 Por (∗) tenemos que ‖𝑓′(𝑥) − 𝑓′(𝑥0)‖ < 𝜀, esto condición implica que sup{‖𝑓′(𝑥) − 𝑓′(𝑥0)‖: 𝑥 ∈ 𝑆} ≤ 𝜀. Por lo tanto, ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑥0)(𝑥1 − 𝑥2)‖ ≤ 𝜀‖𝑥1 − 𝑥2‖. El autor Bartle R. presenta una demostración parecida en [4], pág.410. Nota: Sea 𝑈 ⊂ ℝ𝑚 un conjunto abierto y 𝑓:𝑈 → ℝ𝑛. En lo siguiente se establecerá, el carácter local de la transformación 𝑓 en un punto 𝑐 ∈ 𝑈; estas características están determinadas por la transformación lineal 𝑓′(𝑐). Veremos los siguientes casos: i. Si 𝑚 ≤ 𝑛 y 𝑓′(𝑐) es inyectiva, entonces 𝑓 es inyectiva en vecindades pequeñas de 𝑐. ii. Si 𝑚 ≥ 𝑛 y 𝑓′(𝑐) es sobreyectiva, entonces la imagen bajo 𝑓 de una vecindad pequeña de 𝑐 es una vecindad de 𝑓(𝑐). iii. Si 𝑚 = 𝑛 y 𝑓′(𝑐) es biyectiva, entonces 𝑓 aplica una vecindad 𝑈 de 𝑐 en una forma uno a uno sobre una vecindad 𝑉 de 𝑓(𝑐). 47 B. Resultados Obtenidos En esta parte exponemos los resultados más importantes de la investigación realizada. Resultado 1: Teorema de la Función Inyectiva Sean 𝑈 ⊂ ℝ𝑚 un conjunto abierto y 𝑓: 𝑈 → ℝ𝑛 de clase 𝐶1(𝑈), 𝑐 ∈ 𝑈 donde 𝑓′(𝑐) es inyectiva. Entonces existe 𝛿 > 0 tal que 𝑔 = 𝑓|𝐵[𝑐,𝛿] es inyectiva y 𝑔−1: 𝑔(𝐵[𝑐, 𝛿]) → 𝐵[𝑐, 𝛿] es continua. Demostración Sea 𝑐 ∈ 𝑈 tal que 𝑓′(𝑐) es inyectiva. Por el Corolario 6.1.6, existe 𝑟 > 0 tal que 𝑟‖𝑢‖ ≤ ‖𝑓′(𝑐)𝑢‖, para todo 𝑢 ∈ ℝ𝑚 …(∗) Consideremos 𝜀 = 𝑟 2 > 0. Por el Lema de Aproximación, existe 𝛿1 > 0 tal que si 𝑥1,𝑥2 ∈ 𝑈 con ‖𝑥1 − 𝑐‖ ≤ 𝛿1 y ‖𝑥2 − 𝑐‖ ≤ 𝛿2, entonces ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑐)(𝑥1 − 𝑥2)‖ ≤ 𝑟 2 ‖𝑥1 − 𝑥2‖. Asumiendo que 𝑢 = 𝑥1 − 𝑥2, resulta que ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑐)(𝑢)‖ ≤ 𝑟 2 ‖𝑢‖. Por la desigualdad triangular, obtenemos que: ‖𝑓′(𝑐)𝑢‖ − ‖𝑓(𝑥1) − 𝑓(𝑥2)‖ ≤ ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑐)(𝑢)‖ ≤ 𝑟 2 ‖𝑢‖ ≤ 1 2 ‖𝑓′(𝑐)𝑢‖, por la desigualdad (∗) Entonces 1 2 ‖𝑓′(𝑐)𝑢‖ ≤ ‖𝑓(𝑥1) − 𝑓(𝑥2)‖… (∗∗) 1) Probaremos que 𝑓 es inyectiva en 𝐵[𝑐, 𝛿1]. Para este fin consideremos 𝑥1, 𝑥2 ∈ 𝐵[𝑐, 𝛿1] con 𝑓(𝑥1) = 𝑓(𝑥2), entonces 𝑥1,𝑥2 ∈ 𝑈 con ‖𝑥1 − 𝑐‖ ≤ 𝛿1 y ‖𝑥2 − 𝑐‖ ≤ 𝛿1; luego 1 2 ‖𝑓′(𝑐)𝑢‖ ≤ ‖𝑓(𝑥1) − 𝑓(𝑥2)‖ = 0 y en consecuencia 1 2 ‖𝑓′(𝑐)𝑢‖ = 0; de aquí se sigue que ‖𝑓′(𝑐)𝑢‖ = 0, entonces 𝑓′(𝑐)𝑢 = 𝜃. Siendo 𝑓′(𝑐) un monomorfismo, concluimos que 𝑢 = 𝜃; entonces se concluye que 𝑥1 − 𝑥2 = 𝜃; es decir 𝑥1 = 𝑥2. Por lo tanto, 𝑓 es inyectiva en 𝐵[𝑐, 𝛿]. Definamos 𝑔:𝐵[𝑐, 𝛿1] → 𝑓(𝐵[𝑐, 𝛿1]) mediante 𝑔(𝑥) = 𝑓(𝑥), para todo 𝑥 ∈ 𝐵[𝑐, 𝛿1]. Así, 𝑔 es biyectiva. 2) Probaremos que 𝑔−1 es continua. Efectivamente, dados 𝑦1,𝑦2 ∈ 𝑓(𝐵[𝑐, 𝛿1]), existe un único 𝑥1 ∈ 𝐵[𝑐, 𝛿1] tal que 𝑦1 = 𝑓(𝑥1) y existe un único 𝑥2 ∈ 𝐵[𝑐, 𝛿1] tal que 𝑦2 = 𝑓(𝑥2). Luego, ‖𝑔−1(𝑦1) − 𝑔−1(𝑦2)‖ = ‖𝑥1 − 𝑥2‖ ≤ 1 𝑟 ‖𝑓′(𝑐)𝑢‖, por (∗) ≤ 2 𝑟 ‖𝑓(𝑥1) − 𝑓(𝑥2)‖, por (∗∗) 48 = 2 𝑟 ‖𝑦1 − 𝑦2‖. Dado 𝜀 > 0, existe 𝛿 = min {𝛿1, 𝜀𝑟 2 } > 0 tal que si ‖𝑦1 − 𝑦2‖ < 𝛿, entonces ‖𝑦1 − 𝑦2‖ < 𝛿1 y ‖𝑦1 − 𝑦2‖ < 𝜀𝑟 2 ; luego tenemos que, ‖𝑔−1(𝑦1) − 𝑔−1(𝑦2)‖ ≤ 2 𝑟 ‖𝑦1 − 𝑦2‖ < 2 𝑟 𝜀𝑟 2 = 𝜀. Lo que demuestra que 𝑔−1 es continua. 𝑐 𝑓(𝑐) 𝑈 𝑓(𝑈) 𝑓 ℝ𝑚 ℝ𝑛 49 Resultado 2: Teorema de la Función Sobreyectiva Sean 𝑈 ⊂ ℝ𝑚 un conjunto abierto y 𝑓: 𝑈 → ℝ𝑛 de clase 𝐶1(𝑈), 𝑐 ∈ 𝑈 donde 𝑓′(𝑐) es sobreyectiva. Entonces existen 𝑘 > 0 y 𝛼 > 0 tales que si 𝑦 ∈ ℝ𝑛 y ‖𝑦 − 𝑓(𝑐)‖ ≤ 𝛼 2𝑘 , entonces existe 𝑥 ∈ 𝑈 tal que ‖𝑥 − 𝑐‖ ≤ 𝛼 y 𝑓(𝑥) = 𝑦. Demostración Sea 𝑐 ∈ 𝑈 tal que 𝑓′(𝑐):ℝ𝑚 → ℝ𝑛 es sobreyectiva. Cada uno los vectores 𝑒𝑖, de la base canónica de ℝ𝑛, es la imagen bajo 𝑓′(𝑐) de algún vector en ℝ𝑛; entonces existen vectores 𝑢1, 𝑢2,… ,𝑢𝑛 en ℝ𝑛 tal que 𝑓′(𝑐)(𝑢𝑖) = 𝑒𝑖, para todo 1 ≤ 𝑖 ≤ 𝑛. Puesto que para cada 𝑦 ∈ ℝ𝑛, existen escalares únicos 𝛼1, 𝛼2,…,𝛼𝑛 tales que 𝑦 = 𝛼1𝑒1 + 𝛼2𝑒2 + ⋯+ 𝛼𝑛𝑒𝑛 [cuando 𝑦 = (𝛼1, 𝛼2, ⋯ , 𝛼𝑛)], entonces podemos definir una función 𝑔: ℝ𝑛 → ℝ𝑚 mediante la regla de correspondencia 𝑔(𝑦) = 𝑔(𝛼1, 𝛼2, ⋯ , 𝛼𝑛) = ∑ 𝛼𝑖𝑢𝑖 𝑛 𝑖=1 . 1) Es claro que 𝑔 es una transformación lineal. 2) También es evidente que 𝑓′(𝑐) ∘ 𝑔:ℝ𝑛 → ℝ𝑛 es una transformación lineal. Además, para cada 𝑦 ∈ ℝ𝑛 , se tiene (𝑓′(𝑐) ∘ 𝑔)(𝑦) = 𝑓′(𝑐)(𝑔(𝑥)) = 𝑓′(𝑐)∑ 𝛼𝑖𝑢𝑖 𝑛 𝑖=1 = ∑ 𝛼𝑖𝑓 ′(𝑐)𝑢𝑖 𝑛 𝑖=1 = ∑ 𝛼𝑖𝑒𝑖 = 𝑦𝑛 𝑖=1 , entonces (𝑓′(𝑐) ∘ 𝑔)(𝑦) = 𝑦, para todo 𝑦 ∈ ℝ𝑛 . Por lo tanto, 𝑓′(𝑐) ∘ 𝑔 es la identidad en ℝ𝑛. 3) Si 𝑘 = (∑ ‖𝑢𝑖‖ 2𝑛 𝑖=1 ) 1 2, entonces ‖𝑔(𝑦)‖ ≤ 𝑘‖𝑦‖, para 𝑦 ∈ ℝ𝑛 . Efectivamente, para cada 𝑦 ∈ ℝ𝑛 se tiene ‖𝑔(𝑦)‖ = ‖𝑔(𝛼1, 𝛼2,⋯ , 𝛼𝑛)‖ = ‖∑ 𝛼𝑖𝑔(𝑒𝑖) 𝑛 𝑖=1 ‖ = ‖∑ 𝛼𝑖𝑢𝑖 𝑛 𝑖=1 ‖, ≤ ∑ |𝛼𝑖| ⋅ ‖𝑢𝑖‖ 𝑛 𝑖=1 , ≤ (∑ |𝛼𝑖| 2𝑛 𝑖=1 ) 1 2 ⋅ (∑ ‖𝑢𝑖‖ 𝑛 𝑖=1 2 ) 1 2 = ‖𝑦‖𝑘. Por lo tanto, ‖𝑔(𝑦)‖ ≤ 𝑘‖𝑦‖, para 𝑦 ∈ ℝ𝑛. 4) Para 1 2𝑘 > 0, por el Lema de Aproximación, existe 𝛿 > 0 tal que si 𝑥1,𝑥2 ∈ 𝑈 con ‖𝑥1 − 𝑐‖ ≤ 𝛿 y ‖𝑥2 − 𝑐‖ ≤ 𝛿, se satisface que ‖𝑓(𝑥1) − 𝑓(𝑥2) − 𝑓′(𝑐)(𝑥1 − 𝑥2)‖ ≤ 1 2𝑘 ‖𝑥1 − 𝑥2‖. Además, podemos elegir 𝛿 de tal modo que 𝐵[𝑐, 𝛿] ⊂ 𝑈. 5) Sea 𝑦 ∈ ℝ𝑛 donde ‖𝑦 − 𝑓(𝑐)‖ ≤ 𝛼 2𝑘 y consideremos 𝑥0 = 𝑐, 𝑥1 = 𝑥0 + 𝑔(𝑦 − 𝑓(𝑐)). Entonces, como 𝑥1 − 𝑥0 = 𝑔(𝑦 − 𝑓(𝑐)); se sigue que ‖𝑥1 − 𝑥0‖ = ‖𝑔(𝑦 − 𝑓(𝑐))‖ 50 y ‖𝑔(𝑦 − 𝑓(𝑐))‖ ≤ 𝑘‖𝑦 − 𝑓(𝑐)‖ ≤ 𝑘 ( 𝛼 2𝑘 ) = 𝛼 2 . Entonces ‖𝑥1 − 𝑥0‖ ≤ 𝛼 2 [o ‖𝑥1 − 𝑥0‖ ≤ (1 − 1 2 ) 𝛼]. De esta manera, resulta que ‖𝑥1 − 𝑐‖ = ‖𝑥1 − 𝑥0‖ ≤ 𝛼 2 ≤ 𝛼 y que ‖𝑥0 − 𝑐‖ = ‖𝑐 − 𝑐‖ = 0 ≤ 𝛼. Siendo 𝑥1, 𝑥0 ∈ 𝑈, por la parte 4) tenemos que ‖𝑓(𝑥1) − 𝑓(𝑥0) − 𝑓′(𝑐)(𝑥1 − 𝑥0)‖ ≤ 1 2𝑘 ‖𝑥1 − 𝑥0‖. Tomemos 𝑥2 = 𝑥1 − 𝑔(𝑓(𝑥1) − 𝑓(𝑥0) − 𝑓′(𝑐)(𝑥1 − 𝑥0)); sigue que ‖𝑥2 − 𝑥1‖ = ‖𝑔(𝑓(𝑥1) − 𝑓(𝑥0) − 𝑓′(𝑐)(𝑥1 − 𝑥0))‖ ≤ 𝑘‖𝑓(𝑥1) − 𝑓(𝑥0) − 𝑓′(𝑐)(𝑥1 − 𝑥0)‖, por la parte 3) ≤ 𝑘 ( 1 2𝑘 ) ⋅ ‖𝑥1 − 𝑥0‖ = 1 2 ‖𝑥1 − 𝑥0‖ ≤ 1 2 ⋅ 𝛼 2 = 𝛼 22 Entonces ‖𝑥2 − 𝑥1‖ ≤ 𝛼 22. Luego, ‖𝑥2 − 𝑥0‖ ≤ ‖𝑥2 − 𝑥1‖ + ‖𝑥1 − 𝑥0‖ ≤ 𝛼 22 + (1 − 1 2 ) 𝛼 = [1 − ( 1 2 − 1 22)] 𝛼 = (1 − 1 22)𝛼 Por lo tanto, ‖𝑥2 − 𝑥0‖ ≤ (1 − 1 22) 𝛼. Entonces podemos definir inductivamente 𝑥3, 𝑥4, … ,𝑥𝑖 de modo que ‖𝑥𝑗 − 𝑥𝑗−1‖ ≤ 𝛼 2𝑗 y ‖𝑥𝑗 − 𝑐‖ ≤ (1 − 1 2𝑗) 𝛼, donde 3 ≤ 𝑗 ≤ 𝑖. De esta manera para 𝑥𝑖+1 = 𝑥𝑖 − 𝑔(𝑓(𝑥𝑖) − 𝑓(𝑥𝑖−1) − 𝑓′(𝑐)(𝑥𝑖 − 𝑥𝑖−1)) se cumple que ‖𝑥𝑖+1 − 𝑥𝑖‖ = ‖𝑔(𝑓(𝑥𝑖) − 𝑓(𝑥𝑖−1) − 𝑓′(𝑐)(𝑥𝑖 − 𝑥𝑖−1))‖ ≤ 𝑘‖𝑓(𝑥𝑖) − 𝑓(𝑥𝑖−1) − 𝑓′(𝑐)(𝑥𝑖 − 𝑥𝑖−1)‖ ≤ 𝑘 1 2𝑘 ⋅ ‖𝑥𝑖 − 𝑥𝑖−1‖ = 1 2 ‖𝑥𝑖 − 𝑥𝑖−1‖ ≤ 1 2 ( 𝛼 2𝑖) = 𝛼 2𝑖+1. Se obtiene entonces que ‖𝑥𝑖+1 − 𝑥𝑖‖ ≤ 𝛼 2𝑖+1, para todo 𝑖 ≥ 1. Asimismo, ‖𝑥𝑖+1 − 𝑐‖ ≤ ‖𝑥𝑖+1 − 𝑥𝑖‖ + ‖𝑥𝑖 − 𝑐‖ ≤ 𝛼 2𝑖+1 + (1 − 1 2𝑖 ) 𝛼 = (1 − 1 2𝑖+1)𝛼, entonces ‖𝑥𝑖+1 − 𝑐‖ ≤ (1 − 1 2𝑖+1) 𝛼, para todo 𝑖 ≥ 1. Así se ha construido una sucesión (𝑥𝑝) en ℝ𝑚 tal que ‖𝑥𝑝 − 𝑥𝑝−1‖ ≤ 𝛼 2𝑝, ‖𝑥𝑝 − 𝑐‖ ≤ (1 − 1 2𝑝) 𝛼. 51 6) Afirmamos que (𝑥𝑝) ⊂ ℝ𝑚 es de Cauchy. Efectivamente, sean 𝑝 ∈ ℕ, 𝑞 ∈ ℕ con 𝑝 ≤ 𝑞 ‖𝑥𝑝 − 𝑥𝑞‖ ≤ ‖𝑥𝑝 − 𝑥𝑝+1‖ + ‖𝑥𝑝+1 − 𝑥𝑝+2‖ + ⋯+ ‖𝑥𝑞−1 − 𝑥𝑞‖ ≤ 𝛼 2𝑝+1 + 𝛼 2𝑝+2