9  Introducción al Álgebra Lineal

9.1 Introducción a los sistemas de ecuaciones lineales

Una recta en el plano, \(\mathbb{R}^2\), se puede representar algebraicamente mediante una ecuación de la forma \[\begin{equation} a_1x+a_2y=b \end{equation}\]

Una ecuación de este tipo se conoce como ecuación lineal en las variables \(x\) y \(y\). En forma general, se define una ecuación lineal en las \(n\) variables \(x_1, x_2,\,\dots\,, x_n\) como aquélla que se puede expresar en la forma

\[\begin{equation} a_1x_1+a_2x_2+\cdots +a_nx_n=b \end{equation}\]

en donde \(a_1, a_2, \, \dots \, , a_n\) y \(b\) son constantes reales.

Observar que una ecuación lineal no comprende productos o raíces de variables. Todas las variables se presentan únicamente a la primera potencia y no aparecen como argumento para funciones trigonométricas, logarítmicas o exponenciales. Las que siguen no son ecuaciones lineales:

\[\begin{equation} \begin{array}{rr} x+3 y^{2}=7 & 3 x+2 y-z+x z=4 \\ y-\operatorname{sen} x=0 & \sqrt{x_{1}}+2 x_{2}+x_{3}=1 \end{array} \end{equation}\]

Una solución de una ecuación lineal \(a_1x_1 + a_2x_2 + \cdots + a_nx_n = b\) es una sucesión de n números \(s_1, s_2,\,\dots\, , s_n\) , tales que la ecuación se satisface cuando se hace la sustitución \(x_1 = s_1 , x_2 = s_2, \,\dots\, , x_n = s_n\). El conjunto de todas las soluciones de la ecuación es su conjunto solución.

Un conjunto finito de ecuaciones lineales en las variables \(x_1, x_2,\, \dots\, , x_n\) se conoce como sistema de ecuaciones lineales o sistema lineal. Una sucesión de números \(s_1, s_2,\,\dots \,,s_n\) es una solución del sistema si \(x_1 = s_1, x_2 = s_2,\,\dots\, , x_n=s_n\) es una solúción de toda ecuación en tal sistema. Por ejemplo, el sistema

\[\begin{equation} \begin{array}{rr} 4x_1-x_2+3x_3=& -1 \\ 3x_1+x_2+9x_3= &-4 \end{array} \end{equation}\]

tiene la solución \(x_1 = 1\), \(x_2 = 2\), \(x_3 = -1\), puesto que estos valores satisfacen las dos ecuaciones. Sin embargo, \(x_1 = 1\), \(x_2 = 8\), \(x_3 = 1\) no es una solución, ya que estos valores sólo satisfacen la primera de las dos ecuaciones del sistema.

No todos los sistemas de ecuaciones lineales tienen soluciones.

Cuando un sistema de ecuaciones no tiene solución se dice que es inconsistente. Si existe al menos una solución, se le denomina consistente. A fin de ilustrar las posibilidades qUe pueden presentarse al resolver sistemas de ecuaciones lineales, considérese un sistema general de dos ecuaciones lineales en las incógnitas \(x\) y \(y\):

\[\begin{equation} \begin{array}{ll} a_{1} x+b_{1} y=c_{1} & \left(a_{1}, b_{1} \text { ninguno es cero }\right) \\ a_{2} x+b_{2} y=c_{2} & \left(a_{2}, b_{2} \text { ninguno es cero }\right) \end{array} \end{equation}\]

Las gráficas de estas ecuaciones son rectas; se hará referencia a ellas como \(\ell_1\) y \(\ell_2\). Puesto que un punto \((x, y)\) está sobre una recta si y sólo si los números \(x\) y \(y\) satisfacen la ecuación de la misma, las soluciones del sistema de ecuaciones corresponden a puntos de intersección de \(\ell_1\) y \(\ell_2\), . Se tienen tres posibilidades.

Aun cuando sólo se consideraron dos ecuaciones con dos incógnitas, este resultado se cumple para sistemas arbitrarios; es decir, todo sistema de ecuaciones lineales no tiene solución alguna, tiene exactamente una solución, o bien, una infinidad de soluciones.

Un sistema arbitrario de \(m\) ecuaciones lineales en \(n\) incógnitas se escribe

\[\begin{equation} \begin{array}{c} a_{11} x_{1}+a_{12} x_{2}+\cdots+a_{1 n} x_{n}=b_{1} \\ a_{21} x_{1}+a_{22} x_{2}+\cdots+a_{2 n} x_{n}=b_{2} \\ \vdots \quad \vdots \\ a_{m 1} x_{1}+a_{m 2} x_{2}+\cdots+a_{m n} x_{n}=b_{m} \end{array} \end{equation}\]

en donde \(x_1, x_2, \, \dots \, ,x_n\) son las incógnitas y las \(a\) y \(b\) con subíndices denotan constantes.

Por ejemplo, un sistema general de tres ecuaciones lineales en cuatro incógnitas se escribe

\[\begin{equation} \begin{array}{l} a_{11} x_{1}+a_{12} x_{2}+a_{13} x_{3}+a_{14} x_{4}=b_{1} \\ a_{21} x_{1}+a_{22} x_{2}+a_{23} x_{3}+a_{24} x_{4}=b_{2} \\ a_{31} x_{1}+a_{32} x_{2}+a_{33} x_{3}+a_{34} x_{4}=b_{3} \end{array} \end{equation}\]

El subíndice doble en los coeficientes de las incógnitas es una idea útil que se emplea para establecer la ubicación del coeficiente en el sistema. El primer subíndice del coeficiente \(a_{ij}\) indica la ecuación en la que se encuentra, y el segundo indica la incógnita que multiplica. Por tanto , \(a_{12}\) se encuentra en la primera ecuación y multiplica a la incógnita \(x_2\).

Una manera de expresar un sistema de \(m\) ecuaciones lineales en \(n\) incógnitas es escribiendo únicamente el arreglo rectangular de números:

\[\begin{equation} \left(\begin{array}{ccccc} a_{11} & a_{12} & \cdots & a_{1n} & b_{1} \\ a_{21} & a_{22} & \cdots & a_{2n} & b_{2} \\ \vdots & \vdots &\ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_{m} \end{array}\right) \end{equation}\]

Esto se conoce como matriz aumentada para el sistema. (En matemáticas se utiliza el término matriz para denotar un arreglo rectangular de números). Como ilustración, la matriz aumentada para el sistema de ecuaciones

\[\begin{equation} \begin{array}{r} x_{1}+x_{2}+2 x_{3}=9 \\ 2 x_{1}+4 x_{2}-3 x_{3}=1 \\ 3 x_{1}+6 x_{2}-5 x_{3}=0 \end{array} \end{equation}\]

es

\[\begin{equation} \left(\begin{array}{rrrr} 1 & 1 & 2 & 9 \\ 2 & 4 & -3 & 1 \\ 3 & 6 & -5 & 0 \end{array}\right) \end{equation}\]

El método básico para resolver un sistema de ecuaciones lineales es reemplazar el sistema dado por uno nuevo que tenga el mismo conjunto solución, pero que sea más fácil de resolver. En general, este sistema nuevo se obtiene siguiendo una serie de pasos aplicando los tres tipos siguientes de operaciones a fin de eliminar sistemáticamente las incógnitas.

  1. Multiplicar una de las ecuaciones por una constante diferente de cero.

  2. Intercambiar dos de las ecuaciones.

  3. Sumar un múltiplo de una de las ecuaciones a otra

Puesto que las filas (líneas horizontales) de una matriz aumentada corresponden a las ecuaciones del sistema asociado, estas tres operaciones corresponden a las operaciones siguientes sobre los renglones de la matriz aumentada:

  1. Multiplicar una de las filas por una constante diferente de cero.

  2. Intercambiar dos de las filas.

  3. Sumar un múltiplo de una de las filas a otra fila.

Estas se denominan operaciones elementales sobre las filas.


9.2 Eliminación Gaussiana

La matriz

\[\begin{equation} \left(\begin{array}{llll} 1 & 0 & 0 & 1 \\ 0 & 1 & 0 & 2 \\ 0 & 0 & 1 & 3 \end{array}\right) \end{equation}\]

es un ejemplo de una matriz escalón reducida por filas. Para encontrarse en esta forma, una matriz debe tener las siguientes propiedades:

  1. Si una fila no consta completamente de ceros, entonces el primer número diferente de cero en la fila en es un \(1\). A este \(1\) se le denomina \(1\) principal.

  2. Si existen filas que consten completamente de ceros, entonces se agrupan en la parte inferior de la matriz.

  3. Si dos filas sucesivas no constan completamente de ceros, el \(1\) principal de la fila inferior se presenta más hacia la derecha que el \(1\) principal de la fila superior.

  4. Cada columna que contenga un \(1\) principal tiene ceros en todas las demás posiciones.

Si una matriz tiene las propiedades \(1\), \(2\) y \(3\) se dice que está en la forma escalón por filas.


9.3 Sistemas de ecuaciones lineales homogéneos

Se dice que un sistema de ecuaciones lineales es homogéneo si todos los términos constantes son cero; es decir, el sistema tiene la forma

\[\begin{equation} \begin{array}{c} a_{11} x_{1}+a_{12} x_{2}+\ldots+a_{1n} x_{n}=0 \\ a_{21} x_{1}+a_{22} x_{2}+\ldots+a_{2n} x_{n}=0 \\ \vdots \\ a_{m1} x_{1}+a_{m2} x_{2}+\ldots+a_{mn} x_{n}=0 \end{array} \end{equation}\]

Todo sistema homogéneo de ecuaciones lineales es consistente, ya que \(x_1 = 0, x_2=0,\, \dots \,,x_n =0\) siempre es una solución. Esta solución se conoce como solución trivial; si existen otras soluciones, se dice que son soluciones no triviales.

Dado que un sistema de ecuaciones lineales homogéneo debe ser consistente, se tiene una solución o una infinidad de soluciones. Puesto que una de estas soluciones es la trivial, se puede afirmar lo siguiente:

Para un sistema de ecuaciones lineales homogéneo, se cumple exactamente una de las siguientes proposiciones:

  1. El sistema tiene sólo la solución trivial.

  2. El sistema tiene una infinidad de soluciones no triviales además de la trivial.

Existe un caso en el que queda asegurado que un sistema homogéneo tiene soluciones no triviales.

Teorema Un sistema de ecuaciones lineales homogéneo con más incógnitas que ecuaciones siempre tiene una infinidad de soluciones.

9.4 Matrices y operaciones matriciales.

Definición Una matriz es un arreglo rectangular de números. Los números del arreglo se conocen como elementos de la matriz.

El tamaño de una matriz se describe especificando el número de filas (líneas horizontales) y columnas (líneas verticales) que se presentan en ella. El primer número siempre indica el número de renglones y el segundo el número de columnas.

Si \(A\) es una matriz, se usará \(a_{ij}\) para denotar el elemento en la fila \(i\) y la columna \(j\) de \(A\). Por consiguiente , una matriz general de \(3 \times 4\) se puede escribir

\[\begin{equation} A=\left(\begin{array}{l l l l } a_{11} & a_{12} & a_{13} & a_{14} \\ a_{21} & a_{22} & a_{23} & a_{24} \\ a_{31} & a_{32} & a_{33} & a_{34} \end{array}\right) \end{equation}\]

Naturalmente, si se usa \(B\) para denotar la matriz, entonces se usará \(b_{ij}\) para el elemento que está en la fila \(i\) y la columna \(j\). Así entonces, una matriz general de \(m \times n\) podría escribirse

\[\begin{equation} B=\left(\begin{array}{l l l l } b_{11} & b_{12} & \cdots & b_{1n} \\ b_{21} & b_{22} & \cdots & b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ b_{m1} & b_{m2} & \cdots & b_{mn} \end{array}\right) \end{equation}\]

Una matriz \(A\) con \(n\) filas y \(n\) columnas se denomina matriz cuadrada de orden \(n\) y se dice que los elementos \(a_{11} , a_{22}, ... , a_{nn}\) están en la diagonal principal de \(A\).

Se dice que dos matrices son iguales si tienen el mismo tamaño y los elementos correspondientes en las dos matrices son iguales.

Definición. Si \(A\) y \(B\) son dos matrices cualesquiera del mismo tamaño, entonces la suma \(A + B\) es la matriz que se obtiene al sumar los elementos correspondientes de las dos matrices. Las matrices de tamaños difererites no se pueden sumar.

Definición. Si \(A\) es una matriz cualquiera y \(c\) es cualquier escalar, entonces el producto \(cA\) es la matriz que se obtiene al multiplicar cada elemento de \(A\) por \(c\).

Si \(B\) es una matriz cualquiera, entonces \(- B\) denota el producto \((-1) B\). Si \(A\) Y \(B\) son dos matrices del mismo tamaño, entonces \(A- B\) se define como la suma \(A + (- B) = A+ (- 1)B\).

Definición. Si \(A\) es una matriz de \(m \times r\) y \(B\) es una de \(r \times n\), entonces el producto \(AB\) es la matriz de \(m \times n\) cuyos elementos se determinan como sigue. Para encontrar el elemento en la fila \(i\) y la columna \(j\) de \(AB\), distíngase la fila \(i\) de la matriz \(A\) y la columna \(j\) de la \(B\). Multiplíquense los elementos correspondientes de la fila y columna, a continuación, súmense los productos resultantes.

La definición de la multiplicación de matrices requiere que el número de columnas del primer factor \(A\) sea igual al número de filas del segundo factor \(B\), para formar el producto \(AB\). Si no se satisface esta condición, el producto no está definido.

La multiplicación de matrices tiene una aplicación importante a los sistemas de ecuaciones lineales. Considérese cualquier sistema de \(m\) ecuaciones lineales en \(n\) incógnitas:

\[\begin{equation} \begin{array}{c} a_{11} x_{1}+a_{12} x_{2}+\cdots+a_{1 n} x_{n}=b_{1} \\ a_{21} x_{1}+a_{22} x_{2}+\cdots+a_{2 n} x_{n}=b_{2} \\ \vdots \qquad\qquad \vdots \\ a_{m 1} x_{1}+a_{m 2} x_{2}+\cdots+a_{m n} x_{n}=b_{m} \end{array} \end{equation}\]

Puesto que dos matrices son iguales si y sólo si sus elementos correspondientes son iguales, es posible reemplazar las \(m\) ecuaciones de este sistema por la ecuación matricial única

\[\begin{equation} \left( \begin{array}{c} a_{11} x_{1}+a_{12} x_{2}+\cdots+a_{1 n} x_{n}\\ a_{21} x_{1}+a_{22} x_{2}+\cdots+a_{2 n} x_{n}\\ \vdots \qquad\qquad \vdots \\ a_{m 1} x_{1}+a_{m 2} x_{2}+\cdots+a_{m n} x_{n} \end{array} \right)= \left( \begin{array}{c} b_1\\ b_2\\ \vdots\\ b_m \end{array} \right) \end{equation}\]

La matriz de \(m X 1\) del primer miembro de esta ecuación se puede escribir como un producto para dar

\[\begin{equation} \left( \begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} &\cdots & a_{2 n} \\ \vdots \qquad\qquad \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n} \end{array} \right) \left(\begin{array}{c} x_1 \\ x_2 \\ \vdots\\ x_n \end{array} \right)= \left(\begin{array}{c} b_1 \\ b_2 \\ \vdots\\ b_m \end{array} \right) \end{equation}\]

Si se designan estas matrices por \(A\), \(X\) , y \(B\), respectivamente, se ha reemplazado el sistema original de \(m\) ecuaciones en \(n\) incógnitas por la ecuación matricial única

\[\begin{equation} AX=B \end{equation}\]

La matriz \(A\) dada en esta ecuación se llama matriz de coeficientes para el sistema.

9.4.1 Propiedades de las operaciones matriciales.

Teorema. Suponiendo que los tamaños de las matrices son tales que es posible efectuar las operaciones indicadas, son válidas las siguientes reglas de la aritmética matricial:

  1. \(A + B = B + A\) (La adición de matrices es conmutativa).
  2. \(A + (B + C) = (A + B) + C\) (La adición de matrices es asociativa).
  3. \(A(BC) = (AB)C\) (La multiplicación de matrices es asociativa).
  4. \(A(B + C) = AB + AC\) (Propiedad distributiva).
  5. \((B + C)A = BA + CA\).
  6. \(A(B - C) = AB - AC\).
  7. \((B - C)A = BA - CA\).
  8. \(a(B + C) = aB + aC\), \(a\in \mathbb{R}\).
  9. \(a(B - C) = aB - aC\).
  10. \((a + b)C = aC + bC\).
  11. \((a - b)C = aC - bC\).
  12. \((ab)C = a(bC)\).
  13. \(a(BC) = (aB)C = B(aC)\).

Una matriz en la que todos sus elementos son cero, se denomina matriz cero.

Si \(A\) es cualquier matriz y \(0\) es la matriz cero con el mismo tamaño entonces \(A+0=A\).

Hay algunas propiedades de las operaciones definidas en los reales que no se cumplen en el álgebra de matrices, por ejemplo

  1. Si \(ab = ac\) y \(a\neq 0\), entonces \(b = c\) (Ley de cancelación).
  2. Si \(ad = 0\), entonces al menos uno de los factores es \(0\).

Teorema. Suponiendo que los tamaños de las matrices son tales que se pueden efectuar las operaciones indicadas, las siguientes reglas de la aritmética matricial son válidas.

  1. \(A + 0 = 0 + A = A\)
  2. \(A - A = 0\)
  3. \(0- A = -A\)
  4. \(A0 = 0\); \(0A = 0\)

Como aplicación de las propiedades de la operaciones con matrices, se enuncia siguiente teorema.

Teorema. Todo sistema de ecuaciones lineales no tiene soluciones, tiene exactamente una solución, o bien, una infinidad de soluciones.

Definición Una matriz identidad de \(n\times n\) es aquella cuyos elementos en la diagonal principal son uno y los demás son cero. La matriz identidad será denotada por \(I\) si es importante hacer hincapié en el tamaño escribiremos \(I_n\).

Si \(A\) es una matriz de \(m\times n\) entonces \(AI_n=A\) y \(I_mA=A\).

Definición Si \(A\) es una matriz cuadrada cualquiera y si es posible hallar una matriz \(B\) tal que \(AB = BA = I\), entonces se dice que \(A\) es invertible y \(B\) se conoce como inversa de \(A\).

Teorema. Si tanto \(B\) como \(C\) son inversas de la matriz \(A\), entonces \(B = C\).

Si \(A\) es invertible , entonces su inversa se denota como \(A^{-1}\). Por consiguiente

\[\begin{equation} AA^{-1}=I\qquad A^{-1}A=I \end{equation}\]

La inversa de \(A\) desempeña casi la misma función en la aritmética matricial que la desempeñada por el recíproco \(a^{-1}\) en las relaciones numéricas \(aa^{-1} = 1\) Y \(a^{-1} a = 1\).

Considérese la matriz de \(2\times 2\)

\[\begin{equation} A=\left( \begin{array}{c c} a & b\\ c & d \end{array} \right) \end{equation}\]

Si \(ad-bc\neq 0\), entonces

\[\begin{equation} A^{-1}=\frac{1}{ad-bc}\left( \begin{array}{c c} d & -b\\ -c & a \end{array} \right) \end{equation}\]

Teorema. Si \(A\) Y \(B\) son matrices invertibles del mismo tamaño, entonces

  1. \(AB\) es invertible

  2. \((AB)^{-1} =B^{-1} A^{-1}\).

Un producto de matrices invertibles siempre es invertible y la inversa del product es el producto de las inversas en orden inverso.

Teorema. Si \(A\) es una matriz invertible, entonces:

  1. \(A^{-1}\) es invertible y \((A^{-1})^{-1}=A\).

  2. \(A^n\) es invertible y \((A^n)^{-1}=(A^{-1})^n\) para \(n=0,1,2,...\)

  3. Para cualquier escalar diferente de cero \(k\), \(kA\) es invertible y \((kA)^{-1}=\frac{1}{k}A^{-1}\).


Si \(A\) es una matriz cuadrada y \(r\) y \(s\) son enteros, entonces son válidas las leyes de los exponentes siguientes

\[\begin{equation} A^rA^s=A^{r+s}\qquad (A^r)^s=A^{rs} \end{equation}\]