Ajuste Lineal por Mínimos Cuadrados

¿Qué es el Ajuste Lineal por Mínimos Cuadrados?

Sean (x₁, y₁), (x₂, y₂)... (x_N, y_N) puntos de datos experimentales como se muestra en el diagrama de dispersión a continuación y supongamos que queremos predecir la variable dependiente y para diferentes valores de la variable independiente x usando un modelo lineal de la forma

y = a x + b

Diagrama de dispersión de puntos de datos — Figura 1. Diagrama de dispersión

Un procedimiento ampliamente utilizado en matemáticas es minimizar la suma D de los cuadrados de las distancias verticales d1, d2, ... entre el modelo matemático y = f(x) y los puntos experimentales como se muestra en el gráfico a continuación.

Figura 2. Ajuste por mínimos cuadrados de un modelo a los datos

Sea \( f(x) = a x + b \) el modelo lineal a utilizar. Por lo tanto, las distancias verticales \(d_1, d_2, ... \) vienen dadas por

\( d_1 = |y_1 - (a x_1 + b))| \) , \( d_2 = |y_2 - (a x_2 + b))| \) , ...

La suma D de los cuadrados de las distancias verticales d1, d2, ... puede escribirse como
\[ D = \sum_{i=1}^{N} (y_i - (a x_i + b))^2 \] Los valores de a y b que minimizan D son los valores que hacen que las derivadas parciales de D con respecto a a y b sean simultáneamente iguales a 0. Por lo tanto, primero calculamos las dos derivadas: \[ \dfrac {\partial D}{\partial a} = \sum_{i=1}^{N} - 2 x_i(y_i - a x_i - b) \] \[ \dfrac {\partial D}{\partial b } = \sum_{i=1}^{N} - 2 (y_i - a x_i - b) \] luego resolvemos para \( a \) y \( b \) el sistema de ecuaciones
\begin{cases} \sum_{i=1}^{N} - 2 x_i(y_i - a x_i - b) = 0 \\ \sum_{i=1}^{N} - 2 (y_i - a x_i - b) = 0 \end{cases} Dividimos ambos lados de cada ecuación por -2 y simplificamos para reescribir el sistema de ecuaciones como
\begin{cases} \sum_{i=1}^{N} x_i(y_i - a x_i - b) = 0 \\ \sum_{i=1}^{N} (y_i - a x_i - b) = 0 \end{cases} Es un sistema de ecuaciones con las dos incógnitas a y b. Expandimos las sumas.
\begin{cases} \sum_{i=1}^{N} x_iy_i - a \sum_{i=1}^{N} x_i x_i - \sum_{i=1}^{N} x_i b = 0 \\ \sum_{i=1}^{N} y_i - a\sum_{i=1}^{N} x_i - \sum_{i=1}^{N} b = 0 \end{cases} Ahora reescribimos el sistema de ecuaciones con los términos que contienen a y b a la izquierda y todos los demás términos a la derecha de la siguiente manera
\begin{cases} a \sum_{i=1}^{N} x_i^2 + b \sum_{i=1}^{N} x_i = \sum_{i=1}^{N} x_iy_i \\ a\sum_{i=1}^{N} x_i + b N = \sum_{i=1}^{N} y_i \end{cases} El sistema anterior en forma matricial se escribe como \[ \begin{bmatrix} \sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\ \sum_{i=1}^{N} x_i & N \end{bmatrix} \begin{bmatrix} a \\ b \end{bmatrix} = \begin{bmatrix} \sum_{i=1}^{N} x_iy_i \\ \sum_{i=1}^{N} y_i \end{bmatrix} \] El sistema anterior puede resolverse utilizando la matriz inversa de la siguiente manera \[ \begin{bmatrix} a \\ b \end{bmatrix} = \begin{bmatrix} \sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\ \sum_{i=1}^{N} x_i & N \end{bmatrix}^{-1} \begin{bmatrix} \sum_{i=1}^{N} x_iy_i \\ \sum_{i=1}^{N} y_i \end{bmatrix} \] donde usamos la inversa de una matriz de 2 por 2 para encontrar \[ \begin{bmatrix} \sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\ \sum_{i=1}^{N} x_i & N \end{bmatrix}^{ -1} = \dfrac{1}{N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \begin{bmatrix} N & - \sum_{i=1}^{N} x_i \\ - \sum_{i=1}^{N} x_i & \sum_{i=1}^{N} x_i^2 \end{bmatrix} \] Finalmente \[ \begin{bmatrix} a \\ b \end{bmatrix} = \dfrac{1}{N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \begin{bmatrix} N & - \sum_{i=1}^{N} x_i \\ - \sum_{i=1}^{N} x_i & \sum_{i=1}^{N} x_i^2 \end{bmatrix} \begin{bmatrix} \sum_{i=1}^{N} x_iy_i \\ \sum_{i=1}^{N} y_i \end{bmatrix} \] donde \[ a = \dfrac{N \sum_{i=1}^{N} x_iy_i - (\sum_{i=1}^{N} x_i)(\sum_{i=1}^{N} y_i)} {N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \]
\[ b = \dfrac{ - (\sum_{i=1}^{N} x_i) (\sum_{i=1}^{N} x_i y_i) + (\sum_{i=1}^{N} x_i^2)( \sum_{i=1}^{N}y_i) } {N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \]

Ejemplo de Aplicación del Ajuste Lineal por Mínimos Cuadrados

Encuentre el ajuste lineal por mínimos cuadrados y = a x + b para los puntos de datos experimentales dados por: {(1 , 2) , (3 , 4) , (2 , 6) , (4 , 8) , (5 , 12) , (6 , 13) , (7 , 15)}
Solución
Configure una tabla con las cantidades incluidas en las fórmulas anteriores para a y b.

\(x_i\)	\(y_i\)	\(x_i\) \(y_i\)	\(x_i^{2}\)
1	2	2	1
3	4	12	9
2	6	12	4
4	8	32	16
5	12	60	25
6	13	78	36
7	15	105	49

El número total de puntos es N = 7.

\( \sum_{i=1}^{7} x_i \) = 1 + 3 + 2 + 4 + 5 + 6 + 7 = 28

\( \sum_{i=1}^{7} y_i \) = 2 + 4 + 6 + 8 + 12 + 13 + 15 = 60

\( \sum_{i=1}^{7} x_iy_i \) = 2 + 12 + 12 + 32 + 60 + 78 + 105 = 301

\( \sum_{i=1}^{7} x_i^2 \) = 1 + 9 + 4 + 16 + 25 + 36 + 49 = 140

Sustituimos para obtener

\( a = \dfrac{7 \times 301 - 28 \times 60} {7 \times 140 - 28^2} = 2.17857142857 \)

\( b = \dfrac{ - 28 \times 301 + 140 \times 60 } {7 \times 140 - 28^2} = -0.14285714285 \)

Calculadora de Ajuste Lineal por Mínimos Cuadrados

Dados puntos experimentales, esta calculadora calcula los coeficientes a y b y, por lo tanto, la ecuación de la recta y = a x + b y la correlación. También traza los puntos experimentales y la ecuación y = a x + b donde a y b vienen dados por las fórmulas anteriores.
Ingrese los puntos experimentales (x₁, y₁), (x₂, y₂)... (x_N, y_N) separados por comas, verifique los datos ingresados y luego presione "Calcular y Trazar". Si tiene datos ya formateados como puntos separados por comas, puede copiarlos y pegarlos en el área de texto de entrada a continuación.
Pase el cursor del mouse en la esquina superior derecha y puede usar la opción de descargar el gráfico en formato png.

Más Referencias y Enlaces

Edwards, A. L. An Introduction to Linear Regression and Correlation. San Francisco, CA: W. H. Freeman.
Derivadas Parciales
Preguntas sobre Matriz Inversa con Soluciones
Funciones de Varias Variables
Problemas de Regresión Lineal con Soluciones
Mínimos Cuadrados Lineales (Wikipedia)