Sean (x1, y1), (x2, y2)... (xN, yN) puntos de datos experimentales como se muestra en el diagrama de dispersión a continuación y supongamos que queremos predecir la variable dependiente y para diferentes valores de la variable independiente x usando un modelo lineal de la forma
y = a x + b
Figura 1. Diagrama de dispersión
Un procedimiento ampliamente utilizado en matemáticas es minimizar la suma D de los cuadrados de las distancias verticales d1, d2, ... entre el modelo matemático y = f(x) y los puntos experimentales como se muestra en el gráfico a continuación.
Figura 2. Ajuste por mínimos cuadrados de un modelo a los datos
Sea \( f(x) = a x + b \) el modelo lineal a utilizar. Por lo tanto, las distancias verticales \(d_1, d_2, ... \) vienen dadas por
La suma D de los cuadrados de las distancias verticales d1, d2, ... puede escribirse como
\[ D = \sum_{i=1}^{N} (y_i - (a x_i + b))^2 \]
Los valores de a y b que minimizan D son los valores que hacen que las derivadas parciales de D con respecto a a y b sean simultáneamente iguales a 0. Por lo tanto, primero calculamos las dos derivadas:
\[ \dfrac {\partial D}{\partial a} = \sum_{i=1}^{N} - 2 x_i(y_i - a x_i - b) \]
\[ \dfrac {\partial D}{\partial b } = \sum_{i=1}^{N} - 2 (y_i - a x_i - b) \]
luego resolvemos para \( a \) y \( b \) el sistema de ecuaciones
\begin{cases}
\sum_{i=1}^{N} - 2 x_i(y_i - a x_i - b) = 0 \\
\sum_{i=1}^{N} - 2 (y_i - a x_i - b) = 0
\end{cases}
Dividimos ambos lados de cada ecuación por -2 y simplificamos para reescribir el sistema de ecuaciones como
\begin{cases}
\sum_{i=1}^{N} x_i(y_i - a x_i - b) = 0 \\
\sum_{i=1}^{N} (y_i - a x_i - b) = 0
\end{cases}
Es un sistema de ecuaciones con las dos incógnitas a y b. Expandimos las sumas.
\begin{cases}
\sum_{i=1}^{N} x_iy_i - a \sum_{i=1}^{N} x_i x_i - \sum_{i=1}^{N} x_i b = 0 \\
\sum_{i=1}^{N} y_i - a\sum_{i=1}^{N} x_i - \sum_{i=1}^{N} b = 0
\end{cases}
Ahora reescribimos el sistema de ecuaciones con los términos que contienen a y b a la izquierda y todos los demás términos a la derecha de la siguiente manera
\begin{cases}
a \sum_{i=1}^{N} x_i^2 + b \sum_{i=1}^{N} x_i = \sum_{i=1}^{N} x_iy_i \\
a\sum_{i=1}^{N} x_i + b N = \sum_{i=1}^{N} y_i
\end{cases}
El sistema anterior en forma matricial se escribe como
\[
\begin{bmatrix}
\sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\
\sum_{i=1}^{N} x_i & N
\end{bmatrix} \begin{bmatrix}
a \\
b
\end{bmatrix} = \begin{bmatrix}
\sum_{i=1}^{N} x_iy_i \\
\sum_{i=1}^{N} y_i
\end{bmatrix}
\]
El sistema anterior puede resolverse utilizando la matriz inversa de la siguiente manera
\[
\begin{bmatrix}
a \\
b
\end{bmatrix} = \begin{bmatrix}
\sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\
\sum_{i=1}^{N} x_i & N
\end{bmatrix}^{-1} \begin{bmatrix}
\sum_{i=1}^{N} x_iy_i \\
\sum_{i=1}^{N} y_i
\end{bmatrix}
\]
donde usamos la inversa de una matriz de 2 por 2 para encontrar
\[
\begin{bmatrix}
\sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\
\sum_{i=1}^{N} x_i & N
\end{bmatrix}^{ -1} = \dfrac{1}{N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \begin{bmatrix}
N & - \sum_{i=1}^{N} x_i \\
- \sum_{i=1}^{N} x_i & \sum_{i=1}^{N} x_i^2
\end{bmatrix}
\]
Finalmente
\[
\begin{bmatrix}
a \\
b
\end{bmatrix} =
\dfrac{1}{N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \begin{bmatrix}
N & - \sum_{i=1}^{N} x_i \\
- \sum_{i=1}^{N} x_i & \sum_{i=1}^{N} x_i^2
\end{bmatrix}
\begin{bmatrix}
\sum_{i=1}^{N} x_iy_i \\
\sum_{i=1}^{N} y_i
\end{bmatrix}
\]
donde
\[
a = \dfrac{N \sum_{i=1}^{N} x_iy_i - (\sum_{i=1}^{N} x_i)(\sum_{i=1}^{N} y_i)} {N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2}
\]
\[
b = \dfrac{ - (\sum_{i=1}^{N} x_i) (\sum_{i=1}^{N} x_i y_i) + (\sum_{i=1}^{N} x_i^2)( \sum_{i=1}^{N}y_i) } {N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2}
\]
Ejemplo de Aplicación del Ajuste Lineal por Mínimos Cuadrados
Encuentre el ajuste lineal por mínimos cuadrados y = a x + b para los puntos de datos experimentales dados por:
{(1 , 2) , (3 , 4) , (2 , 6) , (4 , 8) , (5 , 12) , (6 , 13) , (7 , 15)}
Solución
Configure una tabla con las cantidades incluidas en las fórmulas anteriores para a y b.
Calculadora de Ajuste Lineal por Mínimos Cuadrados
Dados puntos experimentales, esta calculadora calcula los coeficientes a y b y, por lo tanto, la ecuación de la recta y = a x + b y la correlación. También traza los puntos experimentales y la ecuación y = a x + b donde a y b vienen dados por las fórmulas anteriores.
Ingrese los puntos experimentales (x1, y1), (x2, y2)... (xN, yN) separados por comas, verifique los datos ingresados y luego presione "Calcular y Trazar". Si tiene datos ya formateados como puntos separados por comas, puede copiarlos y pegarlos en el área de texto de entrada a continuación.
Pase el cursor del mouse en la esquina superior derecha y puede usar la opción de descargar el gráfico en formato png.
Más Referencias y Enlaces
Edwards, A. L. An Introduction to Linear Regression and Correlation. San Francisco, CA: W. H. Freeman.