Sea (x1, y1), (x2, y2)... (xN, yN) un conjunto de puntos de datos experimentales como se muestra en el diagrama de dispersión a continuación y supongamos que queremos predecir la variable dependiente y para diferentes valores de la variable independiente x usando un modelo lineal de la forma
y = a x + b
Un procedimiento ampliamente utilizado en matemáticas es minimizar la suma D de los cuadrados de las distancias verticales d1, d2, ... entre el modelo matemático y = f(x) y los puntos experimentales como se muestra en el gráfico a continuación.
Sea \( f(x) = a x + b \) el modelo lineal a utilizar. Por lo tanto, las distancias verticales \(d_1, d_2, ... \) están dadas por
La suma D de los cuadrados de las distancias verticales d1, d2, ... puede escribirse como
\[ D = \sum_{i=1}^{N} (y_i - (a x_i + b))^2 \]
Los valores de a y b que minimizan D son los valores que hacen que las derivadas parciales de D con respecto a a y b sean simultáneamente iguales a 0. Por lo tanto, primero calculamos las dos derivadas:
\[ \dfrac {\partial D}{\partial a} = \sum_{i=1}^{N} - 2 x_i(y_i - a x_i - b) \]
\[ \dfrac {\partial D}{\partial b } = \sum_{i=1}^{N} - 2 (y_i - a x_i - b) \]
luego resolvemos para \( a \) y \( b \) el sistema de ecuaciones
\begin{cases}
\sum_{i=1}^{N} - 2 x_i(y_i - a x_i - b) = 0 \\
\sum_{i=1}^{N} - 2 (y_i - a x_i - b) = 0
\end{cases}
Divida ambos lados de cada ecuación por - 2 y simplifique para reescribir el sistema de ecuaciones como
\begin{cases}
\sum_{i=1}^{N} x_i(y_i - a x_i - b) = 0 \\
\sum_{i=1}^{N} (y_i - a x_i - b) = 0
\end{cases}
Es un sistema de ecuaciones con los dos desconocidos a y b. Expandir las sumas.
\begin{cases}
\sum_{i=1}^{N} x_iy_i - a \sum_{i=1}^{N} x_i x_i - \sum_{i=1}^{N} x_i b = 0 \\
\sum_{i=1}^{N} y_i - a\sum_{i=1}^{N} x_i - \sum_{i=1}^{N} b = 0
\end{cases}
Ahora reescribimos el sistema de ecuaciones con los términos que contienen a y b a la izquierda y todos los demás términos a la derecha de la siguiente manera
\begin{cases}
a \sum_{i=1}^{N} x_i^2 + b \sum_{i=1}^{N} x_i = \sum_{i=1}^{N} x_iy_i \\
a\sum_{i=1}^{N} x_i + b N = \sum_{i=1}^{N} y_i
\end{cases}
El sistema anterior en forma matricial se escribe como
\[
\begin{bmatrix}
\sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\
\sum_{i=1}^{N} x_i & N
\end{bmatrix} \begin{bmatrix}
a \\
b
\end{bmatrix} = \begin{bmatrix}
\sum_{i=1}^{N} x_iy_i \\
\sum_{i=1}^{N} y_i
\end{bmatrix}
\]
El sistema anterior se puede resolver usando la matriz inversa de la siguiente manera
\[
\begin{bmatrix}
a \\
b
\end{bmatrix} = \begin{bmatrix}
\sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\
\sum_{i=1}^{N} x_i & N
\end{bmatrix}^{-1} \begin{bmatrix}
\sum_{i=1}^{N} x_iy_i \\
\sum_{i=1}^{N} y_i
\end{bmatrix}
\]
donde usamos la inversa de una matriz 2 por 2 para encontrar
\[
\begin{bmatrix}
\sum_{i=1}^{N} x_i^2 & \sum_{i=1}^{N} x_i \\
\sum_{i=1}^{N} x_i & N
\end{bmatrix}^{ -1} = \dfrac{1}{N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \begin{bmatrix}
N & - \sum_{i=1}^{N} x_i \\
- \sum_{i=1}^{N} x_i & \sum_{i=1}^{N} x_i^2
\end{bmatrix}
\]
Finalmente
\[
\begin{bmatrix}
a \\
b
\end{bmatrix} =
\dfrac{1}{N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2} \begin{bmatrix}
N & - \sum_{i=1}^{N} x_i \\
- \sum_{i=1}^{N} x_i & \sum_{i=1}^{N} x_i^2
\end{bmatrix}
\begin{bmatrix}
\sum_{i=1}^{N} x_iy_i \\
\sum_{i=1}^{N} y_i
\end{bmatrix}
\]
donde
\[
a = \dfrac{N \sum_{i=1}^{N} x_iy_i - (\sum_{i=1}^{N} x_i)(\sum_{i=1}^{N} y_i)} {N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2}
\]
\[
b = \dfrac{ - (\sum_{i=1}^{N} x_i) (\sum_{i=1}^{N} x_i y_i) + (\sum_{i=1}^{N} x_i^2)( \sum_{i=1}^{N}y_i) } {N \sum_{i=1}^{N} x_i^2 - (\sum_{i=1}^{N} x_i)^2}
\]
Ejemplo de Aplicación del Ajuste por Mínimos Cuadrados Lineales
Encuentra el ajuste por mínimos cuadrados lineales y = a x + b para los puntos de datos experimentales dados por:
{(1 , 2) , (3 , 4) , (2 , 6) , (4 , 8) , (5 , 12) , (6 , 13) , (7 , 15)}
Solución
Configura una tabla con las cantidades incluidas en las fórmulas anteriores para m y b.
Calculadora de Ajuste por Mínimos Cuadrados Lineales
Dado puntos experimentales, esta calculadora calcula los coeficientes a y b y por lo tanto la ecuación de la línea y = a x + b y la correlación. También traza los puntos experimentales y la ecuación y = a x + b donde a y b son dados por las fórmulas anteriores.
Ingresa los puntos experimentales (x1, y1), (x2, y2)... (xN, yN) separados por comas, verifica los datos ingresados y luego presiona "Calcular y Graficar". Si ya tienes datos formateados como puntos separados por comas, puedes copiarlos y pegarlos en el área de texto de entrada a continuación.
Pasa el cursor del ratón en la parte superior derecha y puedes usar la opción de descargar el gráfico en formato png.
Más Referencias y Enlaces
Edwards, A. L. Introducción a la Regresión Lineal y la Correlación. San Francisco, CA: W. H. Freeman.