Problemas de regressão linear e modelagem são apresentados junto com suas soluções na parte inferior da página. Além disso, uma calculadora e gráfico de regressão linear pode ser usada para verificar respostas e criar mais oportunidades para a prática.
Revisão
Se o gráfico de n pares de dados (x, y) para um experimento parece indicar uma "relação linear" entre y e x, então o método de mínimos quadrados podem ser usados para escrever uma relação linear entre x e y.
A linha de regressão de mínimos quadrados é a linha que minimiza a soma dos quadrados (d1 + d2 + d3 + d4) do desvio vertical de cada ponto de dados até a linha (veja a figura abaixo como exemplo de 4 pontos).
A linha de regressão de mínimos quadrados para o conjunto de n pontos de dados é dada pela equação de uma linha na forma de interceptação de inclinação:
y = ax + b
onde a e b são dados por
Problema 1
Considere o seguinte conjunto de pontos: {(-2 , -1) , (1 , 1) , (3 , 2)}
a) Encontre a linha de regressão de mínimos quadrados para os pontos de dados fornecidos.
b) Trace os pontos dados e a linha de regressão no mesmo sistema retangular de eixos.
Problema 2
a) Encontre a linha de regressão de mínimos quadrados para o seguinte conjunto de dados
{(-1 , 0),(0 , 2),(1 , 4),(2 , 5)}
b) Trace os pontos dados e a linha de regressão no mesmo sistema retangular de eixos.
Problema 3
Os valores de y e seus valores correspondentes de y são mostrados na tabela abaixo
x
0
1
2
3
4
y
2
3
5
4
6
a) Encontre a linha de regressão de mínimos quadrados y = a x + b.
b) Estime o valor de y quando x = 10.
Problema 4
As vendas de uma empresa (em milhões de dólares) para cada ano são mostradas na tabela abaixo.
x (ano)
2005
2006
2007
2008
2009
y (vendas)
12
19
29
37
45
a) Encontre a linha de regressão de mínimos quadrados y = a x + b.
b) Utilize a reta de regressão de mínimos quadrados como modelo para estimar as vendas da empresa em 2012.
Soluções para os problemas acima
a) Vamos organizar os dados em uma tabela.
x
y
x y
x 2
-2
-1
2
4
1
1
1
1
3
2
6
9
Σx = 2
Σy = 2
Σxy = 9
Σx2 = 14
Agora usamos a fórmula acima para calcular a e b da seguinte forma
a = (nΣx y - ΣxΣy) / (nΣx2 - (Σx)2) = (3*9 - 2*2 ) / (3*14 - 22) = 23/38
b = (1/n)(Σy - a Σx) = (1/3)(2 - (23/38)*2) = 5/19
b) Agora representamos graficamente a reta de regressão dada por y = a x + b e os pontos dados.
a) Usamos uma tabela como segue
x
y
x y
x 2
-1
0
0
1
0
2
0
0
1
4
4
1
2
5
10
4
Σx = 2
Σy = 11
Σx y = 14
Σx2 = 6
Agora usamos a fórmula acima para calcular a e b da seguinte forma
a = (nΣx y - ΣxΣy) / (nΣx2 - (Σx)2) = (4*14 - 2*11 ) / (4*6 - 22) = 17/10 = 1,7
b = (1/n)(Σy - a Σx) = (1/4)(11 - 1,7*2) = 1,9
b) Agora representamos graficamente a reta de regressão dada por y = ax + b e os pontos dados.
a) Usamos uma tabela para calcular a e b.
x
y
x y
x 2
0
2
0
0
1
3
3
1
2
5
10
4
3
4
12
9
4
6
24
16
Σx = 10
Σy = 20
Σx y = 49
Σx2 = 30
Agora calculamos a e b usando as fórmulas de regressão de mínimos quadrados para a e b.
a = (nΣx y - ΣxΣy) / (nΣx2 - (Σx)2) = (5*49 - 10*20 ) / (5*30 - 102) = 0,9
b = (1/n)(Σy - a Σx) = (1/5)(20 - 0,9*10) = 2,2
b) Agora que temos a reta de regressão de mínimos quadrados y = 0,9 x + 2,2 . Substitua x por 10 para encontrar o valor do y correspondente.
y = 0,9 * 10 + 2,2 = 11,2
a) Primeiro mudamos a variável x para t de modo que t = x - 2005 e, portanto, t representa o número de anos após 2005. Usar t em vez de x torna os números menores e, portanto, gerenciáveis. A tabela de valores torna-se.
t (número de anos após 2005)
0
1
2
3
4
y (vendas)
12
19
29
37
45
Agora usamos a tabela para calcular a e b incluídas na fórmula da linha de regressão mínima.
t
y
t y
t 2
0
12
0
0
1
19
19
1
2
29
58
4
3
37
111
9
4
45
180
16
Σx = 10
Σy = 142
Σxy = 368
Σx2 = 30
Agora calculamos a e b usando as fórmulas de regressão de mínimos quadrados para a e b.
a = (nΣt y - ΣtΣy) / (nΣt2 - (Σt)2) = (5*368 - 10*142 ) / (5*30 - 102) = 8,4
b = (1/n)(Σy - a Σx) = (1/5)(142 - 8,4*10) = 11,6
b) Em 2012, t = 2012 - 2005 = 7
As vendas estimadas em 2012 são: y = 8,4 * 7 + 11,6 = 70,4 milhões de dólares.