Ajuste por mínimos quadrados: versão papel e caneta

Algumas grandezas só podem ser medidas de forma indireta. O que significa que é necessário um modelo teórico que associe a grandeza de interesse a grandezas que podem ser medidas diretamente. Um ótimo exemplo para isso é a medida da aceleração da gravidade através do movimento de um corpo sob a ação da força gravitacional. Neste caso, a grandeza de interesse é a aceleração de um corpo em queda livre. Podemos usar a equação do tempo de queda t_q de um corpo em queda livre a partir do repouso por uma dada altura h. A equação, para o caso sem resistência do ar, é

t_q^2 = \frac{2h}{g}\qquad \qquad \qquad \qquad (1)

Observe que o quadrado do tempo de queda é diretamente proporcional à altura da queda. Além disso, a constante de proporcionalidade está diretamente ligada à aceleração da gravidade g.

Muitas vezes, os resultados experimentais de uma dada grandeza de interesse podem ser obtidos como função de outra grandeza acessível do experimento realizado. Continuando com o caso de um corpo em queda livre, o quadrado do tempo de queda é uma função linear da altura. Isto indica que se for possível medir diferentes valores de t_q para diferentes valores de h, podemos verificar a linearidade da dependência e usar essa linearidade para calcular com maior confiança o valor da constante de proporcionalidade e, portanto o valor de g.

Considere que após a realização do experimento, tenhamos obtido o conjunto \{y_1, y_2, y_3, ..., y_N\} para os valores calculados de t_q^2 para diferentes valores de alturas h \{x_1, x_2, x_3, ..., x_N\} , respectivamente. O gráfico da Figura 01 mostra a dependência dos dados experimentais de t_q^2 vs. h (círculos pretos). Por questão de simplicidade, não mostraremos as barras de erros das medidas.

figura01menor

Figura 01

Pela Eq. 01, sabemos que a relação entre t_q^2 e h deve ser linear. Observe que o gráfico da Figura 01 também mostra duas retas (azul e vermelha). Qual destas retas melhor representa os dados experimentais? Note que nenhuma das duas cruza a origem dos eixos. Você pode usar diferentes argumentos para decidir qual das retas melhor representa os dados experimentais.

Método de mínimos quadrados para funções lineares

O objetivo deste texto é apresentar um método numérico que permita a obtenção dos coeficientes linear e angular de uma reta que seja uma boa representação dos dados experimentais. Este método se chama ajuste por mínimos quadrados. Considere a função linear

f(x)=a+bx\qquad \qquad \qquad \qquad (2)

Podemos quantificar a separação entre o valor da função f e o valor medido da grandeza y para um dado valor de x. Esta separação (distância) pode ser calculada como

d_i = f(x_i) - y_i\qquad \qquad \qquad \qquad (3)

figura02menor

Figura 02

A Figura 02 mostra um gráfico com um conjunto de pontos experimentais e uma reta que obedece uma função linear do tipo da Equação 02. Definimos então uma grandeza S que é igual a soma dos quadrados das distâncias para todos os pontos dos dados experimental.

S=\sum_{i=1}^{N}d_i^2\qquad \qquad \qquad \qquad (4)

Observe que S é uma função de a e b, coeficientes da reta na Equação 02. Assim, o método de ajuste linear consiste em encontrar os valores de a e b que minimizam o valor da função S (ver Figura 03). Daí o nome do método, ajuste por mínimos quadrados. Como encontrar os valores de a e b que minimizam S?

Figura 03

Figura 03

Sabemos que nos pontos onde S é mínimo a derivada de S com relação a a e com relação a b devem ser nulas. Lembre-se que a derivada nula não garante um ponto de mínimo. Além disso, mais de um ponto de mínimo podem ser identificados em funções mais complexas. Entretanto, isso será discutido depois. Segue-se daí que

\frac{\partial S}{\partial a} = 0 \qquad \qquad \qquad \qquad (5)

\frac{\partial S}{\partial b} = 0 \qquad \qquad \qquad \qquad (6)

Combinando as Equações de 02 a 06 e resolvendo o sistema de equações, pode-se mostrar que

a = \frac{\sum y_i - b \sum x_i}{N} \qquad \qquad \qquad \qquad (7)

b = \frac{N\sum x_i y_i - \sum x_i\sum y_i}{N\sum x_i^2-(\sum x_i)^2} \qquad \qquad \qquad \qquad (8)

Observe que os valores de a e b podem ser calculados a partir dos N pares de valores experimentais (x_i ,y_i ). Deste modo, a partir de um conjunto de dados experimentais, pode-se obter os coeficientes linear e angular de uma reta que melhor ajusta os dados obtidos. Se a quantidade de dados não é tão grande, é possível calcular a e b com facilidade usando as Equações 07 e 08 usando apenas uma calculadora de bolso.

Com relação à possibilidade de que as Eq. 05 e 06 satisfaçam uma condição de máximo: o que caracteriza um ponto de mínimo ou de máximo? Você pode mostrar que as soluções para a e b são de fato para mínimo. Vale a pena fazer o cálculo e ver por você mesmo. Com relação à existência de mais de um ponto de mínimo. Você já deve ter calculado que não existem pontos de máximo para a solução apresentada neste texto. É possível concluir algo sobre a unicidade da
solução?

Vamos fazer um exemplo: Tempo de queda em um plano inclinado

Vamos concluir esta texto com um exemplo prático de um experimento onde se mediu o tempo de queda (t_q^2) de um corpo em um plano inclinado para diferentes valores de deslocamento (\Delta x ) a partir do repouso. Sabemos que a relação entre essas duas grandezas é dada pela Equação (9).

\Delta x = \frac{a}{2} t_q^2\qquad \qquad \qquad \qquad (9)

A Figura 04 mostra uma tabela com o resumo do cálculo realizado para a obtenção dos valores de a e b através das equações 07 e 08.

Figura 04

Figura 04

A Figura 05 mostra um gráfico com os dados experimentais e o gráfico da reta calculado a partir dos coeficientes linear e angular, a e b, respectivamente.

Figura 05

Figura 05

Encontrou algum erro? Entra em contato e ajuda a corrigir. :)