Musa da Matemática

Regressão Linear

Modelo estatístico para análise de relações entre variáveis contínuas

O que é?

O modelo de regressão linear múltipla é um modelo estatístico versátil para avaliar relacionamentos entre um destino contínuo e os preditores.

Características

  • Suporta preditores contínuos, categóricos e derivados

  • Permite modelagem de relacionamentos não lineares

  • Inclui termo constante (interceptação) no modelo

Detalhamento Técnico

O modelo é linear porque consiste em termos aditivos em que cada termo é um preditor que é multiplicado por um coeficiente estimado. O termo constante (interceptação) normalmente também é incluído no modelo.

A regressão linear é usada para gerar insights para gráficos que contêm pelo menos dois campos contínuos com um identificado como o destino e o outro como um preditor. Além disso, um preditor categórico e dois campos contínuos auxiliares podem ser especificados em um gráfico e usados para gerar um modelo de regressão apropriado.

A significância estatística do modelo é avaliada através de testes estatísticos apropriados, e sua performance é medida através de métricas como R², RMSE e Erro Máximo.

Resultados do Modelo

Análise detalhada das métricas de performance do modelo em dados de treino e validação.

R² Score

Training

0.9277

Validation

0.9325

RMSE

Training

4.5854

Validation

4.4422

Erro Máximo

Training

43.4339

Validation

31.0151

Análise de Performance

Coeficiente de Determinação (R²)

O modelo apresenta R² de 0.9325 na validação, indicando que 93.25% da variabilidade dos dados é explicada pelo modelo.

Erro Quadrático Médio (RMSE)

O RMSE de 4.4422 na validação indica o erro médio das predições em unidades da variável alvo.

Erro Máximo

O erro máximo de 31.0151 na validação representa o pior caso de predição do modelo.