Musa da Matemática

Random Forest

Algoritmo ensemble baseado em múltiplas árvores de decisão

O que é?

A floresta aleatória (random forest) é um algoritmo de aprendizado de máquina, marca registrada por Leo Breiman e Adele Cutler, que combina a saída de várias árvores de decisão para chegar a um único resultado.

Características-chave

  • Combinação de múltiplas árvores de decisão

  • Versatilidade em problemas de classificação e regressão

  • Alta facilidade de uso e flexibilidade

Vantagens

  • Redução do overfitting através do ensemble de árvores

  • Robusto a outliers e ruídos nos dados

  • Fornece medidas de importância das variáveis

Aplicações

  • Previsão de valores contínuos (regressão)

  • Classificação de categorias

  • Análise de importância de features

Resultados do Modelo

Análise detalhada das métricas de performance do modelo em dados de treino e validação.

R² Score

Training

0.9921

Validation

0.9616

RMSE

Training

1.5117

Validation

3.3578

Erro Máximo

Training

30.5270

Validation

30.6990

Análise de Performance

Coeficiente de Determinação (R²)

O modelo apresenta R² de 0.9616 na validação, indicando que 96.16% da variabilidade dos dados é explicada pelo modelo.

Erro Quadrático Médio (RMSE)

O RMSE de 3.3578 na validação indica o erro médio das predições em unidades da variável alvo.

Erro Máximo

O erro máximo de 30.6990 na validação representa o pior caso de predição do modelo.