
Geometrica
Predição e Análise
Random Forest
Algoritmo ensemble baseado em múltiplas árvores de decisão
O que é?
A floresta aleatória (random forest) é um algoritmo de aprendizado de máquina, marca registrada por Leo Breiman e Adele Cutler, que combina a saída de várias árvores de decisão para chegar a um único resultado.
Características-chave
Combinação de múltiplas árvores de decisão
Versatilidade em problemas de classificação e regressão
Alta facilidade de uso e flexibilidade
Vantagens
Redução do overfitting através do ensemble de árvores
Robusto a outliers e ruídos nos dados
Fornece medidas de importância das variáveis
Aplicações
Previsão de valores contínuos (regressão)
Classificação de categorias
Análise de importância de features
Resultados do Modelo
Análise detalhada das métricas de performance do modelo em dados de treino e validação.
R² Score
Training
0.9921
Validation
0.9616
RMSE
Training
1.5117
Validation
3.3578
Erro Máximo
Training
30.5270
Validation
30.6990
Análise de Performance
Coeficiente de Determinação (R²)
O modelo apresenta R² de 0.9616 na validação, indicando que 96.16% da variabilidade dos dados é explicada pelo modelo.
Erro Quadrático Médio (RMSE)
O RMSE de 3.3578 na validação indica o erro médio das predições em unidades da variável alvo.
Erro Máximo
O erro máximo de 30.6990 na validação representa o pior caso de predição do modelo.