
Geometrica
Predição e Análise
Bem-vindo ao Geometrica
Um trabalho do Projeto Integrador IV que contempla a análise comparativa de modelos de machine learning.
Sobre o Dataset
Para a análise foi escolhido um dataset de uma planta enérgica de ciclo combinado. O conjunto de dados contém 9.568 pontos de dados coletados de uma Usina de Ciclo Combinado ao longo de 6 anos (2006-2011), quando a usina foi configurada para trabalhar com carga total. Os dados foram obtidos do UCI Machine Learning Repository.
Características dos Dados
- Temperatura (T): variando entre 1.81°C e 37.11°C
- Pressão Ambiente (AP): entre 992.89-1033.30 milibar
- Umidade Relativa (RH): entre 25.56% e 100.16%
- Potência Elétrica (PE): entre 420.26-495.76 MW (variável alvo)
Análise de Sensibilidade
Na análise do nosso dataset, identificamos a relação entre as variáveis independentes (inputs do modelo) e a variável dependente (output - Potência Elétrica) através do coeficiente de correlação de Pearson.
Tipos de Variáveis
Variáveis Independentes: São os inputs do modelo que influenciam o resultado. Em nosso caso, são as condições ambientais medidas.
Variável Dependente: É o output que queremos prever - a Potência Elétrica gerada pela usina.
Variável Independente | Coeficiente Pearson (r) |
---|---|
Temperatura Ambiente (TA) | -0.95 |
Vácuo de Exaustão (VE) | -0.87 |
Pressão Ambiente (PA) | 0.52 |
Umidade Relativa (UR) | 0.39 |
Interpretação
- Temperatura Ambiente (-0.95): Apresenta forte correlação negativa, indicando que aumentos na temperatura tendem a reduzir significativamente a potência elétrica gerada.
- Vácuo de Exaustão (-0.87): Também possui correlação negativa forte, sugerindo impacto considerável na redução da potência.
- Pressão Ambiente (0.52): Correlação positiva moderada, indicando que aumentos na pressão tendem a aumentar a potência gerada.
- Umidade Relativa (0.39): Correlação positiva fraca, sugerindo menor influência na potência gerada.
Metodologia
Utilizamos três diferentes abordagens de machine learning:
- Regressão Linear - Modelo estatístico básico e interpretável
- Support Vector Machine - Algoritmo robusto para regressão não-linear
- Random Forest - Ensemble learning para capturar relações complexas
Orientador
Luis Pedro Dragão Jeronimo
Equipe
Gabriel Tomazini Ferreira
Carmen Silvia Mello Wiezel
Felipe Machini Malachias Marques
Odecio Luiz de Oliveira Souza
Tamiris Baptista Camargo
Polos
Ribeirão Preto - SP
Altinopolis - SP
São Simão - SP
Santa Cruz da Esperança - SP
Créditos do Dataset
Dataset disponibilizado por Pınar Tüfekci e Heysem Kaya no UCI Machine Learning Repository sob licença Creative Commons Attribution 4.0 International (CC BY 4.0).