Musa da Matemática

Bem-vindo ao Geometrica

Um trabalho do Projeto Integrador IV que contempla a análise comparativa de modelos de machine learning.

Sobre o Dataset

Para a análise foi escolhido um dataset de uma planta enérgica de ciclo combinado. O conjunto de dados contém 9.568 pontos de dados coletados de uma Usina de Ciclo Combinado ao longo de 6 anos (2006-2011), quando a usina foi configurada para trabalhar com carga total. Os dados foram obtidos do UCI Machine Learning Repository.

Características dos Dados

  • Temperatura (T): variando entre 1.81°C e 37.11°C
  • Pressão Ambiente (AP): entre 992.89-1033.30 milibar
  • Umidade Relativa (RH): entre 25.56% e 100.16%
  • Potência Elétrica (PE): entre 420.26-495.76 MW (variável alvo)

Análise de Sensibilidade

Na análise do nosso dataset, identificamos a relação entre as variáveis independentes (inputs do modelo) e a variável dependente (output - Potência Elétrica) através do coeficiente de correlação de Pearson.

Tipos de Variáveis

Variáveis Independentes: São os inputs do modelo que influenciam o resultado. Em nosso caso, são as condições ambientais medidas.

Variável Dependente: É o output que queremos prever - a Potência Elétrica gerada pela usina.

Variável IndependenteCoeficiente Pearson (r)
Temperatura Ambiente (TA)-0.95
Vácuo de Exaustão (VE)-0.87
Pressão Ambiente (PA)0.52
Umidade Relativa (UR)0.39

Interpretação

  • Temperatura Ambiente (-0.95): Apresenta forte correlação negativa, indicando que aumentos na temperatura tendem a reduzir significativamente a potência elétrica gerada.
  • Vácuo de Exaustão (-0.87): Também possui correlação negativa forte, sugerindo impacto considerável na redução da potência.
  • Pressão Ambiente (0.52): Correlação positiva moderada, indicando que aumentos na pressão tendem a aumentar a potência gerada.
  • Umidade Relativa (0.39): Correlação positiva fraca, sugerindo menor influência na potência gerada.

Metodologia

Utilizamos três diferentes abordagens de machine learning:

  • Regressão Linear - Modelo estatístico básico e interpretável
  • Support Vector Machine - Algoritmo robusto para regressão não-linear
  • Random Forest - Ensemble learning para capturar relações complexas

Orientador

Luis Pedro Dragão Jeronimo

Equipe

Gabriel Tomazini Ferreira

Carmen Silvia Mello Wiezel

Felipe Machini Malachias Marques

Odecio Luiz de Oliveira Souza

Tamiris Baptista Camargo

Polos

Ribeirão Preto - SP

Altinopolis - SP

São Simão - SP

Santa Cruz da Esperança - SP

Créditos do Dataset

Dataset disponibilizado por Pınar Tüfekci e Heysem Kaya no UCI Machine Learning Repository sob licença Creative Commons Attribution 4.0 International (CC BY 4.0).