51º Congresso Brasileiro de Geologia

Dados da Submissão


Título

O IMPACTO DA REDUÇÃO DA DIMENSIONALIDADE VIA ANÁLISE DE PCA PARA A PREDIÇÃO DO CONTEÚDO ORGÂNICO TOTAL, NA PORÇÃO OFFSHORE DA BACIA DE SANTOS, SE- BRASIL.

Texto do resumo

A análise das componentes principais (PCA) é uma técnica algébrica
muito comum no campo do aprendizado de máquina (ML) e da inteligência
artificial (IA) quando estas utilizam grandes bases de dados. Esta técnica
transforma um grupo de propriedades físicas correlacionáveis em um número
menor de propriedades físicas, chamados componentes principais. Estas
componentes retornam uma direção preferencial fruto da variância explicada
pela sua base de dados. Muitos trabalhos que utilizam a geofísica de poços de
dados de pirólise como entrada dos modelos de IA e ML chamam a atenção
para a o uso de determinadas combinações de perfis geofísicos como sendo o
melhor conjunto para o treinamento dos modelos. Neste trabalho,
apresentamos um estudo sistemático que utilizou dados de perfilagem
geofísica de poços públicos, fornecidos pela Agência Nacional do Petróleo
(ANP), com o objetivo de melhor predizer o conteúdo orgânico total (COT) em
poços que atingiram a geradora lacustre do pré-sal da Bacia de Santos.
Metodologicamente calculamos as PCAs de uma base de dados de perfilagem e treinamos um XGBoost de três maneiras diferentes a saber: (a) com os conjuntos de dados originais, (b) com os PCAs, (c) com os conjunto de dados originais e as PCAs. Por fim, fizemos a análise SHAP para descobrir qual é a direção do impacto de cada componente para o cálculo do COT. O conjunto de treinamento (a) apresentou o resultado mais promissor indicando um baixo RMS e sem o superajuste no COT calculado. O conjunto (b) não apresentou superajuste, mas representou um aumento do RMS. Enquanto que o conjunto (c) apresentou baixo RMS e alto indicativo de superajuste. Neste trabalho, apresentamos uma metodologia sistemática para análise do impacto do PCA com o auxílio da análise SHAP no cálculo da predição de COT via XGBoost, na porção off-shore da Bacia de Santos. O estudo demonstra que a PCA pode ser utilizada para reduzir a dimensionalidade dos dados de entrada na predição do COT em poços pré-sal da Bacia de Santos, mas que seu uso requer cautela, pois podem gerar superajustes nos dados calculados. E a análise SHAP foi útil para identificar os componentes mais importantes para a predição.

Palavras Chave

Bacia de Santos; PCA; COT; XGBoost; SHAP

Área

TEMA 16 - Geoquantificação e Geotecnologias

Autores/Proponentes

Pedro Vitor Abreu Affonso, Ana Luiza Spadano Albuquerque, André Luiz Belem, Victor Ribeiro Carreira, Bernardo Chede, Igor Martins Venancio, Andre Luiz Durante Spigolon