51º Congresso Brasileiro de Geologia

Dados da Submissão


Título

O USO DE MACHINE LEARNING NA IDENTIFICAÇÃO LITOLÓGICA A PARTIR DE DADOS DE PERFIS GEOFÍSICOS DE POÇOS ESTRATIGRÁFICOS

Texto do resumo

Durante a perfuração de um poço de petróleo, são obtidas amostras de calha, que em conjunto com os perfis geofísicos auxiliam na avaliação das propriedades das rochas e caracterização do reservatório, e como suporte na interpretação dos perfis, pode-se utilizar o Machine Learning. Deste modo, utilizou-se o Aprendizado de Máquina supervisionado para classificação da litologia de perfis geofísicos de quatro poços estratigráficos do Campo de Mexilhão na Bacia de Santos, em que se utilizou os perfis de raios gama, resistividade, densidade e perfil neutrônico e os algoritmos KNN (k-vizinhos mais próximos) e Floresta Aleatória que foram implementados na linguagem de programação Python 3. Para a classificação foram seguidos cinco passos principais: 1) seleção de dados; 2) pré-processamento; 3) separação do conjunto de dados em treino, teste e blind; 4) treinamento; e 5) métricas de avaliação. A seleção dos dados consistiu na escolha dos poços de acordo com as propriedades físicas presentes em cada um deles. No pré-processamento foi realizada limpeza dos dados com exclusão de valores nulos e outliers, bem como a aplicação de rótulos para os poços com a identificação da litologia, tendo como base o perfil AGP que, com a filtragem, foram classificadas 5 litologias (arenito, siltito, folhelho, marga e calcário). Na terceira etapa, separou-se um dos poços para ser utilizado como validação cega (blind) dos dados, enquanto que os demais, foram aleatoriamente separados em conjunto de treinamento e teste na proporção de 80% e 20%. No treinamento, aplicou-se os algoritmos KNN e Floresta Aleatória. Por fim, com o objetivo de avaliar a performance das classificações obtidas pelos algoritmos utilizados, foi calculada uma matriz de confusão para os dados de treinamento, teste e para o blind. Para o KNN, obteve-se como resultado acurácia de 93% no treinamento, 92% no teste e de 83% na aplicação do blind, com acerto final maior que 50% somente para o arenito (89%) e o folhelho (87%), zerando para a marga. Para a Floresta Aleatória, chegou-se a uma acurácia de 99% no treinamento, 98% no teste e de 82% na aplicação do blind, com valor de acerto final maior que 50% somente para o arenito (89%) e o folhelho (84%) e zerando para a marga. Ao analisar a matriz de confusão de ambos os algoritmos, é observado que o maior erro nos dados está relacionado com a classificação de siltito, calcário e marga, os quais foram classificados como folhelho ou como arenito. O folhelho e o arenito permaneceram com alta taxa de acerto. Durante a etapa de pré-processamento, observou-se que, quando aplicado o teor de argilosidade para o siltito, esse apresentava picos para argilosidade característico de arenito e folhelho, com apenas uma parte correspondente ao que é atribuído para o próprio siltito, levando a reclassificação da litologia entre arenito, folhelho e siltito. Essa dificuldade na classificação da litologia, juntamente com acurácias menores que 40%, chegando até 20% para ambos os algoritmos, levantou duas hipóteses como justificativa: a primeira é atribuída a qualidade dos dados utilizados, desde a aquisição até a interpretação dos perfis recebidos, e a segunda, à limitação dos métodos de classificação ao analisar litologias com várias frações granulométricas juntas, que podem representar camadas derivadas de processos turbidíticos como é o caso das rochas pertencentes à Formação Juréia, Itajaí-Açu (Grupo Ilhabela) e à Marambaia.

Palavras Chave

Perfil geofísico; Machine Learning; KNN; Floresta aleatória; Classificação litológica.

Área

TEMA 16 - Geoquantificação e Geotecnologias

Autores/Proponentes

Andressa Rizzi Kuzjman, Carolina Danielski Aquino, Alexsandro Guerra Cerqueira, Filipe Moura Antonio Cordeiro