51º Congresso Brasileiro de Geologia

Dados da Submissão


Título

PREDIÇÃO DE LITOFÁCIES UTILIZANDO ALGORITMO DE APRENDIZADO DE MÁQUINA BASEADO EM MÉTRICA DE DISTÂNCIA, CAMPO DE NAMORADO, BACIA DE CAMPOS, BRASIL.

Texto do resumo

Uma das principais fases da exploração petrolífera envolve a investigação das rochas de forma indireta, por meio da análise dos dados levantados durante as etapas de perfuração e perfilagem do poço. Para isso, a partir do registro de diferentes propriedades físicas e químicas das rochas (variáveis) é possível aplicar diversos algoritmos de aprendizado de máquina (machine learning), que cada vez mais têm se mostrado úteis na indústria petrolífera e na academia para diversos fins. O atual trabalho tem como objetivo aplicar o algoritmo de aprendizado de máquina KNN, baseado em métricas de distância, para predizer fácies litológicas do poço NA02, localizado no campo de Namorado na bacia de Campos, Brasil, e amplamente utilizado em diversos estudos anteriores.
Desta forma, este estudo foi realizado utilizando dados de perfilagem do poço NA02, a partir de um script escrito em linguagem Python para processamento e visualização dos dados, utilizando dados brutos, dados normalizados e dados normalizados com média móvel. Para isso, foram realizados diversos testes com cinco variáveis (GR, RHOB, NPHI, DT e ILD), testados com diversos números de vizinhos, dois tipos de peso (distância e uniforme), métrica euclidiana e validação cruzada (n=5).
A exatidão do modelo variou de 43 a 72%, sendo o melhor resultado obtido com dados normalizados e média móvel de 9 períodos. A matriz de confusão indicou que a maior taxa de acerto foi para a litofácies Siltito, enquanto a menor foi para a litofácies Interlaminado Arenoso. O grupo de litofácies Arenito, Folhelho e Siltito (A, F e S, respectivamente) apresentou resultados satisfatórios, com mais de 75% de pontuação no f1-score, enquanto o grupo (Ia, Iac, Iarc e M) obteve resultados insatisfatórios, com o f1-score máximo de 54% mesmo com dados normalizados e média móvel aplicada. Isto pode estar relacionado a um fator classificatório, onde através do agrupamento de intervalos litológicos menores, a fim de evitar que estes sejam ignorados pelo algoritmo, são atribuídas características de diversas litologias a uma mesma litofácies, como exemplo a litofácie Marga, que apresenta características composicionais tanto carbonáticas quanto siliciclásticas, refletindo em assinaturas petrofísicas heterogêneas e consequentemente na dificuldade do algoritmo em diferenciá-la dos intervalos arenosos e carbonáticos. Contudo, este resultado também pode estar relacionado ao desbalanceamento amostral nas bases de treino e teste, visto que apesar da litofácies Folhelho ter pouca amostragem, obteve bom resultado nas métricas de classificação, indicando que sua assinatura petrofísica é boa o suficiente para não depender de um número muito grande de amostras para que o modelo funcione bem, o que não se aplica às demais litofácies com poucas amostras (Interlaminado Arenoso e Interlaminado Argiloso Carbonático).
Apesar dos resultados obtidos terem sido aquém em relação ao desempenho de precisão de outros modelos (ex: “Random Forest”), este estudo permitiu detalhar o impacto das técnicas de normalização e de média móvel utilizadas, além de revelar o quanto os modelos de aprendizado de máquina são sensíveis a classificações detalhadas das litofácies geradas com diferentes combinações de variáveis para que possam ser aplicadas com eficiência no modelo de algoritmo KNN.

Palavras Chave

KNN; Inteligência Artificial; Métricas de avaliação de modelo; média móvel; perfilagem geofísica.

Área

TEMA 16 - Geoquantificação e Geotecnologias

Autores/Proponentes

Arthur Montesuma Coelho, Francisco Manoel Wohnrath Tognoli, André Sena de Oliveira, Beatriz Maluf Haas Peçanha