51º Congresso Brasileiro de Geologia

Dados da Submissão


Título

Classificação e predição de associações de fácies sedimentares da transição carbonífero-permiano na Bacia do Paraná a partir de algoritmo de aprendizado de máquina supervisionado

Texto do resumo

Por décadas, a identificação de rochas em perfurações de poços limitou-se à análise de amostras recuperadas, como amostra de calha, lateral ou testemunho. Com os avanços em sensores e registros digitais na perfilagem de poços, técnicas quantitativas tornaram-se viáveis para identificar rochas e estimar suas propriedades. A análise de padrões das fácies sedimentares nos dados de perfilagem permitiu o uso de aprendizado de máquina para classificação e predição de rochas sedimentares.
Este trabalho objetiva predizer associações de fácies a partir da análise da influência do número de vizinhos utilizado no algoritmo de classificação supervisionada KNN e interpretar seus resultados. Dessa forma, este estudo utilizou dados de medição de raios gama de testemunhos de sondagem de rochas do Grupo Itararé e da Formação Rio Bonito das áreas do Paleovale Capané e do Alto Iruí-Butiá, na Bacia do Paraná, que registram eventos glaciais da transição Carbonífero-Permiano. As medidas de raios gama totalizaram 1591 amostras em 1241,27 metros, obtidas a partir de um gamaespectrômetro portátil, com calibração verificada por correlações com valores de coeficiente de correlação conhecidos. Foram utilizados os dois testemunhos de sondagem mais espessos e sequencialmente contínuos (DU01-RS e IB-93-RS) da área de estudo como referência para a definição das associações de fácies.
Assim, os dados gamaespectrométricos foram analisados a partir de scripts escritos em linguagem Python para avaliação de parâmetros estatísticos, visualização gráfica e testes com funções de classificação. Para os testes de modelos de classificação, constituiu-se como etapa fundamental o reconhecimento das variáveis mais influentes e sua influência nas métricas de desempenho do modelo. Os testes envolveram modelos gerados com o uso de dados normalizados, calculados para os dois poços de referência, que foram utilizados nas etapas de teste, treino e validação do algoritmo KNN. Os valores de Contagem total (CT), porcentagem de potássio (K) e as medidas em parte por milhão de urânio (U) e tório (Th) foram selecionadas como as variáveis apropriadas para o modelo de aprendizado de máquina. Assim, a escolha do algoritmo de classificação supervisionada KNN ocorreu em função de sua simplicidade, rapidez de processamento e ampla utilização em trabalhos científicos.
Dessa maneira, as três associações de fácies (AF) tiveram seus dados subdivididos em conjuntos de treinamento (70%) e teste (30%), variando o número de vizinhos (k = 1 a 17), com validação cruzada (n=5) e diferentes pesos (uniforme e distância). Com a plotagem dos valores obtidos pelas métricas de avaliação, percebemos a seguinte tendência: nas métricas precision, recall e f1-score, os valores mais baixos (0.67, 0.4, 0.51, respectivamente) são obtidos na associação de fácies 2, que acaba por diminuir a exatidão total dos modelos para 82.2%.
Duas hipóteses estão sendo testadas: a) se a intercalação recorrente de camadas mais finas presente na associação de fácies 2 é responsável por aumentar a variabilidade da amostragem, gerando resultados menos precisos, ou b) se a característica transicional do sistema deposicional registrou nos dados gamaespectrométricos a mudança paleoclimática, de frio e seco a quente e úmido durante a deposição dos sedimentos destas unidades, com intensificação do intemperismo químico em relação ao físico e subsequente variabilidade nas leituras gamaespectrométricas relacionadas às proporções entre K, U e Th.

Palavras Chave

KNN; Machine Learning; Métricas de avaliação de modelo; Gamaespectrometria; Deglaciação Gonduânica.

Área

TEMA 16 - Geoquantificação e Geotecnologias

Autores/Proponentes

Beatriz Maluf Haas Peçanha, Francisco Manoel Wohnrath Tognoli, Aline Fernanda Spaniol, Arthur Montesuma Coelho