Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo

Autores

  • Mônica Canaan Carvalho Universidade Federal de Lavras, Departamento de Ciências Florestais, Aquenta Sol, CEP 37200-900 Lavras, MG.
  • Lucas Rezende Gomide Universidade Federal de Lavras, Departamento de Ciências Florestais, Aquenta Sol, CEP 37200-900 Lavras, MG.
  • José Roberto Soares Scolforo Universidade Federal de Lavras, Departamento de Ciências Florestais, Aquenta Sol, CEP 37200-900 Lavras, MG.
  • Kalill José Viana da Páscoa Universidade Federal de Lavras, Departamento de Ciências Florestais, Aquenta Sol, CEP 37200-900 Lavras, MG.
  • Laís Almeida Araújo Universidade Federal de Lavras, Departamento de Ciências Florestais, Aquenta Sol, CEP 37200-900 Lavras, MG.
  • Isáira Leite e Lopes Eucatex S.A., Rua Ribeirão Preto, no 909, Jardim Marilia, CEP 13323-010 Salto, SP.

Palavras-chave:

manejo florestal, algoritmo genético, floresta aleatória

Resumo

O objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque.

Downloads

Publicado

2022-12-05

Como Citar

Carvalho, M. C., Gomide, L. R., Scolforo, J. R. S., Páscoa, K. J. V. da, Araújo, L. A., & Lopes, I. L. e. (2022). Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo. Pesquisa Agropecuária Brasileira, 57(Z), e03015. Recuperado de https://apct.sede.embrapa.br/pab/article/view/27172