Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco

Autores

  • Laura Milani da Silva Dias Universidade Estadual de Campinas, Rua Pandiá Calógeras, no 51, Cidade Universitária, CEP 13083-870 Campinas, SP.
  • Ricardo Marques Coelho Instituto Agronômico, Avenida Barão de Itapura, no 1.481, Jardim Guanabara, CEP 13012-970 Campinas, SP.
  • Gustavo Souza Valladares Universidade Federal do Piauí, Campus Universitário Ministro Petrônio Portella, Ininga, CEP 64049-550 Teresina, PI.
  • Ana Carolina Cunha de Assis Instituto Agronômico, Avenida Barão de Itapura, no 1.481, Jardim Guanabara, CEP 13012-970 Campinas, SP.
  • Edilene Pereira Ferreira Instituto Agronômico, Avenida Barão de Itapura, no 1.481, Jardim Guanabara, CEP 13012-970 Campinas, SP.
  • Rafael Cipriano da Silva Universidade de São Paulo, Escola Superior de Agricultura Luiz de Queiroz, Avenida Pádua Dias, no 11, Vila Independência, CEP 13418-260 Piracicaba, SP.

DOI:

https://doi.org/10.1590/S1678-3921.pab2016.v51.22491

Palavras-chave:

acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico

Resumo

O objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes.

Biografia do Autor

Laura Milani da Silva Dias, Universidade Estadual de Campinas, Rua Pandiá Calógeras, no 51, Cidade Universitária, CEP 13083-870 Campinas, SP.

http://lattes.cnpq.br/7411365793554118

Ricardo Marques Coelho, Instituto Agronômico, Avenida Barão de Itapura, no 1.481, Jardim Guanabara, CEP 13012-970 Campinas, SP.

http://lattes.cnpq.br/1190769214913092

Gustavo Souza Valladares, Universidade Federal do Piauí, Campus Universitário Ministro Petrônio Portella, Ininga, CEP 64049-550 Teresina, PI.

http://lattes.cnpq.br/7710601501267719

Ana Carolina Cunha de Assis, Instituto Agronômico, Avenida Barão de Itapura, no 1.481, Jardim Guanabara, CEP 13012-970 Campinas, SP.

http://lattes.cnpq.br/7000004568898795

Edilene Pereira Ferreira, Instituto Agronômico, Avenida Barão de Itapura, no 1.481, Jardim Guanabara, CEP 13012-970 Campinas, SP.

http://lattes.cnpq.br/8581279312251165

Downloads

Publicado

2016-10-17

Como Citar

Dias, L. M. da S., Coelho, R. M., Valladares, G. S., Assis, A. C. C. de, Ferreira, E. P., & Silva, R. C. da. (2016). Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco. Pesquisa Agropecuária Brasileira, 51(9), 1396–1404. https://doi.org/10.1590/S1678-3921.pab2016.v51.22491