Regressão linear múltipla e modelo Random Forest para estimar a densidade do solo em áreas montanhosas

Autores

  • Waldir Carvalho Junior Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.
  • Braz Calderano Filho Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.
  • Cesar da Silva Chagas Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.
  • Silvio Barge Bhering Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.
  • Nilson Rendeiro Pereira Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.
  • Helena Saraiva Koenow Pinheiro Universidade Federal Rural do Rio de Janeiro, Departamento de Solos, BR-465, Km 47, CEP 23890-000 Seropédica, RJ.

DOI:

https://doi.org/10.1590/S1678-3921.pab2016.v51.22426

Palavras-chave:

estoque de carbono, funções de pedotransferência, modelos dirigidos pelos dados, stepwise.

Resumo

O objetivo deste trabalho foi o desenvolvimento de modelos com diferentes conjuntos de dados, para estimar a densidade de solos de regiões tropicais montanhosas, a partir de atributos de solos comumente encontrados nas análises de perfis de solos descritos nos levantamentos regionais. O conjunto total de dados compõe-se de 163 amostras e foi dividido em seis grupamentos, dos quais três com 73 amostras, com o máximo de 32 covariáveis, e três com 163 amostras, com o máximo de 18 covariáveis. Testaram-se modelos
de regressão linear múltipla (RLM) e randomForest (RF). A menor incerteza entre os modelos foi alcançada pelo RLM2, com R2 de 0,56, 13 covariáveis e 73 amostras. Nos grupamentos com 163 amostras, os melhores modelos foram os RF, com R2 médio de 0,48. A raiz quadrada da média do erro ao quadrado variou entre 0,09 e 0,14. As covariáveis mais importantes no modelo RF foram: carbono orgânico, hidrogênio, areia fina e grossa, saturação por bases e capacidade de troca catiônica. Pelo método "stepwise regression", as variáveis mais importantes foram: a relação silte/argila; areia grossa e fina; carbono orgânico; saturação por bases; e potássio.

Biografia do Autor

Waldir Carvalho Junior, Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.

http://lattes.cnpq.br/7992394393174495

Braz Calderano Filho, Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.

http://lattes.cnpq.br/1022003330179698

Cesar da Silva Chagas, Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.

http://lattes.cnpq.br/2023294299618632

Silvio Barge Bhering, Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.

http://lattes.cnpq.br/7591583531224450

Nilson Rendeiro Pereira, Embrapa Solos, Rua Jardim Botânico, no 1.024, Jardim Botânico, CEP 22460-000 Rio de Janeiro, RJ.

http://lattes.cnpq.br/7827914057878445

Helena Saraiva Koenow Pinheiro, Universidade Federal Rural do Rio de Janeiro, Departamento de Solos, BR-465, Km 47, CEP 23890-000 Seropédica, RJ.

http://lattes.cnpq.br/6947091664236298

Downloads

Publicado

2016-10-17

Como Citar

Carvalho Junior, W., Calderano Filho, B., Chagas, C. da S., Bhering, S. B., Pereira, N. R., & Pinheiro, H. S. K. (2016). Regressão linear múltipla e modelo Random Forest para estimar a densidade do solo em áreas montanhosas. Pesquisa Agropecuária Brasileira, 51(9), 1428–1437. https://doi.org/10.1590/S1678-3921.pab2016.v51.22426