RESUMEN
ABSTRACT: Estimating leaf chlorophyll contents through leaf reflectance spectra is efficient and nondestructive. The literature base regarding optical indices (particularly chlorophyll indices) is wide ranging and extensive. However, it is without much consensus regarding robust indices for Gannan navel orange. To address this problem, this study investigated the performance of 19 published indices using RDS (raw data spectrum), FDS (first derivative data spectrum) and SDS (second derivative data spectrum) for the estimation of chlorophyll content in navel orange leaves. The single spectral index and combination of multiple spectral indices were compared for their accuracy in predicting chlorophyll a content (Chla), chlorophyll b content (Chlb) and total chlorophyll content (Chltot) content in navel orange leaves by using partial least square regression (PLSR), adaboost regression (AR), random forest regression (RFR), decision tree regression (DTR) and support vector machine regression (SVMR) models. Through the comparison of the above data in three datasets, the optimal modeling data set is RDS data, followed by FDS data, and the worst is SDS data. In modeling with multiple spectral indices, good results were obtained for Chla (NDVI750, NDVI800), Chlb (Datt, DD, Gitelson 2) and Chltot (Datt, DD, Gitelson2) by corresponding index combinations. Overall, we can find that the AR is also the best regression method judging by prediction performance from the results of single spectral index models and multiple spectral indices models. In comparison, result of multiple spectral indices models is better than single spectral index models in predicting Chla and Chltot content using FDS data and SDS data, respectively.
RESUMO: Estimar os teores de clorofila foliar através de espectros de refletância foliar é eficiente e não destrutivo, a base da literatura sobre índices ópticos (principalmente índices de clorofila) é ampla e extensa. No entanto, não há muito consenso sobre índices robustos para a laranja de Gannan. O estudo investigou o desempenho de 19 índices publicados usando RDS (espectro de dados brutos), FDS (espectro de dados de primeira derivada) e SDS (espectro de dados de segunda derivada) para a estimativa do teor de clorofila em folhas de laranja de umbigo. Os índices espectrais foram comparados quanto à sua precisão na previsão do teor de clorofila a (Chla), teor de clorofila b (Chlb) e teor de clorofila total (Chltot) em folhas de laranja de umbigo usando regressão dos mínimos quadrados parcial (PLSR), regressão adaboost (AR), modelos de regressão de floresta aleatória (RFR), regressão de árvore de decisão (DTR) e regressão de máquina de vetor de suporte (SVMR). Através da comparação dos dados acima em três conjuntos de dados, o conjunto de dados de modelagem ideal são os dados RDS, seguidos pelos dados FDS, e o pior são os dados SDS. Na modelagem com vários índices espectrais, bons resultados foram obtidos para Chla (NDVI750, NDVI800), Chlb (Datt, DD, Gitelson 2) e Chltot (Datt, DD, Gitelson2) por combinações de índices correspondentes. No geral, podemos descobrir que o AR também é o melhor método de regressão a julgar pelo desempenho de previsão dos resultados de modelos de índice espectral único e modelos de índices espectrais múltiplos. Em comparação, o resultado de modelos de índices espectrais múltiplos é melhor do que os modelos de índices espectrais únicos na previsão do conteúdo de Chla e Chltot usando dados FDS e dados SDS, respectivamente.
RESUMEN
Estimating leaf chlorophyll contents through leaf reflectance spectra is efficient and nondestructive. The literature base regarding optical indices (particularly chlorophyll indices) is wide ranging and extensive. However, it is without much consensus regarding robust indices for Gannan navel orange. To address this problem, this study investigated the performance of 19 published indices using RDS (raw data spectrum), FDS (first derivative data spectrum) and SDS (second derivative data spectrum) for the estimation of chlorophyll content in navel orange leaves. The single spectral index and combination of multiple spectral indices were compared for their accuracy in predicting chlorophyll a content (Chla), chlorophyll b content (Chlb) and total chlorophyll content (Chltot) content in navel orange leaves by using partial least square regression (PLSR), adaboost regression (AR), random forest regression (RFR), decision tree regression (DTR) and support vector machine regression (SVMR) models. Through the comparison of the above data in three datasets, the optimal modeling data set is RDS data, followed by FDS data, and the worst is SDS data. In modeling with multiple spectral indices, good results were obtained for Chla (NDVI750, NDVI800), Chlb (Datt, DD, Gitelson 2) and Chltot (Datt, DD, Gitelson2) by corresponding index combinations. Overall, we can find that the AR is also the best regression method judging by prediction performance from the results of single spectral index models and multiple spectral indices models. In comparison, result of multiple spectral indices models is better than single spectral index models in predicting Chla and Chltot content using FDS data and SDS data, respectively.
Estimar os teores de clorofila foliar através de espectros de refletância foliar é eficiente e não destrutivo, a base da literatura sobre índices ópticos (principalmente índices de clorofila) é ampla e extensa. No entanto, não há muito consenso sobre índices robustos para a laranja de Gannan. O estudo investigou o desempenho de 19 índices publicados usando RDS (espectro de dados brutos), FDS (espectro de dados de primeira derivada) e SDS (espectro de dados de segunda derivada) para a estimativa do teor de clorofila em folhas de laranja de umbigo. Os índices espectrais foram comparados quanto à sua precisão na previsão do teor de clorofila a (Chla), teor de clorofila b (Chlb) e teor de clorofila total (Chltot) em folhas de laranja de umbigo usando regressão dos mínimos quadrados parcial (PLSR), regressão adaboost (AR), modelos de regressão de floresta aleatória (RFR), regressão de árvore de decisão (DTR) e regressão de máquina de vetor de suporte (SVMR). Através da comparação dos dados acima em três conjuntos de dados, o conjunto de dados de modelagem ideal são os dados RDS, seguidos pelos dados FDS, e o pior são os dados SDS. Na modelagem com vários índices espectrais, bons resultados foram obtidos para Chla (NDVI750, NDVI800), Chlb (Datt, DD, Gitelson 2) e Chltot (Datt, DD, Gitelson2) por combinações de índices correspondentes. No geral, podemos descobrir que o AR também é o melhor método de regressão a julgar pelo desempenho de previsão dos resultados de modelos de índice espectral único e modelos de índices espectrais múltiplos. Em comparação, o resultado de modelos de índices espectrais múltiplos é melhor do que os modelos de índices espectrais únicos na previsão do conteúdo de Chla e Chltot usando dados FDS e dados SDS, respectivamente.