Estudio sobre la detección del contenido de proteína en semillas de trigo basado en modelos apilados SWG y LSG de aprendizaje automático

SONG Mao-xing ,  

MA Hong-liang ,  

WU Zhi-hui ,  

LI Tong ,  

YANG Meng-ying ,  

HUANG Hui-na ,  

WU Peng ,  

YANG Dong-xu ,  

XU Da-chuan ,  

LU Qing ,  

摘要

Se desarrolló un método rápido, no destructivo y preciso para la detección del contenido de proteínas en semillas de trigo. Se utilizó la tecnología de espectroscopía de infrarrojo cercano (NIRS) combinada con un método de aprendizaje automático de modelo apilado para analizar los datos espectrales de infrarrojo cercano de 248 semillas de trigo, comparando los efectos de dos métodos de agrupamiento de bandas espectrales: agrupamiento por ventana deslizante (SWG) y agrupamiento por muestreo estratificado (LSG). En el modelo base, la regresión por mínimos cuadrados parciales (PLS) mostró el error cuadrático medio de predicción (RMSEP) más bajo y el coeficiente de determinación (R²) más alto, con valores de 0.2120 y 0.9899 respectivamente. Tras implementar el modelo apilado, el rendimiento de los diferentes algoritmos mejoró significativamente. La combinación de LSG con regresión lineal redujo el RMSEP a 0.1990 y elevó el R² a 0.9911, siendo el modelo óptimo. Los resultados indican que el algoritmo de aprendizaje automático basado en modelo apilado integrado con LSG proporciona un algoritmo más preciso para predecir el contenido de proteína en semillas de trigo.

关键词

espectroscopía de infrarrojo cercano; semillas de trigo; contenido de proteína; modelo apilado; aprendizaje automático

阅读全文