Se empleó espectrometría de masas de plasma acoplado inductivamente para determinar el contenido de elementos minerales en 255 lotes de cáscara de naranja envejecida de Xin Hui y Guangxi. Se utilizó análisis discriminante por mínimos cuadrados parciales ortogonales para estudiar los elementos diferenciales en la cáscara de diferentes regiones. Se aplicaron cuatro métodos de preprocesamiento de datos: normalización Z-score, normalización min-max, normalización por media y escalado de valor absoluto máximo, combinados con modelos de aprendizaje automático como bosques aleatorios, árboles de decisión, máquinas de vectores de soporte y boosting de gradiente para construir modelos de identificación de origen de la cáscara. Los resultados mostraron que, entre 41 elementos minerales, Na, Sn, Y, Ba, Er, Ho, Yb, Dy, Ni, Li, Gd, Tb, Sm, Nd y Rb son los principales elementos diferenciales entre las cáscaras de Xin Hui y Guangxi. Entre los cuatro modelos de aprendizaje automático, el de máquina de vectores de soporte presentó los mejores resultados predictivos. En este modelo, los conjuntos de datos de entrenamiento y prueba bajo las tres formas de procesamiento de datos Z-score, min-max y normalización por media presentaron la misma precisión de 100% y 96%, respectivamente, con un valor F1 de 0.96, mostrando así una alta exactitud del modelo. Este estudio basado en el contenido de elementos minerales combinado con aprendizaje automático presenta alta precisión y confiabilidad para la identificación de origen de la cáscara, proporcionando soporte técnico para el control de calidad y también puede servir como referencia para la trazabilidad de materias primas farmacéuticas tradicionales.
关键词
elementos minerales; aprendizaje automático; cáscara; identificación del origen