El espectro de infrarrojo cercano en el análisis cuantitativo es fácilmente afectado por muestras atípicas. Debido a que el espectro se forma por la superposición de picos de absorción de grupos que contienen hidrógeno, los métodos tradicionales analizan todo el espectro basándose únicamente en características globales, lo que dificulta identificar características atípicas sutiles en picos específicos, y sus umbrales fijos carecen de adaptabilidad. Por ello, este artículo propone una estrategia de identificación de muestras atípicas basada en la descomposición de mezcla gaussiana, construyendo un modelo de mezcla gaussiana dentro de picos de absorción clave, analizando los picos superpuestos mediante múltiples componentes gaussianos, y luego estableciendo rangos normales basados en el criterio del rango intercuartílico para las amplitudes de los componentes, considerando atípicas aquellas muestras que excedan estos rangos. El método propuesto se aplicó a la predicción de la concentración total de azúcar en la mezcla de la etapa de materia prima de la fermentación de ácido cítrico, mostrando que el método identifica eficazmente muestras atípicas tanto en espectros artificiales como reales. En comparación con el espectro original, al eliminar las muestras atípicas el modelo PLS construido redujo el RMSE en un 34.69% y aumentó el R² en un 26.28%. Este método, al analizar la estructura de los picos de absorción, logra una detección adaptativa de características atípicas locales, proporcionando un enfoque estructurado y explicable para mejorar la calidad del espectro de infrarrojo cercano.
关键词
espectro de infrarrojo cercano;identificación de muestras atípicas;modelo de mezcla gaussiana;descomposición de picos superpuestos;fermentación de ácido cítrico