Исследование определения содержания белка в семенах пшеницы на основе стекинг-модели машинного обучения SWG и LSG

SONG Mao-xing ,  

MA Hong-liang ,  

WU Zhi-hui ,  

LI Tong ,  

YANG Meng-ying ,  

HUANG Hui-na ,  

WU Peng ,  

YANG Dong-xu ,  

XU Da-chuan ,  

LU Qing ,  

摘要

Разработан быстрый, безразрушающий и точный метод определения содержания белка в семенах пшеницы. Использованы технологии ближней инфракрасной спектроскопии (NIRS) в сочетании с машинным обучением на основе стекинг-модели для анализа данных спектров ближнего инфракрасного диапазона 248 семян пшеницы, а также проведено сравнение двух методов группировки спектральных диапазонов: скользящее окно группировки (SWG) и стратифицированная выборка группировки (LSG). В базовой модели метод наименьших квадратов с частичным сокращением (PLS) показал наименьшую среднеквадратичную ошибку прогноза (RMSEP) и наивысший коэффициент детерминации (R²) со значениями 0.2120 и 0.9899 соответственно. После внедрения стекинг-модели производительность различных алгоритмов значительно улучшилась. Комбинация LSG с линейной регрессией снизила RMSEP до 0.1990 и повысила R² до 0.9911, став оптимальной моделью. Результаты показывают, что машинно-обучающий алгоритм стекинг-модели, интегрированной с LSG, предоставляет более точный метод прогнозирования содержания белка в семенах пшеницы.

关键词

ближняя инфракрасная спектроскопия; семена пшеницы; содержание белка; стекинг-модель; машинное обучение

阅读全文