SWGおよびLSGスタッキングモデル機械学習アルゴリズムに基づく小麦種子タンパク質含有量検出の研究

SONG Mao-xing ,  

MA Hong-liang ,  

WU Zhi-hui ,  

LI Tong ,  

YANG Meng-ying ,  

HUANG Hui-na ,  

WU Peng ,  

YANG Dong-xu ,  

XU Da-chuan ,  

LU Qing ,  

摘要

高速で非破壊かつ高精度な小麦種子のタンパク質含有量検出方法を開発した。近赤外分光法(NIRS)技術とスタッキングモデルの機械学習手法を組み合わせて、248個の小麦種子の近赤外分光データを分析し、スライディングウィンドウグルーピング(SWG)と層別抽出グルーピング(LSG)の2種類のスペクトルバンドグルーピング方法の効果を比較した。基本モデルでは、部分最小二乗法(PLS)が最小の予測二乗平均平方根誤差(RMSEP)と最高の決定係数(R²)を示し、それぞれ0.2120と0.9899であった。スタッキングモデルの実装後は、異なるアルゴリズムの性能が顕著に向上した。LSGと線形回帰の組み合わせによりRMSEPは0.1990に減少し、R²は0.9911に向上し、最適モデルとなった。結果は、LSGと統合されたスタッキングモデルの機械学習アルゴリズムが小麦種子のタンパク質含有量予測により正確なアルゴリズムを提供することを示している。

关键词

近赤外分光法;小麦種子;タンパク質含有量;スタッキングモデル;機械学習

阅读全文