Foi desenvolvido um método rápido, não destrutivo e preciso para detectar o teor de proteína em sementes de trigo. A tecnologia de espectroscopia no infravermelho próximo (NIRS) combinada com o método de aprendizado de máquina baseado em modelo empilhado foi usada para analisar dados espectrais no infravermelho próximo de 248 sementes de trigo, comparando os efeitos de dois métodos de agrupamento de bandas espectrais: agrupamento por janela deslizante (SWG) e agrupamento por amostragem estratificada (LSG). No modelo básico, a regressão por mínimos quadrados parciais (PLS) apresentou o menor erro quadrático médio de predição (RMSEP) e o maior coeficiente de determinação (R²), com valores de 0,2120 e 0,9899, respectivamente. Após a implementação do modelo empilhado, o desempenho dos diferentes algoritmos foi significativamente aprimorado. A combinação de LSG com regressão linear reduziu o RMSEP para 0,1990 e aumentou o R² para 0,9911, sendo o modelo ótimo. Os resultados indicam que o algoritmo de aprendizado de máquina do modelo empilhado integrado ao LSG oferece um algoritmo mais preciso para prever o teor de proteína em sementes de trigo.
关键词
espectroscopia no infravermelho próximo; sementes de trigo; teor de proteína; modelo empilhado; aprendizado de máquina