Este estudo utilizou a tecnologia de análise por espectrometria de massa por ionização por dessorção a laser assistida por matriz com tempo de voo (MALDI-TOF MS) combinada com dois algoritmos aprimorados de fusão de random forest para a análise da origem do Baizhu. Primeiro, foram obtidos dados espectrais de massas de amostras de Baizhu de três províncias via MALDI-TOF MS, com tamanho de dados de 1×234 154 por amostra. Devido ao grande volume de dados, foi utilizada uma estratégia de binning para simplificação preliminar (1×6 600). Em seguida, foi realizada uma análise de componentes principais com limiar de contribuição de variância acumulada definido para redução dimensional. Usando os dados reduzidos, foram construídos modelos de random forest extremo adaptativo reforçado (AERF) e random forest equilibrado adaptativo reforçado (ABRF). Finalmente, por meio de uma estratégia de fusão de modelos, foi obtido o modelo AERF-ABRF para a análise da origem do Baizhu. Os resultados indicam que o modelo AERF-ABRF baseado em dados reduzidos pode distinguir com precisão as amostras de Baizhu das três províncias, com precisão de classificação de 100% tanto no conjunto de teste quanto no conjunto de previsão. Além disso, em comparação com modelos discriminantes únicos, a estratégia de fusão de modelos apresenta maior precisão de classificação.
关键词
random forest; fusão de modelos; Baizhu; análise de origem; MALDI-TOF MS