Analyse de la traçabilité géographique de Baizhu par MALDI-TOF MS combinée à un modèle de fusion de forêts aléatoires

WANG Ying-qi ,  

ZHAO Han-qing ,  

FANG Huan ,  

WANG Tong ,  

摘要

Cette étude a utilisé la technologie d'analyse par spectrométrie de masse par désorption/ionisation laser assistée par matrice à temps de vol (MALDI-TOF MS) combinée à deux algorithmes améliorés de fusion de forêts aléatoires pour analyser la traçabilité géographique du Baizhu. Tout d'abord, les données spectrales des échantillons de Baizhu provenant de trois provinces ont été obtenues via MALDI-TOF MS, chaque échantillon contenant 1×234 154 données. En raison du volume important de données, une stratégie de compartimentation des données a été utilisée pour un pré-traitement simplifié (1×6 600). Une analyse en composantes principales a ensuite été réalisée avec un seuil de contribution de variance cumulée défini pour la réduction dimensionnelle. Les données réduites ont servi à construire des modèles de forêt aléatoire extrême adaptative renforcée (AERF) et de forêt aléatoire équilibrée adaptative renforcée (ABRF). Finalement, la stratégie de fusion de modèles a permis d’obtenir le modèle AERF-ABRF pour la traçabilité de Baizhu. Les résultats montrent que le modèle AERF-ABRF basé sur les données réduites distingue avec précision les échantillons de Baizhu issus des trois provinces, avec une précision de classification de 100 % sur les ensembles de test et de prédiction. Par ailleurs, comparativement aux modèles discriminants individuels, la stratégie de fusion des modèles offre une précision de classification plus élevée.

关键词

forêts aléatoires; fusion de modèles; Baizhu; traçabilité géographique; MALDI-TOF MS

阅读全文