Studie zur Unterscheidung der Herkunft von Rizinussamen basierend auf der Verschmelzung energetischer Merkmale, maschinellem Lernen und quantitativer Analyse hochkonzentrierter Metaboliten
Im Notfallmanagement bei öffentlichen Sicherheitsereignissen im Zusammenhang mit Ricin besteht ein dringender Bedarf an einer regionalen Herkunftsklassifizierung von Rizinussamen. Diese Studie etablierte eine Methode zur Analyse von Fettsäuren in Rizinussamen basierend auf Gaschromatographie-Massenspektrometrie und eine Methode zur quantitativen Bestimmung von Ricin mittels Enzymgebundener Immunadsorptionsanalyse. Es wurden quantitative Bestimmungen von 6 Fettsäuren und Ricin in 100 Proben aus 23 verschiedenen chinesischen Provinzen durchgeführt. Unter Leitung der energetischen Stoffwechseleigenschaften der Pflanze wurden 3 energetische Merkmalsparameter eingeführt (Ungesättigtindex, Verhältnis von Ölsäure- zu Linolsäuregehalt, Verhältnis von Toxin- zu Fettsäuregehalt), welche effektiv 3 maschinelle Lernalgorithmen zur Ursprungsbestimmung kombinierten. Die Modellevaluation zeigte, dass das L1-regularisierte Support-Vektor-Maschinenmodell bei Einbeziehung der energetischen Merkmalsparameter und unter klar definierter minimaler Merkmalsmenge eine AUC von 73,63 % bzw. 71,95 % erreichte, mit Testgenauigkeiten von 70,37 % und 68,52 %, während die externe Validierungsgenauigkeit jeweils 75,00 % betrug, was eine gute Generalisierungsleistung zeigt. Diese Studie bestätigt das Anwendungspotenzial hochkonzentrierter Metaboliten bei der Rückverfolgung von Rizinussamen und zeigt, dass die Einführung energetischer Merkmalsparameter im maschinellen Lernen einen praktikablen Weg für biologieorientiertes Data Mining bietet.