Исследование классификации источников рициновых семян на основе объединения энергетических характеристик, машинного обучения и количественного анализа метаболитов высокой концентрации

YUAN Meng-tao ,  

ZHANG Yuan-yuan ,  

HOU Chang ,  

HUANG Xuan ,  

YOU Wei ,  

CHEN Jia ,  

TAN Mei-lian ,  

GUO Lei ,  

LI Kai-kai ,  

XIE Jian-wei ,  

摘要

В экстренном реагировании на происшествия с угрозой общественной безопасности, связанные с рицином, существует острая необходимость в проведении классификации и источниковой идентификации рициновых семян по регионам. В данном исследовании была разработана методика анализа жирных кислот в рициновых семенах на основе газожидкостной хроматографии с масс-спектрометрией и количественного определения рицина методом иммуноферментного анализа. Было проведено количественное определение 6 видов жирных кислот и рицина в 100 образцах из 23 различных провинций Китая. Руководствуясь особенностями энергетического метаболизма растений, введены 3 параметра энергетических характеристик (индекс ненасыщенности, отношение содержания олеиновой кислоты к линолевой, отношение содержания токсина к жирным кислотам), что эффективно сочетало 3 алгоритма машинного обучения для классификации источников. Оценка модели показала, что модель опорных векторов с L1-регуляризацией при введении энергетических параметров и при определении минимального набора признаков достигла площади под кривой рабочих характеристик 73,63% и 71,95% соответственно, с точностью тестирования 70,37% и 68,52%, а точность на внешней валидации составила 75,00%, демонстрируя хорошую обобщающую способность. Исследование подтверждает потенциал применения метаболитов с высокой концентрацией для источниковой идентификации рициновых семян, а введение энергетических параметров в машинное обучение обеспечивает реализуемый путь для биологически ориентированного анализа данных.

关键词

рициновые семена;рицин;жирные кислоты;географическое происхождение;машинное обучение;энергетические параметры

阅读全文