Данное исследование основано на технологии сверхвысокоэффективной жидкостной хроматографии с квадрупольной орбитальной ловушкой высокого разрешения (UHPLC-Q-Orbitrap HRMS) в сочетании с различными методами машинного обучения для построения стратегии определения происхождения лекарственного сырья красного шавлера из провинции Сычуань и других северных регионов. С помощью UHPLC-Q-Orbitrap HRMS получена информация о химическом составе образцов, использован многомерный статистический анализ для отбора дифференцирующих соединений, на основе которых построены модели классификации случайного леса (RF), градиентного усиления (XGBoost) и адаптивного усиления (AdaBoost). Производительность моделей оценивалась по площади под кривой рабочей характеристики получателя (AUC), а также применен метод объяснений с добавлением Шепли (SHAP) для количественной оценки и интерпретации вклада эндогенных компонентов в процесс классификации. В общей сложности выявлено 95 химических компонентов, из которых 40 существенно различаются между регионами происхождения. Сравнение производительности моделей показало превосходство модели RF по точности и стабильности над XGBoost и AdaBoost. Анализ SHAP дополнительно выявил, что линолевая кислота, ревносид и пиридоксин вносят наибольший вклад в определение происхождения, при этом их содержание значительно выше в красном шавлере из Сычуани, что указывает на их потенциал в качестве характеристических компонентов происхождения. Разработанная методическая база позволяет эффективно реализовать точное распознавание красного шавлера из Сычуани и предоставляет новые идеи и техническую поддержку для оценки аутентичности и контроля качества традиционного китайского лекарственного сырья.
关键词
красный шавлер;хемометрия;химический состав;машинное обучение;географическое происхождение;сверхвысокоэффективная жидкостная хроматография - квадруполь с орбитальной ловушкой высокого разрешения (UHPLC-Q-Orbitrap HRMS)