Улучшение точности спектрального распознавания просроченных лекарств с помощью ансамблевой модели, основанной на генерации виртуальных образцов

TAN Chao ,  

TAN Cheng ,  

CHENG Bin ,  

ZOU Qin ,  

CHEN Hui ,  

WU Tong ,  

LIN Zan ,  

摘要

Качественное распознавание поддельных лекарств на основе ближней инфракрасной спектроскопии требует использования вычислительной техники и хемометрии для извлечения характеристической информации из сложных, перекрывающихся и изменяющихся спектров и построения предсказательных моделей. В таких задачах может встречаться проблема несбалансированности классов из-за относительной нехватки образцов некоторых категорий. Основываясь на генерации виртуальных образцов и ансамблевом моделировании, возможно повысить точность распознавания моделей, обученных на несбалансированных наборах данных. В данной работе изучался азитромицин, была разработана серия экспериментальных наборов образцов, построен классификатор с использованием ансамблевого метода дискретного анализа на основе виртуальных образцов для распознавания срока годности лекарства. Производительность одиночных и ансамблевых моделей сравнивалась на 10 различных спектральных диапазонах, обсуждалось влияние соотношения классов, состава образцов и размера ансамбля. Чувствительность ансамблевого классификатора в среднем увеличилась примерно на 9%. Эксперименты подтвердили преимущества этого ансамблевого подхода, особенно при очень малом числе образцов миноритарного класса, предложенный метод показал свои преимущества и обладает потенциалом применения для других типов данных.

关键词

виртуальные образцы;ансамбль;ближняя инфракрасная спектроскопия;лекарства;распознавание

阅读全文