Качественное распознавание поддельных лекарств на основе ближней инфракрасной спектроскопии требует использования вычислительной техники и хемометрии для извлечения характеристической информации из сложных, перекрывающихся и изменяющихся спектров и построения предсказательных моделей. В таких задачах может встречаться проблема несбалансированности классов из-за относительной нехватки образцов некоторых категорий. Основываясь на генерации виртуальных образцов и ансамблевом моделировании, возможно повысить точность распознавания моделей, обученных на несбалансированных наборах данных. В данной работе изучался азитромицин, была разработана серия экспериментальных наборов образцов, построен классификатор с использованием ансамблевого метода дискретного анализа на основе виртуальных образцов для распознавания срока годности лекарства. Производительность одиночных и ансамблевых моделей сравнивалась на 10 различных спектральных диапазонах, обсуждалось влияние соотношения классов, состава образцов и размера ансамбля. Чувствительность ансамблевого классификатора в среднем увеличилась примерно на 9%. Эксперименты подтвердили преимущества этого ансамблевого подхода, особенно при очень малом числе образцов миноритарного класса, предложенный метод показал свои преимущества и обладает потенциалом применения для других типов данных.