가상 샘플 생성을 기반으로 한 집합 모델을 통한 만료 약물 스펙트럼 인식 정확도 향상

TAN Chao ,  

TAN Cheng ,  

CHENG Bin ,  

ZOU Qin ,  

CHEN Hui ,  

WU Tong ,  

LIN Zan ,  

摘要

근적외선 분광법을 기반으로 한 가짜 약물의 정성적 인식은 복잡하고 중첩되며 변동하는 스펙트럼에서 특징 정보를 추출하고 예측 모델을 구축하기 위해 컴퓨터와 화학계량학의 도움이 필요하다. 이러한 작업에서는 일부 클래스 샘플이 상대적으로 부족한 클래스 불균형 문제가 발생할 수 있다. 가상 샘플 생성 및 집합 모델링을 기반으로 불균형 학습 집합에서 획득한 모델의 인식 정확도를 향상시킬 수 있다. 본 논문은 아지트로마이신을 연구 대상으로 설정하고 실험 샘플 세트를 설계하였으며, 가상 샘플 기술 기반의 부분 최소 제곱 판별 분석 집합 모델을 사용하여 약물의 유효기간 경과 여부를 식별하는 분류기를 구축하였다. 10개의 서로 다른 스펙트럼 구간에서 단일 모델과 집합 모델의 성능을 비교하였으며, 불균형 비율, 샘플 구성 및 집합 규모의 영향에 대해 논의하였다. 집합 분류기의 민감도는 평균 약 9% 향상되었다. 실험을 통해 이 집합 전략의 우수성을 확인하였으며, 소수 클래스 샘플이 매우 적을 때 제안된 집합 알고리즘이 더 큰 장점을 나타내며 이 방법은 다른 유형의 데이터에도 적용 가능성이 있다.

关键词

가상 샘플;집합;근적외선 분광법;약물;인식

阅读全文