기계 학습이 스펙트럼 분석에 깊이 적용됨에 따라 모델 훈련은 데이터 샘플 부족과 클래스 분포 불균형 등의 도전에 직면하여 모델의 일반화 성능을 제한하고 과적합 위험을 초래한다. 본 논문은 2017년 이후 국내외 공개 문헌을 검토하여 스펙트럼 데이터 증강 방법을 비심층 학습 데이터 증강 방법과 심층 학습 데이터 증강 방법의 두 가지로 분류하고, 얕은 층 데이터 확장에서 심층 생성 모델링으로의 진화 추세를 밝힌다. 비심층 학습 데이터 증강 방법은 스펙트럼 변환과 스펙트럼 합성을 통해 데이터 확장을 구현하며, 계산 효율성의 이점으로 산업 공정 모니터링, 한약 원산지 추적 및 의약품과 식품 품질 검사 등 소규모 샘플 환경에서 우수한 적용성을 보인다. 심층 생성 모델은 주로 생성적 적대 신경망(GAN)과 그 파생 방법 및 개선된 자동인코더(AE)를 포함한다. GAN은 적대적 게임 메커니즘을 통해 원본 데이터와 구조적 유사성과 분포 일치를 갖는 증강 샘플을 생성하며, 의료 영상 진단, 정밀 농업 및 재료 분류 등 고정밀 모델링 환경에서 널리 사용된다; 개선된 AE는 잠재 공간 표현 학습을 통해 데이터의 본질적 특징을 포착하며, 생성된 데이터는 원본 분포 특성을 유지함과 동시에 특징의 견고성을 가지며, 화학 물질 식별 및 토양 성분 검사 등 고차원 데이터 처리 작업에서 뛰어난 장점을 가진다. 본 논문은 기존 데이터 증강 방법의 한계를 지적하고 미래 발전 방향을 논의한다.