Com a aplicação aprofundada do aprendizado de máquina na análise espectral, o treinamento de modelos enfrenta desafios como escassez de amostras de dados e distribuição desequilibrada de classes, restringindo o desempenho de generalização do modelo e gerando riscos de sobreajuste. Este artigo revisa a literatura nacional e internacional desde 2017, classificando os métodos de aumento de dados espectrais em duas categorias principais: métodos de aumento de dados não baseados em aprendizado profundo e métodos baseados em aprendizado profundo, revelando uma tendência evolutiva da expansão superficial de dados para a modelagem generativa profunda. Os métodos de aumento de dados não profundos expandem os dados por meio de transformações espectrais e síntese espectral, mostrando boa aplicabilidade em cenários de pequenas amostras, como monitoramento de processos industriais, rastreamento de ervas medicinais e detecção da qualidade de medicamentos e alimentos, graças à sua eficiência computacional. Os modelos generativos profundos incluem principalmente redes adversariais generativas (GAN) e seus métodos derivados, bem como autoencoders aprimorados (AE). GAN geram amostras aumentadas com similaridade estrutural e coerência de distribuição em relação aos dados originais por meio de um mecanismo adversarial, amplamente utilizados em cenários de modelagem de alta precisão, como diagnóstico por imagem médica, agricultura de precisão e classificação de materiais; AE aprimorados capturam, por meio do aprendizado de representação do espaço latente, as características essenciais dos dados, gerando dados que mantêm tanto as propriedades de distribuição originais quanto a robustez das características, apresentando vantagens em tarefas de processamento de dados de alta dimensão, como identificação de substâncias químicas e detecção da composição do solo. Esta revisão aponta as limitações dos métodos atuais de aumento de dados e discute direções futuras de desenvolvimento.
关键词
aumento de dados; análise espectral; aprendizado profundo; redes adversariais generativas; autoencoders variacionais