文献标识码:A
DOI:10.19358/j.issn.2097-1788.2023.08.010
引用格式:明水根,张洪.基于因果关系和特征对齐的图像分类域泛化模型[J].网络安全与数据治理,2023,42(8):59-65.
0引言
深度学习在计算机视觉和自然语言处理等领域都取得了惊人的成就。传统的深度学习方法基于一个基本假设:训练数据和测试数据是独立且同分布的(Independent and Identically Distribution,IID)。但是,在现实任务中,如医学成像和自主驾驶等领域,这种IID假设通常不成立。当训练数据的分布(也称为域)与测试数据的分布不同时,由于存在分布差距,训练出的模型通常表现不佳。训练数据的域与测试数据的域不同的现象也被称为域偏移。上述观点促进了域适应(Domain Adaptation,DA)和域泛化(Domain Generalization,DG)的研究。域泛化的目标是从多个相似分布(也称为源域)中学习一种通用表征。一般数据都存在某些与输出(即标签)相关且在不同域间都保持不变的特征,那么就可以将这种特征迁移到具有未见过分布(也称为目标域)的测试数据上。域泛化任务的示例如图1所示。
大多数域泛化研究集中在学习不受域干扰的表征,从而得到所谓的域不变特征。例如,Li等[1]采用了域适应研究中的思想,使用对抗训练来学习域不变特征以解决域泛化问题。尽管这些基于学习策略的方法在真实世界的任务中表现良好,但缺乏理论可解释性。Ilse等[2]和Peng等[3]采用特征解耦方法来学习标签的特定特征,并希望这些特征是关于域不变的。这种基于特征解耦的方法在理论上是可解释的,但在实际的域泛化任务中表现不佳。因此,研究既具有理论可解释性又在真实的域泛化任务中表现良好的方法非常重要。
本文提出了一种称为对抗域不变变分自动编码器(Adversarial Domain Invariant Variational AutoEncoder,ADIVA)的模型来解决域泛化问题。该模型先使用变分自动编码器[4](Variational AutoEncoder,VAE)框架将输入数据解耦成三个潜在因子:域信息因子、标签信息因子和包含任何残留信息的因子,然后,将因果关系引入到域泛化任务中,将域偏移问题拆分为两个相关分布的偏移问题。为了修正这些偏移,本文采用特征对齐方法来学习域不变特征。此外,为了解决VAE中存在的解耦不完全问题,本文采用对抗训练来消除潜在因子中的混淆信息,以进一步提高模型的实际表现。本文在两个域泛化公开数据集——Rotated MNIST和PACS上,对ADIVA进行了大量实验。实验结果表明,ADIVA在域泛化表现方面具有与目前最优方法相当的竞争力。本文的主要贡献有:其一,本文基于域泛化中的因果关系使用特征对齐来解决域偏移问题;其二,本文采用对抗训练来解决VAE特征解耦不完全的问题,提升ADIVA在实际任务中的性能;其三,本文证明了ADIVA的可识别性理论。
本文详细内容请下载:https://www.chinaaet.com/resource/share/2000005468
作者信息:
明水根1,张洪2
(1.中国科学技术大学大数据学院,安徽合肥230026;2.中国科学技术大学管理学院,安徽合肥230026)