kaiyun官方注册
您所在的位置: 首页> 人工智能> 设计应用> 基于因果关系和特征对齐的图像分类域泛化模型
基于因果关系和特征对齐的图像分类域泛化模型
网络安全与数据治理 8期
明水根,张洪
(1.中国科学技术大学大数据学院,安徽合肥230026; 2.中国科学技术大学管理学院,安徽合肥230026)
摘要:针对现有域泛化方法性能较差或缺乏理论可解释性的缺点,提出了一种基于因果关系和特征对齐的图像分类域泛化模型,并证明了该模型的可识别性。该模型利用域泛化中的因果关系来学习含有不同信息的特征,将域泛化问题转化为特征相关分布的偏移,再利用特征对齐消除偏移。为提高模型的性能,采用对抗训练进一步优化学到的特征。在公共数据集上的实验结果表明,新提出的模型与目前最优的方法性能相当,表明该模型具有理论可解释性的同时,还有不俗的实际性能表现。
中图分类号:TP183、
文献标识码:A
DOI:10.19358/j.issn.2097-1788.2023.08.010
引用格式:明水根,张洪.基于因果关系和特征对齐的图像分类域泛化模型[J].网络安全与数据治理,2023,42(8):59-65.
Domain generalization model in image classification based on causality and feature alignment
Ming Shuigen1,Zhang Hong2
(1School of Big Data, University of Science and Technology of China, Hefei 230026, China; 2School of Management, University of Science and Technology of China, Hefei 230026, China)
Abstract:Aiming at the shortcomings of poor performance or lack of theoretical interpretability of existing domain generalization methods, a novel domain generalization model for image classification based on causality and feature alignment is proposed, and the model′s identifiability is demonstrated. The model uses causal relationships in domain generalization to learn features containing different information, transforms the domain generalization problem into the biases of featurerelated distributions, and then eliminates the biases by aligning features. To improve the performance of the model, adversarial training is used to further optimize the learned features. Experimental results on public datasets show that the newly proposed model performs comparably with the stateoftheart models, indicating that the model has theoretical interpretability as well as decent practical performance.
Key words :domain generalization; variational autoencoder; causality; feature alignment; adversarial training

0引言


深度学习在计算机视觉和自然语言处理等领域都取得了惊人的成就。传统的深度学习方法基于一个基本假设:训练数据和测试数据是独立且同分布的(Independent and Identically Distribution,IID)。但是,在现实任务中,如医学成像和自主驾驶等领域,这种IID假设通常不成立。当训练数据的分布(也称为域)与测试数据的分布不同时,由于存在分布差距,训练出的模型通常表现不佳。训练数据的域与测试数据的域不同的现象也被称为域偏移。上述观点促进了域适应(Domain Adaptation,DA)和域泛化(Domain Generalization,DG)的研究。域泛化的目标是从多个相似分布(也称为源域)中学习一种通用表征。一般数据都存在某些与输出(即标签)相关且在不同域间都保持不变的特征,那么就可以将这种特征迁移到具有未见过分布(也称为目标域)的测试数据上。域泛化任务的示例如图1所示。

大多数域泛化研究集中在学习不受域干扰的表征,从而得到所谓的域不变特征。例如,Li等[1]采用了域适应研究中的思想,使用对抗训练来学习域不变特征以解决域泛化问题。尽管这些基于学习策略的方法在真实世界的任务中表现良好,但缺乏理论可解释性。Ilse等[2]和Peng等[3]采用特征解耦方法来学习标签的特定特征,并希望这些特征是关于域不变的。这种基于特征解耦的方法在理论上是可解释的,但在实际的域泛化任务中表现不佳。因此,研究既具有理论可解释性又在真实的域泛化任务中表现良好的方法非常重要。

本文提出了一种称为对抗域不变变分自动编码器(Adversarial Domain Invariant Variational AutoEncoder,ADIVA)的模型来解决域泛化问题。该模型先使用变分自动编码器[4](Variational AutoEncoder,VAE)框架将输入数据解耦成三个潜在因子:域信息因子、标签信息因子和包含任何残留信息的因子,然后,将因果关系引入到域泛化任务中,将域偏移问题拆分为两个相关分布的偏移问题。为了修正这些偏移,本文采用特征对齐方法来学习域不变特征。此外,为了解决VAE中存在的解耦不完全问题,本文采用对抗训练来消除潜在因子中的混淆信息,以进一步提高模型的实际表现。本文在两个域泛化公开数据集——Rotated MNIST和PACS上,对ADIVA进行了大量实验。实验结果表明,ADIVA在域泛化表现方面具有与目前最优方法相当的竞争力。本文的主要贡献有:其一,本文基于域泛化中的因果关系使用特征对齐来解决域偏移问题;其二,本文采用对抗训练来解决VAE特征解耦不完全的问题,提升ADIVA在实际任务中的性能;其三,本文证明了ADIVA的可识别性理论。



本文详细内容请下载:https://www.chinaaet.com/resource/share/2000005468




作者信息:

明水根1,张洪2

(1.中国科学技术大学大数据学院,安徽合肥230026;2.中国科学技术大学管理学院,安徽合肥230026)


微信图片_20210517164139.jpg

此内容为AET网站原创,未经授权禁止转载。
Baidu
map