kaiyun官方注册
您所在的位置: 首页> 其他> 设计应用> 基于光量子计算的信用评分特征筛选研究报告
基于光量子计算的信用评分特征筛选研究报告
网络安全与数据治理 3期
文 凯1,马 寅1,王 鹏2,朱德立2
(1.北京玻色量子科技有限公司,北京100016;2.光大科技有限公司,北京100083)
摘要:随着科学技术的进步,量子计算突破了传统的算力瓶颈,在各个领域发挥着越来越重要的作用。在金融领域中,信用评分场景是贷款行业的重中之重。特征选取是一种十分高效的数据预处理策略。特征选择可以构建更简单、更容易理解的模型,提高数据挖掘性能,从中提取有效的特征,降低数据维度,为金融业提供有效的贷款参考信息。主要讨论量子计算在信用评分场景下的应用,改进了金融数据预处理的方式,创新性地使用量子计算机来求解特征选择的QUBO模型,与one-hot转码相比较,所使用的WOE分箱处理策略可以直接解析出特征,筛选结果可以进行直接对比。基于量子计算的特征选取与传统的基于相关性的特征选取策略相比,差距很小,并且由于量子计算机的先天优势,此策略速度更快,更具前景。
中图分类号:TP38
文献标识码:A
DOI:10.20044/j.csdg.2097-1788.2022.03.002
引用格式: 文凯,马寅,王鹏,等. 基于光量子计算的信用评分特征筛选研究报告[J].网络安全与数据治理,2022,41(3):13-18.
Research report on feature screening of credit scoring based on photonic quantum computing
Wen Kai1,Ma Yin1,Wang Peng2,Zhu Deli2
(1.Beijing Qboson Quantum Technology Co.,Ltd.,Beijing 100016,China; 2.Everbright Technology Co.,Ltd.,Beijing 100040,China)
Abstract:With the progress of science and technology, quantum computing has broken through the traditional bottleneck of computing power and is playing an increasingly important role in various fields. In the financial field, the credit scoring scenario is the top priority of the loan industry. Feature selection can build simpler and easier-to-understand models, improve data mining performance, prepare concise and understandable data to extract effective features and reduce data dimensions, and provide effective loan reference information for the financial industry. This paper mainly discusses the application of quantum computing in the credit scoring scenario, improves the financial data preprocessing method, and creatively uses quantum computer to solve the QUBO model of feature selection. Compared with one-hot encoding, the WOE strategy used in this paper can directly analyze the features, and the screening results can be directly compared. Compared with the traditional feature selection strategy based on correlation, the feature selection strategy based on quantum computing is little difference. Moreover, due to the inherent advantages of quantum computer, this strategy is faster and more promising.
Key words :quantum computing;feature selection;correlation;credit evaluation

0 引言

目前,量子计算是未来的计算发展趋势,全球各主要研究机构和公司选用不同的物理方案来制造量子计算机,主流的技术路线包括超导量子计算、光量子计算等。超导量子计算系统对环境要求苛刻,要求在绝对零度附近的超低温下才能工作;光量子计算其原理是使用光量子的叠加态对组合优化问题进行指数级求解加速。基于光量子系统的相干伊辛计算架构(Coherent Ising Machine,CIM)[1],具有光量子常温下编码操控和其在相干时间、室温工作、全联接等方面的技术优势。目前,国内北京玻色量子科技有限公司等企业,已完成第一台全国产光量子计算原型机的设计制造。

CIM可以充分利用光量子常温下编码操控的技术优势,实现100~100 000量子比特的量子计算的有效应用和算法优越性验证[2],并且可以广泛地应用于生物制药、交通、人工智能[3-7]等领域。在金融风控领域,特别是在信贷业务场景下,需要利用客户多维度的特征,对客户未来的违约行为做出预测,从而进行风险控制决策。因此好的风控评估模型能为银行风控业务提供从资产负债、信用风险、反欺诈、反洗钱等全方位完整的风险控制方案。在建立风控模型的过程中,随着大数据时代的到来,客户数据维度呈指数型增长,传统的特征筛选方法需要人工经验的参与,对大维度数据的处理显得较为吃力,亟需创新式的解决方案。量子计算作为超强算力的代表,在此领域拥有极大的潜力。

信用评分的建模场景中[8],特征选择在整个过程起着至关重要的作用,通过筛选后续入模的特征从而提高模型的准确率和效率,并具有更好的泛化能力。尤其是在特征数较大时,不同特征的选择将决定最后信用评分模型的整体效果。本文将采用传统信用评分的建模逻辑,对于特征筛选这一环节,采用量子计算的方式进行优化,从而对整体模型效果进行提升(并与传统方式的特征选择进行对比)。通过建立相应的二次无约束二值优化(Quadratic Unbounded Binary Optimization,QUBO)[9]模型来实现特征选择,该模型理想情况下选择既独立又有影响力的特征。此次研究主要通过量子计算解决QUBO模型来实现特征选择,相比传统信用评分的特征选择,在不牺牲准确率的前提下,量子计算效率更高而且人工干扰更少,并在特征数很大时,解决了人工筛选难度大的问题。




本文详细内容请下载http://www.chinaaet.com/resource/share/2000004899





作者信息:

文 凯1,马 寅1,王 鹏2,朱德立2

(1.北京玻色量子科技有限公司,北京100016;2.光大科技有限公司,北京100083)


此内容为AET网站原创,未经授权禁止转载。
Baidu
map