基于PCNN的工业制造领域质量文本实体关系抽取方法
信息技术与网络安全
张 彤1,宋明艳1,王 俊1,2,白 洋1
(1.北京京航计算通讯研究所,北京100071; 2.哈尔滨工业大学 经济与管理学院,黑龙江 哈尔滨150006)
摘要:对汽车、机械等工业制造行业的质量报告进行关系抽取,对于该行业质量知识图谱、质量问答系统等研究有着极为重要的意义。针对在工业制造领域的质量知识图谱构建过程中尚无公开数据集可用的情况,收集了质量文本并进行相应的专业标注,构建了工业制造领域质量知识图谱关系抽取专业数据集。基于该数据集利用分段卷积神经网络(Piecewise Convolutional Neural Network,PCNN)实现关系抽取,然后根据中文特性,提出了改进的PCNN模型(C-PCNN),以提升在中文语料中关系抽取的性能。在本文构建的数据集中,改进后模型的准确率、召回率以及F1值优于对比的PCNN和RNN模型,验证了该方法的可行性和有效性。该研究对从事制造行业的人员有一定的实际意义。
中图分类号:TP391
文献标识码:A DOI:10.19358/j.issn.2096-5133.2021.03.002
引用格式: 张彤,宋明艳,王俊,等。 基于PCNN的工业制造领域质量文本实体关系抽取方法[J].信息技术与网络安全,2021,40(3):8-13.
文献标识码:A DOI:10.19358/j.issn.2096-5133.2021.03.002
引用格式: 张彤,宋明艳,王俊,等。 基于PCNN的工业制造领域质量文本实体关系抽取方法[J].信息技术与网络安全,2021,40(3):8-13.
Entity relation extraction method for quality text of industrial manufacturing based on Piecewise Convolutional Neural Network
Zhang Tong1,Song Mingyan1,Wang Jun1,2,Bai Yang1
(1.Beijing Jinghang Research Institute of Computing and Communication,Beijing 100071,China; 2.School of Management,Harbin Institute of Technology,Harbin 150006,China)
Abstract:Relation extraction of quality reports in industrial manufacturing industries such as automobiles and machinery is of great significance to the research of quality knowledge graph and quality question answering system of the industry. Aiming at the situation that there is no public dataset available for relation extraction of quality reports in the industrial manufacturing field, this paper collects quality reports in the field of industrial manufacturing and makes corresponding professional labels to construct a professional dataset for relation extraction. Based on this dataset, Piecewise Convolutional Neural Network(PCNN) is used for relation extraction. To be more specific, then based on Chinese characteristics, an improved PCNN model(C-PCNN) based on chinese characteristics is proposed to improve the performance of relation extraction in chinese corpus. Experimental results on the constructed dataset show that the accuracy, recall, and F1 values of the C-PCNN are respectively better than PCNN and RNN, indicating the feasibility and effectiveness of the method. This research has practical significance for personnel engaged in the manufacturing industry.
Key words :industrial manufacturing;quality text;relation extraction;Piecewise Convolutional Neural Network
0 引言
汽车、机械等工业制造行业的产品是涉及多个技术领域的高精度、高可靠性产品,具有结构复杂,生产周期长、生产状态多等特点[1]。随着信息化时代的发展,在生产研制过程中产生的各类质量数据日趋庞大,但由于现阶段缺乏统一的数据管理,各类质量信息散落在业务系统中,以电子或纸质文档方式存在,这些离散存储的质量信息包含各类质量问题的原因、问题部件、采取措施等关键信息。如何从这些离散存储的质量信息中抽取出有效信息,为工业制造提供数据支撑,帮助相关人员有效监督产品生产、快速解决质量问题,构成工业制造领域质量管理的迫切需求。本文从质量文本出发,利用关系抽取技术挖掘文本中实体间存在的语义关系,为后续构建质量知识图谱、质量问答系统奠定坚实基础。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003422
作者信息:
张 彤1,宋明艳1,王 俊1,2,白 洋1
(1.北京京航计算通讯研究所,北京100071;
2.哈尔滨工业大学 经济与管理学院,黑龙江 哈尔滨150006)
此内容为AET网站原创,未经授权禁止转载。