物理与工程

2026, v.36;No.232(02) 179-185

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于数据挖掘的非结构化工单信息关键要素自动标识
AUTOMATIC IDENTIFICATION OF KEY ELEMENTS IN UNSTRUCTURED CHEMICAL ORDER INFORMATION BASED ON DATA MINING

罗润祥,陈春雪,李雄

摘要(Abstract):

不同渠道的非结构化工单信息缺乏统一格式约束,格式存在异构性,增加了工单信息关键要素的标识难度,为此本文提出基于数据挖掘的非结构化工单信息关键要素自动标识方法。对非结构化工单信息进行泛化处理,通过建立正向最短编辑距离路径并进行聚类,以消除格式异构性。利用预训练语言模型(BERT)提取泛化工单信息特征,并将其与工单元数据进行结构化映射,得到混合特征向量。将该混合特征向量输入数据挖掘算法中的最小二乘支持向量机模型中,优化模型参数,实现非结构化工单信息关键要素的自动标识。实验以国家电网95598服务热线工单为例,结果表明,该方法泛化后领域适应差距远低于阈值,格式异构性较低。特征提取的斯皮尔曼等级相关系数接近1,结构化映射长尾实体覆盖率良好,对同地点报修工单的服务地点、故障核心要素和特殊影响等关键要素标识精准,能够有效标识电力运维非结构化信息的关键要素。

关键词(KeyWords): 数据挖掘;非结构化工单;关键要素;自动标识;结构化映射

Abstract:

Keywords:

基金项目(Foundation): 基于大数据和AI技术的95598服务风险管控总体技术研究与应用(GZKJXM20232616)

作者(Author): 罗润祥,陈春雪,李雄

DOI: 10.27024/j.wlygc.2025.09.03.02

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享