-
公开(公告)号:CN115994220A
公开(公告)日:2023-04-21
申请号:CN202211595240.1
申请日:2022-12-13
Applicant: 中铁二院工程集团有限责任公司
Inventor: 蔡俊宇 , 陈可 , 王健 , 谢晨琳 , 杨佳 , 邓云川 , 林宗良 , 陈科 , 于龙 , 钟源 , 丁润 , 刘涛 , 鲁小兵 , 李默然 , 杨洋 , 邵岩 , 谭磊 , 刘习文 , 王彦哲 , 梁婧文 , 陈子文 , 朱晟颉 , 代玉林
IPC: G06F16/35 , G06F40/30 , G06Q10/0635 , G06Q50/06 , G06Q50/26 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/08
Abstract: 本发明公开了一种基于语义挖掘的接触网文本数据缺陷识别方法及设备,包括:获取原始接触网文本数据,对原始接触网文本数据进行预处理;将预处理后的接触网文本数据输入至预先建立的文本挖掘‑缺陷分类模型,利用预先建立的文本挖掘‑缺陷分类模型生成接触网文本数据的缺陷类别;其中,预先建立的文本挖掘‑缺陷分类模型为:BERT‑DTCN联合模型;其中,BERT子模型用于对预处理后的接触网文本数据进行语义挖掘,DTCN子模型用于对BERT子模型输出的语义挖掘文本进行缺陷分类。本发明针对接触网文本数据,设计相应的语义挖掘模型与缺陷分类模型,基于语义挖掘模型高效、准确地挖掘缺陷记录中包含的缺陷知识,同时配合缺陷分类模型确定缺陷严重程度识别。