-
公开(公告)号:CN108717425A
公开(公告)日:2018-10-30
申请号:CN201810385484.4
申请日:2018-04-26
申请人: 国家电网公司 , 英大传媒投资集团有限公司 , 南瑞集团有限公司 , 国网山东省电力公司烟台供电公司
发明人: 刘前卫 , 盛兴 , 赵焱 , 刘广峰 , 张渝 , 张涛 , 周莉 , 聂庆 , 谢秋学 , 雍志娟 , 贺芳 , 孙金 , 吴培培 , 滕家雨 , 张楠 , 商莹楠 , 王光林 , 刘斌 , 季笑庆 , 张婷婷
IPC分类号: G06F17/30
摘要: 本发明公开了一种基于多数据源的知识图谱人物实体对齐方法,该方法首先从知识图谱中将同名的人物实体规约在一起,然后对两个及以上相同名字的实体相互之间进行比较,计算两者之间相似度,设置相应的阈值区间[a,b],相似度大于b则判断是相同的实体,如果相似度大于a而小于b则加入到人工确认合并候选集,由人工进行确认,如果相似度小于a,则直接判定为不同实体。本发明在本体信息不完备的情形下进行人物实体合并,通过利用百科知识库、基于共同发文网络关系和研究领域相似度的方法进行加权求和,最后综合判断,且加权参数根据机器学习的结果实时更新,机器自主学习,让结果更加精准。
-
公开(公告)号:CN109740149A
公开(公告)日:2019-05-10
申请号:CN201811554878.4
申请日:2018-12-19
申请人: 英大传媒投资集团有限公司 , 国家电网有限公司 , 南瑞集团有限公司 , 国网山东省电力公司烟台供电公司
IPC分类号: G06F17/27
摘要: 本发明公开了一种基于远程监督的同义词提取方法,属于自然语言处理技术领域。该方法包括:建立领域中同义词的词汇句法模式模型;构建基于LSTM和CRF的远程监督神经网络学习模型,并使用领域词条进行训练,得到同义词发现的句子序列标注集;根据标注集,将语料库中的语句中的候选实体进行标注及配对,抽取实体后得到同义词。本发明通过利用基于百科知识库词条特性、结合领域同义词的相应词汇-句法模式、通过远程监督学习和机器自主学习,获取领域同义词,该方法以机器处理为主,人工处理为辅,提高同义词获取的效率,在不降低精度的情况下,大幅降低人工成本。通过定期对在线百科的词条学习和对隐藏同义词的分析可以发现新词。
-
公开(公告)号:CN109740149B
公开(公告)日:2019-12-13
申请号:CN201811554878.4
申请日:2018-12-19
申请人: 英大传媒投资集团有限公司 , 国家电网有限公司 , 南瑞集团有限公司 , 国网山东省电力公司烟台供电公司
IPC分类号: G06F17/27
摘要: 本发明公开了一种基于远程监督的同义词提取方法,属于自然语言处理技术领域。该方法包括:建立领域中同义词的词汇句法模式模型;构建基于LSTM和CRF的远程监督神经网络学习模型,并使用领域词条进行训练,得到同义词发现的句子序列标注集;根据标注集,将语料库中的语句中的候选实体进行标注及配对,抽取实体后得到同义词。本发明通过利用基于百科知识库词条特性、结合领域同义词的相应词汇‑句法模式、通过远程监督学习和机器自主学习,获取领域同义词,该方法以机器处理为主,人工处理为辅,提高同义词获取的效率,在不降低精度的情况下,大幅降低人工成本。通过定期对在线百科的词条学习和对隐藏同义词的分析可以发现新词。
-
公开(公告)号:CN112507076A
公开(公告)日:2021-03-16
申请号:CN202011464939.5
申请日:2020-12-14
申请人: 英大传媒投资集团有限公司 , 南瑞集团有限公司
IPC分类号: G06F16/33 , G06F16/36 , G06F40/295 , G06F40/30
摘要: 本发明公开了一种语义分析搜索方法、装置及存储介质,其中方法包括:基于知识图谱,构建用于对用户问题进行语义分析的领域分词模型,对所述领域分词模型得到的实体、算子集合进行意图识别,构造意识图谱,基于搜索条件对所述意识图谱进行优化,得到意图子图,获取用户选择的搜索方式,分别基于所述知识图谱、所述意图子图获取对应回答,并输出给用户。本发明提高了语义分析搜索算法的计算效率和准确性。
-
公开(公告)号:CN114416102A
公开(公告)日:2022-04-29
申请号:CN202210103654.1
申请日:2022-01-27
申请人: 英大传媒投资集团有限公司 , 国网山东省电力公司信息通信公司 , 海乂知信息科技(南京)有限公司
摘要: 本发明公开了一种基于知识图谱脚本的数据处理方法,其特征在于,所述方法包括:基于知识图谱业务体系构建知识图谱脚本;当接收到xml数据后将所述xml数据放入指定目录,所述xml数据为图书;通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookData对象;当所述bookData对象中的数据解析完成后,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联;通过上述方法,能够基于知识图谱脚本,实现xml数据的解析和入图操作,使得操作简单并减少知识入图存储的繁琐程度,最终形成可信度较高并且可支撑的电力行业企业内的人员管理手段。
-
公开(公告)号:CN114490989A
公开(公告)日:2022-05-13
申请号:CN202210104028.4
申请日:2022-01-27
申请人: 英大传媒投资集团有限公司 , 海乂知信息科技(南京)有限公司 , 国网山东省电力公司信息通信公司
发明人: 郑林 , 丁军 , 张渝 , 张涛 , 汤琳琳 , 聂庆 , 贺芳 , 王磬音 , 谢秋学 , 马青 , 孙金 , 赵秋慧 , 常秀 , 李一斌 , 张晓川 , 陈添添 , 郑海杰 , 苏婧仪 , 巫乾军
IPC分类号: G06F16/332 , G06F16/338 , G06F16/36 , G06Q50/06
摘要: 本申请公开了一种电力行业机器人问答方法、装置、设备和存储介质。该方法包括:接收用户提出的问题;根据预先建立的搜索模块查找所述问题的结果;所述搜索模块包括:第一搜索模块、第二搜索模块、第三搜索模块和第四搜索模块;根据预先设定的每个搜索模块的权值计算第一结果、第二结果、第三结果和第四结果的影响分值;根据所述影响分值对所第一结果、第二结果、第三结果和第四结果进行排序;确定影响分值最大的结果并输出。本发明的技术方案,通过采用四种不同的搜索引擎来获得四种不同的答案,通过评分排序,输出分值最大的结果,提高了答案的优化水平,使得用户获得最优的答案,提高搜索的效率。
-
公开(公告)号:CN114428909A
公开(公告)日:2022-05-03
申请号:CN202210103655.6
申请日:2022-01-27
申请人: 英大传媒投资集团有限公司 , 国网山东省电力公司信息通信公司 , 海乂知信息科技(南京)有限公司
IPC分类号: G06F16/9535 , G06F16/9538 , G06F16/36 , G06F16/81
摘要: 本申请公开了一种基于行业知识图谱的搜索方法、装置、设备和存储介质。应用于服务器,该方法包括:接收客户端输入的行业搜索关键词;根据预先建立的知识图谱,对行业搜索关键词进行搜索,得到对应的搜索结果;在客户端的显示界面上显示所述搜索结果;所述搜索结果包括:搜索结果列表;所述行业搜索关键词相关的知识图谱;所述行业搜索关键词相关的行业关键词推荐列表;与所述行业搜索关键词相关的行业期刊文章推荐列表。本申请的显示界面上显示的内容丰富,方便了用户需求。采用知识图谱搜索,提高了搜索效果。
-
-
-
-
-
-