-
公开(公告)号:CN117390196A
公开(公告)日:2024-01-12
申请号:CN202311346047.9
申请日:2023-10-17
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/36 , G06F18/2415 , G06N3/04
Abstract: 本发明涉及一种基于大模型抽象事理图谱构建的事件预测方法,属于人工智能、大数据领域。本发明首先基于大模型chatGLM2抽取事件信息,构建抽象事理图谱;再者,基于抽象事理图谱筛选出候选事件,形成新的事件链条;最后,将新的事件链条作为图神经网络事件预测模型的输入,预测出候选事件。本发明提出了融合候选事件转移概率的注意力机制,一方面,学习候选事件和已发生事件上下文的相关性;另一方面,也学习了候选事件本身的概率信息。本发明提出的模型不仅增强了可解释性,也学习到了上下文信息。
-
公开(公告)号:CN116757221B
公开(公告)日:2025-05-06
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/353 , G06F16/334
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN117390157B
公开(公告)日:2025-05-06
申请号:CN202311341725.2
申请日:2023-10-17
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/3329 , G06F16/36 , G06F16/35 , G06F40/30
Abstract: 本发明涉及一种基于门控主题模型的无监督关键词抽取方法,属于人工智能、大数据、自然语言处理领域。本发明提出了一种语义自适应的文档语义表示方法,在整个语料库上训练一个神经主题模型来挖掘该领域的相关主题,并采用门控机制对文档主题进行独立加权,使具有较高语义丰富度的文档被分配相对更多的主题;利用文档主题信息设计了一种新的关键词评分算法,同时考虑了主题相似度与主题重要度对关键词评判的影响。通过这两方面因素的折衷,避免了对文本核心主题的过度关注,从而提高了所抽取关键词的多样性。
-
公开(公告)号:CN116757221A
公开(公告)日:2023-09-15
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/35 , G06F16/33
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN117390157A
公开(公告)日:2024-01-12
申请号:CN202311341725.2
申请日:2023-10-17
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/332 , G06F16/36 , G06F16/35 , G06F40/30
Abstract: 本发明涉及一种基于门控主题模型的无监督关键词抽取方法,属于人工智能、大数据、自然语言处理领域。本发明提出了一种语义自适应的文档语义表示方法,在整个语料库上训练一个神经主题模型来挖掘该领域的相关主题,并采用门控机制对文档主题进行独立加权,使具有较高语义丰富度的文档被分配相对更多的主题;利用文档主题信息设计了一种新的关键词评分算法,同时考虑了主题相似度与主题重要度对关键词评判的影响。通过这两方面因素的折衷,避免了对文本核心主题的过度关注,从而提高了所抽取关键词的多样性。
-
公开(公告)号:CN116561639A
公开(公告)日:2023-08-08
申请号:CN202310596095.7
申请日:2023-05-24
Applicant: 北京计算机技术及应用研究所
IPC: G06F18/24 , G06F18/213 , G06F18/25 , G06F18/214 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及一种面向开源情报的多模态数据情感分析方法,属于人工智能、大数据、情感分析领域。本发明通过在Spark Streaming框架内封装多模态情感分析模型,实现了资源分类矩阵算子、图文数据对增强算子、多模态算法算子和多标签内容算子;该方法处理过程如下:首先,对从HDFS接收的输入数据进行预处理操作,其次,调用资源分类矩阵算子对文本、视频、图像进行分类处理,再次,调用图文数据对增强算子进行图文数据增强,调用多模态算法算子和多标签内容算子实现情感预测,最后,将预测的结果写入到Kafka,完成情感预测的整个流程。本发明实现大数据+深度学习的技术融合,满足可扩展性和低资源应用,支持海量数据的智能挖掘分析。
-
-
-
-
-