-
公开(公告)号:CN116757221A
公开(公告)日:2023-09-15
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/35 , G06F16/33
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN115017293A
公开(公告)日:2022-09-06
申请号:CN202210566870.X
申请日:2022-05-23
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/335
Abstract: 本发明涉及一种基于LDA主题模型的文档推荐方法,属于信息技术领域。本发明使用了LDA主题模型将每个文档进行向量化,并输出该文档的主题概率,将推荐系统中的所有文档主题概率结合起来便能得到一个文档对主题的矩阵。另一方面,通过给新用户初始化来赋予每个用户一个主题概率,并使用户主题概率的维度与文档主题概率的维度保持一致,然后将所有用户主题概率结合起来得到一个用户对主题的矩阵。最后,通过用户和文档的两个主题概率矩阵,计算出用户对文档的兴趣值并将相应文档推荐给用户。这种推荐方法可以广泛运用在文档推荐系统中,并适用于各类文档。
-
公开(公告)号:CN114881032A
公开(公告)日:2022-08-09
申请号:CN202210462583.4
申请日:2022-04-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多任务学习的层次类别命名实体识别模型设计方法,属于自然语言处理技术领域。本发明通过在命名实体识别模型中加入对于类别关系的建模,使得模型能够同时识别出命名实体的多个类别,同时,本发明提出了基于多任务学习的模型来解决具有层次类别的命名实体识别问题。模型使用多任务学习机制同时学习多个层次的命名实体识别任务,这些任务共享同一个编码层,这样可以使得编码层学习到的编码向量可以同时适应多个层次的命名实体识别而不是过拟合于某一个单独的层次。最后,还分别设计了两种信息传递机制传递不同层次间的识别信息,以提高模型的识别效果。
-
公开(公告)号:CN119760061A
公开(公告)日:2025-04-04
申请号:CN202411726651.9
申请日:2024-11-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/3329 , G06F16/334 , G06F16/335 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 本发明涉及一种基于多层次语义推理的时序知识图谱问答方法,属于人工智能、自然语言处理以及知识图谱技术领域。本发明通过引入多层次的模块设计,包括问题分解、相关性排序和语义理解,有效提升系统在复杂时序问题上的问答能力。该方法利用大型语言模型的强大语义理解和推理能力,无需依赖额外的实体链接信息,能够在多时间粒度的复杂场景中提供准确的问答结果。通过采用问题分解与提示微调技术,本发明在提升问答系统性能的同时,增强了对复杂时序推理问题的处理能力,可以提高系统的准确性和鲁棒性。
-
公开(公告)号:CN117521666A
公开(公告)日:2024-02-06
申请号:CN202311451928.7
申请日:2023-11-03
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/211 , G06F40/117 , G06F16/33 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。
-
公开(公告)号:CN116561639A
公开(公告)日:2023-08-08
申请号:CN202310596095.7
申请日:2023-05-24
Applicant: 北京计算机技术及应用研究所
IPC: G06F18/24 , G06F18/213 , G06F18/25 , G06F18/214 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及一种面向开源情报的多模态数据情感分析方法,属于人工智能、大数据、情感分析领域。本发明通过在Spark Streaming框架内封装多模态情感分析模型,实现了资源分类矩阵算子、图文数据对增强算子、多模态算法算子和多标签内容算子;该方法处理过程如下:首先,对从HDFS接收的输入数据进行预处理操作,其次,调用资源分类矩阵算子对文本、视频、图像进行分类处理,再次,调用图文数据对增强算子进行图文数据增强,调用多模态算法算子和多标签内容算子实现情感预测,最后,将预测的结果写入到Kafka,完成情感预测的整个流程。本发明实现大数据+深度学习的技术融合,满足可扩展性和低资源应用,支持海量数据的智能挖掘分析。
-
-
-
-
-