-
公开(公告)号:CN119719381A
公开(公告)日:2025-03-28
申请号:CN202411685755.X
申请日:2024-11-23
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/36 , G06F17/18 , G06F17/16 , G06N3/042 , G06N3/0455 , G06N3/0499 , G06N3/045 , G06N3/09 , G06N3/084 , G06F40/295
Abstract: 本发明涉及一种借助知识图谱生成关系型数据的方法,属于人工智能技术领域。本发明通过使用Graph Transformer,利用多头注意力机制和前馈神经网络的邻域聚合,能有效捕捉节点之间的语义关联与重要性,从而在新生成的图谱中保留了原始结构的特征,保证新生成的图谱结构和原始图谱结构保持一致;通过使用大语言模型(LLM)结合提示工程进行数据增强,在上下文和实体级别应用增强策略,在保持原有三元组结构的同时,通过替换策略确保增强文本内容与现实逻辑一致。微调预训练模型以适应实体识别和关系抽取任务,进一步提高了生成内容的可靠性和现实应用价值。
-
公开(公告)号:CN114860852A
公开(公告)日:2022-08-05
申请号:CN202210404352.8
申请日:2022-04-18
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/28 , G06F16/215 , G06F16/26 , G06F16/33 , G06F16/36 , G06F16/838 , G06F16/951
Abstract: 本发明涉及一种面向军事领域的知识图谱构建方法,属于知识图谱领域。本发明通过爬虫从互联网获取到军事相关新闻报道和百科类装备及机构等信息,对已有的数据进行补充;然后通过总结和前期经验,设置部分实体类型和实体关系类型,利用多种算法融合的方式进行军事实体、要素属性和实体间关系的抽取;对获得的实体、属性和关系进行融合校验,得到正确数据集合,进而进行知识图谱的可视化和推理、挖掘等其他应用。本发明可形成知识图谱,可以进行进一步应用和可视化展现。
-
公开(公告)号:CN119829784A
公开(公告)日:2025-04-15
申请号:CN202411711340.5
申请日:2024-11-27
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于分类的快速以图搜图方法,属于信息检索技术领域。本发明主要解决以图搜图的速度问题,针对特征向量匹配量大、匹配速度待提高的情况,提出了一种快速检索方法,采用由粗到细、层次化的方式,降低匹配量级,并在此基础上进行特征向量降维、量化等方式,进一步提高检索速度,同时采取不同方法保证以图搜图的准确性。
-
公开(公告)号:CN119721023A
公开(公告)日:2025-03-28
申请号:CN202411700522.2
申请日:2024-11-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/279 , G06F40/186 , G06N3/096 , G06N3/0455 , G06F16/353 , G06F18/22
Abstract: 本发明涉及一种识别非结构化数据中事件间关系的方法,属于大数据处理与数据挖掘技术领域。本发明模板创建步骤根据规则创建模型训练步骤和关系推断步骤中所需模板句子;模型训练步骤使用创建模板对BART模型进行微调;利用模型训练步骤的模型和模板创建步骤中的模板句子进行事件间关系推断的步骤。本发明提高了识别准确率并且可以同时进行多种事件关系的识别,本发明进行事件关系识别时,其精准率、召回率和综合得分分数都优于传统方法及其对应模型;而且本发明可以在不改变输出层格式的情况下,通过修改模板来轻易地扩展到多种关系的识别。
-
公开(公告)号:CN119721022A
公开(公告)日:2025-03-28
申请号:CN202411699641.0
申请日:2024-11-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06F18/22 , G06F40/186 , G06F40/211 , G06F40/253 , G06N20/00 , G06N3/045
Abstract: 本发明涉及一种基于关键词提示的细粒度关系抽取数据增强方法,属于人工智能、大数据、自然语言处理技术领域。此方法在句子合成过程中增加了关键词提示的上下文约束,以确保生成的句子在保持关系依赖性和语义一致性的同时,通过结合大语言模型的强大生成能力,生成具有丰富上下文多样性的句子,同时保持语义一致性,提高生成数据的多样性。
-
公开(公告)号:CN117217222A
公开(公告)日:2023-12-12
申请号:CN202310746380.2
申请日:2023-06-25
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F18/15 , G06F18/214 , G06F18/241
Abstract: 本发明涉及一种军事领域标注数据修正与事件检测方法,属于信息抽取技术领域。本发明使用原始数据集训练模型,并对原始标注数据进行预测,对于预测得分大于一定阈值的样本,将原始数据集的标注结果修改为模型预测结果,从而修正数据集中的错误标注数据和污染数据,提高训练集的质量。本发明在模型训练时引入了分层学习率策略,为靠近下游任务的模型层参数设置更大的学习率,提高预训练模型对于下游任务的适配能力;在模型推理时采用基于投票修正的模型融合方法,通过模型集成的方式提升少样本类别事件的召回率和准确率,融合多个模型的投票结果确定最终预测结果,从而提升模型的鲁棒性。
-
公开(公告)号:CN115114925A
公开(公告)日:2022-09-27
申请号:CN202210836787.X
申请日:2022-07-15
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种面向军事装备领域的实体识别方法,属于自然语言处理领域。本发明的方法包括军事装备实体的识别模型构建;字向量、词向量和实体后缀特征向量生成和拼接;装备实体标签预测;实体识别效果评估。本发明利用BERT预训练向量拼接军事实体后缀特征向量,通过Word Character LSTM‑CRF实现军事装备实体的识别抽取。使用BERT向量和实体后缀特征向量进行拼接,Word Character LSTM‑CRF实现军事实体的语义组成及后缀特点信息应用,提升识别的精确率。
-
-
-
-
-
-