-
公开(公告)号:CN119831030A
公开(公告)日:2025-04-15
申请号:CN202411730689.3
申请日:2024-11-29
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于领域数据配比的大语言模型知识注入方法,属于大语言模型、领域知识、自然语言处理技术领域。本发明设计了一个自我监督的持续预训练框架,该框架能够在不增加额外人工标注成本的情况下,利用选定的知识对LLMs进行知识增强;提出了一个基于同质性度量的知识筛选机制,用于从大规模知识图谱中精选与目标任务相关的高质量知识,有效提升了LLMs的领域感知。在多个低资源垂直领域的NER任务上进行了广泛的实验,实验结果验证了本方法的有效性,尤其是在提升模型对复杂实体类型识别能力方面表现出色。
-
公开(公告)号:CN116757221A
公开(公告)日:2023-09-15
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/35 , G06F16/33
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN116757221B
公开(公告)日:2025-05-06
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/353 , G06F16/334
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN119834810A
公开(公告)日:2025-04-15
申请号:CN202411699337.6
申请日:2024-11-26
Applicant: 北京计算机技术及应用研究所
IPC: H03M7/30 , G06F18/10 , G06F18/2131 , G06F18/2433
Abstract: 本发明涉及一种强时敏目标场景下的多源瞬时饱和数据压缩方法,属于数据压缩技术领域。本发明通过多级分层架构设计,实现数据的高效压缩。该方法通过时序分析和深度学习模型提取数据关键特征,基于传感器数据的重要性与变化特性,动态选择压缩策略,满足强时敏目标场景中的实时性需求。
-
-
-