-
公开(公告)号:CN117010366A
公开(公告)日:2023-11-07
申请号:CN202310820600.1
申请日:2023-07-06
Applicant: 北京邮电大学 , 北京东方通网信科技有限公司 , 北京东方通科技股份有限公司
IPC: G06F40/211 , G06F40/289 , G06F18/214
Abstract: 本发明公开了一种面向文本特定句子的内容识别和纠错方法,属于自然语言处理领域。该方法结合多项技术,包括正则匹配、hfl/rbt3模型上下句预测、位置敏感哈希技术以及Jaccard相似度计算等方法,针对领导重要讲话等特定句子识别和纠错这种特定语境,综合各种不同的方法,可以较为准确地识别新闻文章中领导重要讲话等金句部分;通过改进minhash算法,使其在处理特定文本上更有效,并且针对其中的短文本利用Jaccard相似度计算匹配,使得其在错误识别部分上也有较高的准确度。该方法能够有效地提取和校验领导重要讲话内容等特定句子,对于新闻发布等起到提高效率和准确性的重要作用。
-
公开(公告)号:CN119150868A
公开(公告)日:2024-12-17
申请号:CN202411180411.3
申请日:2024-08-27
Applicant: 国网山东省电力公司德州供电公司 , 北京邮电大学
IPC: G06F40/295 , G06F18/25 , G06F18/22 , G06N3/0455
Abstract: 本发明提供一种基于大模型和混合专家的增强感知命名实体识别方法,设计有四个任务单元架构,包括:基于文生图模型的数据增强任务、图文检索任务、基于混合专家模型的多模态信息融合任务以及基于大模型的生成式命名实体识别任务,本发明设计架构科学可靠,增强了改进命名实体识别的效果,利用大模型本身丰富的知识,为命名实体识别提供额外知识,增强外部信息,从而辅助命名实体识别效果;充分利用图像知识,并利用混合专家模型筛选重要信息,去除干扰信息,增强命名实体识别的鲁棒性;利用检索模型检索相似的命名实体识别例子,为目标样本识别提供增强的知识,增强实体识别性能,与现有技术相比,本发明提出的方法具有良好的性能。
-
公开(公告)号:CN118113832A
公开(公告)日:2024-05-31
申请号:CN202410174038.4
申请日:2024-02-07
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/31 , G06F16/35 , G06N5/04 , G06N5/022 , G06F40/35 , G06F40/216
Abstract: 本发明公开了一种融合大语言模型和领域知识的问答系统构建方法,通过引入大语言模型和领域知识提取技术,实现领域知识库的自动构建以及可靠答案的准确生成,解决了领域问答系统数据成本高昂、知识构建复杂和生成效果难以保证等问题,整体展现出零人工标注、跨领域适用、自适应性知识库构建、智能匹配与高效生成等优势,显著提升领域知识获取、理解和利用的效率,适用于构建多类端到端自适应性领域问答系统。
-
-