-
公开(公告)号:CN115858813B
公开(公告)日:2025-05-16
申请号:CN202211628660.5
申请日:2022-12-20
Applicant: 北京信息科技大学 , 北京市工程咨询股份有限公司
IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F16/35 , G06F16/3329 , G06F40/30
Abstract: 本发明涉及面向工程咨询报告的文本检索方法,以改善工程咨询报告撰写过程中人力成本大、编撰周期过长等问题,包括以下步骤:构建面向工程咨询报告的文本检索语料集,使用语料集微调simCSE对比学习模型,将得到的模型参数初始化Vanilla BERT模型,将语料的文本信息送入Vanilla BERT模型得到语义匹配分数。将文本信息和关键词信息通过SAT模型得到词级粒度的义原词向量表示并送入DRMM深度文本交互模型,得到关联匹配分数。将得到的语义匹配分数和关联匹配分数归一化后加权融合,得到最终的匹配分数,完成标题与段落之间的文本检索。本发明联合上下文向量表示和文本交互匹配方法,有效增强了文本检索的效果。
-
公开(公告)号:CN118093874A
公开(公告)日:2024-05-28
申请号:CN202410275955.1
申请日:2024-03-12
IPC: G06F16/35 , G06F16/33 , G06F18/2415 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/084
Abstract: 本发明涉及一种低资源语言处理领域的情感分析方法。提出一种基于网格结构与多头注意力的新闻句子情感分析方法。包括以下步骤:通过将网格结构无损转换为扁平结构,实现音节序列中单词信息的引入;采用相对位置编码机制,编码音节和单词的位置和方向信息;使用多头自注意力机制,识别序列中音节和单词的关联关系和语义信息;最后通过全连接层进行分类得到低资源语言新闻句子情感类别。本发明解决了传统循环神经网络无法进行大规模并行计算以及卷积神经网络难以建模句子中的长距离依赖关系的问题,其中多头注意力机制的运用,丰富了词语间的关联关系,增强了句子语义和句法结构信息的理解,提高了低资源语言新闻句子情感分类效果。
-
公开(公告)号:CN110134925A
公开(公告)日:2019-08-16
申请号:CN201910404981.9
申请日:2019-05-15
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种一种中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合来计算文本相似度,包括:从专利文本中抽取出SAO三元组;计算SAO三元组中词语的相似度;计算SAO之间相似度;基于SAO计算专利文本相似度;把向量空间模型方法和基于SAO结构的方法进行融合。本发明提供的中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合的方法计算专利文本相似度,充分发挥了二者的优点,克服了二者的缺陷,得到了极佳的正确率、召回率和F值,可以很好地满足实际应用的需要。
-
公开(公告)号:CN116028846A
公开(公告)日:2023-04-28
申请号:CN202211628659.2
申请日:2022-12-20
Applicant: 北京信息科技大学
IPC: G06F18/24 , G06F18/25 , G10L15/16 , G06V10/82 , G06V20/40 , G06N3/0455 , G06N3/0442
Abstract: 本发明公开了一种融合多特征和注意力机制的多模态情感分析模型,该模型具体包括以下步骤:通过多模态特征提取模块获得各模态丰富的低层特征;通过自注意力机制实现对三种模态内部信息的提取,获得对应的高层特征;通过跨模态注意力机制分别实现音频‑文本和视频‑文本的交互,在空间上实现模态间信息的交互,将学习到的模态内部信息和模态间交互信息进行拼接,得到更加丰富的音频和视频融合特征;最后拼接三种模态的最终表示并传入一个软注意力模块,为三种模态分配不同的权重,通过全连接层实现多模态情感分类结果。在公开数据集CH‑SIMS上进行测试,本发明可以有效提升多模态情感分析的准确性。
-
公开(公告)号:CN114091442A
公开(公告)日:2022-02-25
申请号:CN202111213156.4
申请日:2021-10-19
Applicant: 北京信息科技大学
IPC: G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种文本关键词提取方法。本申请实施例提供的文本关键词提取方法,基于多特征融合进行关键词提取,利用BERT向量和五笔向量捕捉输入序列的语义特征和字形特征,并将字频特征作为权重值进一步获取输入序列的上下文特征,从而使编码层BiLSTM捕捉到长序列更多的语义信息,并利用CRF添加约束信息促使输出标签序列结果更合理有效。本申请实施例提出的文本关键词提取方法,基于多特征融合进行关键词提取,可以有效地提升关键词提取的效果,取得了较高的准确率、召回率和F1值,完全能够满足实际应用的需要。
-
公开(公告)号:CN114065780A
公开(公告)日:2022-02-18
申请号:CN202111212884.3
申请日:2021-10-19
Applicant: 北京信息科技大学
IPC: G06F40/58 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种机器翻译方法,通过Transformer模型实现,所述Transformer模型由多个同构的编码器和解码器组成,所述编码器用于编码中文的新能源专利文本,所述解码器用于产出对应英文专利的翻译结果;所述编码器与所述解码器都使用多头自注意力机制来捕获句子内部结构,所述编码器与所述解码器之间通过注意力机制连接来进行对齐翻译。本申请的机器翻译方法,能有效将术语信息整合到新能源中英专利机器翻译中,提高了翻译质量,并且大部分术语词都能得到正确的翻译。
-
公开(公告)号:CN112101970A
公开(公告)日:2020-12-18
申请号:CN202011213761.7
申请日:2020-11-04
Applicant: 北京信息科技大学 , 阳光易购(湖南)科技有限公司
Abstract: 本发明公开了一种基于区块链食品溯源系统的后台数据管理方法及系统,所述方法包括获取通过所述客户端上报的疫情信息,其中,所述疫情信息包括门店名和疫情食材名;筛选出与所述门店名一致的所述餐饮主体名,并标记为疫情餐饮主体名;获取包括了所述疫情餐饮主体名的所述餐饮商信息,并标记为源头疫情单位信息;获取所述源头疫情单位信息对应的所有的所述台账信息;本发明提出的一种基于区块链食品溯源系统的后台数据管理方法将防疫功能和食品溯源技术进行了有效的结合,大大提升了食品溯源技术的应用范围,不仅能够对食品安全市场进行监督,还增加了卫生健康监督的能力。
-
公开(公告)号:CN110059192A
公开(公告)日:2019-07-26
申请号:CN201910404059.X
申请日:2019-05-15
Applicant: 北京信息科技大学
IPC: G06F16/35
Abstract: 本发明涉及一种基于五笔码的字符级文本分类方法,采用五笔字型码对中文进行转换的字符级表示模型,采用五笔码将中文字符转化成唯一的英文字符串,再将英文字符串输入字符级模型中进行分类。本发明提供的基于五笔码的字符级文本分类方法,采用字符级表示模型,无需分词且能进行很好的字符转化,在中文文本分类中有着特殊的优势,分类效果明显优于传统模型和其他深度学习模型,可以有效地应用于中文文本分类,可以很好地满足实际应用的需要。
-
公开(公告)号:CN115270785A
公开(公告)日:2022-11-01
申请号:CN202210975168.9
申请日:2022-08-17
Applicant: 北京信息科技大学
IPC: G06F40/284 , G06F40/295 , G06F16/35 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理领域的知识抽取技术,特别涉及对武器装备知识领域的三元组抽取,可以充分挖掘非结构化信息,缓解模型对样本标注的依赖。包括以下步骤:(一)、通过爬虫对舰船、飞机等信息进行了采集并持久化至容器。(二)、使用自编码方式结合自注意力机制对文本的双向上下文以获取特征向量;(三)、将特征向量投入结合多轮对抗攻击的头实体识别器将其识别为头实体或尾实体;(四)、针对不同的头实体类型获取到句子向量,以字为最小粒度进行融合;(五)、在关系尾实体识别模块,指定关系对应的实体识别;本发明可获得更好缓解武器装备领域遇到的单实体重叠问题和实体对重叠问题,实现对武器装备领域的复杂关系以及隐含关系进行抽取。
-
公开(公告)号:CN112528661A
公开(公告)日:2021-03-19
申请号:CN202011470736.7
申请日:2020-12-15
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F40/30
Abstract: 本申请公开了一种实体相似度计算方法,包括:概念相似度计算步骤、距离相似度计算步骤、语义相似度计算步骤以及属性相似度计算步骤。所述概念相似度计算步骤为融合路径权重的实体概念相似度计算步骤。所述语义相似度计算步骤为基于Bert的语义相似度计算步骤。所述属性相似度计算步骤为基于TextRank的属性相似度计算步骤。本申请实施例提供的实体相似度计算方法,利用概念层次和距离来衡量实体之间的差异,利用语义和属性来衡量实体之间的共性,得到的正确率、召回率以及F1值较高,相较于传统的单独使用路径或者概念层次的方法取得了更好的效果。
-
-
-
-
-
-
-
-
-