一种中文专利文本相似度计算方法

    公开(公告)号:CN110134925A

    公开(公告)日:2019-08-16

    申请号:CN201910404981.9

    申请日:2019-05-15

    Abstract: 本发明涉及一种一种中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合来计算文本相似度,包括:从专利文本中抽取出SAO三元组;计算SAO三元组中词语的相似度;计算SAO之间相似度;基于SAO计算专利文本相似度;把向量空间模型方法和基于SAO结构的方法进行融合。本发明提供的中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合的方法计算专利文本相似度,充分发挥了二者的优点,克服了二者的缺陷,得到了极佳的正确率、召回率和F值,可以很好地满足实际应用的需要。

    一种融合多特征和注意力机制的多模态情感分析方法

    公开(公告)号:CN116028846A

    公开(公告)日:2023-04-28

    申请号:CN202211628659.2

    申请日:2022-12-20

    Abstract: 本发明公开了一种融合多特征和注意力机制的多模态情感分析模型,该模型具体包括以下步骤:通过多模态特征提取模块获得各模态丰富的低层特征;通过自注意力机制实现对三种模态内部信息的提取,获得对应的高层特征;通过跨模态注意力机制分别实现音频‑文本和视频‑文本的交互,在空间上实现模态间信息的交互,将学习到的模态内部信息和模态间交互信息进行拼接,得到更加丰富的音频和视频融合特征;最后拼接三种模态的最终表示并传入一个软注意力模块,为三种模态分配不同的权重,通过全连接层实现多模态情感分类结果。在公开数据集CH‑SIMS上进行测试,本发明可以有效提升多模态情感分析的准确性。

    文本关键词提取方法
    5.
    发明公开

    公开(公告)号:CN114091442A

    公开(公告)日:2022-02-25

    申请号:CN202111213156.4

    申请日:2021-10-19

    Abstract: 本申请公开了一种文本关键词提取方法。本申请实施例提供的文本关键词提取方法,基于多特征融合进行关键词提取,利用BERT向量和五笔向量捕捉输入序列的语义特征和字形特征,并将字频特征作为权重值进一步获取输入序列的上下文特征,从而使编码层BiLSTM捕捉到长序列更多的语义信息,并利用CRF添加约束信息促使输出标签序列结果更合理有效。本申请实施例提出的文本关键词提取方法,基于多特征融合进行关键词提取,可以有效地提升关键词提取的效果,取得了较高的准确率、召回率和F1值,完全能够满足实际应用的需要。

    机器翻译方法
    6.
    发明公开
    机器翻译方法 审中-实审

    公开(公告)号:CN114065780A

    公开(公告)日:2022-02-18

    申请号:CN202111212884.3

    申请日:2021-10-19

    Abstract: 本申请公开了一种机器翻译方法,通过Transformer模型实现,所述Transformer模型由多个同构的编码器和解码器组成,所述编码器用于编码中文的新能源专利文本,所述解码器用于产出对应英文专利的翻译结果;所述编码器与所述解码器都使用多头自注意力机制来捕获句子内部结构,所述编码器与所述解码器之间通过注意力机制连接来进行对齐翻译。本申请的机器翻译方法,能有效将术语信息整合到新能源中英专利机器翻译中,提高了翻译质量,并且大部分术语词都能得到正确的翻译。

    一种基于区块链食品溯源系统的后台数据管理方法及系统

    公开(公告)号:CN112101970A

    公开(公告)日:2020-12-18

    申请号:CN202011213761.7

    申请日:2020-11-04

    Abstract: 本发明公开了一种基于区块链食品溯源系统的后台数据管理方法及系统,所述方法包括获取通过所述客户端上报的疫情信息,其中,所述疫情信息包括门店名和疫情食材名;筛选出与所述门店名一致的所述餐饮主体名,并标记为疫情餐饮主体名;获取包括了所述疫情餐饮主体名的所述餐饮商信息,并标记为源头疫情单位信息;获取所述源头疫情单位信息对应的所有的所述台账信息;本发明提出的一种基于区块链食品溯源系统的后台数据管理方法将防疫功能和食品溯源技术进行了有效的结合,大大提升了食品溯源技术的应用范围,不仅能够对食品安全市场进行监督,还增加了卫生健康监督的能力。

    基于五笔码的字符级文本分类方法

    公开(公告)号:CN110059192A

    公开(公告)日:2019-07-26

    申请号:CN201910404059.X

    申请日:2019-05-15

    Abstract: 本发明涉及一种基于五笔码的字符级文本分类方法,采用五笔字型码对中文进行转换的字符级表示模型,采用五笔码将中文字符转化成唯一的英文字符串,再将英文字符串输入字符级模型中进行分类。本发明提供的基于五笔码的字符级文本分类方法,采用字符级表示模型,无需分词且能进行很好的字符转化,在中文文本分类中有着特殊的优势,分类效果明显优于传统模型和其他深度学习模型,可以有效地应用于中文文本分类,可以很好地满足实际应用的需要。

    一种面向武器装备领域的复杂三元组抽取方法

    公开(公告)号:CN115270785A

    公开(公告)日:2022-11-01

    申请号:CN202210975168.9

    申请日:2022-08-17

    Abstract: 本发明涉及自然语言处理领域的知识抽取技术,特别涉及对武器装备知识领域的三元组抽取,可以充分挖掘非结构化信息,缓解模型对样本标注的依赖。包括以下步骤:(一)、通过爬虫对舰船、飞机等信息进行了采集并持久化至容器。(二)、使用自编码方式结合自注意力机制对文本的双向上下文以获取特征向量;(三)、将特征向量投入结合多轮对抗攻击的头实体识别器将其识别为头实体或尾实体;(四)、针对不同的头实体类型获取到句子向量,以字为最小粒度进行融合;(五)、在关系尾实体识别模块,指定关系对应的实体识别;本发明可获得更好缓解武器装备领域遇到的单实体重叠问题和实体对重叠问题,实现对武器装备领域的复杂关系以及隐含关系进行抽取。

    实体相似度计算方法
    10.
    发明公开

    公开(公告)号:CN112528661A

    公开(公告)日:2021-03-19

    申请号:CN202011470736.7

    申请日:2020-12-15

    Abstract: 本申请公开了一种实体相似度计算方法,包括:概念相似度计算步骤、距离相似度计算步骤、语义相似度计算步骤以及属性相似度计算步骤。所述概念相似度计算步骤为融合路径权重的实体概念相似度计算步骤。所述语义相似度计算步骤为基于Bert的语义相似度计算步骤。所述属性相似度计算步骤为基于TextRank的属性相似度计算步骤。本申请实施例提供的实体相似度计算方法,利用概念层次和距离来衡量实体之间的差异,利用语义和属性来衡量实体之间的共性,得到的正确率、召回率以及F1值较高,相较于传统的单独使用路径或者概念层次的方法取得了更好的效果。

Patent Agency Ranking