一种基于图卷积拓扑特征和关键词特征的文本检索方法

    公开(公告)号:CN115329046A

    公开(公告)日:2022-11-11

    申请号:CN202211001959.8

    申请日:2022-08-21

    Abstract: 本发明涉及自然语言处理领域的文本检索技术,提升了现有方法在语义匹配上的不足,包括以下步骤:围绕在工程咨询报告范围获取实验所需数据,每个标题标注60段文本数据;将数据以[CLS]标题[SEP]段落[SEP]的形式传入BERT模型,得到标题和段落的向量表示;基于向量分别构建图拓扑结构,并利用图卷积神经网络GCN获取全局结构特征;针对具有上下文信息和全局特征的向量表示,利用排序模型得到第一个得分;将段落对应关键词利用Word2Vec得到向量表示,基于余弦相似度得到第二个得分,对两个得分加权平均得到最终匹配结果;训练模型并更新参数,在测试集上提取文本特征并进行检索。本发明能够提升文本检索的准确性。

    一种中文专利文本相似度计算方法

    公开(公告)号:CN110134925A

    公开(公告)日:2019-08-16

    申请号:CN201910404981.9

    申请日:2019-05-15

    Abstract: 本发明涉及一种一种中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合来计算文本相似度,包括:从专利文本中抽取出SAO三元组;计算SAO三元组中词语的相似度;计算SAO之间相似度;基于SAO计算专利文本相似度;把向量空间模型方法和基于SAO结构的方法进行融合。本发明提供的中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合的方法计算专利文本相似度,充分发挥了二者的优点,克服了二者的缺陷,得到了极佳的正确率、召回率和F值,可以很好地满足实际应用的需要。

    一种融合多特征和注意力机制的多模态情感分析方法

    公开(公告)号:CN116028846A

    公开(公告)日:2023-04-28

    申请号:CN202211628659.2

    申请日:2022-12-20

    Abstract: 本发明公开了一种融合多特征和注意力机制的多模态情感分析模型,该模型具体包括以下步骤:通过多模态特征提取模块获得各模态丰富的低层特征;通过自注意力机制实现对三种模态内部信息的提取,获得对应的高层特征;通过跨模态注意力机制分别实现音频‑文本和视频‑文本的交互,在空间上实现模态间信息的交互,将学习到的模态内部信息和模态间交互信息进行拼接,得到更加丰富的音频和视频融合特征;最后拼接三种模态的最终表示并传入一个软注意力模块,为三种模态分配不同的权重,通过全连接层实现多模态情感分类结果。在公开数据集CH‑SIMS上进行测试,本发明可以有效提升多模态情感分析的准确性。

    文本关键词提取方法
    7.
    发明公开

    公开(公告)号:CN114091442A

    公开(公告)日:2022-02-25

    申请号:CN202111213156.4

    申请日:2021-10-19

    Abstract: 本申请公开了一种文本关键词提取方法。本申请实施例提供的文本关键词提取方法,基于多特征融合进行关键词提取,利用BERT向量和五笔向量捕捉输入序列的语义特征和字形特征,并将字频特征作为权重值进一步获取输入序列的上下文特征,从而使编码层BiLSTM捕捉到长序列更多的语义信息,并利用CRF添加约束信息促使输出标签序列结果更合理有效。本申请实施例提出的文本关键词提取方法,基于多特征融合进行关键词提取,可以有效地提升关键词提取的效果,取得了较高的准确率、召回率和F1值,完全能够满足实际应用的需要。

    机器翻译方法
    8.
    发明公开
    机器翻译方法 审中-实审

    公开(公告)号:CN114065780A

    公开(公告)日:2022-02-18

    申请号:CN202111212884.3

    申请日:2021-10-19

    Abstract: 本申请公开了一种机器翻译方法,通过Transformer模型实现,所述Transformer模型由多个同构的编码器和解码器组成,所述编码器用于编码中文的新能源专利文本,所述解码器用于产出对应英文专利的翻译结果;所述编码器与所述解码器都使用多头自注意力机制来捕获句子内部结构,所述编码器与所述解码器之间通过注意力机制连接来进行对齐翻译。本申请的机器翻译方法,能有效将术语信息整合到新能源中英专利机器翻译中,提高了翻译质量,并且大部分术语词都能得到正确的翻译。

    一种基于区块链食品溯源系统的后台数据管理方法及系统

    公开(公告)号:CN112101970A

    公开(公告)日:2020-12-18

    申请号:CN202011213761.7

    申请日:2020-11-04

    Abstract: 本发明公开了一种基于区块链食品溯源系统的后台数据管理方法及系统,所述方法包括获取通过所述客户端上报的疫情信息,其中,所述疫情信息包括门店名和疫情食材名;筛选出与所述门店名一致的所述餐饮主体名,并标记为疫情餐饮主体名;获取包括了所述疫情餐饮主体名的所述餐饮商信息,并标记为源头疫情单位信息;获取所述源头疫情单位信息对应的所有的所述台账信息;本发明提出的一种基于区块链食品溯源系统的后台数据管理方法将防疫功能和食品溯源技术进行了有效的结合,大大提升了食品溯源技术的应用范围,不仅能够对食品安全市场进行监督,还增加了卫生健康监督的能力。

    基于五笔码的字符级文本分类方法

    公开(公告)号:CN110059192A

    公开(公告)日:2019-07-26

    申请号:CN201910404059.X

    申请日:2019-05-15

    Abstract: 本发明涉及一种基于五笔码的字符级文本分类方法,采用五笔字型码对中文进行转换的字符级表示模型,采用五笔码将中文字符转化成唯一的英文字符串,再将英文字符串输入字符级模型中进行分类。本发明提供的基于五笔码的字符级文本分类方法,采用字符级表示模型,无需分词且能进行很好的字符转化,在中文文本分类中有着特殊的优势,分类效果明显优于传统模型和其他深度学习模型,可以有效地应用于中文文本分类,可以很好地满足实际应用的需要。

Patent Agency Ranking