一种基于层级注意力和标签引导学习的关键信息识别方法

    公开(公告)号:CN114139522A

    公开(公告)日:2022-03-04

    申请号:CN202111319941.8

    申请日:2021-11-09

    Abstract: 本发明涉及一种基于层级注意力和标签引导学习的关键信息识别方法,属于文本挖掘和信息处理技术领域。本发明采用基于层级注意力和标签引导学习融合的关键信息识别框架,将文本表示模型直接应用于文本挖掘的局限性,词编码层和句编码层能够充分捕捉文本组织结构,将重要单词聚合为句子向量,然后将重要句子向量聚合为文本向量;词注意力层和句注意力层将注意力机制分别用于单词和句子层面,使其能够在文本表示时区别关注更重要或者次重要的内容;采用标签引导学习层执行基于标签的注意力编码,将文本表示映射到标签空间,标签引导学习层可以直接与上下文编码一起联合学习。本发明在引文分析、信息检索和细粒度知识服务等领域,具有广阔的应用前景。

    一种基于层级注意力和标签引导学习的关键信息识别方法

    公开(公告)号:CN114139522B

    公开(公告)日:2024-07-26

    申请号:CN202111319941.8

    申请日:2021-11-09

    Abstract: 本发明涉及一种基于层级注意力和标签引导学习的关键信息识别方法,属于文本挖掘和信息处理技术领域。本发明采用基于层级注意力和标签引导学习融合的关键信息识别框架,将文本表示模型直接应用于文本挖掘的局限性,词编码层和句编码层能够充分捕捉文本组织结构,将重要单词聚合为句子向量,然后将重要句子向量聚合为文本向量;词注意力层和句注意力层将注意力机制分别用于单词和句子层面,使其能够在文本表示时区别关注更重要或者次重要的内容;采用标签引导学习层执行基于标签的注意力编码,将文本表示映射到标签空间,标签引导学习层可以直接与上下文编码一起联合学习。本发明在引文分析、信息检索和细粒度知识服务等领域,具有广阔的应用前景。

    一种基于模式识别的英文论文文档多粒度内容处理方法

    公开(公告)号:CN112597267A

    公开(公告)日:2021-04-02

    申请号:CN202011474201.7

    申请日:2020-12-14

    Abstract: 本发明涉及一种基于模式识别的英文论文文档多粒度内容处理方法,属于信息处理技术领域。本方法,针对英文PDF格式论文文档内容识别处理面临的问题,将论文按章、节、段落拆分为更小粒度的内容子单元,并将论文中的表格、图形、算法等非文本内容单独抽取,同时,保留各个子单元原有的语义关系和上下文联系,以便后续应用。在进行信息抽取时,通过利用文本内容之间的语义关联及文本位置信息,能够高效、快速、准确地识别目标文本内容对象。

    一种可变形的涡喷飞行器
    4.
    发明公开

    公开(公告)号:CN117922863A

    公开(公告)日:2024-04-26

    申请号:CN202410117923.9

    申请日:2024-01-29

    Abstract: 本发明公开了一种可变形的涡喷飞行器,涉及飞行器技术领域,包括由能够产生大挠度变形的材料制成的机身、能够驱动机身向上弯曲的正向变形机构、能够驱动机身向下弯曲的反向变形机构、多个绕机身周向均匀布设的涡喷推力机构以及与正向变形机构、反向变形机构和涡喷推力机构通信连接的控制系统。本发明提供的可变形的涡喷飞行器能够同时提高载荷能力与通过性。

    一种基于深度学习的知识服务实体聚类数目预测方法

    公开(公告)号:CN115758191A

    公开(公告)日:2023-03-07

    申请号:CN202211350301.8

    申请日:2022-10-31

    Abstract: 本发明涉及一种基于深度学习的知识服务实体聚类数目预测方法,属于数据挖掘应用与信息处理技术领域。本方法为了解决在网络知识服务应用中,在海量文献和数据下如何有效预测实体聚类数目,提高信息数据挖掘推送精准度和效率的技术问题,结合了自编码器与蒙特卡洛方法,能够准确地自动预估高维数据集的聚类数目,有效地克服目前聚类数目需要人为预估的技术缺陷,显著提高系统在热点推荐、搜索、问答等方面的信息推荐能力,为用户推荐相关度更高的信息。本发明在文本挖掘和细粒度知识服务等领域,具有广阔的应用前景。

    一种基于模式识别的英文论文文档多粒度内容处理方法

    公开(公告)号:CN112597267B

    公开(公告)日:2022-09-20

    申请号:CN202011474201.7

    申请日:2020-12-14

    Abstract: 本发明涉及一种基于模式识别的英文论文文档多粒度内容处理方法,属于信息处理技术领域。本方法,针对英文PDF格式论文文档内容识别处理面临的问题,将论文按章、节、段落拆分为更小粒度的内容子单元,并将论文中的表格、图形、算法等非文本内容单独抽取,同时,保留各个子单元原有的语义关系和上下文联系,以便后续应用。在进行信息抽取时,通过利用文本内容之间的语义关联及文本位置信息,能够高效、快速、准确地识别目标文本内容对象。

Patent Agency Ranking