一种文本语料库的关系抽取方法

    公开(公告)号:CN112836062B

    公开(公告)日:2022-05-13

    申请号:CN202110039879.0

    申请日:2021-01-13

    Abstract: 本发明属于关系抽取技术领域,具体涉及一种文本语料库的关系抽取方法。本发明解决了传统关系分类模型不能很好的利用句子中重要的信息对关系进行建模,并且一些神经网络模型往往需要使用NLP工具来提取额外的特征的问题,提出了基于注意力机制的分段循环神经网络。本发明所提出模型可以突出考虑句子中的关键部分,而且能够利用句子的其他部分对关键部分进行补充,然后利用潜在关系向量和注意力机制得到句子的关系表示向量,在这个过程中不需要任何手工设计的特征或者NLP工具。本发明通过依存句法分析发现关系类型,并提出了一种用来构建训练语料的弱监督方法。实验结果显示提出的关系抽取模型在弱监督获取的训练数据集上达到了较高的性能。

    一种文本语料库的关系抽取方法

    公开(公告)号:CN112836062A

    公开(公告)日:2021-05-25

    申请号:CN202110039879.0

    申请日:2021-01-13

    Abstract: 本发明属于关系抽取技术领域,具体涉及一种文本语料库的关系抽取方法。本发明解决了传统关系分类模型不能很好的利用句子中重要的信息对关系进行建模,并且一些神经网络模型往往需要使用NLP工具来提取额外的特征的问题,提出了基于注意力机制的分段循环神经网络。本发明所提出模型可以突出考虑句子中的关键部分,而且能够利用句子的其他部分对关键部分进行补充,然后利用潜在关系向量和注意力机制得到句子的关系表示向量,在这个过程中不需要任何手工设计的特征或者NLP工具。本发明通过依存句法分析发现关系类型,并提出了一种用来构建训练语料的弱监督方法。实验结果显示提出的关系抽取模型在弱监督获取的训练数据集上达到了较高的性能。

    一种面向中文医疗文本命名实体识别的方法

    公开(公告)号:CN111079377B

    公开(公告)日:2022-12-13

    申请号:CN201911223532.0

    申请日:2019-12-03

    Abstract: 本发明属于医学文本标注技术领域,具体涉及一种面向中文医疗文本命名实体识别的方法。本发明通过自定义多个实体类别并依此构建医疗术语标注词典实现了对原始医疗文本中实体的自动标注,在此基础上提出了一种多粒度特征融合的模型,首次将汉字的部首作为实体识别和分类的特征应用到医疗实体识别的任务中,通过对医疗文本中的词、字、字的部首三个不同粒度上的特征进行提取、表示和融合,并利用ID‑CNN‑CRF算法训练模型,以实现对各类医疗文本中医疗实体的识别工作。该方法的优势在于能应用在电子病历、医学期刊等各类医疗文本中,同时能较好地解决医疗领域中不同实体之间长度差异较大的问题,并且对于未登录实体的识别有着很好的效果。

    一种基于混合变异策略的网络协议漏洞挖掘方法

    公开(公告)号:CN115238822A

    公开(公告)日:2022-10-25

    申请号:CN202210998579.X

    申请日:2022-08-19

    Abstract: 一种基于混合变异策略的网络协议漏洞挖掘方法,它属于网络协议的漏洞挖掘技术领域。本发明解决了现有网络协议漏洞挖掘方法对未知网络协议漏洞挖掘能力差,且现有网络协议漏洞挖掘方法仅仅针对于单个网络协议,无法适用于不同网络协议的漏洞挖掘问题。本发明基于改进的生成对抗网络模型和线下漏洞知识库指导生成样本数据变异以提高漏洞触发率,进而生成更有效、针对性更强的测试用例,减少对漏洞挖掘无效测试用例的生成,可以智能高效地挖掘出未知网络协议的漏洞。本发明方法适用于大部分不同网络协议,大大减少人工分析数据帧的时间,可以迁移应用在不同网络协议上。本发明方法可以应用于网络协议的漏洞挖掘。

    一种基于改进Sarsa算法的路径规划方法

    公开(公告)号:CN113467481B

    公开(公告)日:2022-10-25

    申请号:CN202110918358.2

    申请日:2021-08-11

    Abstract: 一种基于改进Sarsa算法的路径规划方法,属于强化学习和路径规划领域。本发明为了解决基于传统Sarsa算法的路径规划过程存在规划收敛速度较慢、规划效率较低的问题。本发明针对于待进行路径规划的区域建立地图模型,引入路径矩阵P(s,a),在智能体探索的过程中,动态调整贪婪因子ε,采用ε‑greedy策略进行动作选择,智能体采取动作a后,环境会反馈一个奖励R并进入到下一个状态s′;并基于路径矩阵更新Q值表,从而基于改进的Sarsa算法实现路径规划。主要用于机器人的路径规划。

    一种在病历中快速提取十二导联心电图的方法

    公开(公告)号:CN114519369A

    公开(公告)日:2022-05-20

    申请号:CN202210066080.5

    申请日:2022-01-20

    Abstract: 本发明属于计算机视觉技术领域,具体涉及一种在病历中快速提取十二导联心电图的方法。本发明包括病历数据的预处理以及手工定义特征的二次细化,使用该二次细化可以加速人工标记过程,加快了模型训练过程。本发明通过定义卷积神经网络EcgNet;结合设置特征和卷积神经神经网络训练模型实现自动提取十二导联心电图,经过检验该模型提取的十二导联心电图具有单边100%的准确率,提取的心电图达到人工提取的水平。本发明可以快速精准的从病历数据中提取出满足要求的十二导联心电图,训练好模型后的提取过程快速且不需要人力参与,极大地节省了人力物力,加速了心血管疾病患者的临床数据集的构建。

Patent Agency Ranking