一种面向中文医疗文本命名实体识别的方法

    公开(公告)号:CN111079377B

    公开(公告)日:2022-12-13

    申请号:CN201911223532.0

    申请日:2019-12-03

    Abstract: 本发明属于医学文本标注技术领域,具体涉及一种面向中文医疗文本命名实体识别的方法。本发明通过自定义多个实体类别并依此构建医疗术语标注词典实现了对原始医疗文本中实体的自动标注,在此基础上提出了一种多粒度特征融合的模型,首次将汉字的部首作为实体识别和分类的特征应用到医疗实体识别的任务中,通过对医疗文本中的词、字、字的部首三个不同粒度上的特征进行提取、表示和融合,并利用ID‑CNN‑CRF算法训练模型,以实现对各类医疗文本中医疗实体的识别工作。该方法的优势在于能应用在电子病历、医学期刊等各类医疗文本中,同时能较好地解决医疗领域中不同实体之间长度差异较大的问题,并且对于未登录实体的识别有着很好的效果。

    一种在病历中快速提取十二导联心电图的方法

    公开(公告)号:CN114519369A

    公开(公告)日:2022-05-20

    申请号:CN202210066080.5

    申请日:2022-01-20

    Abstract: 本发明属于计算机视觉技术领域,具体涉及一种在病历中快速提取十二导联心电图的方法。本发明包括病历数据的预处理以及手工定义特征的二次细化,使用该二次细化可以加速人工标记过程,加快了模型训练过程。本发明通过定义卷积神经网络EcgNet;结合设置特征和卷积神经神经网络训练模型实现自动提取十二导联心电图,经过检验该模型提取的十二导联心电图具有单边100%的准确率,提取的心电图达到人工提取的水平。本发明可以快速精准的从病历数据中提取出满足要求的十二导联心电图,训练好模型后的提取过程快速且不需要人力参与,极大地节省了人力物力,加速了心血管疾病患者的临床数据集的构建。

    一种四险一金领域政策法规文本实体识别方法

    公开(公告)号:CN112836046A

    公开(公告)日:2021-05-25

    申请号:CN202110039836.2

    申请日:2021-01-13

    Abstract: 本发明属于命名实体识别技术领域,具体涉及一种四险一金领域政策法规文本实体识别方法。本发明通过预训练语言模型BERT得到每个字符基于上下文特征动态生成的具有上下文语义信息的字向量,通过word2vec中的skip‑gram模型得到每个词语的词向量,将具有上下文语义信息的字向量和其所在的词的词向量利用维度拼接的方式进行特征融合,得到联合字词向量,不仅可以弥补少量标注样本特征不足和字符语义提取不充分的问题,还为字向量补充了词级短语信息,从而在一定程度上提高模型的准确率。本发明可以有效解决四险一金领域命名实体识别任务中标注数据不足以及识别精度不高的问题。

    一种基于结构化查询语言语句的源信息追踪方法

    公开(公告)号:CN102402615B

    公开(公告)日:2013-02-27

    申请号:CN201110434707.X

    申请日:2011-12-22

    Abstract: 本发明提供了一种基于结构化查询语言语句的源信息追踪方法。首先将SQL语句按其不同的结构进行分类,之后对不同类型的SQL语句进行逆向处理,在得到源信息后将源信息进行存储,并在源信息上再次执行原SQL语句,与之前得到的结果集进行对比,得出结论。该源信息查询方法已经通过实际数据进行了验证,验证结果证明该方法与其他数据血缘方法相比,可以在原有SQL的基础上,直接对SQL语句进行处理,将其有效的转化成源信息查询语句,并成功查找到对应的源信息。本发明提供的数据追踪方法适用于关系数据库中源信息的查询,可应用在各领域中对源信息进行的查询和存储。

    一种基于电子商务优惠券领域知识图谱的推荐系统及方法

    公开(公告)号:CN116450854A

    公开(公告)日:2023-07-18

    申请号:CN202310560444.X

    申请日:2023-05-17

    Abstract: 一种基于电子商务优惠券领域知识图谱的推荐系统及方法,涉及知识图谱与推荐技术领域。本发明是为了解决现有商务优惠券推荐方法还存在无法为新用户推荐、推荐可靠性及准确率低的问题。本发明包括:构建当前电商平台用户对应的知识图谱,获得知识图谱库;获取当前用户信息,并判断当前用户是否为新用户;获取当前用户对应的知识图谱,利用当前用户对应的知识图谱获取用户‑优惠券列表,从而进行优惠券推荐信息;获取新用户输入的老用户信息,并在知识图谱库中获取老用户对应的知识图谱;利用老用户对应的知识图谱和当前新用户对电商平台热门商品的打分情况构建新用户知识图谱,然后获取优惠券推荐信息。本发明用于推荐电子商务优惠券。

    一种基于多模态深度学习的主动脉瓣反流检测系统

    公开(公告)号:CN116434947A

    公开(公告)日:2023-07-14

    申请号:CN202310410930.3

    申请日:2023-04-17

    Abstract: 一种基于多模态深度学习的主动脉瓣反流检测系统,涉及心脏医疗领域。本发明是为了解决现有技术还无法实现通过心电图检测主动脉瓣反流的问题,而提出了一种基于多模态深度学习的主动脉瓣反流检测系统。本发明包括:获取心电图图像和文本结构化数据;将心电图图像和本文结构化数据输入到主动脉瓣反流检测网络中,获得主动脉瓣反流检测结果;主动脉反流检测网络处理流程为:提取心电图图像的特征和文本结构化数据的特征;将心电图图像特征与文本结构化数据的特征组合,获得最终特征,对最终特征进行分类并输出主动脉瓣反流检测结果;主动脉瓣反流检测结果为0或1,0表示正常,1表示主动脉瓣有反流。本发明用于利用心电图获取主动脉瓣反流情况。

    一种基于神经网络的文本分类方法

    公开(公告)号:CN111078833B

    公开(公告)日:2022-05-20

    申请号:CN201911223541.X

    申请日:2019-12-03

    Abstract: 本发明属于文本分类技术领域,具体涉及一种基于神经网络的文本分类方法。了解决传统文本分类方法不能同时有效的利用文本的语义信息和结构信息的问题,本发明可以提取文本的不同层次的语义信息和结构信息,包括单词级语义信息、单词级结构信息、短语级语义信息、短语级结构信息。为了得到文本的最终表示,本发明又提出两种融合方法来融合四种信息,分别是静态融合和基于注意力机制的动态融合。本发明基于神经网络,综合利用文本不同层次的语义信息和结构信息,提高了文本分类的准确率。

    一种文本语料库的关系抽取方法

    公开(公告)号:CN112836062A

    公开(公告)日:2021-05-25

    申请号:CN202110039879.0

    申请日:2021-01-13

    Abstract: 本发明属于关系抽取技术领域,具体涉及一种文本语料库的关系抽取方法。本发明解决了传统关系分类模型不能很好的利用句子中重要的信息对关系进行建模,并且一些神经网络模型往往需要使用NLP工具来提取额外的特征的问题,提出了基于注意力机制的分段循环神经网络。本发明所提出模型可以突出考虑句子中的关键部分,而且能够利用句子的其他部分对关键部分进行补充,然后利用潜在关系向量和注意力机制得到句子的关系表示向量,在这个过程中不需要任何手工设计的特征或者NLP工具。本发明通过依存句法分析发现关系类型,并提出了一种用来构建训练语料的弱监督方法。实验结果显示提出的关系抽取模型在弱监督获取的训练数据集上达到了较高的性能。

    仿真模型安全指标的可信度复核方法

    公开(公告)号:CN104731639A

    公开(公告)日:2015-06-24

    申请号:CN201510147987.4

    申请日:2015-03-31

    Abstract: 本发明公开了一种仿真模型安全指标的可信度复核方法。包括以下步骤:对基本养老保险安全指标体系的完整性进行评估,对基本养老保险安全指标体系的可信度进行计算,安全指标仿真模型可信度评估,对可信度小于阈值的仿真模型进行修正,重复步骤一~步骤四,直到仿真模型的可信度大于阈值。本发明的优点在于,通过调用审计养老保险数据集,可以不断修正模型,直到模型到达最优模型为止。

Patent Agency Ranking