一种联合序列标注和模式匹配的事件元素检测方法

    公开(公告)号:CN113177416B

    公开(公告)日:2022-06-07

    申请号:CN202110532819.2

    申请日:2021-05-17

    Applicant: 同济大学

    Abstract: 目前的中文医疗事理知识图谱事件元素检测研究主要基于单一的模式匹配或深度学习模型,且未对事件元素进行长短级粒度划分,不能有效抽取长句级元素,导致了模型灵活性不高、泛化性差。因此,本发明提出了一种联合序列标注和模式匹配的事件元素检测方法,创新点在依据事件类型对其中的事件元素进行粒度区分,并针对不同粒度的事件元素采用不同的方法进行检测。首先,对于短词级事件元素检测,使用基于序列标注的BERT‑BiLSTM‑CRF模型,并结合实体信息、触发词信息等语料特征,以实现较强的可扩展性。其次,通过联合依存句法分析的模式匹配方法,进行了长句级事件元素的检测,由此提高事件元素检测的准确率。

    一种肺部X线胸片检查报告自动生成方法

    公开(公告)号:CN111243729B

    公开(公告)日:2022-03-08

    申请号:CN202010013066.X

    申请日:2020-01-07

    Applicant: 同济大学

    Abstract: 目前的X线胸片检查报告自动生成方法无法准确地生成长段的检查报告、无法有效地捕获胸片包含的语义信息、未考虑中文检查报告中正常样本描述相似的特点。一种肺部X线胸片检查报告自动生成方法,本发明的创新点在于利用胸片的语义标签生成检查报告,并针对中文检查报告的特点加入二分类器来区分胸片的正常与异常,有效地提高了自动生成中文检查报告的精确度。

    一种基于负样本多样性的问答模型集成方法

    公开(公告)号:CN113254609A

    公开(公告)日:2021-08-13

    申请号:CN202110516176.2

    申请日:2021-05-12

    Applicant: 同济大学

    Inventor: 方钰 翟鹏珺 崔雪

    Abstract: 一种基于负样本多样性的问答模型集成方法。自动问答系统的问答匹配阶段常通过集成模型来捕捉语料中多角度的信息,从而提升问答系统的准确性和稳定性。在中文医疗问答领域,现有问答模型集成方法大多数使用随机采样或单一相似度距离分段采样的方法获取负样本,忽略了负样本的多样性,进而导致基模型的多样性不足,影响了集成模型的效果。本发明根据正负样本间的多种相似度距离,分别对负样本进行排序和分段采样,由此构成多个训练样本集,并基于这些训练样本集训练出多个基模型最后进行集成,不仅弥补了基模型多样性的不足,也提升了问答模型的稳定性和准确率。

    一种面向样本不均衡的多疾病分类器设计方法

    公开(公告)号:CN112560900A

    公开(公告)日:2021-03-26

    申请号:CN202011365674.3

    申请日:2020-11-28

    Applicant: 同济大学

    Abstract: 本发明目的在于克服现有技术的不足,给出一种面向样本不均衡的多疾病分类器设计方法,首先对按其疾病类别将医学病例数据划分为多个病例样本子集,然后对每个样本子集进行病症关联规则的特征选择方法,选择出该病例样本子集的特征向量,然后在不均衡度为上限阈值的前提条件下,迭代随机更新采用概率,对病例样本子集进行均衡化,然后再训练每一个样本子集的弱分类器并计算其分类效果,并最终通过判断macro‑F1的差值是否满足迭代收敛阈值来决定迭代生成多疾病分类器是否结束。

    中文电子病历的关系抽取方法

    公开(公告)号:CN111223539A

    公开(公告)日:2020-06-02

    申请号:CN201911388053.4

    申请日:2019-12-30

    Applicant: 同济大学

    Abstract: 一种基于中文电子病历的关系抽取方法,其特征在于,使用NLPIR分词器对中文电子病历文本进行分词,提取词和词性特征,即基本特征;对中文电子病历文本进行分句,抽取实体对,保留其起始和终止位置信息、实体类别以及修饰信息;提取电子病历的章节名字为章节信息特征(病历特征),为扩展特征;构建关系指示词词典,提取每对实体对的核心词特征,为扩展特征;利用LTP工具对分句后的句子进行依存分析,得到句子各成分之间依存关系;将二元实体的句法依存关系、实体对的依存关系以及二元实体与核心谓词的距离作为依存句法特征;将上述基本特征、扩展特征和依存特征组成的特征向量输入已训练好的支持向量机分类器,抽取中文电子病历的实体关系。

    一种细粒度时序动作检测方法
    17.
    发明公开

    公开(公告)号:CN117746493A

    公开(公告)日:2024-03-22

    申请号:CN202311584629.0

    申请日:2023-11-26

    Applicant: 同济大学

    Abstract: 本发明属于计算机视觉领域,提出了一种细粒度时序动作检测方法,包括:步骤1、对数据集中的原始视频进行预处理与特征抽取;步骤2、对步骤1得到的视频特征构建特征金字塔;步骤3、利用全局时序特征编码器对步骤2得到的特征金字塔中的每一层级的特征序列进行编码,并生成粗糙预测结果;步骤4、利用步骤2得到的特征金字塔的对应下层特征对步骤3生成的粗糙预测进行边界修正得到最终的动作实例检测结果。本发明提出了一个全局特征感知与局部边界修正的无锚时序动作检测方法,有效地提升了细粒度时序动作检测的准确率,对于视频理解领域有重大意义。

    一种新闻视频描述自动生成方法
    18.
    发明公开

    公开(公告)号:CN115408563A

    公开(公告)日:2022-11-29

    申请号:CN202210990725.4

    申请日:2022-08-18

    Applicant: 同济大学

    Abstract: 一种新闻视频描述自动生成方法,可以对一个附加了文本的新闻视频产生蕴含实体信息的准确描述。目前的新闻视频描述方法均基于一段式的生成模型,且未对冗余的上下文语句进行筛选,造成生成描述不准确。本发明的创新点在于首先利用视频对附加文本进行筛选,之后利用一个基于模板生成和实体插入的两段式生成方法生成新闻视频描述,其中,在模板生成部分聚焦于事件的内容,在实体插入部分聚焦于事件的参与者等实体信息,有效地提升了新闻视频描述的准确率。

    一种联合序列标注和模式匹配的事件元素检测方法

    公开(公告)号:CN113177416A

    公开(公告)日:2021-07-27

    申请号:CN202110532819.2

    申请日:2021-05-17

    Applicant: 同济大学

    Abstract: 目前的中文医疗事理知识图谱事件元素检测研究主要基于单一的模式匹配或深度学习模型,且未对事件元素进行长短级粒度划分,不能有效抽取长句级元素,导致了模型灵活性不高、泛化性差。因此,本发明提出了一种联合序列标注和模式匹配的事件元素检测方法,创新点在依据事件类型对其中的事件元素进行粒度区分,并针对不同粒度的事件元素采用不同的方法进行检测。首先,对于短词级事件元素检测,使用基于序列标注的BERT‑BiLSTM‑CRF模型,并结合实体信息、触发词信息等语料特征,以实现较强的可扩展性。其次,通过联合依存句法分析的模式匹配方法,进行了长句级事件元素的检测,由此提高事件元素检测的准确率。

    一种基于知识图谱的医疗查询扩展方法

    公开(公告)号:CN113076411A

    公开(公告)日:2021-07-06

    申请号:CN202110454713.5

    申请日:2021-04-26

    Applicant: 同济大学

    Inventor: 方钰 崔雪 翟鹏珺

    Abstract: 一种基于知识图谱的医疗查询扩展方法。自动问答系统中的查询扩展技术通过向问句中补充扩展信息来减小问答句间的语义差距,从而提高问答系统的准确性。在医疗问答领域,目前的查询扩展方法没有充分结合不同查询意图下医学术语间的共现关联关系与推理关联关系,因此得到的扩展词不够准确。本发明以医疗知识图谱为扩展词的知识来源,利用医学术语在不同查询意图下的推理关联得到候选扩展词,并结合否定医学术语识别与互信息技术筛选出最终的扩展词,最终提高了医疗问答系统的准确率。

Patent Agency Ranking