一种跨类型乳腺肿瘤临床文档的结构化处理方法

    公开(公告)号:CN107423289A

    公开(公告)日:2017-12-01

    申请号:CN201710590651.4

    申请日:2017-07-19

    CPC classification number: G06F17/277 G06F17/271

    Abstract: 本发明提供了一种跨类型乳腺肿瘤临床文档的结构化处理方法,步骤1:对乳腺肿瘤临床文档的文本进行预处理,包括:切分短文本、及对切分后的短文本进行分词;步骤2:针对分词结果,进行单类型报告的部分语料标注;步骤3:采用所述单类型报告的语料,实现跨类型实体识别;步骤4:提取出结构化结果,包括:组织、位置、特征、特征值。本发明提供的方法克服了现有技术的不足,结构化信息的提取是自动形成,节省了人力与时间,且不局限于报告类型,可以应用于不同报告的特征识别与文本结构化,解决了中文跨类型临床文档的结构化处理问题。方法实现简单,处理速度快,处理结果准确率高。

    语音输入甲状腺超声异常描述自动生成超声报告的方法

    公开(公告)号:CN110765274B

    公开(公告)日:2023-10-24

    申请号:CN201910957032.3

    申请日:2019-10-10

    Abstract: 本发明提供了一种语音输入B超异常关键字生成甲状腺超声报告的方法。包括以下步骤:定义甲状腺超声语义树;根据甲状腺超声语义树生成子结构;B超异常关键字语音输入;定位描述范围;定位腺体背景描述部位并进行属性定位;定位局灶性病变描述结节并进行属性定位;补充必要属性;补充默认信息;生成文本。本发明使得B超医生在进行超声影像诊断的同时语音输入B超异常描述,无需额外医生手工录入超声文本报告,大大节约人力。在医生语音输入结束后可自动填充未提及属性的正常属性值,避免医生语音描述大量默认冗余信息,在尽可能少的语音输入情况下确保报告的完整性。最后,基于生成的样本树生成文本,解决报告歧义问题。

    基于深度卷积神经网络的乳腺癌风险评估分析系统

    公开(公告)号:CN107220506A

    公开(公告)日:2017-09-29

    申请号:CN201710414761.5

    申请日:2017-06-05

    CPC classification number: G06N3/084

    Abstract: 本发明涉及一种基于深度卷积神经网络的乳腺癌风险评估分析系统,包括医疗文档预处理模块,用于对医学文本大数据进行预处理生成字向量训练使用的字表;字向量训练模块,通过训练一个深度卷积神经网络生成初级字向量;分布式语义特征医学信息抽取模块,使用全连接层将学到的分布式特征表示映射到样本标记空间,并生成医学领域的分布式语义特征;长时语义关联特征提取模块,用于使用分布式语义特征表示,提取医疗临床文档的长时语义关联特征;乳腺癌风险评估分析模块,使用长时语义关联特征训练一个用于乳腺癌风险评估的深度神经网络,并进行乳腺癌风险评估。本发明提高了乳腺癌筛查的自动化和智能化水平。

    非结构化中文乳腺超声文本的结构化处理方法

    公开(公告)号:CN106502982B

    公开(公告)日:2019-04-09

    申请号:CN201610894239.7

    申请日:2016-10-13

    Abstract: 本发明涉及非结构化中文乳腺超声文本的结构化处理方法,该方法接受由超声科医生书写的非结构化中文乳腺超声文本,输出结构化之后的超声特征及其特征值,该方法包括以下步骤:对乳腺超声文本内容按照描述规则,分别切分为描述双、左、右侧乳腺的文本短句;对切分后的文本短句进行同义词替换;对替换后的文本短句分别进行句法分析;乳腺超声特征、特征值的提取。本发明能够将非结构化的中文乳腺超声文本进行结构化处理。

    语音输入甲状腺超声异常描述自动生成超声报告的方法

    公开(公告)号:CN110765274A

    公开(公告)日:2020-02-07

    申请号:CN201910957032.3

    申请日:2019-10-10

    Abstract: 本发明提供了一种语音输入B超异常关键字生成甲状腺超声报告的方法。包括以下步骤:定义甲状腺超声语义树;根据甲状腺超声语义树生成子结构;B超异常关键字语音输入;定位描述范围;定位腺体背景描述部位并进行属性定位;定位局灶性病变描述结节并进行属性定位;补充必要属性;补充默认信息;生成文本。本发明使得B超医生在进行超声影像诊断的同时语音输入B超异常描述,无需额外医生手工录入超声文本报告,大大节约人力。在医生语音输入结束后可自动填充未提及属性的正常属性值,避免医生语音描述大量默认冗余信息,在尽可能少的语音输入情况下确保报告的完整性。最后,基于生成的样本树生成文本,解决报告歧义问题。

Patent Agency Ranking