发明授权
- 专利标题: 一种电子病历文本摘要抽取方法
-
申请号: CN202110010116.3申请日: 2021-01-04
-
公开(公告)号: CN112732900B公开(公告)日: 2022-07-29
- 发明人: 张述睿 , 吴军 , 樊昭磊 , 桑波 , 李福友
- 申请人: 山东众阳健康科技集团有限公司
- 申请人地址: 山东省济南市市辖区高新区新泺大街1166号奥盛大厦一号楼12层
- 专利权人: 山东众阳健康科技集团有限公司
- 当前专利权人: 众阳健康科技集团有限公司
- 当前专利权人地址: 250000 山东省济南市高新区新泺大街1166号奥盛大厦一号楼12层
- 代理机构: 济南泉城专利商标事务所
- 代理商 支文彬
- 主分类号: G06F16/34
- IPC分类号: G06F16/34 ; G06F40/30 ; G06F16/31 ; G06K9/62 ; G16H10/60
摘要:
一种电子病历文本摘要抽取方法,通过定义语义覆盖度损失函数,可以将以往医师总结出的抽象式摘要用作训练自动抽取式摘要模型,避免了数据标注。从原始电子病历文本中筛选出比较重要的句子作为候选集,缩小自动抽取式摘要的搜寻范围,再通过罗列候选集中句子的不同组合方式,找出对原始电子病历中语义覆盖度最高的句子组合作为抽取式摘要,在判定语义覆盖度时,结合候选集中所有句子的语义信息做出判断,降低了自动抽取式摘要中信息冗余和信息缺失的可能,提升了自动抽取式摘要的质量。
公开/授权文献
- CN112732900A 一种电子病历文本摘要抽取方法 公开/授权日:2021-04-30