发明公开
- 专利标题: 基于混合算法的医疗文献检索方法
-
申请号: CN202211410896.1申请日: 2022-11-11
-
公开(公告)号: CN115659047A公开(公告)日: 2023-01-31
- 发明人: 张子成 , 曹伟
- 申请人: 南京汇宁桀信息科技有限公司
- 申请人地址: 江苏省南京市栖霞区仙林街道文苑路3号南京财经大学大学生创新创业园
- 专利权人: 南京汇宁桀信息科技有限公司
- 当前专利权人: 南京汇宁桀信息科技有限公司
- 当前专利权人地址: 江苏省南京市栖霞区仙林街道文苑路3号南京财经大学大学生创新创业园
- 代理机构: 南京行高知识产权代理有限公司
- 代理商 李晓
- 主分类号: G06F16/9535
- IPC分类号: G06F16/9535 ; G06F40/289 ; G06F40/30 ; G16H50/70 ; G06F18/22 ; G06F18/241 ; G06F18/23
摘要:
本发明公开了一种基于混合算法的医疗文献检索方法,对查询词进行扩展,采用改进的BM25算法作为一次检索的基础算法,根据标准化得分降序排序得出检索文献;对一次检索得到的文献进行基于聚类的摘要提取,采用基于Biobert模型的摘要、标题与检索任务的相似度匹配方法计算摘要相似度得分与标题相似度得分;将一次检索得到的文献的得分标准化,使其与标题相似度得分与摘要相似度得分处于同一等级,将三种得分相加并降序排序输出最后的检索结果。本发明所述的基于混合算法的医疗文献检索方法,在检索的两大指标P@10、R‑Prec上均有提高;通过实验与现有算法对比,验证本发明所提出的算法的有效性,其综合性能优于现有算法。
公开/授权文献
- CN115659047B 基于混合算法的医疗文献检索方法 公开/授权日:2023-07-28