一种医疗大数据训练设施便捷集成框架和方法

    公开(公告)号:CN118866288A

    公开(公告)日:2024-10-29

    申请号:CN202410767855.0

    申请日:2024-06-14

    Abstract: 本发明公开了一种医疗大数据训练设施便捷集成框架,包括基础训练平台和实际业务模块,基础训练平台与实际业务模块使用相同的文件目录规范,通过统一文件形式进行信息交互,其中:基础训练平台用于进行基础操作功能,通过规定运行各个功能所需要的输入输出文件形式和结构,将原始的数据、模型的配置、标注的结果信息以指定文件形式和结构存放于对应位置,并通过给定命令触发实际业务模块进行下一步处理;实际业务模块用于运行实际业务。采用本发明通过文件目录规范定义,以及在指定开发环境下的调试、发布一体式构建,降低已有功能的维护成本、提高了整体应用平台的可用性,极大方便了新功能、新模型的添加。

    一种用于人群队列研究数据的数据质控方法及装置

    公开(公告)号:CN118538341A

    公开(公告)日:2024-08-23

    申请号:CN202410568545.6

    申请日:2024-05-09

    Abstract: 本发明公开了一种用于人群队列研究数据的数据质控方法,包括以下步骤,步骤S1,队列数据获取,步骤S2,基础数据质控,对队列数据进行必要的数据质控,排查完整性和唯一性问题;步骤S3,基础数据质控结果返回;步骤S4,变量类型识别,构建一种基于BERT的队列变量类型识别模型,用于自动识别队列变量类型;步骤S5,高级数据质控,进一步对队列数据进行数据质控,排查出准确性和逻辑性问题;步骤S6,高级数据质控结果返回。采用本方法,对采集的队列数据进行自动化智能核查,排查并发现队列数据存在完整性、唯一性、准确性以及逻辑性问题,从而促进队列数据质量的提升。

Patent Agency Ranking