一种基于Confluent社区开源版的实时大数据应用开发方法及系统

    公开(公告)号:CN112800064A

    公开(公告)日:2021-05-14

    申请号:CN202110163182.4

    申请日:2021-02-05

    发明人: 吴彬 朱智源

    摘要: 本发明公开了一种基于Confluent社区开源版的实时大数据应用开发方法及系统,属于数据处理领域。本发明的开发方法及系统时用于解决现有的Confluent社区开源版产品缺乏实时数据应用开发流程化支持,进而导致基于其实时大数据的开发效率较低、且对Confluent社区开源版的易用性差的技术问题,本发明基于Confluent社区开源版的一整套向导式的开发流程服务,可以大大提高实时数据应用开发工程师的开发效率;基于优化的连接器配置,可以大大提高用户配置连接器的效率与成功率;并对查询操作进行了优化,从而提高了易用性,以较好支撑业务数据查询需求;对删除实时表/流流程进行了优化,以提高易用性,进而提高实时数据应用开发工程师的体验舒适度。

    HL7V3标准/FHIR标准的解析映射处理方法及装置

    公开(公告)号:CN115935946B

    公开(公告)日:2023-08-15

    申请号:CN202211550012.2

    申请日:2022-12-05

    摘要: HL7V3标准/FHIR标准的解析映射处理方法及装置,方法包括映射关系配置和数据转换;映射关系配置包括:对导入的源数据模板和目标数据模板进行递归解析,得到源数据XPath树集合和目标数据XPath树集合;根据集合进行循环节点映射和值节点映射,得到源数据与目标数据的循环节点XPath映射信息和值节点XPath映射信息;数据转换包括:对输入的源数据进行格式校验,解析为对应的XML文档对象;生成一个带有循环结构的完整结构目标数据模板;得到有映射关系的目标XPath树形集合;通过检测,则获取到目标数据的XPath路径,替换完整结构目标数据模板对应XPath节点的值,得到目标数据;不通过,则放入异常列表。可对HL7V3、FHIR等标准的结构数据进行快速解析,便于修改与维护。

    一种针对电子病历命名实体识别系统及方法

    公开(公告)号:CN112802570A

    公开(公告)日:2021-05-14

    申请号:CN202110169271.X

    申请日:2021-02-07

    发明人: 杜斌 朱智源

    摘要: 本发明公开了一种针对电子病历命名实体识别系统及方法;进行数据清洗,将清洗之后的数据进行基于规则的预标注,将结果返回给标注算法进行二次标注并生成预标注数据集,再将结果返回给标注人员进行校正与标注从而生成标准数据集。根据对比分析预标注数据集与标准数据集的差异,修正规则与算法。获取线上预测数据,通过人工进行核对校验补充进标准数据集,将原始数据送入预标注系统补充预标注数据集,累计到一定规模之后重新训练模型迭代模型。本发明将命名实体识别整个工业应用流程进行整合与改造,构建出适用于工业场景的命名实体识别框架。

    一种基于Confluent社区开源版的实时大数据应用开发方法及系统

    公开(公告)号:CN112800064B

    公开(公告)日:2023-06-02

    申请号:CN202110163182.4

    申请日:2021-02-05

    发明人: 吴彬 朱智源

    摘要: 本发明公开了一种基于Confluent社区开源版的实时大数据应用开发方法及系统,属于数据处理领域。本发明的开发方法及系统时用于解决现有的Confluent社区开源版产品缺乏实时数据应用开发流程化支持,进而导致基于其实时大数据的开发效率较低、且对Confluent社区开源版的易用性差的技术问题,本发明基于Confluent社区开源版的一整套向导式的开发流程服务,可以大大提高实时数据应用开发工程师的开发效率;基于优化的连接器配置,可以大大提高用户配置连接器的效率与成功率;并对查询操作进行了优化,从而提高了易用性,以较好支撑业务数据查询需求;对删除实时表/流流程进行了优化,以提高易用性,进而提高实时数据应用开发工程师的体验舒适度。

    HL7V3标准/FHIR标准的解析映射处理方法及装置

    公开(公告)号:CN115935946A

    公开(公告)日:2023-04-07

    申请号:CN202211550012.2

    申请日:2022-12-05

    摘要: HL7V3标准/FHIR标准的解析映射处理方法及装置,方法包括映射关系配置和数据转换;映射关系配置包括:对导入的源数据模板和目标数据模板进行递归解析,得到源数据XPath树集合和目标数据XPath树集合;根据集合进行循环节点映射和值节点映射,得到源数据与目标数据的循环节点XPath映射信息和值节点XPath映射信息;数据转换包括:对输入的源数据进行格式校验,解析为对应的XML文档对象;生成一个带有循环结构的完整结构目标数据模板;得到有映射关系的目标XPath树形集合;通过检测,则获取到目标数据的XPath路径,替换完整结构目标数据模板对应XPath节点的值,得到目标数据;不通过,则放入异常列表。可对HL7V3、FHIR等标准的结构数据进行快速解析,便于修改与维护。