文本存储管理与检索方法及装置

    公开(公告)号:CN114168798B

    公开(公告)日:2024-08-09

    申请号:CN202111387757.7

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种文本存储管理与检索方法及装置。本公开运用了分布式文档系统存储核电厂多堆型多类别海量非结构化文档以及对应的分析结果文档,并将文档存储地址作为文档映射存储在关系型数据库中,解决了海量非结构化文档存储问题,利用结果文档的分析结果,设计了基于跳表的分级索引、存储数据快照的四元组信息,使用TF‑IWF方法针对性的对核电厂多堆型多类别的非结构化文档设计了检索结果排序方式的重要指标,相比使用现有的检索引擎架构,本发明更具有轻型、快速以及针对性的优点,因而具有更强的实用性。

    基于正则表达式的文档字符串编码识别方法及装置

    公开(公告)号:CN114168808A

    公开(公告)日:2022-03-11

    申请号:CN202111387759.6

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种基于正则表达式的文档字符串编码识别方法及装置。本公开根据正则表达式确定最佳因子集合;采用CW算法确定出现所述最佳因子集合中的最佳因子的文档记录,并将确定的文档记录添加到候选集合中;根据所述正则表达式确定的DFA自动机对候选集合中的最佳因子的字符串进行验证,将得到成功匹配的字符串。在查询正则表达式的时候定义了一个最佳因子,简化了使用正则表达式来查询的方式。根据最佳因子的个数选择CW算法对提取出来的最佳因子集合快速地查询,有效地过滤掉不包含最佳因子的字符串集合,得到候选字符串,并进一步使用DFA自动机对候选集中的字符串编码进行验证,从而提高整体的查询性能。

    文档内容识别方法及装置
    13.
    发明公开

    公开(公告)号:CN113988011A

    公开(公告)日:2022-01-28

    申请号:CN202110951502.2

    申请日:2021-08-19

    Abstract: 本公开属于核电技术领域,具体涉及一种文档内容识别方法及装置。本公开根据核电厂的编码特性,设计了一种基于正则匹配的预设编码查找的方法。此方法能快速遍历文档文本内容,查找出文档中所有预设编码。本公开设计了一种基于编码库和编码位置系数的相似度匹配方法,通过编码位置系数的计算将预设编码与编码库中编码库进行相似度匹配,能在高召回率的基础上,以高准确率筛选出符合期望的预设编码。解决核电厂不同类型文档中关键编码的高准确率自动识别和提取的问题。

    文档内容识别方法及装置
    14.
    发明授权

    公开(公告)号:CN113988011B

    公开(公告)日:2025-04-11

    申请号:CN202110951502.2

    申请日:2021-08-19

    Abstract: 本公开属于核电技术领域,具体涉及一种文档内容识别方法及装置。本公开根据核电厂的编码特性,设计了一种基于正则匹配的预设编码查找的方法。此方法能快速遍历文档文本内容,查找出文档中所有预设编码。本公开设计了一种基于编码库和编码位置系数的相似度匹配方法,通过编码位置系数的计算将预设编码与编码库中编码库进行相似度匹配,能在高召回率的基础上,以高准确率筛选出符合期望的预设编码。解决核电厂不同类型文档中关键编码的高准确率自动识别和提取的问题。

    一种核电大修重点项目规划方法
    15.
    发明公开

    公开(公告)号:CN119130358A

    公开(公告)日:2024-12-13

    申请号:CN202411152646.1

    申请日:2024-08-21

    Abstract: 本发明涉及核电大修技术领域,旨在解决原有通过EXCEL表来编辑和展示大修重点项目规划存在的数据无法实时更新、无法快速判断大修重点项目和大修工期是否匹配、效率低、易出错、用户不方便查询的问题。本发明提供了一种核电大修重点项目规划方法,读取预防性数据库重点项目清单,上传非预防性数据库项目;确定项目的工作类型;编制重点项目规划初稿;比对项目大修类型与工作类型,提醒不匹配的项目;对不匹配的项目进行分析,修改规划至与大修类型匹配;修改后形成重点项目规划终稿,核对无误后发布并展示给用户。本发明自动在预防性数据库中读取大修重点项目的工作内容、大修编号和周期,自动形成全寿期大修重点项目规划初稿。

    基于正则表达式的文档字符串编码识别方法及装置

    公开(公告)号:CN114168808B

    公开(公告)日:2024-08-09

    申请号:CN202111387759.6

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种基于正则表达式的文档字符串编码识别方法及装置。本公开根据正则表达式确定最佳因子集合;采用CW算法确定出现所述最佳因子集合中的最佳因子的文档记录,并将确定的文档记录添加到候选集合中;根据所述正则表达式确定的DFA自动机对候选集合中的最佳因子的字符串进行验证,将得到成功匹配的字符串。在查询正则表达式的时候定义了一个最佳因子,简化了使用正则表达式来查询的方式。根据最佳因子的个数选择CW算法对提取出来的最佳因子集合快速地查询,有效地过滤掉不包含最佳因子的字符串集合,得到候选字符串,并进一步使用DFA自动机对候选集中的字符串编码进行验证,从而提高整体的查询性能。

    一种核电厂功能设备组数据自动更新的方法

    公开(公告)号:CN114661731A

    公开(公告)日:2022-06-24

    申请号:CN202011529688.4

    申请日:2020-12-22

    Abstract: 本发明涉及核电厂数据处理技术领域,具体公开了一种核电厂功能设备组数据自动更新的方法。该方法包括:建立核电厂功能设备组数据分类模型,对功能组设备进行分类管理,并根据功能设备组数据的更新内容,将功能设备组更新数据更新到设备和工单中;根据设备中功能设备组新增申请、功能设备组修改申请以及功能设备组删除申请,将设备的功能设备组数据进行自动更新;根据工单任务中功能设备组新增申请、功能设备组修改申请以及功能设备组作废申请,将工单任务的功能设备组数据进行自动更新;该方法可以有效减少因FEG数据更新不及时导致的设备重复停役检修,同时提高了计划工程师、运工等人员的工作效率,保障机组安全稳定运行。

Patent Agency Ranking