一种文档自动聚类方法
    21.
    发明公开

    公开(公告)号:CN115964481A

    公开(公告)日:2023-04-14

    申请号:CN202111192698.8

    申请日:2021-10-13

    Abstract: 本发明涉及文本数据挖掘技术领域,具体公开了一种文档自动聚类方法。本方法包括:读取待处理的文档,并对文档中的文本内容进行清洗和分词处理,并利用停用词表,对分词进行匹配输出,并对输出结果进行向量化处理,获得高维稀疏文本向量;将文本向量输入自编码器进行编码和译码处理,并通过全局调整函数,提取低维抽象特征向量;根据聚类文档目标,对特征向量进行聚类处理,并直到获得的所有向量簇不再发生变化为止,从中选取最符合目标的向量簇;利用所述向量簇,对文档中的文本数据进行定位输出。本发明具备更高的准确性和更低的运算复杂度,具有更强的实用性和鲁棒性;本方法的计算复杂度较低,具有实用价值以及易用性。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541A

    公开(公告)日:2022-09-09

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

    基于专家库的专家推荐方法、装置及系统

    公开(公告)号:CN112347148A

    公开(公告)日:2021-02-09

    申请号:CN202011191025.6

    申请日:2020-10-30

    Abstract: 本公开属于核电技术领域,具体涉及一种基于专家库的专家推荐方法、装置及系统。本公开的基于专家库的专家推荐系统从设备管理系统、工单管理系统、门户网站广泛获取专家信息,覆盖范围广,人员的能力评价采用了人员的维修记录数据、职称、工作年限、资质证书、获奖情况等信息,更客观、更准确的评价和展示专家的能力,有利于用户选择更加能力更合适的维修专家。此外,本公开还能够及时获取专家的岗位变动、离职等情况,最大限度的减少对用户决策的影响,由此能综合人员的能力、时间安排、费用等因素,寻求最适合的专家支持。

    一种基于分组模式的预防性维修工单批量触发方法

    公开(公告)号:CN114493065B

    公开(公告)日:2024-08-13

    申请号:CN202011253359.1

    申请日:2020-11-11

    Abstract: 本发明涉及核电厂设备管理技术领域,具体公开了一种基于分组模式的预防性维修工单批量触发方法。该方法包括:根据输入参数,查找所有符合条件的生效状态的PMAQ;对PMAQ数据表中对任一PMAQ进行是否有替代关系判断,并锁定所述PMAQ及关联工单;对锁定的PMAQ生成PM工作计划;对PM工作计划中的PM事件进行状态标识;将PM工作计划与预期页面事件进行比对处理;根据PM工作计划生成状态标识进行事件处理;解除对已锁定PMAQ及关联工单对锁定,并将其设置为已处理状态,并进行PMAQ数据表中下一个或下一组PMAQ的处理。该方法能够实现PM项目批量触发,同时减少对整个系统对影响,提高批处理效率,避免因一个PM项目的问题导致批处理执行失败。

    一种变压器真空注油油位监测装置

    公开(公告)号:CN118225202A

    公开(公告)日:2024-06-21

    申请号:CN202211644174.2

    申请日:2022-12-20

    Abstract: 本发明属于油液监测技术领域,具体涉及一种变压器真空注油油位监测装置。该装置包括测压部、连接部和储油腔室;所述测压部、储油腔室和连接部依次连接,所述连接部与待测油压区域连接;所述测压部包括控制模块、显示模块、数据采集模块、数据拓展模块、报警模块和计算模块,所述控制模块用于键入控制指令设定相关参数及实现基本的数据调取操作;所述显示模块用于显示测压结果;所述数据采集模块用于采集压力数据;所述数据拓展模块用于实现测压部对外的压力数据输出;所述报警模块用于显示异常操作及油位报警;所述计算模块通过数据采集模块采集的压力数据计算油位。该装置设计巧妙,结构简单,性能可靠,有效解决油箱内油位的测量问题。

    一种基于对数正态分布的核电厂备件需求预测方法

    公开(公告)号:CN116258222A

    公开(公告)日:2023-06-13

    申请号:CN202111463780.X

    申请日:2021-12-03

    Abstract: 本发明属于备件管理技术领域,具体涉及一种基于对数正态分布的核电厂备件需求预测方法。包括如下步骤:步骤1:根据备件寿命数据获取对数正态分布的参数的μ和σ,其中μ为对数正态分布的对数均值,σ为对数正态分布的对数标准差;步骤2:根据对数正态分布获取备件在给定时间区间内的失效次数的期望值;步骤3:根据备件的服务水平来确定备件的库存定额。本发明的有益效果在于:目前,核电厂通过人工根据经验来确定备件的库存定额,主观性强,定额偏保守,通过本发明所提供的方法,可实现寿命分布服从对数正态分布的备件在未来给定时间区间内需求量及其概率的定量计算,减少人工主观判断,降低备件库存。

    一种文档字符串内容识别方法
    30.
    发明公开

    公开(公告)号:CN115982419A

    公开(公告)日:2023-04-18

    申请号:CN202111192690.1

    申请日:2021-10-13

    Abstract: 本发明涉及数据信息处理技术领域,具体公开了一种文档字符串内容识别方法。该方法包括:利用Bi‑LSTM‑CRF方法对字符串的编码规则进行分类,构建特定字符串识别模型;构建Bi‑LSTM‑CRF模型,利用特定场景中特定字符串作为字符串编码规则训练集,获得对字符串编码规则分类模型;将文档中的特定字符串与所述字符串编码规则分类模型进行匹配,获得特定字符串的匹配结果;将所述匹配结果与构建的所述特定字符串识别模型进行匹配识别后,生成编码结果集,并在原文档中标注编码。本方法能够在无先验精确编码规则知识前提下,依然能够有效准确识别特定字符串;相比现有的单纯利用字分布式字符串实体识别系统,基于Bi‑LSTM‑CRF模型的实体识别模型取得更好表现,具有更好的准确性。

Patent Agency Ranking