一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541B

    公开(公告)日:2025-03-14

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

    一种核电机组稳压器快速降温的方法

    公开(公告)号:CN112242205A

    公开(公告)日:2021-01-19

    申请号:CN201910640765.4

    申请日:2019-07-16

    Abstract: 本发明所属核电厂技术领域,具体涉及一种核电机组稳压器快速降温的方法。稳压器检修根据设计手册要求壁温小于168度才能进行喷淋冷却,而自然冷却的方法需要至少四天才能达到这个温度,大大延长了等待检修工期。本发明包括如下步骤:步骤一:选择压力设定值;步骤二:选择压力真实值;步骤三:计算蒸汽释放阀PCV5和PCV6开度;步骤四:通过稳定蒸汽流量对稳压器金属避免进行降温;步骤五:计算稳压器温度;步骤六:通过稳定蒸汽流量对稳压器金属壁面进行降温;步骤七:稳压器喷淋降温至检修温度。本发明比正常降温节省了3.375个满功率天,比充水、疏水降温节省了1.5满功率天,能够快速恢复稳压器可用,减少电站经济损失,对机组带来可期的经济效率。

    一种文档自动聚类方法
    25.
    发明公开

    公开(公告)号:CN115982344A

    公开(公告)日:2023-04-18

    申请号:CN202111192689.9

    申请日:2021-10-13

    Abstract: 本发明涉及文本数据挖掘技术领域,具体公开了一种文档自动聚类方法。该方法包括:采集待处理的文档,获取所述文档的文本数据,并进行分词和停用词过滤,获得文本集合特征词汇合集;利用TF‑IDF方法构建空间特征模型,对所述文本集合特征词汇合集进行处理,获得文本特征权重向量;利用改进差分进化算法,对所述文本特征权重向量进行选择和提取,并获得最优特征向量;利用最优特征向量进行聚类,并将所有文档聚类于所设定数目的簇中。本发明能够更好的发现文本集合内在的类别特性,用来发现无结构的文本集合中的“潜在概念”信息,这些信息有助于组织和搜索数量庞大的文档集合;此外本发明在文档处理过程中有效的减少人为的因素影响和人力资源的浪费。

    一种核电厂辐射控制区域剂量单机组划分系统和方法

    公开(公告)号:CN115169813A

    公开(公告)日:2022-10-11

    申请号:CN202210657857.5

    申请日:2022-06-10

    Abstract: 本发明具体涉及一种核电厂辐射控制区域剂量单机组划分系统,包括个人剂量管理系统、辐射工作许可管理系统和多个单独的辐射控制区出入控制系统;所述个人剂量管理系统与各个单独的辐射控制区出入控制系统以及辐射工作许可管理系统数据连接;所述个人剂量管理系统用于定期从各个单独的辐射控制区出入控制系统抽取进出记录信息,以及用于定期从辐射工作许可管理系统抽取辐射工作许可证信息;所述个人剂量管理系统内嵌剂量单机组划分模型,所述剂量单机组划分模型用于将每条进出记录信息划分至单一机组。本发明的核电厂辐射控制区域剂量单机组划分系统,自动对核电厂多机组共用辐射控制区域产生的剂量记录进行机组划分,便于后续数据分析。

    基于相似度的文档字符串编码匹配方法及装置

    公开(公告)号:CN114168809A

    公开(公告)日:2022-03-11

    申请号:CN202111402289.6

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种基于相似度的文档字符串编码匹配方法及装置。本公开中针对待匹配字符串,根据预设的编码规则生成待匹配字符串对应的正则表达式;针对目标文档,根据编码规则将目标文档的文本内容生成候选字符串集;将候选字符串集中的字符串与正则表达式进行匹配,保留与正则表达式匹配的字符串,滤除与正则表达式不匹配的字符串;采用SimHash算法分别生成保留的字符串以及候选字符串集中每个字符串的SimHash签名,确定保留的字符串的SimHash签名与候选字符串集中每个字符串的SimHash之间的汉明距离,输出汉明距离低于阈值的字符串及该字符串在目标文档中的位置。有效的提高了文档的解析效率,提高了编码模式匹配的速度。

Patent Agency Ranking