-
公开(公告)号:CN114169389A
公开(公告)日:2022-03-11
申请号:CN202111231070.4
申请日:2021-10-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06K9/62
Abstract: 本发明涉及目标检测技术领域,特别涉及一种类别扩增的目标检测模型训练方法和存储设备。所述一种类别扩增的目标检测模型训练方法,包括步骤:获取融合数据集;在第一阶段训练中通过预设的无标签冲突损失函数对所述融合数据集进行训练得一阶段模型;通过位置置信度与分类置信度挖掘未被标注的真实框,生成伪标注;通过预设规则结合原始标注真实框与所述伪标注对所述一阶段模型进行再训练得最终模型。上述方法中,可直接对融合数据集进行模型训练,且不用改变使用的神经网络结构,大大节省成本。并且通过预设的无标签冲突损失函数,在训练过程中解决了假负样本的问题,使得得到的最终模型的性能更优。
-
公开(公告)号:CN112417161A
公开(公告)日:2021-02-26
申请号:CN202011258408.0
申请日:2020-11-12
Applicant: 福建亿榕信息技术有限公司
IPC: G06F16/36 , G06F40/295 , G06N3/04
Abstract: 本发明涉及文本识别技术领域,特别涉及一种基于模式扩充及BERT分类的知识图谱上下位关系识别的方法和存储设备。所述一种基于模式扩充及BERT分类的知识图谱上下位关系识别的方法,包括步骤:基于模式扩充从外部数据中抽取潜在的上下位关系对,并结合预设资源库形成上下位关系模型训练种子语料;获取待预测上下位关系数据集,基于BERT‑Attention‑Bi‑LSTM模型对待预测数据集进行预测,得上下位关系预测结果;通过预设规则对所述上下位关系预测结果进一步处理得最终的上下位关系预测结果。该方法大大降低了规则编制的复杂性及人工投入,同时相对于另外一种主流的基于统计的上下位概念识别方法,具备更强的可实现性,能为各类专业知识图谱的构建提供技术支撑。
-
公开(公告)号:CN112380342A
公开(公告)日:2021-02-19
申请号:CN202011247379.8
申请日:2020-11-10
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/35 , G06F40/242 , G06F40/289
Abstract: 本发明涉及一种电力文档主题提取方法及设备,包括以下步骤:S1、获取包括多个文档的数据集;S2、筛除重复数据;S3、筛选出电网相关的文档;S4、对数据集进行分类;S5、提取文档主题。
-
公开(公告)号:CN112328785A
公开(公告)日:2021-02-05
申请号:CN202011070721.1
申请日:2020-10-09
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
Abstract: 本发明涉及数据处理技术领域,特别涉及一种电力领域文本分类的方法和存储设备。所述一种电力领域文本分类的方法,包括步骤:构建电力预训练模型;获取待训练数据,对待训练数据进行预处理;对预处理后的待训练数据进行随机取样生成K组训练数据;设置M个超参组合,生成L*K*M个业务分类子模型;对L*K*M个业务分类子模型进行验证,得每个业务分类子模型的模型评估数据;根据模型评估数据调整模型参数,直至确定最佳超参使得获得的业务分类子模型符合预设条件,共生成L*K个符合预设条件的业务分类子模型;输入待预测文本至符合预设条件的业务分类子模型,得文本分类结果。通过上述步骤,大大提高电力领域文本分类准确率。
-
公开(公告)号:CN112328632A
公开(公告)日:2021-02-05
申请号:CN202011070559.3
申请日:2020-10-09
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/2455 , G06F16/27 , G06F16/22
Abstract: 本发明涉及数据读取技术领域,特别涉及一种分布式两级缓存的方法和系统。所述一种分布式两级缓存的方法,包括步骤:响应用户请求,所述第一业务服务器发送获取命名空间缓存请求至缓存服务器;若缓存服务器中不存在命名空间缓存,则从数据库中获取数据,并将数据同步存储于第一本地内存缓存和集中式缓存;若缓存服务器中存在命名空间缓存,则从第一本地内存缓存中获取数据,若从第一本地内存缓存中无法获取数据,则从集中式缓存中获取数据,并同步存储数据至第一本地内存缓存。通过上述方法可大大提高了数据读取速度,同时可以为多个节点提供服务,也大大缓解了数据库的压力。
-
公开(公告)号:CN110889296A
公开(公告)日:2020-03-17
申请号:CN201911182998.0
申请日:2019-11-27
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F40/58 , G06F16/951
Abstract: 本发明涉及一种结合爬虫技术的实时翻译方法,包括以下步骤:对原文本进行预处理,将原文本处理成实时翻译网页能够读取的格式;替换专业词语,预先建立专业词库,将进行预处理后的原文本中的专业词语替换为专业词库中对应的译文,并对替换的译文添加强制翻译网页不对译文进行翻译的表达式,生成待翻译文本;利用爬虫将待翻译文本送入翻译网页中进行翻译,得到翻译结果并返回;将翻译结果进行整理输出为翻译文本。
-
公开(公告)号:CN105631030A
公开(公告)日:2016-06-01
申请号:CN201511026050.8
申请日:2015-12-30
Applicant: 福建亿榕信息技术有限公司
CPC classification number: G06F16/951 , H04L63/083 , H04L67/146
Abstract: 本发明提供一种通用的网络爬虫模拟登录方法,所述方法为:配置要爬取的各个站点的认证信息,所述认证信息包括:用户名、密码以及用户权限;网络爬虫调用无UI浏览器访问各个站点;无UI浏览器模拟人工登录过程,认证成功后保存各个站点的cookie信息;网络爬虫携带cookie信息访问站点,爬取站点网页内容。本发明解决了爬虫模拟登录过程需要人工参与或需要针对特定站点进行定制程序开发的问题,减少开发工作量并避免了需要人工参与的弊端。
-
公开(公告)号:CN116245815A
公开(公告)日:2023-06-09
申请号:CN202310021015.5
申请日:2023-01-06
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司
IPC: G06T7/00 , G06V10/764 , G06F16/93
Abstract: 本发明涉及一种电子档案纠错方法,包括:获取待处理文件;遍历待处理文件的每一页面,识别页面中的页码,得到页码信息;根据所述页码信息,判断待处理文件中的页码顺序是否有误;若页码顺序有错误,记录页码顺序错误类型;逐一检测页面,检测项目包括:检测页面倾斜度;检测页面是否完整;检测页面污点;检测页面是否空白;记录页面的错误信息;根据页面的错误信息修正页面,包括:对倾斜页面进行纠偏;清除页面中的污点。
-
公开(公告)号:CN116243934A
公开(公告)日:2023-06-09
申请号:CN202310021265.9
申请日:2023-01-06
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司
IPC: G06F8/61
Abstract: 本发明涉及一种基于命令行的人工智能模型部署及调用方法,包括以下步骤:建立资源服务器,在资源服务器收集并存储原始数据资源和人工智能模型资源,并在资源服务器上部署资源调用接口;在资源层建立高性能服务器,在高性能服务器构建模型训练任务,调用资源服务器中的原始数据资源和人工智能模型资源完成模型训练任务,得到训练好的人工智能模型;将人工智能模型按照指定格式的目录结构进行编排并打包为Docker镜像并上传至位于服务层的Docker私服仓库;在服务层设置模型调用接口,包括命令行组件和python接口组件;在客户端工具上通过命令行工具和python库匹配和调用模型服务。
-
公开(公告)号:CN115985153A
公开(公告)日:2023-04-18
申请号:CN202310026362.7
申请日:2023-01-09
Applicant: 福建亿榕信息技术有限公司 , 福州大学
IPC: G09B7/04 , G06V40/20 , G06V10/74 , G06V10/774
Abstract: 本发明涉及图像处理技术领域,公开了一种基于图像处理和行为识别的运维人员训练系统,包括:建模模块,其用于提取建模信息,并基于建模信息生成模拟训练模型;训练数据采集单元,其用于采集运维人员训练过程中的训练数据;训练数据预处理单元,其用于对采集的训练数据进行处理获得当前训练模型;模型预处理模块,其用于对当前训练模型和参照训练模型进行预处理;评分模块,其用于对运维人员的训练进行评分;本发明基于虚拟现实环境来进行运维训练仿真模拟,并采集生理数据、动作数据和图像数据作为训练数据,通过综合的数据处理方法对异构的训练数据进行处理,从生理、心理和知识多个维度评估运维人员的水平。
-
-
-
-
-
-
-
-
-