-
公开(公告)号:CN109597885A
公开(公告)日:2019-04-09
申请号:CN201811511737.4
申请日:2018-12-11
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/338
Abstract: 一种知识地图构建方法及存储介质,其中方法包括如下步骤,识别知识点,通过人工进行部分标注的语料输入基于机器学习的CRF算法模型进行训练,所述CRF算法模型被预置为词性特征倾向、和或信息熵特征倾向、和或全文词频倾向、和或逆文档概率倾向;用训练好的所述模型对特定文档集进行知识点识别,得到知识点集。本发明提出的面向知识搜索的动态知识地图构建方法,不面向特定的业务领域,在不同行业中具备普遍适用性,仅需通过普通标注少量知识点投入的资源少,无监督运行的效果也很好。同时针对不断扩展的企业文档,也能够起到不断进行知识地图结果优化的效果。
-
公开(公告)号:CN104361065B
公开(公告)日:2018-07-06
申请号:CN201410613887.1
申请日:2014-11-04
Applicant: 福建亿榕信息技术有限公司
IPC: G06F17/30
Abstract: 本发明提供一种基于Zookeeper的分布式系统的有序序列号生成方法,所述方法为:1、在分布式系统的Zookeeper上创建有序序列根节点;2、在有序序列根节点下创建持久顺序节点;3、取得持久顺序节点的顺序号;4、删除所述顺序号的前一顺序号对应的顺序节点。本发明利用了Zookeeper的数据强一致性和持久顺序节点的节点顺序性,解决了分布式系统中多服务端高并发请求环境下有序序列号生成的问题。
-
公开(公告)号:CN111090755B
公开(公告)日:2023-04-04
申请号:CN201911197172.1
申请日:2019-11-29
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网北京市电力公司 , 国家电网有限公司大数据中心 , 国网福建省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/36 , G06F16/33 , G06F16/383 , G06F40/289 , G06Q50/06
Abstract: 一种文本关联关系判别方法及存储介质,其中方法包括如下步骤,对输入的语料进行预处理,得到预处理文本,对预处理文本中的文本字段进行判断是否为超短文本,对其中的超短文本根据行业知识图谱进行改写,得到改写文本,将改写文本输入BERT模型进行训练、分析,得到模型输出的关联关系判别结果。本发明可以结合超短文本改写技术进行短文本关联关系判断的方法。对比已有方案具有语义理解能力强、文本长度影响小、相关性判断准确率高的有益效果,综上所述,本发明解决了现有技术中对行业文本相关性的判断仍然不够准确的问题。
-
公开(公告)号:CN109710947A
公开(公告)日:2019-05-03
申请号:CN201910058614.8
申请日:2019-01-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F17/27 , G06F16/36 , G06F16/335
Abstract: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
公开(公告)号:CN105631030A
公开(公告)日:2016-06-01
申请号:CN201511026050.8
申请日:2015-12-30
Applicant: 福建亿榕信息技术有限公司
CPC classification number: G06F16/951 , H04L63/083 , H04L67/146
Abstract: 本发明提供一种通用的网络爬虫模拟登录方法,所述方法为:配置要爬取的各个站点的认证信息,所述认证信息包括:用户名、密码以及用户权限;网络爬虫调用无UI浏览器访问各个站点;无UI浏览器模拟人工登录过程,认证成功后保存各个站点的cookie信息;网络爬虫携带cookie信息访问站点,爬取站点网页内容。本发明解决了爬虫模拟登录过程需要人工参与或需要针对特定站点进行定制程序开发的问题,减少开发工作量并避免了需要人工参与的弊端。
-
公开(公告)号:CN113536768A
公开(公告)日:2021-10-22
申请号:CN202110797247.0
申请日:2021-07-14
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F40/205 , G06F16/903
Abstract: 本发明涉及一种基于正则表达式建立文本抽取模型的方法,包括如下步骤:S1、编写若干个正则表达式;S2、根据所述正则表达式,在语料库中抽取语料集;S3、将所述语料集分割为训练集与验证集;S4、构建文本抽取模型;S5、将训练集输入至文本抽取模型,训练文本抽取模型;S6、将验证集输入训练好的文本抽取模型,对训练好的文本抽取模型进行验证。
-
公开(公告)号:CN109710947B
公开(公告)日:2021-09-07
申请号:CN201910058614.8
申请日:2019-01-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F40/20 , G06F16/36 , G06F16/335
Abstract: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
公开(公告)号:CN107037978B
公开(公告)日:2019-11-05
申请号:CN201610930983.8
申请日:2016-10-31
Applicant: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F3/06
Abstract: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN107037978A
公开(公告)日:2017-08-11
申请号:CN201610930983.8
申请日:2016-10-31
Applicant: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F3/06
Abstract: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN103500087B
公开(公告)日:2016-08-17
申请号:CN201310424542.7
申请日:2013-09-17
Applicant: 福建亿榕信息技术有限公司 , 国家电网公司
IPC: G06F9/44
CPC classification number: G06F8/30
Abstract: 一种基于maven插件和freemarker模版的代码生成方法及装置,包括:准备数据和模版:根据数据库设计文档或数据库表编写或生成.hbm.xml文件,依据项目特点和freemarker模版语法编写模版;调用maven插件进行逻辑运算生成代码的步骤:调用封装了代码生成的运算逻辑的maven插件,根据第一步骤所准备的.hbm.xml文件和freemarker模版文件进行逻辑运算和代码生成;代码生成:将宏套用在代码模板中生成MVC三层架构的目标代码。本发明解决了开发过程中重复性代码的自动生成问题,并且能根据模版进行实际情况下的定制,对于提高生产效率有良好的效果。将代码自动生成和常用构建工具maven绑定在一起,提高了装置的通用性和易用性。
-
-
-
-
-
-
-
-
-