-
公开(公告)号:CN109597885A
公开(公告)日:2019-04-09
申请号:CN201811511737.4
申请日:2018-12-11
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/338
Abstract: 一种知识地图构建方法及存储介质,其中方法包括如下步骤,识别知识点,通过人工进行部分标注的语料输入基于机器学习的CRF算法模型进行训练,所述CRF算法模型被预置为词性特征倾向、和或信息熵特征倾向、和或全文词频倾向、和或逆文档概率倾向;用训练好的所述模型对特定文档集进行知识点识别,得到知识点集。本发明提出的面向知识搜索的动态知识地图构建方法,不面向特定的业务领域,在不同行业中具备普遍适用性,仅需通过普通标注少量知识点投入的资源少,无监督运行的效果也很好。同时针对不断扩展的企业文档,也能够起到不断进行知识地图结果优化的效果。
-
公开(公告)号:CN111090755B
公开(公告)日:2023-04-04
申请号:CN201911197172.1
申请日:2019-11-29
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网北京市电力公司 , 国家电网有限公司大数据中心 , 国网福建省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/36 , G06F16/33 , G06F16/383 , G06F40/289 , G06Q50/06
Abstract: 一种文本关联关系判别方法及存储介质,其中方法包括如下步骤,对输入的语料进行预处理,得到预处理文本,对预处理文本中的文本字段进行判断是否为超短文本,对其中的超短文本根据行业知识图谱进行改写,得到改写文本,将改写文本输入BERT模型进行训练、分析,得到模型输出的关联关系判别结果。本发明可以结合超短文本改写技术进行短文本关联关系判断的方法。对比已有方案具有语义理解能力强、文本长度影响小、相关性判断准确率高的有益效果,综上所述,本发明解决了现有技术中对行业文本相关性的判断仍然不够准确的问题。
-
公开(公告)号:CN109710947A
公开(公告)日:2019-05-03
申请号:CN201910058614.8
申请日:2019-01-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F17/27 , G06F16/36 , G06F16/335
Abstract: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
公开(公告)号:CN113536768A
公开(公告)日:2021-10-22
申请号:CN202110797247.0
申请日:2021-07-14
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F40/205 , G06F16/903
Abstract: 本发明涉及一种基于正则表达式建立文本抽取模型的方法,包括如下步骤:S1、编写若干个正则表达式;S2、根据所述正则表达式,在语料库中抽取语料集;S3、将所述语料集分割为训练集与验证集;S4、构建文本抽取模型;S5、将训练集输入至文本抽取模型,训练文本抽取模型;S6、将验证集输入训练好的文本抽取模型,对训练好的文本抽取模型进行验证。
-
公开(公告)号:CN109710947B
公开(公告)日:2021-09-07
申请号:CN201910058614.8
申请日:2019-01-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F40/20 , G06F16/36 , G06F16/335
Abstract: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
公开(公告)号:CN107037978B
公开(公告)日:2019-11-05
申请号:CN201610930983.8
申请日:2016-10-31
Applicant: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F3/06
Abstract: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN107037978A
公开(公告)日:2017-08-11
申请号:CN201610930983.8
申请日:2016-10-31
Applicant: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F3/06
Abstract: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN118277521A
公开(公告)日:2024-07-02
申请号:CN202410216625.5
申请日:2024-02-27
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/289 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本发明公开了一种基于LLM的电力领域智能问答方法、系统、设备和介质,其中方法包括:S1:通过对电力领域各类文档读取得到文本内容,经过文本切分得到文本内容块,构建并保存文档的上下文关联信息,利用向量模型对文本内容块向量化,将文本内容块和词向量保存至向量数据库;S2:根据用户问题进行多路召回和检索汇总,并对检索到的文档进行文档重排;S3:根据多路召回阶段重排得到的top1文档的上下文关联信息,利用上下文检索器,找到该文档的上下文文档记录,并合并成完整文档;S4:将合并的完整文档内容和用户问题结合Prompt输入LLM模型进行问题回答。本发明克服了基于语义的检索方式的限制,提供更准确全面且适应性强的智能问答解决方案。
-
公开(公告)号:CN113792151A
公开(公告)日:2021-12-14
申请号:CN202110951988.X
申请日:2021-08-18
Applicant: 国家电网有限公司 , 国家电网有限公司大数据中心 , 国网天津市电力公司 , 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司
IPC: G06F16/36 , G06F16/33 , G06F16/335 , G06F16/338 , G06F16/903
Abstract: 本发明涉及一种面向多数据源审计知识图谱的智能检索方法,包括以下步骤:步骤1、对用户的查询请求进行字符串的预处理,并按序查询同构子图,并将所查询到的同构子图加入一次查询候选结果集中;步骤2、对步骤1的一次查询候选结果进行评估;步骤3、将步骤2评估后的一次查询候选结果进行融合;步骤4、对步骤3融合后的查询结果进行二次查询。本发明能够既考虑实体知识表达的多样性和关联性,又不增加知识图谱的维护成本的情况下,从多个数据源的审计知识图谱中,有效获取查询结果。
-
公开(公告)号:CN113641828A
公开(公告)日:2021-11-12
申请号:CN202110742593.9
申请日:2021-07-01
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
Abstract: 本发明涉及数据处理技术领域,特别涉及一种基于知识图谱的电网供应商画像成像方法和存储设备。所述一种基于知识图谱的电网供应商画像成像方法,包括步骤:构建画像标签体系,并设置画像标签体系中每个标签的分析规则;构建图谱的本体结构及本体结构间的关系;获取目标供应商数据,并将目标供应商数据填充至图数据库中,构建知识图谱;结合知识图谱中的数据及每个标签的分析规则计算得每个标签的维度得分;根据每个标签的维度得分构建得供应商标签画像。通过上述步骤,实现从不同维度对供应商进行综合评价,为电网招标采购、供应商全息多维评价、质量监督业务运营决策场景提供辅助支撑,提供现代智慧供应链的基础支撑能力。
-
-
-
-
-
-
-
-
-