-
公开(公告)号:CN112101007A
公开(公告)日:2020-12-18
申请号:CN202010991878.1
申请日:2020-09-21
申请人: 国网辽宁省电力有限公司电力科学研究院 , 福建亿榕信息技术有限公司 , 南京南瑞信息通信科技有限公司 , 国家电网有限公司
发明人: 胡博 , 李钊 , 李伟 , 王丽霞 , 王大维 , 雷振江 , 田小蕾 , 杨超 , 顾海林 , 胡楠 , 刘晓强 , 齐俊 , 高强 , 庄莉 , 梁懿 , 陈新梅 , 刘鹏宇 , 曹国强
IPC分类号: G06F40/216 , G06F40/284 , G06F40/289
摘要: 一种从非结构化文本数据中提取结构化数据的方法及系统属于数据处理技术领域,尤其涉及一种从非结构化文本数据中提取结构化数据的方法及系统。本发明提供一种从非结构化文本数据中提取结构化数据的方法及系统。本发明包括以下步骤:1.在样本中标注要提取的信息在标注操作界面中建立要提取的字段,并在文本数据中标注字段对应的内容,标注完成系统会记录字段名称及其内容在文本中的起止位置。2.分词、标注词性。通过常用分词工具对步骤1中标注好的文本数据逐篇进行分词及词性标注,具体步骤包含:首先根据标注内容在文本中起止位置对文本进行分割,得到数个文本段,然后对这些文本段进行分词和词性标注。
-
公开(公告)号:CN112101001A
公开(公告)日:2020-12-18
申请号:CN202010992851.4
申请日:2020-09-21
申请人: 国网辽宁省电力有限公司电力科学研究院 , 福建亿榕信息技术有限公司 , 南京南瑞信息通信科技有限公司 , 国家电网有限公司
IPC分类号: G06F40/194 , G06F40/30 , G06F40/289 , G06F16/33 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 一种非结构化文本相似性判断的方法及系统属于数据处理技术领域,尤其涉及一种非结构化文本相似性判断的方法及系统。本发明提供一种非结构化文本相似性判断的方法及系统。本方案具体实施步骤如下:1.输入非结构化数据。该非结构化数据可以是来自于网络爬虫的网页或word文档等。2.文本抽取。从非结构化数据中提取文本信息。此步骤采用apache tika(apache组织开源文本抽取组件)进行文本内容的抽取,可兼容多种格式的文本内容抽取,如excel、pdf、xml、json、markdown等,该步骤最终输出抽取后的txt文件。
-
公开(公告)号:CN115794589B
公开(公告)日:2023-04-18
申请号:CN202310005079.6
申请日:2023-01-04
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司 , 华北电力大学 , 国网辽宁省电力有限公司电力科学研究院
摘要: 本发明涉及服务器测试技术领域,公开了一种基于国产CPU服务器的性能测试数据分析系统,包括:控制端,其用于从操作模式库中选择数据库操作模式,然后将数据库操作模式生成数据库操作发送到模拟客户端上;控制端在待测数据库进行测试时监听待测数据库的运行状态,对测试所得到的测试数据进行处理获得测试结果;控制端还用于对数据库操作模式进行适配,控制端提取一个数据库操作模式时需要将其与待测数据库进行适配;本发明避免了以往测试的客户机访问模式和访问资源过于固定和集中的缺陷,实现了模式的随机化,访问资源的平均化,更接近于数据库服务器的现实的应用,改进了测试的效果。
-
公开(公告)号:CN115794314B
公开(公告)日:2023-05-09
申请号:CN202310043832.0
申请日:2023-01-29
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司 , 华北电力大学 , 国网辽宁省电力有限公司电力科学研究院
IPC分类号: G06F9/455
摘要: 本发明公开了一种云计算环境下虚拟机迁移方法,涉及云计算技术领域,包括,对相应物理机的运行环境数据进行采集分析,形成物理机条件评价值;虚拟机确定需要迁移时,形成虚拟机环境评价值;基于对物理机及虚拟机的运行条件,判断当前条件下是否能够开展虚拟机迁移;如果当前不具备迁移的条件,预测获取可供迁移的时间点;获取当前虚拟机内的所有数据并进行分区,对各个数据分区内的数据进行评价,确定数据迁移优先级;依据虚拟机数据迁移优先级,将虚拟机的数据向备用物理机上迁移;在云计算的环境中成功运行。有序的对虚拟机的储存数据进行转移,降低数据迁移的难度,防止虚拟机在迁移时产生拥堵,进而提高迁移的效率,避免数据丢失。
-
公开(公告)号:CN115794589A
公开(公告)日:2023-03-14
申请号:CN202310005079.6
申请日:2023-01-04
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司 , 华北电力大学 , 国网辽宁省电力有限公司电力科学研究院
摘要: 本发明涉及服务器测试技术领域,公开了一种基于国产CPU服务器的性能测试数据分析系统,包括:控制端,其用于从操作模式库中选择数据库操作模式,然后将数据库操作模式生成数据库操作发送到模拟客户端上;控制端在待测数据库进行测试时监听待测数据库的运行状态,对测试所得到的测试数据进行处理获得测试结果;控制端还用于对数据库操作模式进行适配,控制端提取一个数据库操作模式时需要将其与待测数据库进行适配;本发明避免了以往测试的客户机访问模式和访问资源过于固定和集中的缺陷,实现了模式的随机化,访问资源的平均化,更接近于数据库服务器的现实的应用,改进了测试的效果。
-
公开(公告)号:CN115686534A
公开(公告)日:2023-02-03
申请号:CN202310001335.4
申请日:2023-01-03
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司 , 华北电力大学 , 国网辽宁省电力有限公司电力科学研究院
摘要: 本发明涉及指令编译技术领域,公开了一种基于动态二级制翻译的跨CPU桌面终端虚拟化方法,包括以下步骤:将x86二进制程序翻译为中间表示;按照操作节点生成软件模型;当前建模的操作节点进行记录,并对操作节点赋予节点值;从当前建模的软件模型和一致化处理后的历史模型数据中提取建模要素,获得第三要素对集合;将排序后的第一个第三要素对集合的建模要素对中与第一建模要素成对的标准建模要素作为当前建模的下一个操作节点所要生成的建模要素,将建立完毕的软件模型转化为arm平台特定模型,然后生成arm二进制程序;本发明解决了传统的x86二进制程序编译产生的代码膨胀的问题。
-
公开(公告)号:CN115686534B
公开(公告)日:2023-03-31
申请号:CN202310001335.4
申请日:2023-01-03
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司 , 华北电力大学 , 国网辽宁省电力有限公司电力科学研究院
摘要: 本发明涉及指令编译技术领域,公开了一种基于动态二进制翻译的跨CPU桌面终端虚拟化方法,包括以下步骤:将x86二进制程序翻译为中间表示;按照操作节点生成软件模型;当前建模的操作节点进行记录,并对操作节点赋予节点值;从当前建模的软件模型和一致化处理后的历史模型数据中提取建模要素,获得第三要素对集合;将排序后的第一个第三要素对集合的建模要素对中与第一建模要素成对的标准建模要素作为当前建模的下一个操作节点所要生成的建模要素,将建立完毕的软件模型转化为arm平台特定模型,然后生成arm二进制程序;本发明解决了传统的x86二进制程序编译产生的代码膨胀的问题。
-
公开(公告)号:CN115794314A
公开(公告)日:2023-03-14
申请号:CN202310043832.0
申请日:2023-01-29
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司 , 华北电力大学 , 国网辽宁省电力有限公司电力科学研究院
IPC分类号: G06F9/455
摘要: 本发明公开了一种云计算环境下虚拟机迁移方法,涉及云计算技术领域,包括,对相应物理机的运行环境数据进行采集分析,形成物理机条件评价值;虚拟机确定需要迁移时,形成虚拟机环境评价值;基于对物理机及虚拟机的运行条件,判断当前条件下是否能够开展虚拟机迁移;如果当前不具备迁移的条件,预测获取可供迁移的时间点;获取当前虚拟机内的所有数据并进行分区,对各个数据分区内的数据进行评价,确定数据迁移优先级;依据虚拟机数据迁移优先级,将虚拟机的数据向备用物理机上迁移;在云计算的环境中成功运行。有序的对虚拟机的储存数据进行转移,降低数据迁移的难度,防止虚拟机在迁移时产生拥堵,进而提高迁移的效率,避免数据丢失。
-
公开(公告)号:CN111090755A
公开(公告)日:2020-05-01
申请号:CN201911197172.1
申请日:2019-11-29
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网北京市电力公司 , 国家电网有限公司大数据中心 , 国网福建省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F16/36 , G06F16/33 , G06F16/383 , G06F40/289 , G06Q50/06
摘要: 一种文本关联关系判别方法及存储介质,其中方法包括如下步骤,对输入的语料进行预处理,得到预处理文本,对预处理文本中的文本字段进行判断是否为超短文本,对其中的超短文本根据行业知识图谱进行改写,得到改写文本,将改写文本输入BERT模型进行训练、分析,得到模型输出的关联关系判别结果。本发明可以结合超短文本改写技术进行短文本关联关系判断的方法。对比已有方案具有语义理解能力强、文本长度影响小、相关性判断准确率高的有益效果,综上所述,本发明解决了现有技术中对行业文本相关性的判断仍然不够准确的问题。
-
公开(公告)号:CN113961515A
公开(公告)日:2022-01-21
申请号:CN202111101660.5
申请日:2021-09-18
申请人: 福建亿榕信息技术有限公司 , 国网山东省电力公司 , 国网山东省电力公司潍坊供电公司 , 国家电网有限公司 , 国家电网有限公司大数据中心 , 国网信息通信产业集团有限公司 , 国网福建省电力有限公司 , 国网上海市电力公司
摘要: 本发明提供一种督办事项落实情况辅助方法、系统、设备和介质,方法包括:从督办数据中提取结果信息以及关键词信息,得到督办结果信息集和督办关键词信息集;根据督办结果信息集和督办关键词信息集在电子文件数据集中分析得到与督办数据相关的电子文件,并进行关联,为公司重要文件及督办事项落实情况辅助分析提供了重要的依据,为提升企业核心竞争力、赢得改革发展先机提供支撑。
-
-
-
-
-
-
-
-
-