-
公开(公告)号:CN116028636A
公开(公告)日:2023-04-28
申请号:CN202211377886.2
申请日:2022-11-04
Applicant: 南方电网数字电网研究院有限公司
IPC: G06F16/36 , G06F16/33 , G06F16/35 , G06F40/211 , G06F40/30 , G06N3/044 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供的一种基于自学习的电网知识图谱构建方法,所述构建方法包括:采用bootstrapping句法模板以及远监督的方案来构建样本;基于所述样本采用pipeline的方式来进行开放知识挖掘;采用多维度低资源信息的抽取,获得抽取信息;对所述抽取信息进行融合,获得融合信息;根据所述融合信息构建电网知识图谱。解决数据+学习的自组织难题,实现知识体系构建从人工编辑到半自动构建的跨越,实现了电力知识体系的深度沉淀和自动迭代更新。
-
公开(公告)号:CN115757678A
公开(公告)日:2023-03-07
申请号:CN202211380641.5
申请日:2022-11-04
Applicant: 南方电网数字电网研究院有限公司
IPC: G06F16/31 , G06F16/383 , G06F16/71 , G06F16/783 , G06F16/78
Abstract: 本发明提供的一种基于视点合成的非结构化数据内容检索方法包括:根据非结构化数据的特点,利用视频压缩技术对海量的非结构化数据进行压缩,便于传输和存储;利用视点合成技术对相邻的视频数据进行拼接,优化非结构化数据;利用迭代投影重建的图像上采样方法细化图像纹理细节,并采用深度学习方法实现图像信息的细粒度目标识别,形成相应的检索标签,用于支撑后续检索。能够以较低的时间成本再现精细的纹理细节。在图像和视频内容分析上,通过建立深度学习模型,进行分析。
-
公开(公告)号:CN115543989A
公开(公告)日:2022-12-30
申请号:CN202211377889.6
申请日:2022-11-04
Applicant: 南方电网数字电网研究院有限公司
IPC: G06F16/215 , G06F16/2455 , G06F16/25 , G06F16/28
Abstract: 本发明提供的一种基于多源异构数据的融合处理方法,所述融合处理方法包括:根据电力大数据技术特性、应用需求和电力时空特性,建立基于业务的数据时空不确定性与多维关联性描述方法;基于多源异构数据清洁方法、融合机制,建立电力大数据的实用化的组织方案,用于实现以客户需求为导向的数据统一表达和优化方法;建立适应数据时空属性动态化的分布存储。提高数据的读取效率。
-
公开(公告)号:CN115270019A
公开(公告)日:2022-11-01
申请号:CN202210440032.8
申请日:2022-09-23
Applicant: 南方电网数字电网研究院有限公司
IPC: G06F16/957 , G06F40/106 , G06V30/148
Abstract: 本发明涉及一种用于网页版电子文档本地化的方法,属于电子化文档的本地化处理技术领域。该方法具体包括:获取网页版电子文档;全屏截取所述网页版电子文档的最初状态图像;利用边界判断方法截取所述最初状态图像的文档部分;截取所述最初状态图像的文档部分并保存。本发明还提供相应的用于网页版电子文档本地化的系统。本发明通过智能判断并自动截取的方式实现网页版电子文档本地化,便于在没有网络环境下的查阅。
-
公开(公告)号:CN114637903A
公开(公告)日:2022-06-17
申请号:CN202210258764.5
申请日:2022-03-16
Applicant: 南方电网数字电网研究院有限公司
IPC: G06F16/951 , G06F16/9536 , G06F16/957 , G06K9/62
Abstract: 本发明公开了一种针对定向目标数据拓展的舆情数据采集系统,该系统以特定目标数据为种子进行数据扩展,并设计调度策略实现分布式、可持续的数据采集任务,通过人工搜集定向信息采集的目标账号与标签;基于社会网络对种子名单进行扩展;基于相似特征对种子名单进行扩展;搭建分布式迭代数据采集框架;数据关联、去重、结构化等预处理过程;采集程序调度与性能优化策略。本发明在定向数据采集的基础上融合了特征匹配与网络分析技术,通过对种子的数据扩展挖掘潜在关系,实现自动化、可持续、可迭代的分布式信息采集,服务社交媒体分析与关系图谱构建等现实需求。
-
公开(公告)号:CN114611466A
公开(公告)日:2022-06-10
申请号:CN202210259864.X
申请日:2022-03-16
Applicant: 南方电网数字电网研究院有限公司
IPC: G06F40/151 , G06F40/205 , G06F40/279 , G06F40/211 , G06F40/216
Abstract: 本发明公开了一种用于PDF文档页面元素有效信息的提取方法及系统,包括以下:构建初始PDF文档信息提取模型,并存储至第一存储区域;获取文档解析规则集;根据初始PDF文档信息提取模型和文档解析规则集,生成PDF文档信息提取规则模型,并存储至第二存储区域;根据初始PDF文档信息提取模型和PDF文档信息提取规则模型,构建用于提取PDF文档有效信息的PDF文档信息提取模型;通过设定第一间隔时间,根据初始PDF文档信息提取模型和文档解析规则集,更新PDF文档信息提取模型模型;本发明根据页面顶部和底部文本信息,从前后页面分别获取文本以补全本页面缺失的文本信息,以页面为单位对文本信息进行汇总,信息更为精细化。
-
-
-
-
-