-
公开(公告)号:CN113688684B
公开(公告)日:2022-04-05
申请号:CN202110843215.X
申请日:2021-07-26
Applicant: 国网电商科技有限公司 , 国网电子商务有限公司
IPC: G06V30/413 , G06V30/412 , G06K9/62 , G06F40/174
Abstract: 本发明公开了一种基于聚类的表格重构方法及系统,该方法包括:S100:获取包括表格的PDF图片;S200:提取PDF图片中的横线和竖线,分别生成横线图片和竖线图片;S300:基于横线图片和竖线图片提取横线和竖线的交叉点;S400:对交叉点进行基于位置的聚类,基于聚类结果对表格进行分离;S500:提取单个表格所包含的交叉点,对交叉点进行去抖处理;S600:基于广度遍历思想,在交叉点间进行路径游走,重构表格。本发明能够从包括不规则表格的图片中识别并重构表格,相比于现有的表格重构方法,可提升表格重构精度,并可有效解决图片中可能会出现的表格扭曲问题,对不规则表格的重构尤其适用。
-
公开(公告)号:CN113901220A
公开(公告)日:2022-01-07
申请号:CN202111183171.9
申请日:2021-10-11
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本申请公开了一种基于远程监督的信息分类方法及系统,确定句子中的实体词语对,以及实体词语对中的每个实体词语在句子中的位置,将实体词语对以及每个实体词语在句子中的位置输入至卷积神经网络模型,基于实体词语对中的每个实体词语在句子中的位置提取句子中的多个特征信息,基于句子中的多个特征信息确定实体词语对的语义关系。本方案中在将实体词语对及每个实体词语在句子中的位置输入至卷积神经网络模型后,在该模型中,基于每个实体词语在句子中的位置提取句子的多个特征信息进行池化,以更好的确定两个实体词语间的结构化信息,便于精确分类,提高对句子中实体对之间关系确定的精确度,避免引入噪声数据。
-
公开(公告)号:CN113869056A
公开(公告)日:2021-12-31
申请号:CN202111196684.3
申请日:2021-10-14
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本申请提供一种基于远程监督的关系抽取方法及装置,在获取到语料库数据后;根据预设海量特征模型对所述语料库数据进行信息抽取,确定所述语料库数据中每个命名实体对共现句子的特征,生成海量特征向量;根据所述海量特征向量检测和识别所述语料库数据中实体之间的语义关系,并将表示同一语义关系的提及链接起来,以实现关系抽取。本申请中的海量特征训练模型通过外部知识库代替人对语料进行标注,从而可以低成本地获取大量有标注数据,进而通过分类方法进行关系抽取。
-
公开(公告)号:CN113283398A
公开(公告)日:2021-08-20
申请号:CN202110787908.1
申请日:2021-07-13
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本发明公开了一种基于聚类的表格识别方法及系统,所公开的表格识别方法包括:S110:检测PDF图片中文字,将文字的中心标记为关键点;S120:基于关键点识别表格;S130:统计同一类别所包含关键点的横纵坐标,以关键点的横纵坐标分别为横纵坐标绘制折线图,从该折线图获取峰值点被认为表格窗口中心最有可能出现的位置,基于峰值点坐标重新修正同一类别中其他关键点的坐标。本发明能够在PDF中获取结构化的表格数据,相比于其他系统,提升了无边框表格识别的精度,并有效解决了扫描文档中可能会出现的表格扭曲问题。
-
公开(公告)号:CN111754491A
公开(公告)日:2020-10-09
申请号:CN202010598556.0
申请日:2020-06-28
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本申请提供了一种图片清晰度判定方法及装置,利用目标检测模型对待判定图片所包含的物体进行检测识别,得到至少一个主物体,然后,从待判定图片中提取出各主物体的图像,即主物体图像。对各主物体图像进行边缘检测,并根据边缘检测图像计算得到该主物体图像的清晰度。最后根据各主物体图像的清晰度得到整个图片的清晰度。该方案从图片中识别并提取出主物体图像,并计算主物体图像的清晰度,避免图片中包含的模糊背景或锐利背景对整个图片清晰度的影响,因此提高了图片清晰度判定结果的准确度。
-
公开(公告)号:CN111753817A
公开(公告)日:2020-10-09
申请号:CN202010599478.6
申请日:2020-06-28
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本申请提供的信息处理的方法及装置、电子设备及计算机可读存储介质,包括,获取对象的待审核文件,对待审核文件进行文字检测和文字识别,得到待审核文件包括的文本信息,从文本信息中定位待审核属性项,并从文本信息中提取待审核属性项对应的属性值,依据预设的审核规则,对审核信息进行审核,得到针对对象的审核结果。因为,待审核属性项为预先构建的审核属性项数据库中包括的审核属性项,所以,可以确保从文本信息中提取的待审核属性项对应的属性值为需进行审核的文本信息的内容,所以,可以提高对待审核文件进行审核的准确度,进而确保针对对象的审核结果的具有良好的可信度。
-
公开(公告)号:CN113766026A
公开(公告)日:2021-12-07
申请号:CN202111055801.4
申请日:2021-09-09
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本发明公开了一种应用于能源工业网的数据处理方法及系统,包括:获取接入能源工业网的数据类型,并基于所述数据类型进行数据格式的封装,获得数据接口;生成与数据请求对应的响应模式,并基于所述响应模式确定共享交互模式和应急交互模式;确定所述能源工业网的数据管理模式,所述数据管理模式用于对数据进行管理和存储;基于所述数据接口、所述共享交互模式、所述应急交互模式和所述数据管理模式,创建目标数据模型,以使得通过所述目标数据模型对接入所述能源工业网的数据进行标准化处理,实现了数据的统一处理,提升了数据共享和交互的高效性。
-
公开(公告)号:CN113297370B
公开(公告)日:2021-11-16
申请号:CN202110848497.2
申请日:2021-07-27
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/332 , G06F40/30 , G06T11/60 , G06N3/04
Abstract: 本发明公开了基于多交互注意力的端到端多模态问答方法及系统,包括:(1)接收问题和背景知识;(2)从接收的背景知识中筛选出与问题相关的文本背景知识和图像背景知识;(3)对筛选出的文本背景知识进行编码,获得文本背景知识中各段落的特征表示;(4)将筛选出的图像背景知识解析为图像特征表示,并构建可微场景图;(5)融合特征表示和可微场景图,获得背景知识的融合特征表示;(6)将融合特征表示、问题的特征表示、候选答案的特征表示输入非线性层,计算各候选答案的预测概率,输出预测概率最高的候选答案。本发明可有效利用多模态信息,提升多模态语义理解的准确度和全面性,从而提升多模态问答系统的准确率。
-
公开(公告)号:CN113254625B
公开(公告)日:2021-11-16
申请号:CN202110798849.8
申请日:2021-07-15
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/126 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于交互融合的情感对话生成方法及系统,包括:S100:接收对话语句文本;S200:情感分类器识别对话语句文本所蕴含的情感类别,并表示为向量;S300:编码器将对话语句文本编码为上下文向量;S400:细粒度交互模块将对话语句文本的情感类别表示向量和上下文向量融合,生成交互式向量;S500:解码器利用交互式向量进行解码,生成回复;S600:输出回复。本发明可解决现有人机对话系统情感感知能力较弱,情感表达能力不足的问题。
-
公开(公告)号:CN113254625A
公开(公告)日:2021-08-13
申请号:CN202110798849.8
申请日:2021-07-15
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/126 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于交互融合的情感对话生成方法及系统,包括:S100:接收对话语句文本;S200:情感分类器识别对话语句文本所蕴含的情感类别,并表示为向量;S300:编码器将对话语句文本编码为上下文向量;S400:细粒度交互模块将对话语句文本的情感类别表示向量和上下文向量融合,生成交互式向量;S500:解码器利用交互式向量进行解码,生成回复;S600:输出回复。本发明可解决现有人机对话系统情感感知能力较弱,情感表达能力不足的问题。
-
-
-
-
-
-
-
-
-