-
公开(公告)号:CN113901219A
公开(公告)日:2022-01-07
申请号:CN202111181632.9
申请日:2021-10-11
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/253 , G06F40/242 , G06F40/30 , G06F40/216
Abstract: 本申请公开了一种基于意图识别的数据分析方法及系统,通过将待分析数据中的词语映射成预设维度的特征向量,并在对语义角色标注后,利用基于语义角色标注结果确定的有效特征确定有效特征的特征向量,实现对待分析数据的分类,实现了通过待分析数据中有效特征的特征向量分析待分析数据的相似性,从而确定待分析数据所属领域,以便于能够基于待分析数据的领域对待分析数据进行有效分析,以弥补直接基于语义角色标注方法进行待分析数据的分析的不足。
-
公开(公告)号:CN113722492A
公开(公告)日:2021-11-30
申请号:CN202111054974.4
申请日:2021-09-09
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/242 , G06N3/08 , G06N20/00
Abstract: 本发明公开了一种意图识别方法及装置,包括:获取待识别文本;对所述待识别文本进行预处理,得到预处理结果;对所述预处理结果进行特征提取,得到文本特征;将所述文本特征输入至目标意图识别模型,获得意图识别结果,其中,所述目标意图识别模型为基于训练样本训练得到的神经网络模型,所述训练样本为标注有意图标签的文本信息。通过生成文本意图分类器的方法,确定与用户匹配的个性化对话风格,并基于机器学习与深度学习算法,准确预测用户消息所表达的意图信息。提升了意图识别的精准度和可靠性。
-
公开(公告)号:CN113722463A
公开(公告)日:2021-11-30
申请号:CN202111054973.X
申请日:2021-09-09
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/332 , G06N20/10
Abstract: 本发明公开了一种多轮对话方法及装置,包括:接收初始状态向量,所述初始状态向量基于用户的输入语音转化得到;将所述初始状态向量传递给强化学习智能体得到初始动作,所述初始动作至少为一个;将每个初始动作传递给环境模型,得到状态向量和强化信号,所述环境模型用于对初始状态向量进行调整和对每个初始动作进行评价,所述强化信号用于表征对应初始动的评价结果;将所述状态向量和所述强化信号传递给所述强化学习智能体,得到目标动作,将所述目标动作转化为回复语句。上述过程,基于初始状态向量确定了至少一个初始动作,并对各个初始动作进行评价,基于评价结果确定目标动作,目标动作是在多个初始动作中选取的,保证了回复的准确性。
-
公开(公告)号:CN113688684A
公开(公告)日:2021-11-23
申请号:CN202110843215.X
申请日:2021-07-26
Applicant: 国网电商科技有限公司 , 国网电子商务有限公司
IPC: G06K9/00 , G06K9/62 , G06F40/174
Abstract: 本发明公开了一种基于聚类的表格重构方法及系统,该方法包括:S100:获取包括表格的PDF图片;S200:提取PDF图片中的横线和竖线,分别生成横线图片和竖线图片;S300:基于横线图片和竖线图片提取横线和竖线的交叉点;S400:对交叉点进行基于位置的聚类,基于聚类结果对表格进行分离;S500:提取单个表格所包含的交叉点,对交叉点进行去抖处理;S600:基于广度遍历思想,在交叉点间进行路径游走,重构表格。本发明能够从包括不规则表格的图片中识别并重构表格,相比于现有的表格重构方法,可提升表格重构精度,并可有效解决图片中可能会出现的表格扭曲问题,对不规则表格的重构尤其适用。
-
公开(公告)号:CN113688627A
公开(公告)日:2021-11-23
申请号:CN202111069148.7
申请日:2021-09-13
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F40/284 , G06F40/30 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种用于意图识别的词义角色标注方法及系统,方法包括:输入句子序列、谓词序列、谓词上下文和谓词上下文区域标记;将谓词序列和谓词上下文扩展为与句子序列长度相同的序列;将句子序列、谓词序列、谓词上下文和谓词上下文区域标记转换为词向量序列;将句子序列、谓词序列、谓词上下文和谓词上下文区域标记的词向量序列输入双向LSTM模型;通过双向LSTM模型学习输入序列的特征表示,得到新的特征表示序列;将新的特征表示序列输入条件随机场;通过条件随机场对新的特征表示序列进行标注,得到标注结果。本发明能够有效的实现自动词义角色标注,减少意图识别中构建词义标注语料库的时间和成本。
-
公开(公告)号:CN113326284B
公开(公告)日:2021-10-01
申请号:CN202110883483.4
申请日:2021-08-03
Applicant: 国网电商科技有限公司 , 国网电子商务有限公司
IPC: G06F16/242 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了基于正则路径查询的搜索系统,包括:数据库构建模块,用来对RDF数据图进行哈希编码,获得哈希值数据图;再以哈希值数据图的谓词作为key,以三元组作为value,使用key‑value分布式存储方式对哈希值数据图进行存储,获得克林闭包特征数据形式的key‑value数据图;遍历key‑value数据图,标记其中存在克林闭包的谓词及克林闭包谓词对应的三元组簇,将递归形式的三元组簇以递归树结构存储;选择度计算模块,用来基于递归树计算谓词的静态选择度以及两个谓词之间的连接选择度;搜索模块,用来在接收到查询语句时在数据库中进行搜索。本发明可获得查询路路径,可有效提高正则路径查询问题的效率,适合广泛应用。
-
公开(公告)号:CN113297370A
公开(公告)日:2021-08-24
申请号:CN202110848497.2
申请日:2021-07-27
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/332 , G06F40/30 , G06T11/60 , G06N3/04
Abstract: 本发明公开了基于多交互注意力的端到端多模态问答方法及系统,包括:(1)接收问题和背景知识;(2)从接收的背景知识中筛选出与问题相关的文本背景知识和图像背景知识;(3)对筛选出的文本背景知识进行编码,获得文本背景知识中各段落的特征表示;(4)将筛选出的图像背景知识解析为图像特征表示,并构建可微场景图;(5)融合特征表示和可微场景图,获得背景知识的融合特征表示;(6)将融合特征表示、问题的特征表示、候选答案的特征表示输入非线性层,计算各候选答案的预测概率,输出预测概率最高的候选答案。本发明可有效利用多模态信息,提升多模态语义理解的准确度和全面性,从而提升多模态问答系统的准确率。
-
公开(公告)号:CN113254675A
公开(公告)日:2021-08-13
申请号:CN202110808184.4
申请日:2021-07-16
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/126 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本发明公开了基于自适应少样本关系抽取的知识图谱构建方法,该抽取方法包括实体间关系采用自适应关系抽取模型提取,所述自适应关系抽取模型的构建包括:S100:利用文本编码器对训练集实例进行编码,生成上下文关系语义;S200:将支持集输入参数生成器,生成初始化softmax参数;S300:将步骤S100生成的上下文关系语义输入自适应图神经网络,利用自适应图神经网络对实例进行更新;S400:利用softmax分类器对更新后的实例进行分类预测,获取关系类型。本发明在获取关系时不需要大量的人工标注数据,避免了大量的人工打标带来的费时耗钱,且通过少量特定领域的标签数据就可以完成特定领域的关系抽取任务。
-
公开(公告)号:CN112182211A
公开(公告)日:2021-01-05
申请号:CN202011025556.8
申请日:2020-09-25
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本发明提供了一种文本分类方法及装置,该方法包括:获取目标文本分类模型;对目标文本进行预处理,获得目标文本对应的目标文本向量;将目标文本向量输入分类模型,获得分类模型输出目标文本分别属于每个文本类别对应的类别概率;将目标文本分配至最大的类别概率对应的文本类别的类别目录中,完成对目标文本的分类。应用该方法,在需要对文本进行分类时先对文本进行预处理获得对应的文本向量,再通过分类模型对文本进行识别,获得分类模型输出的文本属于每个文本类别对应的概率,以确定该文本属于最大的概率对应的文本类别。通过该方法可以快速对文本进行分类,节约文本分类时间。
-
公开(公告)号:CN112118319A
公开(公告)日:2020-12-22
申请号:CN202010998634.6
申请日:2020-09-22
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: H04L29/08 , H04L12/66 , H04L29/06 , G06F16/955
Abstract: 本发明公开了一种网络URL资源处理方法及系统,方法包括:当外部访问网关时,通过网关前置解析服务密钥生成请求地址,并将请求地址转发至网关引擎;网关引擎通过应用配置,将请求地址转发至应用系统。本发明通过加装网关前置对URL资源进行二次汇集,有效解决了URL资源汇集量大,服务资源暴露的问题,使得调用方更为方便,网关引擎扩展更为灵活。
-
-
-
-
-
-
-
-
-