-
公开(公告)号:CN114387599A
公开(公告)日:2022-04-22
申请号:CN202111517670.7
申请日:2021-12-13
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06V30/148 , G06F40/289
Abstract: 本发明公开了一种数据处理方法及装置,可以获得待处理的字符串,待处理的字符串中包括已知字符和至少一个待识别字符,各待识别字符均存在至少两个相似字符;确定至少一个组合字符串,各组合字符串均是由已知字符和各待识别字符分别对应的一个相似字符经过有序组合而生成的;获得各组合字符串的分词信息;将分词数最少的分词信息确定为待处理分词信息;如果待处理分词信息的数量为多个,则确定各待处理分词信息中的分词匹配程度;将分词匹配程度最高的待处理分词信息确定为目标分词信息;将目标分词信息对应的组合字符串确定为正确字符串;基于正确字符串,确定待处理的字符串中的各待识别字符。本发明可以有效提高对文本的整体识别率。
-
公开(公告)号:CN114201974A
公开(公告)日:2022-03-18
申请号:CN202111542344.1
申请日:2021-12-13
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
Abstract: 本发明公开了一种对话处理方法及相关设备,可以获得一句待回复文本,利用训练好的Seq2Seq模型和训练好的目标强化学习模型对待回复文本进行处理,获得目标强化学习模型输出的与待回复文本相匹配的目标回复文本,目标回复文本有利于推动对话持续进行。本发明可以在进行人机对话时,有效避免万能回复和陷入死循环等问题,有效推动与用户的多轮对话,使得对话可以有效的持续下去。
-
公开(公告)号:CN113723100A
公开(公告)日:2021-11-30
申请号:CN202111054962.1
申请日:2021-09-09
Applicant: 国网电子商务有限公司 , 国网电商科技有限公司
IPC: G06F40/289 , G06K9/62 , G06F40/216 , G06F21/57
Abstract: 本申请提供了一种基于指纹特征的开源组件识别方法及装置,该方法通过确定排列在前设定个数的目标源码单词和/或每个目标源码单词的出现频率,得到第一源码指纹特征和/或第二源码指纹特征,及通过确定排列在前设定个数的目标项目单词和/或每个目标项目单词的出现频率,得到第一项目指纹特征和/或第二项目指纹特征,基于第一源码指纹特征和/或第二源码指纹特征及第一项目指纹特征和/或第二项目指纹特征,确定源码文件和项目文件的相似度,进而确定开源组件是否属于项目程序引用的程序,完成对开源组件的识别,并保证开源组件识别的准确性。
-
公开(公告)号:CN114201974B
公开(公告)日:2024-12-13
申请号:CN202111542344.1
申请日:2021-12-13
Applicant: 国网数字科技控股有限公司 , 国网电商科技有限公司
Abstract: 本发明公开了一种对话处理方法及相关设备,可以获得一句待回复文本,利用训练好的Seq2Seq模型和训练好的目标强化学习模型对待回复文本进行处理,获得目标强化学习模型输出的与待回复文本相匹配的目标回复文本,目标回复文本有利于推动对话持续进行。本发明可以在进行人机对话时,有效避免万能回复和陷入死循环等问题,有效推动与用户的多轮对话,使得对话可以有效的持续下去。
-
公开(公告)号:CN113723100B
公开(公告)日:2023-10-13
申请号:CN202111054962.1
申请日:2021-09-09
Applicant: 国网数字科技控股有限公司 , 国网电商科技有限公司
IPC: G06F40/289 , G06F18/22 , G06F40/216 , G06F21/57
Abstract: 本申请提供了一种基于指纹特征的开源组件识别方法及装置,该方法通过确定排列在前设定个数的目标源码单词和/或每个目标源码单词的出现频率,得到第一源码指纹特征和/或第二源码指纹特征,及通过确定排列在前设定个数的目标项目单词和/或每个目标项目单词的出现频率,得到第一项目指纹特征和/或第二项目指纹特征,基于第一源码指纹特征和/或第二源码指纹特征及第一项目指纹特征和/或第二项目指纹特征,确定源码文件和项目文件的相似度,进而确定开源组件是否属于项目程序引用的程序,完成对开源组件的识别,并保证开源组件识别的准确性。
-
-
-
-