-
公开(公告)号:CN110807333B
公开(公告)日:2024-02-06
申请号:CN201911047112.1
申请日:2019-10-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/30 , G06F16/35 , G06F16/332 , G10L15/22
Abstract: 本发明提供了一种语义理解模型的语义处理方法,包括:获取语音指令信息和车载环境的噪音信息;响应于所述语音指令信息,根据所述车载环境的噪音信息将所述语音指令转换为相应的可识别文本信息;根据与所述词语级的隐变量相匹配的对象,和与所述词语级的隐变量相对应的任务领域,触发相应的业务进程,以实现完成与所述语音指令信息相对应的任务。本发明还提供了语语义理解模型的处理装置及存储介质。本发明能够提升语义理解模型的训练精度与训练速度,使得语义理解模型能够适应车载全双工的使用场景,避免环境噪声对语义理解模型的影响,提升对车载全双工环境下的语义理解的准确性。
-
公开(公告)号:CN110795945B
公开(公告)日:2023-11-14
申请号:CN201911047125.9
申请日:2019-10-30
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明提供了一种语义理解模型训练方法,包括:对数据源中的与车载环境相匹配的训练样本进行召回处理;对与车载环境相匹配的带有噪声的语句样本进行边界语料扩充处理;对经过边界语料扩充处理的与车载环境相匹配的带有噪声的语句样本进行标注,以形成第一训练样本集合;通过语义理解模型对第二训练样本集合进行处理;根据语义理解模型的更新参数,通过第二训练样本集合对语义理解模型的语义表示层网络参数和任务相关输出层网络参数进行迭代更新。本发明还提供了语义理解方法、装置及存储介质。本发明能够提升语义理解模型的训练精度与训练速度,使得语义理解模型能够适应车载环境全双工使用场景,避免环境噪声对语义理解模型的影响。
-
公开(公告)号:CN110209809B
公开(公告)日:2023-10-24
申请号:CN201810981997.1
申请日:2018-08-27
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/35
Abstract: 本发明公开了一种文本聚类方法和装置、存储介质及电子装置。其中,该方法包括:根据待聚类文本之间的特征相似度构建相似度图,其中,该相似度图中的每个节点表示该待聚类文本中的一个文本,且该相似度图中存在连接的两个节点所表示的文本之间的该特征相似度大于第一阈值;从该相似度图中的相似团中获取目标相似团,其中,每个该相似团包括该相似度图中由该连接形成的封闭图形中的节点,或者,该相似度图中与其他节点都不连接的节点;通过该目标相似团确定该待聚类文本的聚类结果。通过本发明,解决了现有的文本聚类方法需事先指定聚类数目导致文本聚类效果较差的技术问题,达到了提高文本聚类效果的技术效果。
-
公开(公告)号:CN113392094A
公开(公告)日:2021-09-14
申请号:CN202011212443.9
申请日:2020-11-03
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/215 , G06F16/36
Abstract: 本发明公开了一种应用在人工智能场景下的信息获取方法、装置和存储介质以及电子设备,具体还涉及自然语言处理中与搜索相关,如排序、关键词、推荐等技术。其中,该方法包括:获取目标题目的题目信息;对目标题目的题目信息执行特征提取,以获得第一特征序列;从已配置的目标题库对应的同义词列表中,确定出与第一特征序列中的第一特征值具有同义词关系的第二特征值,其中,同义词列表中记录有至少两组具有同义词关系的特征值,具有同义词关系的特征值语义相同;基于第二特征值以及第一特征序列,获取第二特征序列;从目标题库中获取与目标特征序列对应的目标题目信息。本发明解决了因去重不够完全,进而导致的信息获取全面性较低的技术问题。
-
公开(公告)号:CN111680489A
公开(公告)日:2020-09-18
申请号:CN202010525837.3
申请日:2020-06-10
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/194 , G06F9/50 , G06F40/279
Abstract: 本发明公开了一种目标文本的匹配方法和装置、存储介质及电子设备。其中,该方法包括:对目标文件中当前待匹配的字符串进行匹配,首先在预先建立的目标搜索树中查找到与字符串匹配的实体,获取实体的实体名称和实体编号,再根据实体编号在信息数组中获取实体的实体类型和指代信息,实体确定为包括实体名称和实体类型以及指代信息的目的,可以理解为,将单类型有指代信息的实体的唯一的类型信息存储到对应的目标搜索树中,可以减少了与目标文本中当前待匹配字符串进行匹配的实体信息数组所占内存,提高目标文本的匹配速度,进而解决了现有技术中,目标文本匹配的内存占用较大以及效率较低的技术问题。
-
公开(公告)号:CN104346339B
公开(公告)日:2019-09-10
申请号:CN201310314194.8
申请日:2013-07-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F17/27
Abstract: 本发明公开了一种语义分析方法,属于计算机领域。所述方法包括:获取训练语料;按照文档维度和词维度将所述训练语料切分成a*M*M个数据块;对切分出的所述a*M*M个数据块进行迭代采样,输出最终收敛的采样模型;根据所述最终收敛的采样模型进行语义分析。本发明通过将获取到的训练语料切分成a*M*M个数据块,对切分出的数据块进行迭代采样,输出最终收敛的采样模型,根据输出的最终收敛的采样模型进行分析。由于切分获得的数据块可以分别单独进行采样,从而可以降低单进程的内存需求,解决了现有技术中当要训练的隐含语义较多时对单进程的内存要求较高的问题,达到提高训练效率的目的。
-
公开(公告)号:CN109190119A
公开(公告)日:2019-01-11
申请号:CN201810960868.4
申请日:2018-08-22
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种时间提取方法和装置、存储介质及电子装置。其中,该方法包括:获取与输入的查询指令相匹配的指令文本;对指令文本执行分词标注处理,得到指令分词集合,其中,指令分词集合中的每一个指令分词分别配置有词性标签;根据词性标签从指令分词集合中确定出时间分词子集;将时间分词子集与预配置的时间类型模板进行匹配,以得到与时间分词子集中所包含的时间分词相匹配的时间类型;按照时间类型对时间分词子集中的时间分词进行转化,以得到从指令文本中提取出的目标时间字段,其中,目标时间字段允许机器识别。本发明解决了相关技术中时间提取的准确性低的技术问题。
-
公开(公告)号:CN104346339A
公开(公告)日:2015-02-11
申请号:CN201310314194.8
申请日:2013-07-24
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种语义分析方法,属于计算机领域。所述方法包括:获取训练语料;按照文档维度和词维度将所述训练语料切分成a*M*M个数据块;对切分出的所述a*M*M个数据块进行迭代采样,输出最终收敛的采样模型;根据所述最终收敛的采样模型进行语义分析。本发明通过将获取到的训练语料切分成a*M*M个数据块,对切分出的数据块进行迭代采样,输出最终收敛的采样模型,根据输出的最终收敛的采样模型进行分析。由于切分获得的数据块可以分别单独进行采样,从而可以降低单进程的内存需求,解决了现有技术中当要训练的隐含语义较多时对单进程的内存要求较高的问题,达到提高训练效率的目的。
-
公开(公告)号:CN111914176B
公开(公告)日:2023-10-27
申请号:CN202010792916.0
申请日:2020-08-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/9535 , G06Q50/20 , G06Q10/04
Abstract: 本申请的实施例提供了一种题目的推荐方法及装置。该题目的推荐方法包括:获取待推送题目,以及所述待推送题目对应的正确率;获取所述目标对象的当前答题行为记录,并根据所述当前答题行为记录,确定所述目标对象所答题目的类别信息以及答题结果,所述答题结果包括回答正确和回答错误;根据所述类别信息以及所述答题结果,更新所述待推送题目中与所述类别信息对应的待推送题目的正确率;根据更新后的所述待推送题目的正确率,确定所述待推送题目中的目标题目,以向所述目标对象进行推送所述目标题目。本申请实施例的技术方案能够根据目标对象的真实学习水平推送题目,从而保证目标对象的做题效果。
-
公开(公告)号:CN110176227B
公开(公告)日:2023-07-14
申请号:CN201810252355.8
申请日:2018-03-26
Applicant: 腾讯科技(深圳)有限公司
Inventor: 赵学敏
Abstract: 本发明实施例公开了一种语音识别的方法,包括:接收待识别的语音信息;若所述语音信息中包含至少一个实体信息,则根据所述至少一个实体信息生成N个待选择模板,其中,所述N为大于或等于1的整数;从所述N个待选择模板中确定目标模板;通过所述目标模板获取所述待识别的语音信息所对应的语音识别结果。本发明实施例还提供一种语音识别装置。本发明实施例先从语音信息中提取实体信息,随后根据实体信息生成待选择模板,再对待选择模板进行校验,提高了校验的效率。
-
-
-
-
-
-
-
-
-