网址检测方法及相关装置、设备和存储介质

    公开(公告)号:CN119514495A

    公开(公告)日:2025-02-25

    申请号:CN202411424560.X

    申请日:2024-10-12

    Abstract: 本申请公开了一种网址检测方法及相关装置、设备和存储介质,其中,网址检测方法包括:分别提取目标网址文本中不符合预设条件的各个目标字符;其中,预设条件至少包括以下两种:预设字体形式和预设网址字符;基于目标字符属于不符合预设条件的具体种类,采用与具体种类相匹配的校正方式处理目标字符,得到目标字符校正之后符合预设条件的标准字符;基于目标字符的标准字符替换目标字符,得到目标网址文本的标准网址文本。上述方案,能够提升网址检测的准确性。

    模型训练方法、问答处理方法、装置、设备、介质及产品

    公开(公告)号:CN117874199A

    公开(公告)日:2024-04-12

    申请号:CN202410040693.0

    申请日:2024-01-10

    Abstract: 本申请提出一种模型训练方法、问答处理方法、装置、设备、介质及产品,该方法包括:利用第一训练数据对大语言模型进行无监督预训练,所述第一训练数据包括事理图谱中的事件内容数据和/或事件关系数据;利用基于所述事理图谱构建的问答数据,对预训练后的所述大语言模型进行有监督的问答训练,得到基于所述事理图谱的问答模型;其中,所述问答数据包括事件参数问答数据、事件关系问答数据、事件关系理解问答数据和思维链式问答数据中的至少一种,所述思维链式问答数据包括待解答问题,以及解答所述待解答问题的推理过程数据。上述方案能够提高基于事理图谱的问答处理的准确度。

    音频信号选取方法、装置、相关设备及信号接收系统

    公开(公告)号:CN116682461A

    公开(公告)日:2023-09-01

    申请号:CN202310822386.3

    申请日:2023-07-05

    Abstract: 本申请公开了一种音频信号选取方法、装置、相关设备及信号接收系统,本申请获取各个候选音频信号并提取每一候选音频信号的声学特征,该声学特征为,能够以其为依据解码得到目标音频信号的声学特征,其中,目标音频信号趋近于或等同于候选音频信号。鉴于声学特征的上述特性可知,声学特征包含了候选音频信号的各个维度的本征信息,如此才能够基于各维度丰富的本征信息解码还原出原始的候选音频信号。显然,声学特征所包含的各维度的本征信息必然包含了影响音频信号质量的各维度的影响因素,在此基础上,可以基于该声学特征准确的评估候选音频信号的质量,并参考各候选音频信号的质量,选取满足设定质量条件的候选音频信号,作为最终选取结果。

    声纹提取方法、声纹识别方法及相关装置、设备和介质

    公开(公告)号:CN115223571A

    公开(公告)日:2022-10-21

    申请号:CN202210683340.3

    申请日:2022-06-15

    Abstract: 本申请公开了一种声纹提取方法、声纹识别方法及相关装置、设备和介质,其中,声纹提取方法包括:获取由目标对象的各目标语音提取到的初始声纹特征,分别与参考声纹特征之间的差值声纹特征;从若干高斯混合模型中,确定与差值声纹特征匹配的高斯混合模型,作为差值声纹特征对应的目标混合模型;基于差值声纹特征和差值声纹特征对应的目标混合模型,分析得到信道特征,并从差值声纹特征对应的初始声纹特征中剥离信道特征,得到差值声纹特征对应的优化声纹特征;基于各差值声纹特征分别对应的优化声纹特征进行特征融合,得到目标对象的最终声纹特征。上述方案,能够尽可能地削弱声纹特征中的信道噪声,以提升声纹识别的准确性。

    语音识别方法、装置、电子设备和存储介质

    公开(公告)号:CN114708854A

    公开(公告)日:2022-07-05

    申请号:CN202210283915.2

    申请日:2022-03-21

    Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语音;基于第一语音识别模型,对待识别语音的频谱特征进行声学状态预测,得到待识别语音的第一声学状态后验概率;基于第二语音识别模型,对待识别语音的语义特征进行声学状态预测,得到待识别语音的第二声学状态后验概率;融合第一声学状态后验概率和第二声学状态后验概率,基于融合得到的融合后验概率进行语音识别解码,得到待识别语音的识别文本。本发明提供的语音识别方法、装置、电子设备和存储介质,在领域场景下能够准确进行语音识别。

    语音识别方法、装置、电子设备和存储介质

    公开(公告)号:CN114708852A

    公开(公告)日:2022-07-05

    申请号:CN202210255584.1

    申请日:2022-03-15

    Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。

    版面分析方法、装置、电子设备和存储介质

    公开(公告)号:CN114491129A

    公开(公告)日:2022-05-13

    申请号:CN202210055957.0

    申请日:2022-01-18

    Abstract: 本发明提供一种版面分析方法、装置、电子设备和存储介质,其中方法包括:从待分析图像的句子集合中,确定各个句子的候选下句;基于各个句子及其候选下句的语义信息,从各个句子的候选下句中确定各个句子的下一句子;基于各个句子的下一句子,对句子集合进行版面排序。本发明提供的方法、装置、电子设备和存储介质,基于各个句子及其候选下句的语义信息进行上下句判断,从而从候选下句中确定句子的下一句子,实现待分析图像中句子的版面排序,全程无需应用人为制定的版面排序规则,避免了人为指定规则对于人力和时间的浪费,并且针对结构变化或者排版复杂的图像同样适用,实现了自动化且适应性更强的版面分析,有助于拓宽版面分析的应用。

    一种语音识别结果确定方法、装置、设备及存储介质

    公开(公告)号:CN114203169A

    公开(公告)日:2022-03-18

    申请号:CN202210094152.7

    申请日:2022-01-26

    Abstract: 本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音在多个语音识别系统上分别对应的候选集,其中,目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;将获取的多个候选集两两组合,以得到若干组候选集;确定若干组候选集分别对应的相似性信息,并基于若干组候选集分别对应的相似性信息,从多个候选集中确定目标语音的识别结果,其中,相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。

Patent Agency Ranking