-
公开(公告)号:CN113935316B
公开(公告)日:2024-12-03
申请号:CN202010669313.1
申请日:2020-07-13
Applicant: 中国电信股份有限公司
IPC: G06F40/216 , G06F40/289
Abstract: 本公开涉及数据处理方法及装置、计算机可存储介质,涉及计算机技术领域。数据处理方法包括:获取与电子文档对应的历史搜索数据,所述历史搜索数据包括多个搜索关键词;根据所述历史搜索数据,确定所述电子文档的易搜度,所述易搜度表征所述电子文档是否容易被搜索到;根据所述易搜度,从所述多个搜索关键词中,选取至少一个参考关键词;推荐所述至少一个参考关键词作为所述电子文档的标题和正文中的至少一种的一部分。根据本公开,提高了电子文档的质量和准确性,进而提高了搜索电子文档的效率。
-
公开(公告)号:CN114265505A
公开(公告)日:2022-04-01
申请号:CN202111617144.8
申请日:2021-12-27
Applicant: 中国电信股份有限公司
IPC: G06F3/01 , G06F3/0481 , G06N5/04
Abstract: 本发明公开了一种人机交互处理方法、装置、存储介质及电子设备。其中,该方法包括:在检测到目标对象的交互请求时,获取上述目标对象的初始交互信息,其中,上述初始交互信息是基于行业历史问题总结得到的;如果存在与上述初始交互信息关联的交互应用场景,则执行与上述交互应用场景对应的人机交互规则;如果不存在与上述初始交互信息关联的交互应用场景,则执行场景选择规则;如果上述场景选择规则定位到上述交互应用场景,则执行与上述交互应用场景对应的人机交互规则。本发明解决了由于现有技术中的人机交互处理方法无法准确推断客户意图,造成的信息推送不准确、用户满意度差的技术问题。
-
公开(公告)号:CN114155840A
公开(公告)日:2022-03-08
申请号:CN202010933317.6
申请日:2020-09-08
Applicant: 中国电信股份有限公司
Abstract: 本公开涉及一种语音发起方的区分方法和装置,涉及语音信号处理技术领域。该方法包括:将语音信号划分为多个语音分段;提取各语音分段的声纹特征和频谱特征,融合为各语音分段的特征向量;根据特征向量,对各语音分段进行聚类处理,区分各语音分段的语音发起方。
-
公开(公告)号:CN117557132A
公开(公告)日:2024-02-13
申请号:CN202311396198.5
申请日:2023-10-25
Applicant: 中国电信股份有限公司
IPC: G06Q10/0639 , G06Q30/01 , G06F16/332 , G06F16/35 , G06F16/33 , G06N3/096 , G06N3/09
Abstract: 本申请公开了一种客户服务语言质检方法、装置、电子设备及存储介质,一种客户服务语言质检方法包括:利用大语言模型获得样本数据集;基于第一老师模型,利用样本数据集对第一学生模型进行第一阶段的知识蒸馏训练,得到第一阶段训练后的第一学生模型;利用第一真实业务数据集对第一阶段训练后的第一学生模型进行第二阶段的知识蒸馏训练,得到第二阶段训练后的第一学生模型;在对客户服务语言质检过程中,利用第二阶段训练后的第一学生模型确定待质检的每条客户服务语言是否合格。应用本申请所提供的技术方案,可以降低人力成本,提高质检效率。
-
公开(公告)号:CN117421410A
公开(公告)日:2024-01-19
申请号:CN202311460512.1
申请日:2023-11-03
Applicant: 中国电信股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F18/22 , G06N3/0455 , G06N3/088 , G06N3/0895
Abstract: 本申请公开了一种问答系统中的文本匹配方法及装置。其中,该方法包括:接收待匹配问题文本;采用双塔模型确定多个候选问题文本中与待匹配问题文本的相似度;按照相似度从大到小的顺序进行排序,将排序靠前的预设数量的候选问题文本确定为初始文本;采用单塔模型对待匹配问题文本与多个初始文本进行相关性分析,得到多个初始文本与待匹配问题文本的相关性分数,并将相关性分数最大的初始文本确定为与待匹配问题文本相匹配的目标文本。本申请至少解决了相关技术中问题文本匹配效率低的技术问题。
-
公开(公告)号:CN115563258A
公开(公告)日:2023-01-03
申请号:CN202211222898.8
申请日:2022-10-08
Applicant: 中国电信股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/34 , G06F40/106 , G06F40/114
Abstract: 本发明实施例提供了一种问卷题目的显示控制系统,该系统包括:分页配置模块,用于接收用户输入的待生成问卷的页数以及多组分页信息,并基于页数以及多组分页信息生成分页配置策略;跳转配置模块,用于接收用户输入的多组跳转信息,并基于多组跳转信息生成跳转配置策略;显示配置模块,用于接收用户输入的多组题目显示信息,并基于多组题目显示信息生成题目显示配置策略;问卷显示模块,用于基于分页配置策略,显示待生成问卷,并基于跳转配置策略跳转至待生成问卷中的目标页或者基于所述题目显示配置策略显示目标待显示题目。本发明基于用户输入的数据生成多个配置策略,之后根据配置策略对问卷进行显示,提升了问卷配置以及显示的灵活性。
-
公开(公告)号:CN113935316A
公开(公告)日:2022-01-14
申请号:CN202010669313.1
申请日:2020-07-13
Applicant: 中国电信股份有限公司
IPC: G06F40/216 , G06F40/289
Abstract: 本公开涉及数据处理方法及装置、计算机可存储介质,涉及计算机技术领域。数据处理方法包括:获取与电子文档对应的历史搜索数据,所述历史搜索数据包括多个搜索关键词;根据所述历史搜索数据,确定所述电子文档的易搜度,所述易搜度表征所述电子文档是否容易被搜索到;根据所述易搜度,从所述多个搜索关键词中,选取至少一个参考关键词;推荐所述至少一个参考关键词作为所述电子文档的标题和正文中的至少一种的一部分。根据本公开,提高了电子文档的质量和准确性,进而提高了搜索电子文档的效率。
-
公开(公告)号:CN115083418B
公开(公告)日:2024-11-12
申请号:CN202110268112.5
申请日:2021-03-12
Applicant: 中国电信股份有限公司
IPC: G10L15/28 , G10L15/06 , H04L67/1008
Abstract: 本发明提供了一种异构语音识别引擎负载均衡的方法,包括:接收不同区域的语音识别请求;根据所述不同区域的语音识别请求中的区域标识,获取每个区域中在线语音识别引擎的负载分配比例,其中,每个区域中部署有不同架构的在线语音识别引擎,每个区域中在线语音识别引擎的负载分配比例是基于优化过程中该区域中不同架构的离线语音识别引擎的识别准确率确定的;根据每个区域中在线语音识别引擎的负载分配比例,对所述不同区域的语音识别请求进行分配,以此方式根据各个引擎的语音识别能力来分配不同区域的语音识别请求,实现了实际意义上的各个语音识别引擎的负载均衡。本发明还提供了一种异构语音识别引擎负载均衡的装置、介质以及电子设备。
-
公开(公告)号:CN118248149A
公开(公告)日:2024-06-25
申请号:CN202211656945.X
申请日:2022-12-22
Applicant: 中国电信股份有限公司
Abstract: 本申请公开了一种语音识别方法及装置。其中,该方法包括:获取待识别语音数据;确定待识别语音数据所属目标领域和所属目标语种,并根据目标领域和目标语种确定识别待识别语音数据所需的多个目标识别网络,目标识别网络中包含多个用于对待识别语音数据进行识别的识别模型,目标识别网络中的多个识别模型分别用于对待识别语音数据进行多个不同维度的识别;按照预先确定的调用策略加载多个识别网络对应的多个识别模型,并根据预先确定的加载策略执行多个线程;分别加载多个目标网络对应的识别模型对待识别语音数据进行识别,依据多个识别结果共同确定搜索待识别语音数据的目标识别结果。本申请至少解决了语音识别引擎资源利用率低的技术问题。
-
公开(公告)号:CN115659211A
公开(公告)日:2023-01-31
申请号:CN202211182902.2
申请日:2022-09-27
Applicant: 中国电信股份有限公司
IPC: G06F18/24 , G06F18/25 , G06N3/0442 , G06N3/09 , G06N20/00 , G10L21/0272
Abstract: 本申请实施例公开了用户画像生成方法、装置、电子设备和计算机可读介质。该方法的实施例包括:将用户通话音频切分为无人声音频片段和含人声音频片段;从无人声音频片段中提取第一音频特征,将第一音频特征输入至预先训练的第一环境声事件检测模型,得到第一检测结果;从含人声音频片段中提取第二音频特征,将第二音频特征输入至预先训练的第二环境声事件检测模型,得到第二检测结果;基于第一检测结果和第二检测结果,生成用户画像。该实施方式丰富了用户画像的生成方式,基于此方式生成的用户画像,能够为用户提供与其所处环境相关的服务,从而提高服务质量。
-
-
-
-
-
-
-
-
-