基于多模态识别的RPA机器人状态判断方法及装置

    公开(公告)号:CN118984352A

    公开(公告)日:2024-11-19

    申请号:CN202411037812.3

    申请日:2024-07-31

    IPC分类号: H04M3/24 G06V10/74

    摘要: 本申请实施例提供一种基于多模态识别的RPA机器人状态判断方法及装置,该方法包括:响应于登录指令,根据软电话登录界面,获取所述软电话登录界面的第一图像;根据所述第一图像和预先存储的第二图像,判断所述第一图像中是否包含所述第二图像;若所述第一图像中包含所述第二图像,则确定软电话登录成功,本申请实施例提供截取软电话登录界面的图像和预先存储的图像进行匹配,若截取软电话登录界面的图像包含预先存储的图像,则说明软电话登录成功,通过对登录是否成功进行判断,可以及时处理登录未成功的情况,从而可以正常执行外呼业务。

    基于因果大模型的销售话术生成的方法、装置、设备、介质及程序产品

    公开(公告)号:CN118820427A

    公开(公告)日:2024-10-22

    申请号:CN202410886496.0

    申请日:2024-07-03

    摘要: 本申请实施例提供一种基于因果大模型的销售话术生成的方法、装置、设备、介质及程序产品,该方法包括:获取当前用户输入的对话语音;将从所述对话语音中提取的用户信息输入到大模型中,识别下一对话环节所属的销售流程,并且,通过大模型确定针对于所述用户信息的解决方案,其中,所述大模型中包括因果链,所述因果链用于表征用户信息与解决方案之间的因果关系;根据所述销售流程和所述解决方案生成销售话术。通过本申请的一些实施例能够从对话语音中识别下一环节相应的销售流程,从而能够基于模型中的因果链获得准确的销售话术。

    一种大模型人机对话系统的修正方法、装置、设备及介质

    公开(公告)号:CN118819931A

    公开(公告)日:2024-10-22

    申请号:CN202410886498.X

    申请日:2024-07-03

    摘要: 本申请实施例提供一种大模型人机对话系统的修正方法、装置、设备及介质,人机对话系统包括多个代理Agent模块;每个Agent模块用于执行对应的对话任务;所述方法包括:针对多个Agent模块中的每个目标Agent模块,将目标Agent模块执行本轮目标任务后的输出结果发送至预设接口;其中,输出结果存储于预设的记忆模块;从预设接口获取输出结果的修正结果;将记忆模块中的输出结果更新为修正结果,以使人机对话系统利用修正结果执行在后任务。在人机对话系统的运行过程中即可及时发现每个Agent模块的输出错误并及时更正,无需在发现整个系统的最终输出错误后再通过重新标注来重新训练与测试,因此大大提高了人机对话系统的修正效率,优化了修正过程。

    基于大模型的产品推荐的方法、装置、电子设备及计算机程序产品

    公开(公告)号:CN118297664A

    公开(公告)日:2024-07-05

    申请号:CN202410334752.5

    申请日:2024-03-22

    摘要: 本申请提供了一种基于大模型的产品推荐的方法、装置、电子设备及计算机程序产品,该方法包括:获取用户与客服交互的对话信息对应的交互标签;基于业务应用程序获取与所述用户相关的初始产品交互信息,其中,所述初始产品交互信息包括:用户信息描述、感兴趣产品序列、不感兴趣产品序列中的至少一种;将所述交互标签和所述初始产品交互信息输入至目标推荐大语言模型,获取与所述用户匹配的目标推荐产品。本申请的一些实施例可以精准定位用户意图,为用户推荐符合其需求的产品,提升产品推荐的多样性,覆盖用户的多兴趣关注点,提升用户体验。

    一种识别语音的方法、装置、设备和可读存储介质

    公开(公告)号:CN116153316A

    公开(公告)日:2023-05-23

    申请号:CN202310180546.9

    申请日:2023-02-15

    IPC分类号: G10L15/26 G10L15/30

    摘要: 本申请提供一种识别语音的方法、装置、设备和可读存储介质,该方法包括,建立语音队列,其中,语音队列用于接收语音软件发送的语音流;获取语音队列中的语音流,并向目标语音识别服务端发送语音流,其中,语音流用于请求目标语音识别服务端对语音流进行识别;接收目标语音识别服务端发送的识别结果。通过该方法可以达到完整的得到语音流对应的识别结果的效果。

    一种多模态情感分析的方法、装置、设备及介质

    公开(公告)号:CN116127982A

    公开(公告)日:2023-05-16

    申请号:CN202211602999.8

    申请日:2022-12-13

    发明人: 陈勇 梁鹏斌 李航

    摘要: 本申请实施例提供一种多模态情感分析的方法、装置、设备及介质,该方法包括:提取待分析文本所对应的文本特征向量,其中,所述待分析文本是对待分析语音进行转换获得的;将所述文本特征向量与所述待分析语音的语音特征向量进行融合,获得融合向量;将所述融合向量输入到多模态情感分析模型中,通过所述多模态情感分析模型对所述融合向量进行情感分析预测,获得所述待分析语音的至少一种情感标签相应的概率。通过本申请的一些实施例能够将文本特征向量和语音特征向量进行融合,获得准确的情感标签,从而能够对用户进行针对性的服务。

    一种外呼时间预估的方法、装置、电子设备及介质

    公开(公告)号:CN116074445A

    公开(公告)日:2023-05-05

    申请号:CN202310140916.6

    申请日:2023-02-15

    发明人: 方程 陈新月 李航

    IPC分类号: H04M3/523

    摘要: 本申请属于通信技术领域,公开了一种外呼时间预估的方法、装置、电子设备及介质,该方法包括,确定目标坐席处于会话状态时,根据目标坐席的多个历史通话时长,获得目标坐席的当前会话预估时长;获取待外呼的目标用户所属的用户集合;根据用户集合中各用户的历史会话转接时长,确定目标用户的会话转接预估时长;根据当前会话的会话起始时间、当前会话预估时长以及会话转接预估时长,预估目标用户的外呼时间。这样,在进行外呼时,解决了何时进行外呼以减少坐席等待时长的问题。

    一种坐席匹配用户的方法、装置、设备和可读存储介质

    公开(公告)号:CN116033077A

    公开(公告)日:2023-04-28

    申请号:CN202211718190.1

    申请日:2022-12-29

    IPC分类号: H04M3/51 H04M3/523

    摘要: 本申请提供一种坐席匹配用户的方法、装置、设备和可读存储介质,该方法包括,在同时向多个用户发起外呼时,确定多个用户和机器人坐席对话的多个用户意图;基于多个用户意图对多个用户进行打分,得到得分结果;将得分结果中分数大于得分阈值的分数对应的用户分配给优质的人工坐席。通过该方法可以达到合理的将用户分配给坐席的效果。

    基于人机对话的训练数据的生成方法、装置和设备

    公开(公告)号:CN114203166B

    公开(公告)日:2023-03-31

    申请号:CN202111504406.X

    申请日:2021-12-10

    摘要: 本申请提供一种基于人机对话的训练数据的生成方法、装置和设备,所述基于人机对话的训练数据的生成方法:获取错误文本、所述错误文本的标注文本和所述错误文本对应的完整语音,所述错误文本是第一语音识别模型识别出的、被判定为识别错误的语音的识别结果,所述第一语音识别模型是还未训练好的语音识别模型;使用第二语音识别模型对每个所述分段语音进行语音识别,得到每个所述分段语音的分段文本,所述第二语音识别模型是已经训练好的语音识别模型;计算所述错误文本或所述标注文本,与,每个所述分段文本之间的相似度,得到最大相似度对应的目标分段文本;将所述标注文本和所述目标分段文本对应的分段语音进行组合,得到训练数据。

    一种语音转接的方法、装置、电子设备及介质

    公开(公告)号:CN115801957A

    公开(公告)日:2023-03-14

    申请号:CN202211508995.3

    申请日:2022-11-29

    IPC分类号: H04M3/523 H04M3/58

    摘要: 本申请实施例提供一种语音转接的方法、装置、电子设备及介质,该方法包括:在对用户开始进行语音外呼时,从多个坐席端中选择至少一个候选坐席端,其中,所述至少一个候选坐席端用于接收所述外呼服务器转接的用户通话;选择与用户分类相对应的语音服务策略,其中,所述用户分类是在与所述用户进行通话的过程中,对用户的对话内容进行分析获得的;根据所述语音服务策略选择对所述用户进行坐席服务或者外呼服务器服务。通过本申请的一些实施例能够提高外呼服务的质量,提升用户体验。