-
公开(公告)号:CN119851661A
公开(公告)日:2025-04-18
申请号:CN202411896662.1
申请日:2024-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G10L15/26 , G10L15/04 , G10L15/18 , G10L15/183 , G06F16/3329 , G06F16/334 , G06F16/353 , G06N5/04
Abstract: 本公开提供了基于大模型的数据处理方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及人工智能、大数据、大模型等技术领域。具体实现方案为:对目标对话音频进行语音活动检测,得到存在语音活动的多个目标音频片段;基于所述多个目标音频片段,得到目标文本内容;利用大模型,对所述目标文本内容进行意图提取,并提取出以下至少之一:与问题相关的问题文本,与回答相关的答复文本;基于目标对话音频中的时间信息以及提取出的文本,得到与所述目标对话音频相关联的带有时间信息的目标对话文本,其中,目标对话文本包括以下至少之一:带有时间信息的问答对,带有时间信息的问题文本。