-
公开(公告)号:CN118095429A
公开(公告)日:2024-05-28
申请号:CN202311870850.2
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06N5/04 , G06F16/332
Abstract: 本申请公开了一种回复生成方法、装置、电子设备和存储介质,该方法包括:获取用户输入内容;利用大语言模型基于用户输入内容进行意图识别,得到至少一个交互意图;利用目标模型分别基于各交互意图,生成各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。通过上述方式,本申请能够提高生成回复的准确性和效率,且生成的回复更加流畅、贴近人类自然交流方式。
-
公开(公告)号:CN114330362B
公开(公告)日:2024-12-03
申请号:CN202111529842.2
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/194
Abstract: 本申请公开了一种语义纠错方法及装置、电子设备和存储介质,其中,语义纠错方法包括:基于人机交互过程中未响应的待纠错文本,获取用户的交互序列;其中,交互序列包括已响应的若干交互文本;再基于待纠错文本分别与若干交互文本之间的拼音相似度,选择交互文本作为纠正待纠错文本语义错误的纠错文本。上述方案,能够提高语义纠错的效率。
-
公开(公告)号:CN118133814A
公开(公告)日:2024-06-04
申请号:CN202311870885.6
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06F40/247 , G06F40/289 , G06F16/35 , G06F18/213 , G06F18/214 , G06N3/084 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种改写方法及改写装置、电子设备和存储介质,其中,该改写方法包括:获取用户输入的第一引导文本;识别第一引导文本是否为风险文本,以及当第一引导文本为风险文本时,识别第一引导文本对应的风险标签;以及响应于第一引导文本为风险文本,利用改写器,基于第一引导文本和对应的风险标签,输出改写后的第二引导文本。风险文本包括第一引导文本本身包括不当信息的文本,和/或第一引导文本具有引导大语言模型输出不当信息的风险的文本。上述方案,能够从大语言模型的输入端着手防止风险文本的输出,减轻了后续审核的负担,增强了用户所接收的输出的连贯性。
-
公开(公告)号:CN115757973A
公开(公告)日:2023-03-07
申请号:CN202211549152.8
申请日:2022-12-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/9535 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F18/24 , G06F18/23
Abstract: 本申请公开了一种推荐系统的排序方法、装置、设备及可读存储介质。该方案中,先确定用户的特征数据,以及与用户对应的多个待推荐对象的特征数据;再构建特征数据对,每个特征数据对中包括用户的特征数据和一个待推荐对象的特征数据;然后,针对每个特征数据对,对特征数据对进行多尺度局部邻域非线性聚合得到聚合后的特征数据,并对聚合后的特征数据进行处理得到特征数据对的置信度得分;最后,基于各特征数据对的置信度得分对多个待推荐对象进行排序。该方案中,针对每个特征数据对,对特征数据对进行多尺度局部邻域非线性聚合的方式,没有较强的归纳偏置,因此,可以避免出现由于较强的归纳偏置导致排序结果不满足用户需求的情况。
-
公开(公告)号:CN119066184A
公开(公告)日:2024-12-03
申请号:CN202411570789.4
申请日:2024-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/289
Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。
-
公开(公告)号:CN115826744A
公开(公告)日:2023-03-21
申请号:CN202211436816.X
申请日:2022-11-16
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种人机交互方法、装置、电子设备及存储介质,其中方法包括:获取指代场景下的用户图像和用户语音;对所述用户图像进行指代动作识别,得到所述用户图像中的指代方向信息;基于所述指代方向信息,从所述指代场景中确定出候选物品;基于所述用户语音的语义信息,从所述候选物品中确定出指代物品;基于所述指代物品,进行人机交互。本发明提供的方法、装置、电子设备及存储介质,图像与语音的结合保证了指代物品确定的可靠性和准确性,且方法执行无需用户提前熟悉操作指令,也不要求指代场景下的物品携带设备标识符,极大降低了基于指代消解的人机交互的执行门槛,有助于扩宽人机交互的应用范围。
-
公开(公告)号:CN114330362A
公开(公告)日:2022-04-12
申请号:CN202111529842.2
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/194
Abstract: 本申请公开了一种语义纠错方法及装置、电子设备和存储介质,其中,语义纠错方法包括:基于人机交互过程中未响应的待纠错文本,获取用户的交互序列;其中,交互序列包括已响应的若干交互文本;再基于待纠错文本分别与若干交互文本之间的拼音相似度,选择交互文本作为纠正待纠错文本语义错误的纠错文本。上述方案,能够提高语义纠错的效率。
-
公开(公告)号:CN119990112A
公开(公告)日:2025-05-13
申请号:CN202510454667.7
申请日:2025-04-11
Applicant: 科大讯飞股份有限公司
IPC: G06F40/258 , G06F40/151 , G06F40/205 , G06F40/30
Abstract: 本申请公开了一种文档识别方法及智能交互方法和相关装置、设备、介质,其中,文档识别方法包括:基于待识别文档进行识别,得到待识别文档中版面元素和版面元素的识别结果;基于标题的识别结果进行分析,得到第一标题序列;修正第一标题序列的标题层级,得到第二标题序列;基于第二标题序列进行验证,得到验证结果;其中,验证结果表征第二标题序列是否无误;响应于验证结果表征第二标题序列有误,选择第二标题序列,作为新的第一标题序列,并返回修正第一标题序列的标题层级,得到第二标题序列的步骤进行迭代,直至满足结束条件为止。上述方案,能够提升文档识别时标题建模的连贯性,以区分文档内各个标题的层级关系,特别是在跨页场景下。
-
公开(公告)号:CN119513624A
公开(公告)日:2025-02-25
申请号:CN202411395440.1
申请日:2024-10-08
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种用户画像构建方法及相关装置、设备和存储介质,其中,用户画像构建方法包括:获取目标用户与目标交互系统进行交互的若干历史交互数据簇,并基于目标用户当前与目标交互系统进行交互时采集的交互操作数据,提取当前交互数据簇;其中,任一交互数据簇中包括交互操作的属性数据,交互操作的属性数据包括交互操作在目标交互系统中交互对象的对象名称、对象类别中至少一种属性类型的属性值;基于当前交互数据簇中与各个历史交互数据簇关于属性数据的相似度,选择历史交互数据簇作为目标交互数据簇;基于当前交互数据簇和目标交互数据簇,构建目标用户的用户画像。上述方案,能够提升用户画像构建的准确性。
-
公开(公告)号:CN118093856B
公开(公告)日:2024-09-06
申请号:CN202410512153.8
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/338
Abstract: 本申请提供了数据处理方法、装置、设备、存储介质及程序产品,该方法包括:基于新闻文本确定对应的新闻摘要;基于新闻摘要在增长数据库中确定对应的新闻簇,将新闻摘要添加至新闻簇并对新闻簇进行更新,得到第一新闻簇;增长数据库用于存储在预设时间段内发生更新的新闻簇;在新闻簇不属于任何事件且新闻簇是在增长数据库中确定出唯一的新闻簇的情况下,根据第一新闻簇在封闭数据库中确定与第一新闻簇相关的第二新闻簇;其中,封闭数据库用于存储在预设时间段内未发生更新的新闻簇;基于第一新闻簇和第二新闻簇构建事件脉络。根据本申请的技术方案,能够提升事件脉络的更新速度和灵活性,保证了事件脉络的完整性。
-
-
-
-
-
-
-
-
-