-
公开(公告)号:CN119783639A
公开(公告)日:2025-04-08
申请号:CN202411728220.6
申请日:2024-11-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/166 , G06F16/35 , G06F40/35
Abstract: 本申请公开了一种问答对生成方法、装置、存储介质及设备,该方法包括:首先根据文本语料数据生成预设格式的第一目标问题文本和第一目标答案文本;然后利用第一目标问题文本构建第一prompt,输入至预设的大语言模型,对第一目标问题文本进行改写,得到模型输出的第二目标问题文本和第二目标答案文本;并利用文本语料数据构建第二prompt,输入至大语言模型,得到模型输出的第三目标问题文本和第三目标答案文本,接着对文本语料数据进行切分处理,并利用切分结果构建第三prompt,输入至大语言模型,得到模型输出的第四目标问题文本和第四目标答案文本;进而利用这些目标问题文本和目标答案文本生成问答对。从而能够提升问答对的生成效率、多样性、专业性等。
-
公开(公告)号:CN119066184B
公开(公告)日:2025-02-28
申请号:CN202411570789.4
申请日:2024-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/335 , G06F16/35 , G06F40/289
Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。
-
公开(公告)号:CN118093856A
公开(公告)日:2024-05-28
申请号:CN202410512153.8
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/338
Abstract: 本申请提供了数据处理方法、装置、设备、存储介质及程序产品,该方法包括:基于新闻文本确定对应的新闻摘要;基于新闻摘要在增长数据库中确定对应的新闻簇,将新闻摘要添加至新闻簇并对新闻簇进行更新,得到第一新闻簇;增长数据库用于存储在预设时间段内发生更新的新闻簇;在新闻簇不属于任何事件且新闻簇是在增长数据库中确定出唯一的新闻簇的情况下,根据第一新闻簇在封闭数据库中确定与第一新闻簇相关的第二新闻簇;其中,封闭数据库用于存储在预设时间段内未发生更新的新闻簇;基于第一新闻簇和第二新闻簇构建事件脉络。根据本申请的技术方案,能够提升事件脉络的更新速度和灵活性,保证了事件脉络的完整性。
-
公开(公告)号:CN116028667A
公开(公告)日:2023-04-28
申请号:CN202211714970.9
申请日:2022-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及标签分析技术领域,提供一种影视标签权重确定方法、装置、电子设备及存储介质,该方法结合影视资源库的关系网络,并借助于演职人员的受欢迎程度以及辅助标签权重,可以为每个影视资源的各个标签的权重进行调整,使不同影视资源的相同标签赋予不同的权重,同一影视资源的不同标签的权重也会存在差异,如此可以形成一套能够更好的描述影视资源风格特点的标签体系,为后续用户画像构建提供更准确的偏好打分,提高用户画像的准确性,进一步提升用户的个性化影视推荐效果,提升用户体验。
-
公开(公告)号:CN115662443A
公开(公告)日:2023-01-31
申请号:CN202211183402.0
申请日:2022-09-27
Applicant: 科大讯飞股份有限公司
IPC: G10L17/06
Abstract: 本申请提出一种语音用户识别方法、装置、电子设备及存储介质,方法包括:通过提取用户语音的声纹特征确定与用户语音对应的第一声纹标识;将第一声纹标识与预先设置的声纹标识对照表中的声纹标识进行对比,确定与第一声纹标识对应的第一主声纹标识;声纹标识对照表中包含各个用户的主声纹标识和副声纹标识。采用本申请的技术方案,利用声纹标识对照表可以将同一用户的所有副声纹标识与主声纹标识对应关联,当用户语音对应的声纹发生偏移时,可以通过声纹偏移后的副声纹标识,从声纹标识对照表准确查询到该用户的主声纹标识,提高了用户信息确定的准确度。
-
公开(公告)号:CN119990112A
公开(公告)日:2025-05-13
申请号:CN202510454667.7
申请日:2025-04-11
Applicant: 科大讯飞股份有限公司
IPC: G06F40/258 , G06F40/151 , G06F40/205 , G06F40/30
Abstract: 本申请公开了一种文档识别方法及智能交互方法和相关装置、设备、介质,其中,文档识别方法包括:基于待识别文档进行识别,得到待识别文档中版面元素和版面元素的识别结果;基于标题的识别结果进行分析,得到第一标题序列;修正第一标题序列的标题层级,得到第二标题序列;基于第二标题序列进行验证,得到验证结果;其中,验证结果表征第二标题序列是否无误;响应于验证结果表征第二标题序列有误,选择第二标题序列,作为新的第一标题序列,并返回修正第一标题序列的标题层级,得到第二标题序列的步骤进行迭代,直至满足结束条件为止。上述方案,能够提升文档识别时标题建模的连贯性,以区分文档内各个标题的层级关系,特别是在跨页场景下。
-
公开(公告)号:CN119513624A
公开(公告)日:2025-02-25
申请号:CN202411395440.1
申请日:2024-10-08
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种用户画像构建方法及相关装置、设备和存储介质,其中,用户画像构建方法包括:获取目标用户与目标交互系统进行交互的若干历史交互数据簇,并基于目标用户当前与目标交互系统进行交互时采集的交互操作数据,提取当前交互数据簇;其中,任一交互数据簇中包括交互操作的属性数据,交互操作的属性数据包括交互操作在目标交互系统中交互对象的对象名称、对象类别中至少一种属性类型的属性值;基于当前交互数据簇中与各个历史交互数据簇关于属性数据的相似度,选择历史交互数据簇作为目标交互数据簇;基于当前交互数据簇和目标交互数据簇,构建目标用户的用户画像。上述方案,能够提升用户画像构建的准确性。
-
公开(公告)号:CN118093856B
公开(公告)日:2024-09-06
申请号:CN202410512153.8
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/338
Abstract: 本申请提供了数据处理方法、装置、设备、存储介质及程序产品,该方法包括:基于新闻文本确定对应的新闻摘要;基于新闻摘要在增长数据库中确定对应的新闻簇,将新闻摘要添加至新闻簇并对新闻簇进行更新,得到第一新闻簇;增长数据库用于存储在预设时间段内发生更新的新闻簇;在新闻簇不属于任何事件且新闻簇是在增长数据库中确定出唯一的新闻簇的情况下,根据第一新闻簇在封闭数据库中确定与第一新闻簇相关的第二新闻簇;其中,封闭数据库用于存储在预设时间段内未发生更新的新闻簇;基于第一新闻簇和第二新闻簇构建事件脉络。根据本申请的技术方案,能够提升事件脉络的更新速度和灵活性,保证了事件脉络的完整性。
-
公开(公告)号:CN119066184A
公开(公告)日:2024-12-03
申请号:CN202411570789.4
申请日:2024-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/289
Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。
-
公开(公告)号:CN114330362A
公开(公告)日:2022-04-12
申请号:CN202111529842.2
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/194
Abstract: 本申请公开了一种语义纠错方法及装置、电子设备和存储介质,其中,语义纠错方法包括:基于人机交互过程中未响应的待纠错文本,获取用户的交互序列;其中,交互序列包括已响应的若干交互文本;再基于待纠错文本分别与若干交互文本之间的拼音相似度,选择交互文本作为纠正待纠错文本语义错误的纠错文本。上述方案,能够提高语义纠错的效率。
-
-
-
-
-
-
-
-
-