-
公开(公告)号:CN117935294A
公开(公告)日:2024-04-26
申请号:CN202311870890.7
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06V30/41 , G06V30/413 , G06F40/58
Abstract: 本申请公开了一种文档识别方法、文档翻译方法及相关设备。该方法包括:获取原始文档中可识别区域的第一识别文本,以及获取原始文档中未识别区域的文本参考信息,其中,第一识别文本是对可识别区域进行文本识别得到的;获取用户基于文本参考信息输入的未识别区域的编辑文本;综合编辑文本和第一识别文本,得到最终识别文档。上述方案,能够提高文档识别的准确度,从而,可以提高对识别文档翻译的准确度。
-
公开(公告)号:CN115985324A
公开(公告)日:2023-04-18
申请号:CN202211654390.5
申请日:2022-12-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种角色区分方法、装置、设备及可读存储介质。该方案中,在获取待进行角色区分处理的视频数据,以及,与视频数据对应的音频数据之后;先从视频数据中提取各个参会人的唇形图片数据;再将音频数据与各个参会人的唇形图片数据进行匹配,得到匹配结果;当匹配结果指示存在与音频数据匹配的唇形图片数据时,将与音频数据匹配的唇形图片数据对应的参会人确定为音频数据的说话人。该方案同时利用视频数据和音频数据,在有多人干扰或者环境复杂的室内场景中,如果有多人交谈,能够对交谈的多人进行准确的角色区分。
-
公开(公告)号:CN112687273A
公开(公告)日:2021-04-20
申请号:CN202011569238.8
申请日:2020-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26
Abstract: 本申请公开了一种语音转写方法及装置,该方法包括:在获取到第一声音采集设备在当前时刻下采集的第一当前声音信号之后,先根据该第一当前声音信号,确定该第一当前声音信号的声音能量;再判断该第一当前声音信号的声音能量是否高于该第一当前声音信号对应的转写阈值,以便在确定该第一当前声音信号的声音能量高于该第一当前声音信号对应的转写阈值时,对第一当前声音信号进行语音转写。其中,第一当前声音信号对应的转写阈值是根据第一历史声音信号的声音能量确定的,且该第一历史声音信号是由该第一声音采集设备在第一历史时间段内采集的。如此能够在出现快速对话、抢话、插话等多人同时说话的现象时准确地获取到各个发言者的发言信息。
-
公开(公告)号:CN120067265A
公开(公告)日:2025-05-30
申请号:CN202510178048.X
申请日:2025-02-18
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F16/35 , G06F16/334 , G06F18/22 , G06N5/022 , G06N5/04 , G06Q50/18
Abstract: 本申请提供了一种法律咨询回复方法和相关装置,涉及计算机技术领域,方法包括:通过预配置的大模型确定与待咨询信息的意图分类结果对应的目标回复路径,确定目标回复路径中的第一路径节点对应的知识插件,调用知识插件得到与待咨询信息相关的知识检索结果,通过大模型根据知识检索结果、待咨询信息和意图分类结果,生成目标回复路径中的各路径节点分别对应的回复内容。本申请通过对待咨询信息进行意图识别和对咨询回复进行路径规划,提高了咨询回复的逻辑性、专业性和规范性,结合知识插件和检索增强生成方法进行法律咨询回复,提高了咨询回复的丰富性和正确性。
-
公开(公告)号:CN112687273B
公开(公告)日:2024-04-16
申请号:CN202011569238.8
申请日:2020-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26
Abstract: 本申请公开了一种语音转写方法及装置,该方法包括:在获取到第一声音采集设备在当前时刻下采集的第一当前声音信号之后,先根据该第一当前声音信号,确定该第一当前声音信号的声音能量;再判断该第一当前声音信号的声音能量是否高于该第一当前声音信号对应的转写阈值,以便在确定该第一当前声音信号的声音能量高于该第一当前声音信号对应的转写阈值时,对第一当前声音信号进行语音转写。其中,第一当前声音信号对应的转写阈值是根据第一历史声音信号的声音能量确定的,且该第一历史声音信号是由该第一声音采集设备在第一历史时间段内采集的。如此能够在出现快速对话、抢话、插话等多人同时说话的现象时准确地获取到各个发言者的发言信息。
-
-
-
-