-
公开(公告)号:CN104639287B
公开(公告)日:2018-06-15
申请号:CN201510023767.0
申请日:2015-01-16
Applicant: 科大讯飞股份有限公司
IPC: H04L1/00
Abstract: 本发明涉及一种超声波通讯编码方法及系统,设计编码序列串,采用所述编码序列串对待传输信息进行编码;将所述编码序列串作为多状态跳转的有限状态自动机的输入字符;将所述有限状态自动机的状态序列映射到超声波单频信号,超声波单频信号状态的跳转包含编码信息。基于有限状态自动机的超声波编码方法,有限状态自动机可以灵活设计编码方案,有效提高信息传输的比特率,可以有效推广超声波通讯在实际生活中应用。本发明在超声波通讯中引入同步信号和奇偶校验信号,提升信息传输的质量。
-
公开(公告)号:CN105244029A
公开(公告)日:2016-01-13
申请号:CN201510560841.2
申请日:2015-08-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音识别后处理方法及系统,该方法包括:预先利用语音识别容易出错的词对构建错词检测模型;在接收到待识别语音数据后,对所述语音数据进行语音识别,得到识别结果;依次将所述识别结果中的各词与通用词典中的每个词组成词对,并提取词对中所述识别结果中各词的语义特征及声学特征,以及词典词的声学特征;利用所述词对的语义特征和声学特征、以及所述错词检测模型,依次检测所述识别结果中的各词,得到修正后的识别结果。利用本发明,可以提高语音识别结果后处理的效果,准确修正识别结果中错误词。
-
公开(公告)号:CN114356278B
公开(公告)日:2025-02-25
申请号:CN202111399689.6
申请日:2021-11-19
Applicant: 科大讯飞股份有限公司
IPC: G06F7/08
Abstract: 本发明公开了一种排序电路以及芯片,排序电路包括:多条第一类型排序链,其中,第一类型排序链分别包括n个依次连接的排序单元;第二类型排序链,包括n个依次连接的排序单元;其中,在输入数据排序阶段,第一类型排序链和第二类型排序链被配置为分别接收一组待处理数据,以并行对待处理数据进行初始排序,得到初始排序结果;在数据再排序阶段,第二类型排序链进一步被配置为对第一类型排序链和第二类型排序链的初始排序结果进行再次排序,以得到最终排序结果。该排序电路适用于数据量大的数据的排序,不受数据量的限制,应用范围广泛,且效率高。
-
公开(公告)号:CN117333514B
公开(公告)日:2024-04-16
申请号:CN202311636539.1
申请日:2023-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06T7/246 , G06T7/223 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种单目标视频跟踪方法、装置、存储介质及设备,该方法包括:首先在获取到包含待跟踪的单目标对象的目标视频后,从目标视频中确定出包含第一帧图像对应的图像跟踪模板的M张图像跟踪模板,然后提取M张图像跟踪模板的模板图像特征,以及提取目标视频中每一帧搜索图像的搜索图像特征,并将模板图像特征和搜索图像特征输入预先构建的编码器网络进行编码,得到编码特征;接着将编码特征和开始标志位向量输入预先构建的解码器网络进行解码,预测出编码特征对应的搜索图像中单目标对象的位置和尺寸,从而能够提高目标视频中每一帧搜索图像中对于单目标视频跟踪结果的准确性。
-
公开(公告)号:CN117351944B
公开(公告)日:2024-04-12
申请号:CN202311664523.1
申请日:2023-12-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法、装置、设备及可读存储介质。在获取待识别语音数据、确定待识别语音数据的声学特征序列之后,基于声学特征序列进行解码处理,其中,在每个解码时刻,只对该解码时刻的候选解码路径中最后一个词被判定为实体词的候选解码路径进行激励,确定所述解码时刻的各候选解码路径的最终解码得分,最后一个解码时刻解码完毕后,基于最后一个解码时刻的各候选解码路径的最终解码得分,确定语音数据的识别结果。本方案中,在解码过程中,只对可能包含实体词的候选解码路径进行激励,这样可以提升实体词的识别效果,且不影响通用词的识别效果。
-
公开(公告)号:CN117316158B
公开(公告)日:2024-04-12
申请号:CN202311599003.7
申请日:2023-11-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种交互方法、装置、控制设备及存储介质,交互方法包括:获取目标用户的手部图像序列和语音序列;识别语音序列中的指令词,并获取指令词对应的时间;根据手部图像序列以及指令词对应的时间,确定目标用户发出指令词时的手部指向区域;根据目标用户发出指令词时的手部指向区域,确定交互设备;控制交互设备执行指令词对应的操作。本发明提供的交互方法为结合语音的指向交互方法,该交互方法有效利用了不同模态信息的互补性,其不但能够实现丰富的交互功能,而且具有较好的交互稳定性,用户体验较好。
-
公开(公告)号:CN116644212B
公开(公告)日:2023-12-01
申请号:CN202310908926.X
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V20/62
Abstract: 本申请公开了一种视频检测方法、装置、设备及可读存储介质。在确定待检测视频以及待对比视频之后;先确定待检测视频的文本片段信息;待检测视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;然后,获取待对比视频的文本片段信息;待对比视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;最后,比较待检测视频的文本片段信息以及待对比视频的文本片段信息,确定待检测视频与待对比视频是否重复。基于该方案,由于视频的文本片段,相对于视频的图像帧来说,数量要少很多,而且,文本片段信息仅仅包含文本信息和其时间戳,比对文本片段信息相对于比对图像帧要更为简单,因此,采用本方案能够提升视频检测的效率。
-
公开(公告)号:CN116628509A
公开(公告)日:2023-08-22
申请号:CN202310900540.4
申请日:2023-07-21
Applicant: 科大讯飞股份有限公司
IPC: G06F18/214
Abstract: 本申请公开了一种模型训练方法、装置、设备及存储介质,方法包括:当确定需要添加新增训练数据时,基于预先构建的batch列表,过滤掉已经训练使用过的batch,得到剩余各batch,避免重复读取已使用的batch迭代训练模型,其中batch列表中按照训练时的读取顺序记录各batch的标识。对于新增训练数据构建成若干batch,将对新增训练数据所构建的各batch与剩余各batch进行随机顺序打乱,并将打乱后的各batch的标识顺序的记录在batch列表中,以便后续按照batch列表顺序读取各标识对应的batch数据,进行在线模型训练,可以最大程度地保持训练数据的分布一致性,提升模型的泛化能力。
-
公开(公告)号:CN114305485A
公开(公告)日:2022-04-12
申请号:CN202111671822.9
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: A61B7/04
Abstract: 本发明提供一种心跳监测装置以及心跳监测方法、计算机可读存储介质,心跳监测装置包括:麦克风阵列,包括多个麦克风单元,所述多个麦克风单元阵列排布;所述多个麦克风单元用于采集待测目标的心音数据,得到多个原始心音数据;处理单元,连接所述麦克风单元用于基于所述原始心音数据确定所述待测目标的心音图。其能够以非接触的方式获取待测目标的心音图,满足用户隐私和卫生方面的需求,并且能够用于医学诊断。
-
公开(公告)号:CN108647045B
公开(公告)日:2021-10-01
申请号:CN201810229334.4
申请日:2018-03-20
Applicant: 科大讯飞股份有限公司
Abstract: 本公开提供一种激活函数的实现方法及装置、存储介质、电子设备。该方法包括:基于采样点的预设位宽,将激活函数的定义域划分为N个子区间,并确定出每个子区间对应的采样点数目;获得每个采样点对应的采样值,生成所述激活函数的查找表;将所述激活函数所有的采样值进行分组处理,得到M个采样组,确定出每个采样组的基准采样值、以及该采样组内的剩余采样值与所述基准采样值之间的差值,所述差值消耗的存储位宽小于该差值对应的剩余采样值消耗的存储位宽;依据所述查找表的预设存储精度,对各采样组的基准采样值和差值进行压缩存储,用以节省所述查找表占用的存储空间。如此方案,可以在确保输出精度的同时,降低资源消耗,节省硅片面积。
-
-
-
-
-
-
-
-
-