-
公开(公告)号:CN118484525A
公开(公告)日:2024-08-13
申请号:CN202410947840.2
申请日:2024-07-16
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F9/50
Abstract: 本申请公开了一种问答交互方法及相关装置、电子设备和存储介质,其中,问答交互方法包括:获取用户在当前轮次输入的第一语句;调用GPU计算资源处理第一语句,得到当前轮次中当前注意力特征,将外部存储空间中历史轮次的历史注意力特征,调取至GPU显存空间;调用GPU计算资源处理当前注意力特征和历史注意力特征,得到第二语句;按照生成时间由新到旧的顺序调取GPU显存空间中键特征和值特征,并写回至外部存储空间,以用于当前轮次的下一轮次。上述方案,能够提升计算资源的利用率和吐字效率,并尽可能地降低首响延迟。此外,通过异构缓存,能够大大缓解保存历史注意力特征对于GPU显存空间的需求压力,特别是在长文本的交互场景下。
-
公开(公告)号:CN118467207A
公开(公告)日:2024-08-09
申请号:CN202410837624.2
申请日:2024-06-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种大模型解码系统、方法、相关设备及计算机程序产品,系统包括终端设备和云端服务器,在终端设备布置小规模的近似模型进行解码,然后在云端服务器采用规模更大的目标模型,对近似模型的当前解码结果进行确认或纠正,在终端硬件资源受限的情况下,能够提升终端设备本地模型的推理效果。同时,无需云端服务器逐个token进行解码,能够降低云端服务器的服务负载。
-
公开(公告)号:CN111581595B
公开(公告)日:2024-02-13
申请号:CN202010334174.7
申请日:2020-04-24
Applicant: 科大讯飞股份有限公司
IPC: G06F17/16
Abstract: 本发明公开了一种矩阵乘法计算方法及计算电路,其中,计算方法包括:存储第一阵列数据,其中,所述第一阵列数据被限定为多个Nα×β的第一子数据矩阵;存储第二阵列数据,其中,所述第二阵列数据被限定为多个β×γ的第二子数据矩阵;从第一子数据矩阵中同步获取N个同列第一数据,从第二子数据矩阵中获取第二数据,并在N个时钟周期依次分别将所述N个同列第一数据与所述第二数据进行矩阵乘法运算。通过此方法能够提高计算效率。
-
公开(公告)号:CN117234161A
公开(公告)日:2023-12-15
申请号:CN202311281708.4
申请日:2023-09-28
Applicant: 科大讯飞股份有限公司
IPC: G05B19/418
Abstract: 本申请提供一种生产调度规划方法、车间调度系统及存储介质,生产调度规划方法包括:根据生产订单数据和生产车间数据,构建用于目标生产车间生产目标产品的预设规划模型,其中,预设规划模型定义目标生产车间生产目标产品所达到的目标函数组,目标函数组包括按照优先级排列的多个目标函数;按照多个目标函数的优先级,对多个目标函数依次进行求解,得到目标求解结果;获取目标求解结果对应的生产调度信息,以规划生产调度。本申请中的方案,通过构建用于目标生产车间生产目标产品的预设规划模型,预设规划模型定义目标生产车间生产目标产品的目标函数组,通过求解目标函数组以得到最优结果,能够适应复杂的场景,规划车间的生产调度。
-
公开(公告)号:CN116644212A
公开(公告)日:2023-08-25
申请号:CN202310908926.X
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V20/62
Abstract: 本申请公开了一种视频检测方法、装置、设备及可读存储介质。在确定待检测视频以及待对比视频之后;先确定待检测视频的文本片段信息;待检测视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;然后,获取待对比视频的文本片段信息;待对比视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;最后,比较待检测视频的文本片段信息以及待对比视频的文本片段信息,确定待检测视频与待对比视频是否重复。基于该方案,由于视频的文本片段,相对于视频的图像帧来说,数量要少很多,而且,文本片段信息仅仅包含文本信息和其时间戳,比对文本片段信息相对于比对图像帧要更为简单,因此,采用本方案能够提升视频检测的效率。
-
公开(公告)号:CN111580784A
公开(公告)日:2020-08-25
申请号:CN202010281365.1
申请日:2020-04-10
Applicant: 科大讯飞股份有限公司
IPC: G06F7/552
Abstract: 本发明公开了一种幂函数计算装置及幂函数计算方法,其中,装置包括:输入电路,用于接收第一输入信息;存储电路,用于存储指定幂函数查找表;第一判断电路,连接输入电路,用于判断第一输入信息是否处于预设区间内;移位电路,连接第一判断电路,用于在第一输入信息未处于预设区间内时,利用第一移位值对第一输入信息进行移位得到第二信息,第二信息在预设区间内;运算电路,连接移位电路及存储电路,用于使用处于预设区间内的第一输入信息或第二信息在指定幂函数查找表中进行查找得到查表结果,并利用查表结果及幂函数的指数进行第一计算获取第一输入信息的幂函数值。用以在数字电路中实现特殊幂函数的计算,并且输出结果精度高。
-
公开(公告)号:CN104916281B
公开(公告)日:2018-09-21
申请号:CN201510326068.3
申请日:2015-06-12
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种大语料音库裁剪方法及系统,该方法包括:采集包含多领域的文本数据作为辅助裁剪文本;利用所述辅助裁剪文本基于决策树模型对大语料音库中的语音单元进行预选,得到预选音库;根据所述预选音库对应的决策树模型叶子节点包含的语音单元之间的相似度计算所述语音单元的裁剪得分;根据所述语音单元的裁剪得分对预选音库中的语音单元进行裁剪,得到裁剪后的大语料音库。本发明可在降低音库占用空间的同时,保证音库语音单元的覆盖度。
-
公开(公告)号:CN104991955A
公开(公告)日:2015-10-21
申请号:CN201510427822.2
申请日:2015-07-17
Applicant: 科大讯飞股份有限公司
CPC classification number: G06F17/30654 , G06F17/2785 , G06K9/6218
Abstract: 本发明公开了一种自动构建模板库的方法及系统,包括:获取大量请求语料;提取所述请求语料的语义信息;根据所述语义信息对所述请求语料进行抽象,得到对应所述请求语料的初级模板,并归入初级模板库;根据所述初级模板库中模板的语义信息,对所述初级模板库中的初级模板进行聚类,根据聚类结果生成高级模板库。由于根据语义信息对请求语料进行抽象得到初级模板库,并对初级模板库进行聚类得到高级模板库,使得模板构建的过程可以以统一的判断标准自动构建模板库,能有效减少冗余模板,进而提高模板库的查找效率。
-
公开(公告)号:CN212112470U
公开(公告)日:2020-12-08
申请号:CN202020657493.7
申请日:2020-04-24
Applicant: 科大讯飞股份有限公司
IPC: G06F17/16
Abstract: 本实用新型公开了一种矩阵乘法计算电路,包括:第一存储器,用于存储第一阵列数据,第一阵列数据被限定为多个Nα×β的第一子数据矩阵;第二存储器,用于存储第二阵列数据,第二阵列数据被限定为多个β×γ的第二子数据矩阵;乘加器阵列,包括多个乘加计算单元,其排列成α×β的矩阵,每个乘加计算单元的第一输入端通过一个对应的随机存储器而连接至第一存储器,以从第一子数据矩阵中同步读取并存储N个同列第一数据,并在N个时钟周期依次分别将N个同列第一数据输入至对应的乘加计算单元,且每个乘加计算单元的第二输入端连接至第二存储器以在N个时钟周期内从第二子数据阵列中读取第二数据,从而对第一数据和第二数据进行矩阵乘法计算,进而提高计算效率。
-
-
-
-
-
-
-
-