-
公开(公告)号:CN115630692A
公开(公告)日:2023-01-20
申请号:CN202211329424.3
申请日:2022-10-27
Applicant: 中国科学技术大学
Abstract: 本申请公开了一种计算精度的调整方法及装置,该方法包括:获取访存瓶颈集合包含的网络层;判断网络层是否能够进行半精度存储转换;若网络层能够进行半精度存储转换,则将网络层以半精度的计算方式进行计算,得到第一输出结果;判断第一输出结果是否小于预设的第一阈值;若第一输出结果小于第一阈值,则将网络层的计算方式调整为半精度。通过本申请公开的方法,能够在调整存在访存瓶颈的网络层时,考虑计算精度的要求,避免网络层的计算效率下降。
-
公开(公告)号:CN115018064B
公开(公告)日:2024-11-08
申请号:CN202210737352.X
申请日:2022-06-27
Applicant: 中国科学技术大学
IPC: G06N3/063 , G06N3/0464 , G06N3/082
Abstract: 本发明实施例公开了一种计算节点的空间分配方法及装置,对神经网络的各个计算节点进行分类,得到多个的计算形状节点和多个的计算张量节点;将与每个计算张量节点相关的计算形状节点融合成一个新节点;将待推理数据输入神经网络;根据计算张量节点的属性和计算特性、新节点的属性和计算特性以及待推理数据,推导得到神经网络的各个计算节点计算待推理数据时所需的存储空间;为各个计算节点分配所述存储空间。可见,本发明实施例中,在推理引擎执行之前就可以通过离线推导得到各个计算节点对应的存储空间,能够在计算开始之前就为各个计算节点分配好对应的存储空间,如此能节约在计算时开辟存储空间的时间,从而提高推理引擎整体的计算效率。
-
公开(公告)号:CN115018064A
公开(公告)日:2022-09-06
申请号:CN202210737352.X
申请日:2022-06-27
Applicant: 中国科学技术大学
Abstract: 本发明实施例公开了一种计算节点的空间分配方法及装置,对神经网络的各个计算节点进行分类,得到多个的计算形状节点和多个的计算张量节点;将与每个计算张量节点相关的计算形状节点融合成一个新节点;将待推理数据输入神经网络;根据计算张量节点的属性和计算特性、新节点的属性和计算特性以及待推理数据,推导得到神经网络的各个计算节点计算待推理数据时所需的存储空间;为各个计算节点分配所述存储空间。可见,本发明实施例中,在推理引擎执行之前就可以通过离线推导得到各个计算节点对应的存储空间,能够在计算开始之前就为各个计算节点分配好对应的存储空间,如此能节约在计算时开辟存储空间的时间,从而提高推理引擎整体的计算效率。
-
公开(公告)号:CN104618518A
公开(公告)日:2015-05-13
申请号:CN201510107486.3
申请日:2015-03-12
Applicant: 中国科学技术大学苏州研究院
Abstract: 本发明公开了一种群组应用场景下多终端协同文件传输方法,当网络中节点组建群组完成之后,群组的网关节点负责管理群组中的信息,它的数据库中存储了所管理群组的信息,包括该群组中所有终端节点的信息以及这些终端节点中存有的文件信息。根据文件传输双方终端节点处于同一群组还是不同群组采用不同的方式进行传输。提高了群组中终端传输过程的稳定性以及灾难恢复的能力,同时,使用多流并发传输技术,实现文件传输速度和网络吞吐量的提高。
-
公开(公告)号:CN115497464A
公开(公告)日:2022-12-20
申请号:CN202211137162.0
申请日:2022-09-19
Applicant: 中国科学技术大学
Abstract: 本申请公开了一种语音样本混淆方法及装置,在该方法中,获取属于多个语音数据源的多个语音样本对应的多个样本索引;按照预设块大小对多个样本索引分块得到多个块索引;混淆多个块索引得到混淆后的多个块索引,实现多个语音数据源粒度的语音样本混淆;从混淆后的多个块索引中选取预设数量的块索引作为多个待处理块索引;将多个待处理块索引包括的样本索引划分成多个批量索引;混淆多个批量索引得到混淆后的多个批量索引,实现多个批量语音样本粒度的语音样本混淆;通过混淆后的多个批量索引包括的样本索引,获取多个待处理语音样本。由此,实现对海量语音样本的充分、全局混淆,提高模型训练过程的稳定性。
-
公开(公告)号:CN114579273A
公开(公告)日:2022-06-03
申请号:CN202210202789.3
申请日:2022-03-02
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种数据处理方法及网络管理装置,可以将待输入至目标子网络进行数据处理的一路待处理数据,作为一个待处理任务保存至与目标子网络对应的队列;基于当前的第一队列、第二队列和第三队列各自保存的任务数量,从第一子网络、第二子网络和第三子网络中确定出优先级最高的子网络;在与优先级最高的子网络对应的队列中,将至少一路待处理数据输入至优先级最高的子网络中进行数据处理,并在优先级最高的子网络进行数据处理过程中,禁止其他子网络对相应队列中的待处理数据进行数据处理。本发明可以实现对多路并发的待处理数据的有效处理。
-
公开(公告)号:CN104618518B
公开(公告)日:2017-10-03
申请号:CN201510107486.3
申请日:2015-03-12
Applicant: 中国科学技术大学苏州研究院
Abstract: 本发明公开了一种群组应用场景下多终端协同文件传输方法,当网络中节点组建群组完成之后,群组的网关节点负责管理群组中的信息,它的数据库中存储了所管理群组的信息,包括该群组中所有终端节点的信息以及这些终端节点中存有的文件信息。根据文件传输双方终端节点处于同一群组还是不同群组采用不同的方式进行传输。提高了群组中终端传输过程的稳定性以及灾难恢复的能力,同时,使用多流并发传输技术,实现文件传输速度和网络吞吐量的提高。
-
公开(公告)号:CN113608852B
公开(公告)日:2024-07-16
申请号:CN202110888396.8
申请日:2021-08-03
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种任务调度方法、调度模块、推理节点和协同作业系统,其中方法应用于调度模块,该方法包括:获取各推理节点的待处理信息,各推理节点协同作业,待处理信息包括对应推理节点下的待处理任务数量和/或各待处理任务的任务类型;基于各推理节点的待处理信息,以及各推理节点在协同作业中的重要性,从各推理节点中选取目标节点,所有目标节点进行任务处理所需的计算资源总和小于等于额定计算量;向目标节点发送任务处理指令,以触发目标节点进行任务处理,满足了对整体吞吐量和任务响应时间的要求,解决了单一神经网络的调度推理方案无法对多个神经网络协同工作的任务进行调度推理的问题,实现了复杂场景下的调度推理。
-
公开(公告)号:CN114579273B
公开(公告)日:2024-04-02
申请号:CN202210202789.3
申请日:2022-03-02
Applicant: 中国科学技术大学
IPC: G06F9/48 , G06N3/10 , G06N3/0464 , G10L15/16
Abstract: 本发明公开了一种数据处理方法及网络管理装置,可以将待输入至目标子网络进行数据处理的一路待处理数据,作为一个待处理任务保存至与目标子网络对应的队列;基于当前的第一队列、第二队列和第三队列各自保存的任务数量,从第一子网络、第二子网络和第三子网络中确定出优先级最高的子网络;在与优先级最高的子网络对应的队列中,将至少一路待处理数据输入至优先级最高的子网络中进行数据处理,并在优先级最高的子网络进行数据处理过程中,禁止其他子网络对相应队列中的待处理数据进行数据处理。本发明可以实现对多路并发的待处理数据的有效处理。
-
公开(公告)号:CN116013269A
公开(公告)日:2023-04-25
申请号:CN202211674197.8
申请日:2022-12-26
Applicant: 中国科学技术大学
Abstract: 本申请实施例记载了一种语音识别模型的量化定标方法。在该方法中,获取语音识别模型的待量化层的待量化数据;根据待量化数据最大值和待量化数据平均值计算第一比值;当第一比值小于或等于预设的阈值时,则计算量化标值,量化标值为当前整型的表示范围的最大值与待量化数据最大值的比值;根据量化标值对待量化数据进行训练,得到训练完成后的语音识别模型,训练后的语音识别模型用于对待识别的语音数据进行识别。由此可见,利用本申请实施例提供的方案,通过计算量化标值,并根据该量化标值对待量化数据进行转换,可以最大限度地降低计算转换过程中网络计算精度的丢失,通过对转换后的数据进行训练能够提高语音识别的精确度。
-
-
-
-
-
-
-
-
-