-
公开(公告)号:CN111667061A
公开(公告)日:2020-09-15
申请号:CN202010305857.X
申请日:2020-04-17
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明涉及一种基于目标众核的深度学习框架移植与优化方法及系统,包括:移植过程为:将深度学习框架的源码移植到目标众核机器上,依据目标众核机器的编译指令,对该框架进行修改与编译,使其满足目标众核机器的运行条件;加速优化过程为:使用该框架在国产众核上分别运行基于深度学习的功能模型,并使用目标众核性能分析工具对代码进行分析,实现对热点函数的确认与提取;对热点函数的特征以及函数参数进行分析与测试,使用并行加速库对热点函数进行加速,确定优化策略,最终在确保框架正确性的前提下提高该框架的加速比,并根据当前的主从核并行代码对所述深度学习框架的编译文件进行修改与测试,以实现当前的主从核并行代码的混合编译与运行。
-
公开(公告)号:CN111666071A
公开(公告)日:2020-09-15
申请号:CN202010306980.3
申请日:2020-04-17
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种基于目标众核的对抗网络移植与优化的方法,方法包括:编写对抗网络代码并移植到目标众核;编写基于目标众核的对抗网络编译文件;通过目标众核主核串运行对抗网络的功能模型,对功能模型进行分析,对功能模型的热点函数进行定位,获取热点函数的统计结果;根据热点函数的统计结果,对热点函数的特征和参数进行分析,编写热点函数的主核加速代码和热点函数的从核加速代码;通过加速库对热点函数的主核加速代码和热点函数的从核加速代码的加速可行性进行测试;当热点函数的主核加速代码和热点函数的从核加速代码的加速可行性通过测试时,通过加速库生成功能模型的优化策略。
-
公开(公告)号:CN115268994B
公开(公告)日:2023-06-09
申请号:CN202210881060.3
申请日:2022-07-26
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/75 , G06F16/901 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明提供了一种基于TBCNN和多头自注意力机制的代码特征提取方法,包括:对程序代码进行解析处理,获得抽象语法树;按照预设的功能节点对抽象语法树进行分割处理,获得若干个小型抽象语法树;将小型抽象语法树输入基于树的卷积神经网络,获得程序代码结构信息的向量序列;利用多头自注意力机制和残差网络对向量序列进行处理,获得程序代码特征;利用全连接网络对程序代码特征进行融合,获得程序代码的特征向量。本发明可以实现CNN网络和RNN网络的功能,不仅可以解决CNN感受野限制和计算复杂度大的问题,而且还可以解决因无法学习长距离依赖导致的梯度消失和梯度爆炸的问题。
-
公开(公告)号:CN111667061B
公开(公告)日:2023-04-18
申请号:CN202010305857.X
申请日:2020-04-17
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明涉及一种基于目标众核的深度学习框架移植与优化方法及系统,包括:移植过程为:将深度学习框架的源码移植到目标众核机器上,依据目标众核机器的编译指令,对该框架进行修改与编译,使其满足目标众核机器的运行条件;加速优化过程为:使用该框架在国产众核上分别运行基于深度学习的功能模型,并使用目标众核性能分析工具对代码进行分析,实现对热点函数的确认与提取;对热点函数的特征以及函数参数进行分析与测试,使用并行加速库对热点函数进行加速,确定优化策略,最终在确保框架正确性的前提下提高该框架的加速比,并根据当前的主从核并行代码对所述深度学习框架的编译文件进行修改与测试,以实现当前的主从核并行代码的混合编译与运行。
-
公开(公告)号:CN115271056A
公开(公告)日:2022-11-01
申请号:CN202210881196.4
申请日:2022-07-26
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种基于层次聚类的SOM算法改进方法,包括:基于层次聚类法,确定SOM算法的初始权重值;基于初始权重值将SOM算法神经元数据进行初始化;基于初始化后的SOM算法神经元数据,通过SOM算法获取对应的聚类方案。加快SOM收敛速度,能够降低数据量较大时的算法时间复杂度,同时,还可以应对数据集不平衡等问题。
-
公开(公告)号:CN112306678B
公开(公告)日:2022-10-04
申请号:CN202011139857.3
申请日:2020-10-22
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F9/50 , G06F15/173
Abstract: 本发明涉及一种基于异构众核处理器的算法并行处理方法及系统,以串行程序中运行耗时大的代码段作为并行计算的对象,根据其特点进行任务的划分,确定主核与从核阵列的任务分工,将耗时的计算交给从核阵列执行;每个从核主动从主存中获取任务和计算所用到的数据,并返回计算结果给主核,主核采用异步串行方式对主存数据进行更新,以避免数据依赖引起数据读写错误;同时,针对主从核通信的时间消耗问题,通过将单数据项封装在结构体中实现数据打包,并设置主核的数据主存地址256B对界,实现单次数据拷贝粒度不小于256B,以最大化地利用单核组的带宽,优化数据传输性能,在从核执行计算过程中,使用双缓冲机制实现通信时间的消耗隐藏,提高并行效率。
-
公开(公告)号:CN111666071B
公开(公告)日:2021-12-17
申请号:CN202010306980.3
申请日:2020-04-17
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种基于目标众核的对抗网络移植与优化的方法,方法包括:编写对抗网络代码并移植到目标众核;编写基于目标众核的对抗网络编译文件;通过目标众核主核串运行对抗网络的功能模型,对功能模型进行分析,对功能模型的热点函数进行定位,获取热点函数的统计结果;根据热点函数的统计结果,对热点函数的特征和参数进行分析,编写热点函数的主核加速代码和热点函数的从核加速代码;通过加速库对热点函数的主核加速代码和热点函数的从核加速代码的加速可行性进行测试;当热点函数的主核加速代码和热点函数的从核加速代码的加速可行性通过测试时,通过加速库生成功能模型的优化策略。
-
公开(公告)号:CN110851679A
公开(公告)日:2020-02-28
申请号:CN201910947241.X
申请日:2019-09-30
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F16/951 , G06F16/9535 , G06F40/14
Abstract: 本发明公开了一种基于正文节点特征的提取网页正文的方法和系统,属于互联网技术领域。本发明方法包括:获取待提取网页的HTML源代码;对HTML源代码进行过滤并提取出HTML源代码HTML DOM树中元素关键节点,针对元素关键节点构建列表;获取每个元素关键节点的节点值为正文节点属性值的概率并进行排序;按正文节点属性值的概率的顺序对元素关键节点进行正文元素提取,确定待判断网页正文为网页正文。本发明在网页正文提取过程中,考虑到HTML网页DOM树元素的属性节点对标记正文节点的重要作用,将网页节点关键属性值id和class与正文节点属性值特征对比,准确找出正文节点值,结合HTML解析器技术准确抽取正文。
-
公开(公告)号:CN115268868A
公开(公告)日:2022-11-01
申请号:CN202210881190.7
申请日:2022-07-26
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种基于有监督学习的智能源码转换方法,包括:从代码网站中抓取大量的并行数据,将获取的并行数据进行预处理;构造词典,将预处理后的并行数据划分为对应的训练集、测试集以及验证集;构造编程语言之间的映射,将语言代码转换为机器识别的编码,将机器识别的编码输入至模型中进行训练,获取代码翻译模型;将输入待翻译的源语言代码输入所述代码翻译模型,基于代码翻译模型对源语言代码进行翻译,获取目标语言的相应代码。实现了将源代码从高级编程语言(如C或Python)转换为另一种语言(如C++或Java),并且提升了翻译的准确率,翻译结果比较理想。
-
公开(公告)号:CN112905232A
公开(公告)日:2021-06-04
申请号:CN202110162209.8
申请日:2021-02-05
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/75
Abstract: 本发明公开了一种基于语法分析树的程序代码平行语料挖掘方法及系统,包括:获取同一项目对应的基于两种不同类型的编程语言编写的第一源码文件和第二源码文件,并进行语法分析,以获取第一语法分析树和第二语法分析树;根据节点信息从所述第一语法分析树和第二语法分析树的根节点开始依次向下进行节点匹配,以确定至少一组匹配成功的属于第一语法分析树的第一语法分析子树和属于第二语法分析树的第二语法分析子树;确定每组匹配成功的第一语法分析子树在所述第一源码文件的字符流中的第一首尾位置和第二语法分析子树在所述第二源码文件的字符流中的第二首尾位置,并根据每组的第一首尾位置和第二首尾位置进行代码提取,以获取多组平行语料。
-
-
-
-
-
-
-
-
-