一种基于ANTLR4的源码翻译方法

    公开(公告)号:CN112445492A

    公开(公告)日:2021-03-05

    申请号:CN202011390106.9

    申请日:2020-12-02

    Abstract: 本发明提出一种基于ANTLR4的源码翻译方法,属于翻译方法技术领域,其基于多线程机制,翻译效率高,且支持多语言解析。该翻译方法包括如下步骤:对待翻译工程所包含的源码文件按照语言种类进行分类,并将不同种类的源码文件分别放入不同的待解析目录中;通过调度线程将不同待解析目录中的源码文件分别调入不同的预处理线程;预处理线程分析调入的源码文件之间的依赖关系并确定解析顺序,计算得到应输出解析文件总数;解析线程按照解析顺序调取源码文件,利用ANTLR4进行翻译并输出对应的解析文件;判断输出的解析文件总数与应输出解析文件总数是否相等;若相等,则翻译结束,否则重复上述步骤;整合输出的解析文件,得到翻译结果。

    一种面向多类型海洋数据的跨模态检索方法及系统

    公开(公告)号:CN110909181A

    公开(公告)日:2020-03-24

    申请号:CN201910943576.4

    申请日:2019-09-30

    Abstract: 本发明公开了一种面向多类型海洋数据的跨模态检索方法及系统,包括:对多个不同类型的海洋源数据进行预处理,以获取处理数据;对第一GAN网络模型进行优化,以确定最优权重对应的第一最优GAN网络模型;对第二GAN网络模型进行优化,以确定第二最优GAN网络模型;利用第一最优GAN网络模型和第二最优GAN网络模型对获取的海洋待检索数据进行处理,以获取所述海洋待检索数据对应的最优检索结果。本发明将人工智能的图像技术和文本技术进行有效的结合,能够深度挖掘文本与图像特征之间的联系,实现了基于文字的图像生成与检索功能和基于图像的文本生成与检索功能,实现了不同模态数据的跨模态检索,建立了高性能、高效率的面向海洋多类型数据的跨模态检索系统。

    一种基于语法分析树的程序代码平行语料挖掘方法及系统

    公开(公告)号:CN112905232B

    公开(公告)日:2023-11-28

    申请号:CN202110162209.8

    申请日:2021-02-05

    Abstract: 本发明公开了一种基于语法分析树的程序代码平行语料挖掘方法及系统,包括:获取同一项目对应的基于两种不同类型的编程语言编写的第一源码文件和第二源码文件,并进行语法分析,以获取第一语法分析树和第二语法分析树;根据节点信息从所述第一语法分析树和第二语法分析树的根节点开始依次向下进行节点匹配,以确定至少一组匹配成功的属于第一语法分析树的第一语法分析子树和属于第二语法分析树的第二语法分析子树;确定每组匹配成功的第一语法分析子树在所述第一源码文件的字符流中的第一首尾位置和第二语法分析子树在所述第二源码文件的字符流中的第二首尾位置,并根据每组的第一首尾位置和第二首尾位置进行代码提取,以获取多组平行语料。

    一种基于有监督学习的智能源码转换方法

    公开(公告)号:CN115268868B

    公开(公告)日:2023-06-27

    申请号:CN202210881190.7

    申请日:2022-07-26

    Abstract: 本发明公开了一种基于有监督学习的智能源码转换方法,包括:从代码网站中抓取大量的并行数据,将获取的并行数据进行预处理;构造词典,将预处理后的并行数据划分为对应的训练集、测试集以及验证集;构造编程语言之间的映射,将语言代码转换为机器识别的编码,将机器识别的编码输入至模型中进行训练,获取代码翻译模型;将输入待翻译的源语言代码输入所述代码翻译模型,基于代码翻译模型对源语言代码进行翻译,获取目标语言的相应代码。实现了将源代码从高级编程语言(如C或Python)转换为另一种语言(如C++或Java),并且提升了翻译的准确率,翻译结果比较理想。

    一种面向多源异构编程语言的智能源码翻译方法及系统

    公开(公告)号:CN113190233B

    公开(公告)日:2023-06-20

    申请号:CN202110405714.0

    申请日:2021-04-15

    Abstract: 本发明公开了一种面向多源异构编程语言的智能源码翻译方法及系统,包括:获取能够实现相同功能的至少两种编码语言类型的编码源文件,并进行预处理,以获取BPE codes文件;对每个编码源文件进行二进制化处理,以获取二进制编码文件;基于去噪自编码器构建初始的智能源码翻译模型,并利用二进制编码文件和BPE codes文件对所述初始的智能源码翻译模型进行预训练,以确定经过预训练的智能源码翻译模型;利用二进制编码文件和BPE codes文件对所述经过预训练的智能源码翻译模型进行翻译训练,确定最终智能源码翻译模型;根据目标编码语言类型,利用所述最终智能源码翻译模型进行待翻译源码文件的翻译,以确定与所述待翻译源码文件对应的目标编码语言类型的编码文件。

    一种抽象语法树裁剪方法
    16.
    发明授权

    公开(公告)号:CN115268867B

    公开(公告)日:2023-04-07

    申请号:CN202210881119.9

    申请日:2022-07-26

    Abstract: 本发明提供了一种抽象语法树裁剪方法,包括:S1:按照自上而下的顺序,为抽象语法树的节点进行编码,获得抽象语法树的节点编码数据集;S2:采用K‑Means聚类方法,按照自下而上的顺序对抽象语法树的节点编码数据集进行重复聚类,获得全部节点的节点编码信息;S3:根据节点编码信息,采用预设的遍历模式遍历抽象语法树,通过计算节点编码信息的余弦相似度,生成若干棵抽象语法子树。本发明通过对一个庞大的抽象语法树进行裁剪,获得若干棵子树,子树中的各个节点关系更加紧密,在使用词向量等方法提取节点特征时,能够取得更好的效果。

    一种基于TBCNN和多头自注意力机制的代码特征提取方法

    公开(公告)号:CN115268994A

    公开(公告)日:2022-11-01

    申请号:CN202210881060.3

    申请日:2022-07-26

    Abstract: 本发明提供了一种基于TBCNN和多头自注意力机制的代码特征提取方法,包括:对程序代码进行解析处理,获得抽象语法树;按照预设的功能节点对抽象语法树进行分割处理,获得若干个小型抽象语法树;将小型抽象语法树输入基于树的卷积神经网络,获得程序代码结构信息的向量序列;利用多头自注意力机制和残差网络对向量序列进行处理,获得程序代码特征;利用全连接网络对程序代码特征进行融合,获得程序代码的特征向量。本发明可以实现CNN网络和RNN网络的功能,不仅可以解决CNN感受野限制和计算复杂度大的问题,而且还可以解决因无法学习长距离依赖导致的梯度消失和梯度爆炸的问题。

    一种用于处理器加密算法移植的方法及系统

    公开(公告)号:CN112148361B

    公开(公告)日:2022-03-04

    申请号:CN202010891735.3

    申请日:2020-08-27

    Abstract: 本发明公开了一种用于处理器加密算法移植的系统及方法,属于异构众核处理器技术领域。本发明方法包括:使用两级并行的编程模型,将处理器主核串行程序中的计算密集型数据或访存密集型数据,分配至处理器从核;处理器从核通过批量访存DMA的处理方式对分配的计算密集型数据或访存密集型数据,存放至核局存LDM空间进行快速计算,所述快速计算完成后,即完成对处理器加密算法的移植;所述快速计算过程中,通过同步和加锁操作对执行中竞争的资源进行分配。本发明提出的方法,实现了资源的合理化分配,减小了算法的工作量,通信的时间,实现了计算隐藏访存。

    一种基于生成式对抗GAN网络的代码翻译方法及系统

    公开(公告)号:CN112905188A

    公开(公告)日:2021-06-04

    申请号:CN202110162786.7

    申请日:2021-02-05

    Abstract: 本发明公开了一种基于生成式对抗GAN网络的代码翻译方法及系统,包括:通过将样本程序集作为输入数据,送入一个代码特征提取模型中,获得每个样本程序对应的第一代码特征值向量,将第一代码特征值向量输入至GAN网络模型的生成器,通过设置相关参数得到预测结果的目标语言,根据预测结果的特征值向量与测试集源程序语言的特征值向量进行对比,不断调参迭代训练,得到最优GAN网络模型;获取待翻译程序,并利用所述最优GAN网络模型进行代码翻译,获取与所述待翻译程序对应的目标翻译程序。本发明的基于生成式对抗GAN网络的代码翻译方法能够实现将源代码从一种高级编程语言转换为另一种高级编程语言,并且具有较高正确率。

    一种用于处理器加密算法移植的方法及系统

    公开(公告)号:CN112148361A

    公开(公告)日:2020-12-29

    申请号:CN202010891735.3

    申请日:2020-08-27

    Abstract: 本发明公开了一种用于处理器加密算法移植的系统及方法,属于异构众核处理器技术领域。本发明方法包括:使用两级并行的编程模型,将处理器主核串行程序中的计算密集型数据或访存密集型数据,分配至处理器从核;处理器从核通过批量访存DMA的处理方式对分配的计算密集型数据或访存密集型数据,存放至核局存LDM空间进行快速计算,所述快速计算完成后,即完成对处理器加密算法的移植;所述快速计算过程中,通过同步和加锁操作对执行中竞争的资源进行分配。本发明提出的方法,实现了资源的合理化分配,减小了算法的工作量,通信的时间,实现了计算隐藏访存。

Patent Agency Ranking