-
公开(公告)号:CN111429972A
公开(公告)日:2020-07-17
申请号:CN201910839110.X
申请日:2019-09-05
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明提出了一种基于深度学习的蛋白质小分子对接打分方案,包括如下步骤:步骤1、构建复合物数据库,并选择其中若干蛋白质配体对用作训练集,若干蛋白质配体对用作验证集,若干蛋白质配体对用作测试集;步骤2、对复合物进行包围网格的创建,得到复合物网格,并通过处理得到多通道复合物描述符;步骤3、使用训练集对多通道复合物描述符进行训练,得到深度学习模型;步骤4、使用验证集对深度学习模型进行验证;步骤5、使用测试集得到复合物描述符,并输入深度学习模型中进行预测,得到复合物的打分值。借此,本发明具有采用多通道网格,通过深度学习对复合物网格进行打分,进而准确且快速预测对接分数的优点。
-
公开(公告)号:CN110459263A
公开(公告)日:2019-11-15
申请号:CN201910569102.8
申请日:2019-06-27
Applicant: 青岛海洋科学与技术国家实验室发展中心 , 中国海洋大学
IPC: G16B15/30
Abstract: 本发明公开了一种基于BFGS算法的计算机药物筛选方法。本发明包括以下步骤:1)建立数据库,由30000-40000个海洋小分子的数据集群,循环遍历匹配,形成相似度为0-1的小分子库;2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象;3)分子对接,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接;4)构象搜索,使用BFGS算法进行构象搜索,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索。本发明通过优化算法使其缩短寻找配体与受体结合在受体活性位点处的低能构象的时间,增加了小分子数据库的基于该方法的虚拟筛选的效果和效率。
-
公开(公告)号:CN112905232B
公开(公告)日:2023-11-28
申请号:CN202110162209.8
申请日:2021-02-05
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/75
Abstract: 本发明公开了一种基于语法分析树的程序代码平行语料挖掘方法及系统,包括:获取同一项目对应的基于两种不同类型的编程语言编写的第一源码文件和第二源码文件,并进行语法分析,以获取第一语法分析树和第二语法分析树;根据节点信息从所述第一语法分析树和第二语法分析树的根节点开始依次向下进行节点匹配,以确定至少一组匹配成功的属于第一语法分析树的第一语法分析子树和属于第二语法分析树的第二语法分析子树;确定每组匹配成功的第一语法分析子树在所述第一源码文件的字符流中的第一首尾位置和第二语法分析子树在所述第二源码文件的字符流中的第二首尾位置,并根据每组的第一首尾位置和第二首尾位置进行代码提取,以获取多组平行语料。
-
公开(公告)号:CN115113303B
公开(公告)日:2023-10-31
申请号:CN202210703932.7
申请日:2022-06-21
Applicant: 天津大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G01W1/14 , G01W1/10 , G06F18/214 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开了一种基于元学习的厄尔尼诺极端天气预警方法及装置,包括:设计全局引导的注意力机制引导低层特征的学习,并利用互信息约束加强不同层级海洋特征的表征一致性,将多层级海洋特征拼接为全局特征,利用该全局特征对厄尔尼诺指数进行预测;对每个元训练任务,利用元学习算法对多层级厄尔尼诺指数预测网络进行参数训练,得到能够处理不同时期数据,且有适应能力的网络参数;以元训练阶段优化好的参数作为初始化参数,在SODA数据集上对多层级厄尔尼诺指数预测网络进行进一步微调;在GODAS数据集上进行最终厄尔尼诺指数预测;建立最终厄尔尼诺指数与降雨量的映射函数,当预测降雨量达到一定阈值时进行预警并提前进行汛期防治工作。
-
公开(公告)号:CN115268868B
公开(公告)日:2023-06-27
申请号:CN202210881190.7
申请日:2022-07-26
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/30 , G06F8/41 , G06N3/047 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于有监督学习的智能源码转换方法,包括:从代码网站中抓取大量的并行数据,将获取的并行数据进行预处理;构造词典,将预处理后的并行数据划分为对应的训练集、测试集以及验证集;构造编程语言之间的映射,将语言代码转换为机器识别的编码,将机器识别的编码输入至模型中进行训练,获取代码翻译模型;将输入待翻译的源语言代码输入所述代码翻译模型,基于代码翻译模型对源语言代码进行翻译,获取目标语言的相应代码。实现了将源代码从高级编程语言(如C或Python)转换为另一种语言(如C++或Java),并且提升了翻译的准确率,翻译结果比较理想。
-
公开(公告)号:CN113190233B
公开(公告)日:2023-06-20
申请号:CN202110405714.0
申请日:2021-04-15
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/41 , G06F40/289
Abstract: 本发明公开了一种面向多源异构编程语言的智能源码翻译方法及系统,包括:获取能够实现相同功能的至少两种编码语言类型的编码源文件,并进行预处理,以获取BPE codes文件;对每个编码源文件进行二进制化处理,以获取二进制编码文件;基于去噪自编码器构建初始的智能源码翻译模型,并利用二进制编码文件和BPE codes文件对所述初始的智能源码翻译模型进行预训练,以确定经过预训练的智能源码翻译模型;利用二进制编码文件和BPE codes文件对所述经过预训练的智能源码翻译模型进行翻译训练,确定最终智能源码翻译模型;根据目标编码语言类型,利用所述最终智能源码翻译模型进行待翻译源码文件的翻译,以确定与所述待翻译源码文件对应的目标编码语言类型的编码文件。
-
公开(公告)号:CN115268867B
公开(公告)日:2023-04-07
申请号:CN202210881119.9
申请日:2022-07-26
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/30 , G06F16/22 , G06F18/23213
Abstract: 本发明提供了一种抽象语法树裁剪方法,包括:S1:按照自上而下的顺序,为抽象语法树的节点进行编码,获得抽象语法树的节点编码数据集;S2:采用K‑Means聚类方法,按照自下而上的顺序对抽象语法树的节点编码数据集进行重复聚类,获得全部节点的节点编码信息;S3:根据节点编码信息,采用预设的遍历模式遍历抽象语法树,通过计算节点编码信息的余弦相似度,生成若干棵抽象语法子树。本发明通过对一个庞大的抽象语法树进行裁剪,获得若干棵子树,子树中的各个节点关系更加紧密,在使用词向量等方法提取节点特征时,能够取得更好的效果。
-
公开(公告)号:CN115880544A
公开(公告)日:2023-03-31
申请号:CN202211604754.9
申请日:2022-12-13
Applicant: 青岛海洋科学与技术国家实验室发展中心 , 中国海洋大学
IPC: G06V10/774 , G06V10/764 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F9/54
Abstract: 本申请公开了一种基于Kafka消息队列的图像分类模型增量训练方法及系统。所述基于Kafka消息队列的图像分类模型增量训练方法包括:通过Kafka消息队列收集增量数据;获取已经经过训练的模型;通过增量数据对已经经过训练的模型进行增量训练。本申请针对增量学习算法脱离生产环境的问题,借助消息队列系统提供了一种图像分类模型增量训练的系统和方法,将增量学习方案与流处理平台相结合,并可以有效的简化增量模型训练和部署的过程。
-
公开(公告)号:CN115469172A
公开(公告)日:2022-12-13
申请号:CN202211289769.0
申请日:2022-10-20
Applicant: 青岛海洋科学与技术国家实验室发展中心 , 中国海洋大学
IPC: G01R31/00 , G01R21/133 , G01R21/00 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种基于神经网络的三相电非侵入式负荷识别方法,属于工业设备能耗监测技术领域。所述方法包括步骤S1、将能耗监测装置安装于产线级配电柜中,用于采集工业三相电信号;步骤S2、由所述产线级配电柜引出电能,以对能耗监测装置供电;步骤S3、将能耗监测装置与远程客户端进行互联;步骤S4、在能耗监测装置中配置采样频率修改模块,用于基于远程客户端的指令调整所述能耗监测装置的采样频率;步骤S5、在能耗监测装置中配置能耗分析模块,用于基于采集的产线电信号计算产线设备的有功功率、无功功率、视在功率及功率因数;步骤S6、将经训练的负荷监控模型嵌入到所述能耗分析模块中,以形成能耗识别、故障预警、故障报警及能耗统计分析的功能。
-
公开(公告)号:CN115268994A
公开(公告)日:2022-11-01
申请号:CN202210881060.3
申请日:2022-07-26
Applicant: 中国海洋大学 , 青岛海洋科学与技术国家实验室发展中心
IPC: G06F8/75 , G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于TBCNN和多头自注意力机制的代码特征提取方法,包括:对程序代码进行解析处理,获得抽象语法树;按照预设的功能节点对抽象语法树进行分割处理,获得若干个小型抽象语法树;将小型抽象语法树输入基于树的卷积神经网络,获得程序代码结构信息的向量序列;利用多头自注意力机制和残差网络对向量序列进行处理,获得程序代码特征;利用全连接网络对程序代码特征进行融合,获得程序代码的特征向量。本发明可以实现CNN网络和RNN网络的功能,不仅可以解决CNN感受野限制和计算复杂度大的问题,而且还可以解决因无法学习长距离依赖导致的梯度消失和梯度爆炸的问题。
-
-
-
-
-
-
-
-
-