-
公开(公告)号:CN111210870A
公开(公告)日:2020-05-29
申请号:CN201911376845.X
申请日:2019-12-27
Applicant: 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种蛋白质分类方法,包括如下步骤:将蛋白质三维模型置入N*N*N大小的体素占据网格;对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;基于射线与蛋白质三维模型的相交情况构建占据模型;将所述占据模型通过三维卷积神经网络实现对蛋白质的分类;采用体素占据网格实现对蛋白质结构的体积表示,从原始蛋白质体积数据中利用机器学习为蛋白质创建快速准确的分类器,对蛋白质数据集实现了高速高精度的分类效果。
-
公开(公告)号:CN111325221A
公开(公告)日:2020-06-23
申请号:CN202010117286.7
申请日:2020-02-25
Applicant: 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种基于图像深度信息的图像特征提取方法,包括以下步骤:多流深度网络模型训练步骤,所述多流深度网络模型由样本图像的 个模态训练形成,为不小于2的整数,所述模态至少包括图像的平面模态和三维结构模态;提取待处理图像的所述 个模态的信息;将待处理图像的 个模态的信息输入至所述多流深度网络进行融合处理,输出得到待处理图像的深度图像融合特征。本发明利用多流深度网络,整合图片的多种信息,至少包括平面模态信息和三维结构模态信息两种不同类型的信息,使得对立体模型的描述更加全面,进而对深度图像的描述更加全面,在图片特征提取方面更加丰富和准确,可重复性好,所提取的特征对图像的表征能力好。
-
公开(公告)号:CN111191058A
公开(公告)日:2020-05-22
申请号:CN201911380213.0
申请日:2019-12-27
Applicant: 青岛海洋科学与技术国家实验室发展中心
IPC: G06F16/532 , G06N3/00
Abstract: 本发明公开了一种图片检索方法,对处理图片分别进行DCT计算和DWT计算得到第一组哈希码,旋转处理图片分别在90°、180°和270°上进行DCT计算和DWT计算得到第二组哈希码、第三组哈希码和第四组哈希码,基于四组哈希码计算并构建NB+树,并组合成为随机森林模型,使用随机森林模型进行图片检索。使用了分块DCT和DWT技术来构造图片的感知哈希码,加速了哈希码的构造过程;依据不同旋转角度的图片来构造决策树,提高了图片检索的准确性;使用了归一化的B+树将高维输入向量减少至一维,显著改善了时间复杂度;使用随机森林模型,结合图片旋转、DCT和DWT的哈希码等多个决策来提高检索的速度和性能。
-
公开(公告)号:CN111414802A
公开(公告)日:2020-07-14
申请号:CN202010106311.1
申请日:2020-02-21
Applicant: 青岛海洋科学与技术国家实验室发展中心
Abstract: 本发明公开了一种蛋白质数据特征提取方法,包括以下步骤:(1)、对蛋白质的原始三维模型进行预处理,得到预处理三维模型;(2)、获取预处理三维模型的多个二维视图,提取各所述二维视图的图像特征矩阵,将所有的图像特征矩阵进行融合,得到蛋白质的二维特征矩阵;(3)、获取蛋白质的三维特征矩阵;(4)、将蛋白质的二维特征矩阵和三维特征矩阵进行融合计算,得到蛋白质数据特征矩阵。本发明的方法通过提取蛋白质的二维视图特征信息和三维模型空间结构信息,使得对蛋白质的外形特征描述更加全面。通避免了仅采用二维提取特征信息不完整,能够保证计算蛋白质模型相似度的科学性和准确性。
-
公开(公告)号:CN111209460A
公开(公告)日:2020-05-29
申请号:CN201911376762.0
申请日:2019-12-27
Applicant: 青岛海洋科学与技术国家实验室发展中心
IPC: G06F16/951 , G06F16/955
Abstract: 本发明公开了一种基于scrapy爬虫框架的数据采集系统及方法,包括:爬虫队列模块和爬虫执行模块;爬虫队列模块包括爬虫种子队列、爬虫种子处理单元和爬虫任务队列;爬虫种子队列用于存储爬虫任务;爬虫种子处理单元用于对爬虫种子队列中的爬虫任务进行去重筛选处理,并将去重筛选后的爬虫任务存储入爬虫任务队列;爬虫执行模块包括网页下载单元和URL挖掘单元;网页下载单元用于从爬虫任务队列中读取当前需要执行的爬虫任务,基于读取到的爬虫任务下载网页;URL挖掘单元用于在下载到的网页中提取到新的URL链接作为新的爬虫任务存入爬虫种子队列;实现对特定领域网站域名的深度挖掘,提升了系统的爬取广度。
-
-
-
-