-
公开(公告)号:CN115641955B
公开(公告)日:2023-06-20
申请号:CN202211280416.4
申请日:2022-10-19
Applicant: 哈尔滨工业大学
Abstract: 基于深度学习的胃癌分期判别系统及存储介质,属于癌症辅助判识技术领域。本发明为了解决现有的胃癌分期判别准确率低的问题,本发明首先通过组学特征相关系数计算单元对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,并得到组学特征矩阵;然后通过胃癌标记基因筛选单元:计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,并与用户输入的原始数据加权,得到特征矩阵Sq*r;胃癌分期预测单元基于该特征矩阵,利用神经网络对胃癌分期进行预测。本发明用于胃癌的分期判别。
-
公开(公告)号:CN113035278B
公开(公告)日:2023-03-24
申请号:CN202110380222.0
申请日:2021-04-08
Applicant: 哈尔滨工业大学
Abstract: 一种基于TPBWT自索引结构滑动窗口压缩方法,本发明涉及一种DNA自索引滑动窗口压缩算法。本发明的目的是为了解决现有压缩工具LYZip不能够按照用户需求压缩指定区间数据,压缩耗时长,无法实现多线程压缩问题。一种基于TPBWT自索引结构滑动窗口压缩方法具体过程为:步骤一、数据预处理;步骤二、对步骤一预处理后数据进行分块处理;步骤三、对步骤二分块处理后的每一块进行分流处理;步骤四:将步骤三分流处理后的数据整合为一个压缩文件。本发明用于三代测序DNA数据压缩领域。
-
公开(公告)号:CN115662521A
公开(公告)日:2023-01-31
申请号:CN202211386630.8
申请日:2022-11-07
Applicant: 哈尔滨工业大学
Abstract: 基于泛基因组的序列实时比对方法,具体涉及一种面向边合成边测序类测序技术的基于泛基因组的序列实时精确比对方法,为解决由于DNA序列比对是在序列测序之后,导致边合成边测序类测序技术在序列比对时会耗费大量的计算资源以及计算时间的问题,构建泛基因组;将泛基因组转换为线性序列与线性参考基因组合并;将合并序列的正反序列合并,并构建其BWT索引;删除BWT索引的SA列表上无效或者重复的信息;根据新BWT索引对待测序序列进行比对,得到比对结果并存储;获取待测序序列在泛基因组上的比对位置;选取待测序序列最优的比对位置作为最终比对结果;利用基数排序算法对最终比对结果进行排序,完成待测序序列的比对。
-
公开(公告)号:CN115631847A
公开(公告)日:2023-01-20
申请号:CN202211280689.9
申请日:2022-10-19
Applicant: 哈尔滨工业大学
IPC: G16H50/20 , G06F18/25 , G06F18/241 , G06V10/82 , G06N20/20
Abstract: 基于多组学特征的早期肺癌诊断系统、存储介质及设备,属于癌症诊断技术领域。为了解决仅使用临床图像的早期肺癌筛查存在准确率较低的问题。本发明所述系统包括针对转化为矩阵形式的影像学数据并分别利用卷积神经网络CNN和深度神经网络DNN进行预测的神经网络预测单元、针对每个组学特征,利用图卷积网络得到全局基因关系矩阵的加权的特征矩阵进而获得多组学特征的组学特征处理单元,以及针对多组学数据分别使用多分类器进行预测的分类器预测单元。本发明适用于早期肺癌诊断。
-
公开(公告)号:CN115602246A
公开(公告)日:2023-01-13
申请号:CN202211366121.9
申请日:2022-10-31
Applicant: 哈尔滨工业大学(CN)
Abstract: 一种基于群体基因组的序列比对方法,具体涉及一种基于群体基因组的人体DNA序列比对方法,为了解决以单一参考基因组作为基准的序列比对方法存在精度偏差,导致测序数据变异检测失败或得到错误变异位点的问题,首先构建基于种子序列的群体基因组索引,提取测序序列的种子序列,利用索引获取种子序列在基因组的位置;其次,根据位置利用稀疏动态规划方法得到种子序列在基因组上最优和次优路径集合;最终,根据最优和次优路径集合得到测序序列在基因组上对应的序列,采用KSW2算法比对测序序列与对应的序列,得到比对得分,根据比对得分得到结果比对文件。属于序列比对领域。
-
公开(公告)号:CN113098526B
公开(公告)日:2022-04-12
申请号:CN202110377573.6
申请日:2021-04-08
Applicant: 哈尔滨工业大学
IPC: H03M7/30
Abstract: 一种DNA自索引区间解压缩方法,它属于DNA压缩数据的解压缩技术领域。本发明解决了现有的解压缩算法需要的解压缩时间长,且解压缩后的数据需要的存储空间大的问题。本发明的自索引区间解压缩算法可以根据需求来选取解压缩的范围,相对于全局静态TPBWT解压缩算法来说,很大程度的降低了解压缩时间,同时也降低了解压缩数据的存储空间。相对于传统解压缩算法,该算法更加灵活能够依据不同需求,解压缩出不同含义的数据,适用性更强。本发明可以应用于对DNA压缩数据的解压缩。
-
公开(公告)号:CN113611368B
公开(公告)日:2022-04-01
申请号:CN202110844660.8
申请日:2021-07-26
Applicant: 哈尔滨工业大学(深圳)
IPC: G16B40/30 , G16B40/20 , G16B25/10 , G06V10/762 , G06V10/764 , G06V10/774 , G06V10/77 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开了一种基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备。其中,所述方法包括:对每个细胞进行数据预处理,和将该经对数据预处理后的每个细胞的基因表达数据都使用2D嵌入的方式,生成一张张合成图像形成图像集,和将该图像集输入到自编码器模型中进行预训练和聚类,和基于该将该图像集输入到自编码器模型中进行预训练和聚类后的聚类结果,构建网络,并运用社区发现算法对该构建网络中的图像集数据进行分类,以及采用将基于卷积神经网络模型来配置的半监督神经网络,对该经分类后的图像集中的所有细胞图像数据进行特征提取,并对该提取的特征进行聚类。通过上述方式,能够实现提高在单细胞数据上进行聚类时的聚类效果。
-
公开(公告)号:CN114141375A
公开(公告)日:2022-03-04
申请号:CN202111504144.7
申请日:2021-12-10
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种异质图表示方法、异质图表示设备、移动设备及存储介质,该方法包括:基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;对所述同构图的每个节点的子图进行分解,获得多个因子图;采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。由此,将异构图转化为同构图后,对节点的子图进行分解获得大量的因子图,并通过双注意力机制对因子图进行邻居信息聚合,以获得该异构图的节点嵌入,进而得到了异构图全面、准确的信息,提高了机器学习中基于少量数据的信息提取的准确性和全面性。
-
公开(公告)号:CN112863600A
公开(公告)日:2021-05-28
申请号:CN202110388432.4
申请日:2021-04-12
Applicant: 哈尔滨工业大学
Abstract: 一种基于外显子区域插入的数据压缩方法,涉及数据压缩领域。本发明是为了解决现有的数据压缩方法压缩时运行速度慢、压缩适应范围窄、压缩存储量消耗大的问题。本发明包括:对测序短读DNA数据进行预处理获取外显子数据集合;对外显子数据集合进行质控获取异常值并将异常值存储在哈希表中;将哈希表中的异常值进行有序存放;使用霍夫曼编码对存放在哈希表中的异常值中的碱基进行压缩存储;利用LYZip局部解压缩方法判断此时累积插入序列深度是否已经达到30X,如果大于30X则表明无法进行插入压缩;如果小于30X,并且累加上新加入的插入序列仍然小于30X,则重复压缩步骤。本发明用于对数据的压缩。
-
公开(公告)号:CN112468038A
公开(公告)日:2021-03-09
申请号:CN202011519810.X
申请日:2020-12-21
Applicant: 哈尔滨工业大学
IPC: H02P6/34 , H02P21/14 , H02P21/20 , H02P21/22 , H02P25/022
Abstract: 永磁同步电机MTPA控制电流轨迹搜索方法及在线控制方法,属于电机控制领域,本发明为解决传统算法使用固定参数值计算MTPA控制下的电流轨迹存在偏差大,无法实现准确的最大转矩电流比控制的问题。本发明方法为:在给定的转矩指令、转速指令、电压极限、电流极限和电机充磁状态下,获取电流幅值最小的电流工作点作为MTPA电流轨迹;该方法包括电流角迭代和电流幅值迭代步骤,首先进行电流角迭代,电流角迭代方向为电流幅值减小方向;在电流角迭代过程中,嵌套电流幅值迭代,用以确定每个电流角对应电流幅值,电流幅值迭代方向为给定转矩与实际转矩误差减小方向,当电流角迭代区间小于给定电流角迭代精度,认为电流幅值已经收敛至最小值,输出MTPA电流轨迹。
-
-
-
-
-
-
-
-
-