序列位点重要度的确定方法、装置、设备及存储介质

    公开(公告)号:CN107516020B

    公开(公告)日:2021-05-14

    申请号:CN201710708490.4

    申请日:2017-08-17

    IPC分类号: G16B30/00 G16B20/30 G16B40/00

    摘要: 本发明公开了序列位点重要度的确定方法、装置、设备及存储介质。该方法包括确定定长序列串集合中序列特征串具有的序列位点数,生成设定数量的维数为所述序列位点数的位点权重向量;初始化各所述位点权重向量,获得所述设定数量的具有初始分量值的初始位点权重向量;基于选定的最优解搜索算法迭代处理各所述初始位点权重向量,获得目标位点权重向量;将所述目标位点权重向量中的各目标分量值对应确定为序列特征串中各序列位点的重要度。利用该方法,能够准确快速的确定序列特征串中各序列位点的重要度,为后续对序列特征串的转录因子结合位点预测提供了有效的预测信息,从而保证了转录因子结合位点预测处理的准确性。

    序列位点重要度的确定方法、装置、设备及存储介质

    公开(公告)号:CN107516020A

    公开(公告)日:2017-12-26

    申请号:CN201710708490.4

    申请日:2017-08-17

    IPC分类号: G06F19/20 G06F19/24

    CPC分类号: G06F19/20 G06F19/24

    摘要: 本发明公开了序列位点重要度的确定方法、装置、设备及存储介质。该方法包括确定定长序列串集合中序列特征串具有的序列位点数,生成设定数量的维数为所述序列位点数的位点权重向量;初始化各所述位点权重向量,获得所述设定数量的具有初始分量值的初始位点权重向量;基于选定的最优解搜索算法迭代处理各所述初始位点权重向量,获得目标位点权重向量;将所述目标位点权重向量中的各目标分量值对应确定为序列特征串中各序列位点的重要度。利用该方法,能够准确快速的确定序列特征串中各序列位点的重要度,为后续对序列特征串的转录因子结合位点预测提供了有效的预测信息,从而保证了转录因子结合位点预测处理的准确性。

    一种甲基化作用的预测方法、装置

    公开(公告)号:CN103559423A

    公开(公告)日:2014-02-05

    申请号:CN201310534661.8

    申请日:2013-10-31

    IPC分类号: G06F19/12

    摘要: 本发明适用于生物信息技术领域,提供了一种甲基化作用的预测方法、装置,所述方法包括:下载得到被甲基化作用的数据;根据所述被甲基化作用的数据获取原始蛋白质序列数据;对所述原始蛋白质序列数据进行预处理,得到阳性数据集和阴性数据集;对所述阳性数据集和所述阴性数据集中的字符串数据进行编码,得到数值型数据;对所述阳性数据集和所述阴性数据集中的数值型数据利用分类算法进行建模,根据建模得到的模型计算最佳的分割方式,最后根据所述分割方式将需要预测是否被甲基化的数据集中的数据划分为两类,一类为被甲基化作用的数据,另一类为没有被甲基化作用的数据。本发明,不需要人工的参与,也不需要绘制图谱,可以节省时间,费用也便宜。

    一种心电信号的处理方法及系统

    公开(公告)号:CN103610457B

    公开(公告)日:2016-03-30

    申请号:CN201310585744.X

    申请日:2013-11-19

    IPC分类号: A61B5/0402

    摘要: 本发明适用于数据处理技术领域,提供了一种心电信号的处理方法及系统,该方法包括:采集心电信号;对采集的心电信号进行预处理;将预处理后的心电信号分解为单周期心电信号组,并对所述单周期心电信号组中的每个单周期心电信号进行归一化处理;对归一化处理后的单周期心电信号进行多项式拟合,获取拟合参数;根据所述拟合参数,通过预先建立的分类模型对所述心电信号进行分类识别,获得识别结果。本发明采用多项式拟和参数作为心电信号分类的特征向量具有更好的鲁棒性,而且通过对单周期心电信号进行归一化处理可有效解决心电信号基线漂移以及心率变化带来的误差。

    一种新闻推荐方法及装置

    公开(公告)号:CN104572855A

    公开(公告)日:2015-04-29

    申请号:CN201410787914.7

    申请日:2014-12-17

    IPC分类号: G06F17/30

    CPC分类号: G06F16/9535

    摘要: 本发明实施例公开了一种新闻推荐方法及装置,包括:获取多个新闻中的目标新闻中的各个词语在目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含目标新闻中的指定词语的新闻数量;根据目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算多个新闻的特征向量;根据多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定待推荐新闻与用户已阅读新闻的相似度;若所述待推荐新闻与所述用户已阅读新闻的相似度大于预设阈值,则对所述待推荐新闻进行推荐。采用本发明实施例,可以提高新闻推荐的精确性。

    一种基因数据处理方法及装置

    公开(公告)号:CN104408332A

    公开(公告)日:2015-03-11

    申请号:CN201410616856.1

    申请日:2014-11-05

    发明人: 周丰丰 赵苗苗

    IPC分类号: G06F19/24

    摘要: 本发明实施例公开了一种基因数据处理方法及装置,所述方法包括:接收参考人群的指定特征类型的基因数据,对所述基因数据进行预处理得到标准化基因数据,使用LASSO方法对所述标准化基因数据进行特征基因选择,得到特征基因数据,基于交叉验证方法,将所述特征基因数据的样本集分成测试样本和训练样本,将所述训练样本注入分类器,得到训练后分类器,将所述测试样本注入所述训练后分类器,对所述测试样本进行特征分类,并统计分类器的分类准确性。本发明实施例可以提高特征基因选择的准确性、降低测试样本和训练样本的选择对分类准确率的影响。

    一种心电信号处理方法及装置

    公开(公告)号:CN104398252A

    公开(公告)日:2015-03-11

    申请号:CN201410617357.4

    申请日:2014-11-05

    IPC分类号: A61B5/0402 A61B5/0456

    摘要: 本发明实施例公开了一种心电信号处理方法及装置,所述方法包括:对包含参考特征类别心电信号的样本数据除噪处理得到滤波心电信号,所述样本数据包括训练用样本数据和测试用样本数据,基于多心电周期融合方法对所述滤波心电信号进行特征提取得到特征心电信号,对所述特征心电信号进行数据归一化处理得到标准心电信号,根据训练用样本数据对应的标准心电信号训练BP神经网络,得到训练后BP神经网络,将测试用样本数据对应的标准心电信号注入所述训练后BP神经网络,获取所述测试用样本数据对应的标准信号的分类结果,本发明实施例可以提高特征心电信号提取和分类的全面性、准确性。

    一种甲基化作用的预测方法、装置

    公开(公告)号:CN103559423B

    公开(公告)日:2017-02-15

    申请号:CN201310534661.8

    申请日:2013-10-31

    IPC分类号: G06F19/12

    摘要: 本发明适用于生物信息技术领域,提供了一种甲基化作用的预测方法、装置,所述方法包括:下载得到被甲基化作用的数据;根据所述被甲基化作用的数据获取原始蛋白质序列数据;对所述原始蛋白质序列数据进行预处理,得到阳性数据集和阴性数据集;对所述阳性数据集和所述阴性数据集中的字符串数据进行编码,得到数值型数据;对所述阳性数据集和所述阴性数据集中的数值型数据利用分类算法进行建模,根据建模得到的模型计算最佳的分割方式,最后根据所述分割方式将需要预测是否被甲基化的数据集中的数据划分为两类,一类为被甲基化作用的数据,另一类为没有被甲基化作用的数据。本发明,不需要人工的参与,也不需要绘制图谱,可以节省时间,费用也便宜。

    基于最近邻算法的蛋白激酶特异性预测方法及装置

    公开(公告)号:CN103745135A

    公开(公告)日:2014-04-23

    申请号:CN201310676124.7

    申请日:2013-12-11

    IPC分类号: G06F19/18

    摘要: 本发明涉及蛋白质修饰化位点识别技术领域,具体涉及一种基于最近邻算法的蛋白激酶特异性预测方法及装置。本发明的预测方法充分利用了磷酸化位点上游、下游的氨基酸信息,增加了预测的正确率;本发明的预测方法利用氨基酸置换矩阵对待测磷酸化位点肽段和已知磷酸化位点肽段的相似性打分,将待测磷酸化位点肽段标注为得分最高的已知磷酸化位点肽段,提高了预测的灵敏度和特异性。