基于测序数据的肿瘤纯度及绝对拷贝数预测方法及系统

    公开(公告)号:CN110289047B

    公开(公告)日:2021-06-01

    申请号:CN201910407581.3

    申请日:2019-05-15

    IPC分类号: G16B20/10 G16B40/30

    摘要: 本发明属于基因组测序技术领域,公开了一种基于测序数据的肿瘤纯度及绝对拷贝数预测方法及系统;利用bwa和samtools生信软件对原始fastq测序数列生成样本的readepth文件;使用拷贝数变异检测方法对预处理好的数据样本进行实验,产生检测结果;根据拷贝数检测结果,提取出其中变异为Loss类型的结果,使用聚类方法分析各个Loss情况的倍体,倍体情况记录作为下一步预测肿瘤纯度的输入;采用无监督的机器学习方法进行肿瘤纯度的预测;利用预测到的肿瘤纯度和拷贝数检测得到的样本readcounts值,计算出癌细胞的readcounts值,根据样本倍体计算出绝对拷贝数。本发明通过仿真数据的测试,可以发现本发明的测试结果相对于其它方法来说更为准确。

    一种面向情感识别的脑电信号通道选择方法、系统及应用

    公开(公告)号:CN111832438A

    公开(公告)日:2020-10-27

    申请号:CN202010593365.5

    申请日:2020-06-27

    发明人: 杨利英 晁思

    IPC分类号: G06K9/00

    摘要: 本发明属于机器学习和智能人机交互技术领域,公开了一种面向情感识别的脑电信号通道选择方法、系统及应用,对脑电数据进行去基值化的预处理;然后结合滑动窗口和快速傅里叶变换计算得到频域信号的功率谱强度,将其作为脑电特征;分别采用ReliefF和MIC算法求取每个特征的权值,并利用波达计数法整合得到每个通道的积分和,依次增加一个积分和值较大通道的特征数据,采用随机森林分类并找出最佳通道子集;进行分类评估。本发明采用将ReliefF和MIC算法相结合的特征选择方法,将每个通道作为整体,实现了通道数量大幅度降低的目标,可以提升系统的效率和提高系统的实时性,对脑电情感识别和智能人机交互领域都具有重要的意义。

    一种基于新一代测序的拷贝数变异检测方法

    公开(公告)号:CN105760712B

    公开(公告)日:2019-03-26

    申请号:CN201610114354.8

    申请日:2016-03-01

    IPC分类号: G16B40/00 G16B30/00

    摘要: 本发明公开了一种基于新一代测序的拷贝数变异检测方法,该方法包括拷贝数变异数据的预处理、滑动窗口的构造、统计量的计算、置换策略的实施与零分布的构造、算法的性能评估,算法的性能评估采用判断算法能否在错误肯定率可控的情况下,获得较高的正确肯定率,评价算法是否能够较准确地估计p值,拷贝数变异的边界检出能力;分析算法的计算复杂度。本发明解决了由于测序平台及测序水平不同引起的拷贝数变异检测误差问题,令结果更准确;利用从多峰频率直方图特点归一化数据,以准确划分正常区域和拷贝数变异区域;本发明变异reads数与变异位点间关联性的综合作用,建立新模型,解决不一致性问题,客观估计拷贝数变异的显著性水平。

    一种泛癌症基因表达和甲基化关联分析方法

    公开(公告)号:CN107766697A

    公开(公告)日:2018-03-06

    申请号:CN201710838076.5

    申请日:2017-09-18

    发明人: 杨利英 耿芳歌

    IPC分类号: G06F19/22 G06F19/20 G06F19/24

    CPC分类号: G06F19/22 G06F19/20 G06F19/24

    摘要: 本发明属于生物信息学和监督学习方法技术领域,公开了一种泛癌症基因表达和甲基化关联分析方法,利用结合线性模型和经验贝叶斯的稳健t检验方法筛选出差异表达基因和差异甲基化位点;将差异基因和甲基化位点与蛋白质交互作用网络结合,发现显著差异性模块以PPI蛋白质交互作用网络为架构;错误发现率FDR大于阈值的子网模块删除,得到具有统计显著性的子网模块;找出基因表达和甲基化之间相似的关联模式和共同的调节基因。本发明结合PPI网络,寻找影响癌症发生的分子通路,使用SPG模块发现算法,得出的子网模块具有生物意义。本发明用于发现不同癌症间的相同的致病模式,从而更好地应用于癌症致病机理。

    一种多样本拷贝数一致性变异区域的统计检验方法

    公开(公告)号:CN106682455A

    公开(公告)日:2017-05-17

    申请号:CN201611040980.3

    申请日:2016-11-24

    IPC分类号: G06F19/24 G06F19/18 G06F19/22

    CPC分类号: G06F19/24 G06F19/18 G06F19/22

    摘要: 本发明公开了一种多样本拷贝数一致性变异区域的统计检验方法,基于拷贝数位点的关系系数构造拟合成曲线,计算每个位点的导数值,通过假设检验方法检测显著的导数值,从确定拷贝数断点,建立拷贝数变异候选区域;通过在全基因组及样本两个方向上随机置换CNVs的方式构建假设检验零分布,检测多样本中拷贝数一致性变异区域。本发明避免直接使用测序读段数,能够容纳一定的测序错误及噪声,能够较准确地定位拷贝数变异区域的边界;基于全基因组及样本两个方向上随机置换CNVs,相比在单个方向上的置换,能够获得更真实的假设检验领分布;同时,有利于检测多样化的一致性变异CNVs,即多样本子类中存在的拷贝数一致性变异区域。

    基因微阵列数据的分类器模型生成方法

    公开(公告)号:CN103793600B

    公开(公告)日:2017-05-03

    申请号:CN201410025412.0

    申请日:2014-01-16

    IPC分类号: G06F19/00 G06F19/20

    摘要: 本发明涉及一种基因微阵列数据的分类器模型生成方法,具体包括以下步骤:(1)用过滤技术预处理基因微阵列数据;(2)将预处理后的基因微阵列数据用独立分量分析技术进行变换,得到独立分量集;(3)应用线性判别分析技术处理独立分量集,将基因微阵列数据投影到具有最佳可分性的低维空间;(4)利用投影后的基因微阵列数据训练最近邻分类器,生成分类器模型。本发明在过滤处理后的基因微阵列数据上,利用独立分量分析挖掘基因微阵列数据的隐含信息,利用线性判别分析将基因微阵列数据投影到具有最佳可分性的低维空间,提高了癌症预测的精度,降低了癌症预测的时间。

    一种基于新一代测序的拷贝数变异检测方法

    公开(公告)号:CN105760712A

    公开(公告)日:2016-07-13

    申请号:CN201610114354.8

    申请日:2016-03-01

    IPC分类号: G06F19/22 G06F19/24

    CPC分类号: G06F19/22 G06F19/24

    摘要: 本发明公开了一种基于新一代测序的拷贝数变异检测方法,该方法包括拷贝数变异数据的预处理、滑动窗口的构造、统计量的计算、置换策略的实施与零分布的构造、算法的性能评估,算法的性能评估采用判断算法能否在错误肯定率可控的情况下,获得较高的正确肯定率,评价算法是否能够较准确地估计p值,拷贝数变异的边界检出能力;分析算法的计算复杂度。本发明解决了由于测序平台及测序水平不同引起的拷贝数变异检测误差问题,令结果更准确;利用从多峰频率直方图特点归一化数据,以准确划分正常区域和拷贝数变异区域;本发明变异reads数与变异位点间关联性的综合作用,建立新模型,解决不一致性问题,客观估计拷贝数变异的显著性水平。

    以内容为中心的网络中保持缓存一致性的方法

    公开(公告)号:CN102780773A

    公开(公告)日:2012-11-14

    申请号:CN201210245588.8

    申请日:2012-07-16

    发明人: 盛立杰 杨利英

    IPC分类号: H04L29/08 H04L12/56

    摘要: 本发明公开了一种以内容为中心的网络中保持缓存一致性的方法,以解决以内容为中心的网络中缓存内容可能与数据源内容不一致的问题。其实现步骤是:在每个内容的属性中加入版本号作为新字段,当内容的版本升级时其版本号随之增加;当用户要获取某内容时,先向存储有该内容的数据源服务器查询其最新版本号,再向网络发出包含有版本号的Interest包;网络结点收到Interest包后,在缓存中查找对应数据片,并将数据片的版本号与Interest包中的版本号比对,当版本号相同时视为缓存查找成功,并返还数据片,反之视为查找失败,继续转发Interest包。本发明具有实现了缓存强一致性的优点,可用于以内容为中心的网络中对数据的缓存。

    一种自校正脑电信号标签噪声的情绪识别方法、系统、设备和介质

    公开(公告)号:CN118415639A

    公开(公告)日:2024-08-02

    申请号:CN202410517265.2

    申请日:2024-04-28

    发明人: 杨利英 田洋

    摘要: 一种自校正脑电信号标签噪声的情绪识别方法、系统、设备和介质,方法包括,获取测试者的脑电信号数据,对脑电信号数据处理得到脑电信号样本;在脑电信号样本对应的情绪标签中,将预设比例的情绪标签取反,视作噪声标签,得到带噪脑电信号样本;建立基于深度学习的自校正混合匹配模型,包括预训练模块、标签切分模块,情绪识别模块以及标签噪声样本校正模块;将带噪脑电信号样本和带噪脑电信号样本对应的情绪标签,输入自校正混合匹配模型,训练自校正混合匹配模型,输出情绪识别结果。系统、设备和介质,用于实现一种自校正脑电信号标签噪声的情绪识别方法。本发明解决标签噪声导致情绪识别准确率下降的问题,具有在标签噪声存在的情况下,提高情绪识别性能的特点。

    一种脑电情感识别方法、系统、计算机设备、可穿戴设备

    公开(公告)号:CN112101152B

    公开(公告)日:2024-02-02

    申请号:CN202010905842.7

    申请日:2020-09-01

    摘要: 本发明属于机器学习和情绪识别的交叉技术领域,公开了一种脑电情感识别方法、系统、计算机设备、可穿戴设备,通过去除最开始视频转换时产生的脑电信号,再用剩下的数据减去该信号的平均值,由此减少非情绪信号对情绪识别的影响;对预处理后的脑电信号使用短时傅里叶变换提取时频域特征;将特征放入卷积神经网络进行训练,提取出高质量特征;将得到的特征进行超图学习,构建超图分类器模型,完成情感分类识别。本发明采用深度学习的方法优化脑电信号的时频特征,然后使用超图学习的方法抽样进行训练与分类,在提高超图学习分类准确率的基础上有效缩短了训练时间、压缩了运算空间,对于便携式可穿戴设备的设计和研发具有重要意义。