胶质瘤的类型识别方法、模型训练方法、装置、设备

    公开(公告)号:CN114972849A

    公开(公告)日:2022-08-30

    申请号:CN202210505393.6

    申请日:2022-05-10

    Applicant: 清华大学

    Abstract: 本公开提供的一种胶质瘤的类型识别方法、模型训练方法、装置、设备,涉及图像处理技术,包括:获取胶质瘤的组织病理图像;将组织病理图像输入预设识别模型,提取胶质瘤中各目标图块的各特征向量,基于第一通道对各特征向量进行处理,得到与每种类型对应的第一分类信息以及目标向量,基于第二通道对目标向量进行处理,得到与每种类型对应的第二分类信息;对第一分类信息和第二分类信息进行处理,得到目标分类结果。本方案中,可以通过第一通道得到每种类型对应的第一分类信息以及目标向量;通过第二通道对目标向量进行处理,得到每种类型对应的第二分类信息;根据第一、第二分类信息,得到分类结果。可在一定程度上提高分型的准确率。

    针对单细胞染色质开放性测序数据的细胞类型识别方法

    公开(公告)号:CN114913923A

    公开(公告)日:2022-08-16

    申请号:CN202210496320.5

    申请日:2022-05-09

    Applicant: 清华大学

    Abstract: 本发明提供一种针对单细胞染色质开放性测序数据的细胞类型识别方法、系统、电子设备及存储介质,属于细胞检测技术领域,通过获得有效表征训练集特征的贝叶斯神经网络模型,实现对单细胞染色质开放性数据进行高精度的细胞类型识别。本发明的包含混合高斯模型的叶贝斯神经网络,作为一种概率生成模型,能够生成与真实数据高度吻合、无批次效应的仿真单细胞染色质开放性数据,适用于单细胞染色质开放性测序数据的细胞类型检测的数据仿真场景中。

    医疗数据系统的权限管理方法

    公开(公告)号:CN111062051B

    公开(公告)日:2022-05-20

    申请号:CN201911199645.1

    申请日:2019-11-29

    Applicant: 清华大学

    Abstract: 本发明提供一种医疗数据系统的权限管理方法,包括:采取默克尔有向无环图存储医疗数据的权限为记录,记录包括内容、内容哈希值、前左记录哈希值、前右记录哈希值和记录哈希值,内容包括首记录哈希值、受权人、授权记录哈希值、权限、授权日期和有效期,将医疗数据在医疗数据系统生成时的权限对应的记录作为首记录,首记录哈希值是首记录的记录哈希值,授权记录哈希值是授权人获得授权权利的记录的记录哈希值,记录哈希值是本记录的内容哈希值、前左记录哈希值和前右记录哈希值三者拼接后,通过哈希运算生成的哈希值。上述方法能够快速检验权限历史篡改情况。

    基于CT影像的肿瘤演进过程分析方法、系统及存储介质

    公开(公告)号:CN114334128A

    公开(公告)日:2022-04-12

    申请号:CN202111446542.8

    申请日:2021-11-30

    Applicant: 清华大学

    Abstract: 本发明涉及智能医学领域,提供一种基于CT影像的肿瘤演进过程分析方法、系统及存储介质,将待检测肿瘤的原始CT影像进行降噪预处理获得肿瘤图像矩阵;对肿瘤图像矩阵进行定位标注,获得含有肿瘤位置信息的图像矩阵;将含有肿瘤位置信息的图像矩阵输入肿瘤影像深度网络模型,获得肿瘤特征向量;将所获得的肿瘤特征向量投影到通过训练预先获取的肿瘤演进轨迹上,获得待检测肿瘤在肿瘤演进轨迹上的位置;根据待检测肿瘤在肿瘤演进轨迹上的位置,获得并输出待检测肿瘤的肿瘤演进过程的评分;达到了准确提供肿瘤在演进过程中所处的阶段,辅助医生精准判断肿瘤病灶的临床特性的技术效果。

    突变数据识别方法、训练方法、处理装置及存储介质

    公开(公告)号:CN110993028B

    公开(公告)日:2022-03-29

    申请号:CN201911304571.3

    申请日:2019-12-17

    Applicant: 清华大学

    Abstract: 本申请公开了一种突变数据识别方法、训练方法、处理装置及存储介质。本申请公开能够同时整合大量非编码区调控因子测序数据和少量非编码区已知有害突变的方法,克服了深度学习模型容易过拟合的缺点,从而对非编码区突变的有害性做出有效的预测。第二,本申请计算效率高,能够在数小时内即能完成模型训练。第三,本申请仅需基序列信息即能完成对非编码区突变有害性的预测,不需要基因表达矩阵等信息的辅助,方便使用。

    二阶段联邦学习方法、系统

    公开(公告)号:CN113723617A

    公开(公告)日:2021-11-30

    申请号:CN202110986930.9

    申请日:2021-08-26

    Applicant: 清华大学

    Abstract: 本发明提供一种二阶段联邦学习方法、系统,按照预设的第一轮次数重复基于特征融合算法根据本地模型和新全局模型进行一阶段联邦学习,以更新本地模型的本地权重和新全局模型的参数,并将更新的新全局模型作为二阶段全局模型,再通过预设的测试数据对二阶段全局模型进行收敛测试以获取准确率,若准确率收敛,则将二阶段全局模型作为客户端的二阶段本地模型,并重复基于联邦平均算法进行二阶段联邦学习,以更新二阶段本地模型的本地权重,若重复次数达到预设的第二轮次数,则完成二阶段联邦学习,如此,改变原模型训练的损失函数,使得本地模型在更新时更接近于从服务器端收到的全局模型,从而减轻用户本地数据的过多影响,进而使模型更快地具有泛化能力,提高收敛速度。

    病历数据结构化分析处理方法

    公开(公告)号:CN109003677B

    公开(公告)日:2021-11-05

    申请号:CN201810594098.6

    申请日:2018-06-11

    Applicant: 清华大学

    Abstract: 本发明公开了一种病历数据结构化分析处理方法。该方法包括以下步骤:对原始病历文本进行预处理,得到诊断结果和不含诊断结果的文本;对不含诊断结果的文本进行关键词识别;提取关键词特征向量,进行机器学习、空间可视化与分类分析;根据分析结果计算不同关键词与诊断结果的相关程度。本发明方法能够最大限度地减小病历格式差异对于分析造成的影响,具有普遍适用性,能够广泛运用于各种格式病历的分析;能够在训练数据的引导下对于不同科室的病历进行分类分析;能够为今后病历结构化文本构建基础信息,及病历相关性分析提供参考。

    一种仿真文本病历的生成方法及系统

    公开(公告)号:CN109003678B

    公开(公告)日:2021-04-30

    申请号:CN201810600640.4

    申请日:2018-06-12

    Applicant: 清华大学

    Abstract: 一种仿真文本病历的生成方法及系统,采用原始病历生成正样本,生成器每次循环以上一次循环输出的词向量和疾病标签向量为输入,输出新的词向量,重复多次生成由多个词向量组成的句子。每生成一个词向量,以已生成词向量序列为初始状态,重复运行生成器采样,生成多个句子,判别器对所有句子的奖励值取平均值,作为该次的词向量的奖励值,根据得到的句子和词向量的奖励值更新生成器,如此反复直至收敛。收敛的生成器生成负样本,与正样本组成混合病历数据集,以疾病标签向量和词向量序列为输入,得到每一病历来自真实病历的概率,更新判别器,如此反复直至收敛。本发明避免涉及病人隐私,仿真文本病历可辅助其它机器学习任务,方便对该疾病的研究。

    一种中文电子病历文本分析方法与系统

    公开(公告)号:CN108831559B

    公开(公告)日:2021-01-15

    申请号:CN201810635258.7

    申请日:2018-06-20

    Applicant: 清华大学

    Abstract: 中文电子病历文本分析方法与系统,该方法包括以下步骤:利用病历文本获取病历数据集;用正则处理分离数值变量和文本信息,根据上下文表述确定数值信息含义,利用正则表达式搜索并结构化保存不同类别的时间信息;采用自然语言处理对文本分词及词性标注,结合医学实体识别进一步筛选,确定文本中医学关键词汇的位置及类型;分析筛选出医学关键词汇和信息;利用上述相关结果,对病历进行仿真;将文本内容转化成数值向量;对各病历文本添加相似性标签;对病历文本的标注进行学习;根据标注和训练结果对新到的病历样本在病历数据集中筛选出具有相似性的病历。本发明对不同的评价标准,每一新到病历文本可从已有病历文本中找到不同的相似病历文本簇。

    基于支持向量机的图像处理装置及方法

    公开(公告)号:CN108921172B

    公开(公告)日:2021-01-12

    申请号:CN201810550987.2

    申请日:2018-05-31

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于支持向量机的图像处理装置。该装置包括:图像块获取模块,用于获取图像块;特征提取模块,提取图像块特征,得到特征向量,包括:第一提取单元,第二提取单元,第三提取单元,以及第四提取单元;图像识别模块,基于邻近算法,从低级别到高级别,根据某一级别中是否存在大于该级别预先设置的阈值的置信分数识别该图像块是否正常;图像分类模块,基于支持向量机对图像分类;数据处理模块,对识别出的图像块数目和分类出的图像块数目进行处理,完成图像的识别和分类。本发明还公开了一种基于支持向量机的图像处理方法。本发明可以快速、准确的完成图像识别与分类,提高了识别和分类的准确性,可应用于病理组织图片处理。

Patent Agency Ranking