-
公开(公告)号:CN114023447A
公开(公告)日:2022-02-08
申请号:CN202111480742.5
申请日:2021-12-06
Applicant: 清华大学 , 中国医学科学院北京协和医院
Abstract: 本公开涉及一种罕见病患者数量预测模型训练方法及装置,所述方法包括:对罕见病名称的文本进行预处理,获得罕见病查询关键词数据库;根据罕见病查询关键词数据库,以及查询历史数据库,确定在多个地区的多个时间段内,对于多种罕见病的查询人数;根据查询人数以及确诊人数,对罕见病患者数量预测模型进行训练。根据本公开的实施例的罕见病患者数量预测模型训练方法,可对罕见病名称的文本进行预处理,减少查询数据的遗漏,提升数据的准确度。且可基于搜索引擎的查询历史数据库预测查询罕见病信息的人数,进而基于人数和实际的确诊人数来训练罕见病患者数量预测模型,提升模型对罕见病患者数量的预测精度。
-
公开(公告)号:CN116598004B
公开(公告)日:2023-11-28
申请号:CN202310869443.3
申请日:2023-07-17
Applicant: 清华大学 , 中国医学科学院北京协和医院
IPC: G16H50/30 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/08
Abstract: 本申请涉及一种患病率的预测方法、装置、计算机设备和存储介质。所述方法包括:根据关键词表从搜索引擎的历史数据库中提取会话数据集;将会话数据集输入至会话分类模型中进行会话分类,得到分类结果;根据分类结果对会话数据集进行筛选,得到目标会话数据集;将目标会话数据集输入至预测模型中进行患病率预测,得到预测结果。采用本方法能够提高罕见病患病率的预测准确度。
-
公开(公告)号:CN116598004A
公开(公告)日:2023-08-15
申请号:CN202310869443.3
申请日:2023-07-17
Applicant: 清华大学 , 中国医学科学院北京协和医院
IPC: G16H50/30 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/08
Abstract: 本申请涉及一种患病率的预测方法、装置、计算机设备和存储介质。所述方法包括:根据关键词表从搜索引擎的历史数据库中提取会话数据集;将会话数据集输入至会话分类模型中进行会话分类,得到分类结果;根据分类结果对会话数据集进行筛选,得到目标会话数据集;将目标会话数据集输入至预测模型中进行患病率预测,得到预测结果。采用本方法能够提高罕见病患病率的预测准确度。
-
公开(公告)号:CN111538830B
公开(公告)日:2023-09-05
申请号:CN202010350649.1
申请日:2020-04-28
Applicant: 清华大学
IPC: G06F16/34 , G06F16/335 , G06F16/338
Abstract: 本公开涉及计算机技术领域,尤其涉及一种法条检索方法、装置、计算机设备及存储介质。所述方法包括:根据待查询案例的案情描述文本,生成待查询的文本摘要;获取候选法条集合;根据待查询的文本摘要和候选法条集合,调用预设检索模型输出得到多个候选法条各自对应的评分;根据多个候选法条各自对应的评分,显示至少两个候选法条。本公开实施例通过基于待查询案例的案情描述文本,计算机设备可以自动生成对应的文本摘要以进行检索,提高了检索的便利性。并且,通过调用预设检索模型得到多个候选法条各自对应的评分,由于评分用于指示候选法条与文本摘要之间的相关性,进而能够快速的确定出与文本摘要相关的法条,提高了检索的准确性。
-
公开(公告)号:CN111538827B
公开(公告)日:2023-09-05
申请号:CN202010350837.4
申请日:2020-04-28
Applicant: 清华大学
IPC: G06F16/335 , G06N3/0442 , G06N3/08
Abstract: 本公开涉及一种基于内容和图神经网络的判例推荐方法、装置及存储介质,所述方法包括:根据目标用户的日志数据,从判例库中确定出多个候选判例;根据所述目标用户的兴趣特征信息及所述多个候选判例的第一特征信息,分别预测所述目标用户对各个候选判例的评分,其中,所述兴趣特征信息包括目标用户的长期兴趣特征和短期兴趣特征,所述长期兴趣特征及所述第一特征信息是通过图神经网络确定的;根据所述评分及预设的推荐数量,确定向所述目标用户推荐的目标判例。根据本公开实施例的判例推荐方法能够有效提高判例推荐的准确性。
-
公开(公告)号:CN111414539A
公开(公告)日:2020-07-14
申请号:CN202010197501.9
申请日:2020-03-19
Applicant: 清华大学 , 智者四海(北京)技术有限公司
IPC: G06F16/9535 , G06F16/435 , G06F16/335 , G06Q30/06 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种基于特征增强的推荐系统神经网络训练方法及装置,所述方法包括:将第一训练集中的多个第一样本,输入第t轮待训练的神经网络中进行处理,得到与多个第一样本对应的预测分值;根据多个第一样本的特征信息及与多个第一样本对应的预测分值,分别确定神经网络对各个属性的关注度;根据关注度阈值及神经网络对各个属性的关注度,分别确定各个属性的增强概率;根据第一增强率及增强概率,从多个第一样本的特征信息中,确定出待更新的特征信息;根据待更新的特征信息及噪声特征值,更新第一训练集中的第一样本,得到更新后的第二训练集;根据第二训练集,对神经网络进行第t轮训练。本公开的实施例可提高神经网络的鲁棒性。
-
公开(公告)号:CN106897254B
公开(公告)日:2020-01-21
申请号:CN201510958761.2
申请日:2015-12-18
Applicant: 清华大学
Abstract: 本发明提供了一种网络表示学习方法,本发明综合考虑文本信息以及网络结构进行学习,并针对文本信息部分,设计了不同类型的基于连续词袋以及基于卷积神经网络的文本编码模型,本发明不仅利用了网络中节点的网络结构信息,对当前节点的邻居节点进行预测,也利用了节点的文本信息,对当前节点文本信息的表示向量进行了预测,本发明的方法,能够有效的将节点的文本信息以及网络结构信息编码到表示向量中,同时在节点分类的任务上显著的提高了分类准确率。同时本方法充分考虑了实际网络中的有效信息,例如文本信息,在不同类型的信息网络数据上都取得了优异的效果,具有良好的实用性。
-
公开(公告)号:CN109145213A
公开(公告)日:2019-01-04
申请号:CN201810962635.8
申请日:2018-08-22
Applicant: 清华大学
IPC: G06F16/9535 , G06F16/33
Abstract: 本公开涉及一种基于历史信息的查询推荐方法及装置,包括:响应于当前查询会话中当前查询的查询操作,获取所述当前查询会话的多个历史查询的历史查询词以及与所述多个历史查询对应的目标文档的标题信息,所述目标文档为历史查询中被浏览过的文档;根据所述目标文档的标题信息及所述历史查询词,生成与当前查询会话对应的上下文向量;获取所述当前查询的查询词相匹配的多个候选查询词;根据所述上下文向量,确定所述多个候选查询词的推荐分值;根据所述推荐分值,从所述多个候选查询词中确定所述当前查询的推荐查询词。根据本公开提供的一种基于历史信息的查询推荐方法及装置,能够提高推荐查询词的精准度。
-
公开(公告)号:CN109086417A
公开(公告)日:2018-12-25
申请号:CN201810885991.4
申请日:2018-08-06
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本公开涉及一种搜索评价方法及装置,所述方法包括:根据搜索结果的相关性评分和点击必要性评分,确定搜索结果被点击的概率;根据搜索结果的摘要的深度、目标页面的深度以及被点击的概率,确定搜索结果的期望浏览深度;根据搜索结果的期望浏览深度,确定搜索结果的期望浏览起始深度;根据搜索结果的期望浏览起始深度、摘要的深度、目标页面的深度、相关性评分以及浏览深度分布函数,确定搜索结果的收益;根据搜索结果的收益,确定搜索页面的评分。根据本公开的实施例的搜索评价方法及装置,在确定搜索页面的评分时,将搜索结果的摘要的深度和目标页面的深度考虑到指标的设计中,可较好地反映用户的使用体验。
-
公开(公告)号:CN106897254A
公开(公告)日:2017-06-27
申请号:CN201510958761.2
申请日:2015-12-18
Applicant: 清华大学
IPC: G06F17/22
Abstract: 本发明提供了一种网络表示学习方法,本发明综合考虑文本信息以及网络结构进行学习,并针对文本信息部分,设计了不同类型的基于连续词袋以及基于卷积神经网络的文本编码模型,本发明不仅利用了网络中节点的网络结构信息,对当前节点的邻居节点进行预测,也利用了节点的文本信息,对当前节点文本信息的表示向量进行了预测,本发明的方法,能够有效的将节点的文本信息以及网络结构信息编码到表示向量中,同时在节点分类的任务上显著的提高了分类准确率。同时本方法充分考虑了实际网络中的有效信息,例如文本信息,在不同类型的信息网络数据上都取得了优异的效果,具有良好的实用性。
-
-
-
-
-
-
-
-
-