-
公开(公告)号:CN114662568A
公开(公告)日:2022-06-24
申请号:CN202210209523.1
申请日:2022-03-04
Applicant: 清华大学 , 百度在线网络技术(北京)有限公司
IPC: G06K9/62
Abstract: 本发明提供一种数据分类方法、装置、设备和存储介质,包括:将待分类数据集的多个待分类数据子集分别输入预设的多个单一分类器,得到多个单一分类结果,其中,所述多个单一分类器是采用训练数据子集对多个初始的单一分类模型训练得到的,所述训练数据子集是采用粒子群优化算法对训练数据集中的样本数据进行动态选取得到的;采用投票机制将所述多个单一分类结果进行整合,得到所述待分类数据集的第一数据分类结果。本发明的技术方案可以实现提高非均衡数据集分类任务的处理效率、优化分类效果。
-
公开(公告)号:CN113767401A
公开(公告)日:2021-12-07
申请号:CN202080005552.5
申请日:2020-04-03
Applicant: 清华大学 , 百度在线网络技术(北京)有限公司
IPC: G06N3/04
Abstract: 一种跨医疗数据源的网络表示学习算法,包括:S1,生成包括源网络和目标网络的医疗网络数据;S2,从源网络和目标网络随机采样设定数量的节点;S3,得到一个L层的神经网络,并对每一层分别计算源网络和目标网络的结构特征和表达特征,计算源网络和目标网络的网络特征之间的距离损失;S4,得到源网络在L层神经网络的输出,并根据分类损失和距离损失计算损失值,根据反向传播算法更新算法的参数;S5,重复步骤S2‑S4,直至整个算法收敛,使得算法对于疾病分类的准确率在多个迭代内不再上升。有益效果:考虑了不同医院数据源之间数据分布不一致的问题,通过提取网络的结构信息及节点属性信息、最小化特征距离弥补信息损失,有着广阔的应用空间。
-
公开(公告)号:CN112967246A
公开(公告)日:2021-06-15
申请号:CN202110232004.2
申请日:2021-03-02
Applicant: 清华大学 , 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种用于临床决策支持系统的X射线影像辅助装置及方法,该装置包括:胸片影像采集模块,用于获取待分类的X射线胸片影像,所述X射线胸片影像包括正位X射线胸片影像和/或侧位X射线胸片影像;胸片影像分类辅助模块,用于将所述X射线胸片影像输入到训练好的X射线影像辅助模型中,得到所述X射线胸片影像的分类结果和病灶标注位置,其中,所述训练好的X射线影像辅助模型是由标注有病种类型的样本X射线胸片影像,对DenseNet‑121网络进行训练得到的。本发明使得临床决策支持系统可以给出可信度较高的医疗辅助结果,有效节省了医生工作时间,且能够对病灶部位进行标注,进一步提高了辅助结果的可信度。
-
公开(公告)号:CN109145099B
公开(公告)日:2021-02-23
申请号:CN201810942612.0
申请日:2018-08-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F40/30
Abstract: 本发明提出了一种基于人工智能的问答方法和装置,其中,方法包括:获取用户发送的目标问题,提取目标问题的第一特征向量;查询预设的问答信息库获取预存的与每个问题集合对应的第二特征向量,按照预设算法计算每个问题集合的第二特征向量与目标问题的第一特征向量之间的匹配度;将所有的匹配度分别与预设阈值比较,获取大于阈值的最大匹配度,并确定与最大匹配度对应的目标问题集合;查询问答信息库获取预存的与目标问题集合对应的答复文本片段,并将答复文本片段反馈给用户。由此,智能化的根据用户输入的问题提供答案,有效扩展了问答技术可处理的问题范围和能力,有利于增加用户和产品的粘性。
-
公开(公告)号:CN109086438B
公开(公告)日:2021-02-19
申请号:CN201810929414.0
申请日:2018-08-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F16/36
Abstract: 本申请实施例公开了用于查询信息的方法和装置。该方法的一具体实施方式包括:获取目标查询问题文本;从该目标查询问题文本中提取实体,生成该目标查询问题文本的实体集合;将该目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到该目标查询问题文本的查询实体集合;对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与该查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,输出该问题文本。
-
公开(公告)号:CN109033244B
公开(公告)日:2020-10-16
申请号:CN201810729232.9
申请日:2018-07-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F16/338 , G06F40/289 , G06F40/30 , G06F16/9538
Abstract: 本发明实施例提出一种搜索结果排序方法和装置。该方法包括:从第一排序结果中获取用户请求和候选结果,用户请求中包括搜索问题,候选结果中包括候选问题和每个候选问题对应的候选答案;获取搜索问题与候选问题的第一相关性指标;获取搜索问题与候选答案的第二相关性指标;根据第一相关性指标和第二相关性指标,对第一排序结果进行重排序,得到第二排序结果。因为在第二排序中加入了更多特定的相关性指标,从而使排序结果不受单一排序方法的限定,可以更好更方便地提供精准的回答排序以及处理一些特定的问题。
-
公开(公告)号:CN109902233A
公开(公告)日:2019-06-18
申请号:CN201910149015.7
申请日:2019-02-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F17/27
Abstract: 本发明实施例公开了一种智能对象推荐方法、装置、设备和存储介质。所述方法包括:根据获取的用户主诉描述信息和候选对象专长信息,分别生成用户特征表示和候选对象特征表示;根据用户特征表示和候选对象特征表示,确定候选对象对用户的响应度;根据候选对象对用户的响应度,从所述候选对象中为用户选择目标对象。本发明实施例通过用户主诉描述信息和候选对象专长信息,分别生成用户特征表示和候选对象特征表示,并根据获取的用户特征表示和候选对象特征表示,来确定候选对象对用户的响应度,最终根据响应度来为用户选择目标对象,实现了基于用户主诉描述信息,向用户推荐目标对象,该方法精准度高、稳定性好。
-
公开(公告)号:CN109840280A
公开(公告)日:2019-06-04
申请号:CN201910165382.6
申请日:2019-03-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提出一种文本分类方法、装置及计算机可读存储介质,其中方法包括:对待分类文本进行识别,得到至少一个维度的信息;其中,所述至少一个维度的信息至少包括有文本元素以及医疗特征信息;对所述至少一个维度的信息进行编码,得到每一个维度所对应的初始向量;基于每一个维度所对应的初始向量,确定所述待分类文本的医疗标签。
-
公开(公告)号:CN113767401B
公开(公告)日:2025-01-03
申请号:CN202080005552.5
申请日:2020-04-03
Applicant: 清华大学 , 百度在线网络技术(北京)有限公司
Abstract: 本公开提出一种跨医疗数据源的网络表示学习方法,包括:S1,生成包括源网络和目标网络的医疗网络数据;S2,从源网络和目标网络随机采样设定数量的节点;S3,得到一个L层的神经网络,并对每一层分别计算源网络和目标网络的结构特征和表达特征,计算源网络和目标网络的网络特征之间的距离损失;S4,得到源网络在L层神经网络的输出,并根据分类损失和距离损失计算损失值,根据反向传播算法更新算法的参数;S5,重复步骤S2‑S4,直至整个算法收敛,使得算法对于疾病分类的准确率在多个迭代内不再上升。本公开考虑了不同医院数据源之间的数据分布不一致问题,通过提取网络的结构信息及节点属性信息、最小化特征距离弥补信息损失,有着广阔的应用空间。
-
公开(公告)号:CN114818969A
公开(公告)日:2022-07-29
申请号:CN202210520719.2
申请日:2022-05-13
Applicant: 清华大学 , 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种变点位置及类别的检测方法及装置。该方法包括:对输入的多维度生理变量图时序数据进行基线抽取,得到各维度生理变量图时序数据的基线序列;对该基线序列中的所有时间点进行筛选,得到各维度生理变量图时序数据对应的候选变点;按照候选变点的时间差距,对该候选变点进行分组,得到多个候选变点组;采用基于投票的广义似然比GLR算法对多个候选变点组内的候选变点进行投票,根据投票结果确定变点;根据该变点的位置从各维度生理变量图时序数据中抽取变点序列数据,该变点序列数据中包括变点;以树形结构分裂的形式对抽取到的变点序列数据进行聚类,得到变点分类结果。该方法有利于医疗领域变点位置及类别的检测。
-
-
-
-
-
-
-
-
-