建立文本分类模型以及文本分类的方法、装置

    公开(公告)号:CN107908635B

    公开(公告)日:2021-04-16

    申请号:CN201710882685.0

    申请日:2017-09-26

    Abstract: 本发明提供一种建立文本分类模型与文本分类的方法、装置,建立方法包括:获取训练样本;基于实体词典对文本进行切词后获取对应的向量矩阵;利用文本的向量矩阵以及文本的分类,训练第一分类模型和第二分类模型;在训练过程中,利用第一分类模型与第二分类模型的损失函数得到文本分类模型的损失函数,并利用文本分类模型的损失函数对第一和第二分类模型调整参数,得到由第一和第二分类模型构成的文本分类模型。文本分类的方法包括:获取待分类的文本;基于实体词典对文本进行切词后获取文本对应的向量矩阵;将向量矩阵输入文本分类模型,根据文本分类模型的输出,得到该文本的分类结果。通过本发明所提供的技术方案,能够提高文本分类的效果。

    一种信息推荐方法及装置

    公开(公告)号:CN105069036A

    公开(公告)日:2015-11-18

    申请号:CN201510435003.2

    申请日:2015-07-22

    CPC classification number: G06F16/9535

    Abstract: 本发明实施例提供了一种信息推荐方法及装置。一方面,本发明实施例通过获取查询词和用户场景信息;从而,利用医疗机构的排序模型对所述查询词和所述用户场景信息进行处理,以获得所述医疗机构的排序信息;进而,根据所述医疗机构的排序信息,获得推荐的医疗机构信息。因此,本发明实施例提供的技术方案用以解决现有技术中推荐医疗机构的准确性和可靠性比较低的问题。

    用于输出信息的方法和装置

    公开(公告)号:CN107729319B

    公开(公告)日:2021-03-09

    申请号:CN201710972236.5

    申请日:2017-10-18

    Abstract: 本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:提取目标医疗文本中的至少一个医疗实体关键词和至少一个属性关键词;然后,生成关键词对集合,其中,关键词对包括所提取的医疗实体关键词和所提取的属性关键词;再,对于关键词对集合中的每个关键词对,提取该关键词对在目标医疗文本中的文本特征,并将所提取的文本特征导入预先训练的关联关系确定模型,得到与该关键词对对应的关联结果;最后,输出关键词对集合中具有关联关系的关键词对。该实施方式提取了与医疗文本中的医疗实体关键词具有关联关系的属性关键词,从而提高了信息输出内容的丰富性。

    建立文本分类模型以及文本分类的方法、装置

    公开(公告)号:CN107908635A

    公开(公告)日:2018-04-13

    申请号:CN201710882685.0

    申请日:2017-09-26

    CPC classification number: G06F17/30705 G06N3/0454

    Abstract: 本发明提供一种建立文本分类模型与文本分类的方法、装置,建立方法包括:获取训练样本;基于实体词典对文本进行切词后获取对应的向量矩阵;利用文本的向量矩阵以及文本的分类,训练第一分类模型和第二分类模型;在训练过程中,利用第一分类模型与第二分类模型的损失函数得到文本分类模型的损失函数,并利用文本分类模型的损失函数对第一和第二分类模型调整参数,得到由第一和第二分类模型构成的文本分类模型。文本分类的方法包括:获取待分类的文本;基于实体词典对文本进行切词后获取文本对应的向量矩阵;将向量矩阵输入文本分类模型,根据文本分类模型的输出,得到该文本的分类结果。通过本发明所提供的技术方案,能够提高文本分类的效果。

    用于输出信息的方法和装置

    公开(公告)号:CN107729319A

    公开(公告)日:2018-02-23

    申请号:CN201710972236.5

    申请日:2017-10-18

    Abstract: 本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:提取目标医疗文本中的至少一个医疗实体关键词和至少一个属性关键词;然后,生成关键词对集合,其中,关键词对包括所提取的医疗实体关键词和所提取的属性关键词;再,对于关键词对集合中的每个关键词对,提取该关键词对在目标医疗文本中的文本特征,并将所提取的文本特征导入预先训练的关联关系确定模型,得到与该关键词对对应的关联结果;最后,输出关键词对集合中具有关联关系的关键词对。该实施方式提取了与医疗文本中的医疗实体关键词具有关联关系的属性关键词,从而提高了信息输出内容的丰富性。

    用于生成信息的方法和装置

    公开(公告)号:CN107910060A

    公开(公告)日:2018-04-13

    申请号:CN201711242792.3

    申请日:2017-11-30

    CPC classification number: G06N3/0454

    Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取描述同一病症的至少两种类型的病症描述信息,其中,病症描述信息的类型包括文本类型、语音类型或图像类型;对于所获取的每种类型的病症描述信息,将该种类型的病症描述信息导入预先建立的与该种类型对应的特征提取模型,生成与该种类型的病症描述信息对应的特征信息,其中,特征提取模型用于表征病症描述信息与特征信息之间的对应关系;将所生成的特征信息导入预先建立的特征融合模型,生成该病症描述信息所描述的病症属于预定义的病症的概率值,其中,该特征融合模型用于表征特征信息与概率值之间的对应关系。该实施方式丰富了生成信息的方式。

Patent Agency Ranking