训练文本分类模型及文本分类的方法、装置及存储介质

    公开(公告)号:CN112131366B

    公开(公告)日:2024-02-09

    申请号:CN202011009658.0

    申请日:2020-09-23

    Abstract: 本申请提供一种训练文本分类模型及文本分类的方法、装置及存储介质,涉及人工智能云技术,以提高文本分类的准确性。通过输入层将第一样本数据输入语言模型编码层,获得第一样本数据的第一特征向量,第一样本数据包含至少一组问答对和用于确定问答对中问题的答案的文本信息;通过嵌入层中引入的关键词突出操作,将第一特征向量中用于表征文本信息的特征向量,根据第一特征向量中用于表征问答对的特征向量进行关键词突出,以获得文本信息的第二特征向量;将第二特征向量和用于表征问答对的特征向量输入到全连接层,确定问答对中问题对应的答案概率;根据全连接层输出的答案概率和第一样本数据中的答案,反向调整语言模型编码层的模型参数。

    智能问答方法、装置、计算机设备和存储介质

    公开(公告)号:CN111708873B

    公开(公告)日:2023-11-24

    申请号:CN202010545399.7

    申请日:2020-06-15

    Abstract: 本申请涉及一种智能问答方法、装置、计算机设备和存储介质。所述方法包括获取待回答的目标问题;获取与所述目标问题的语义相关的目标语义意图;获取与所述目标问题对应的目标语句向量匹配的子意图代表向量,作为目标子意图代表向量,所述子意图代表向量是对所述目标语义意图对应的问题向量集合进行聚类,得到的各个子意图类别对应的代表向量;将所述目标子意图代表向量所对应的子意图作为目标子意图,获取与所述目标子意图匹配的问题,作为参考问题;根据所述参考问题对应的参考答案得到所述目标问题的目标答案。其中,可以基于人工智能模型对目标问题进行语义意图识别,采用本方法能够提高得到的问题的答案的准确度。(56)对比文件侯丽仙;李艳玲;林民;李成城.融合多约束条件的意图和语义槽填充联合识别.计算机科学与探索.2019,(第09期),全文.陈斯斯;董立平;许丹;郭继军.医学文献主题新颖性探测方法对比分析.中华医学图书情报杂志.2018,(第02期),全文.

    相似对象确定方法、装置、设备及存储介质

    公开(公告)号:CN113628709B

    公开(公告)日:2022-02-11

    申请号:CN202111177589.9

    申请日:2021-10-09

    Inventor: 张先礼 管冲

    Abstract: 本申请公开了一种相似对象确定方法、装置、设备及存储介质,属于计算机与互联网技术领域。所述方法包括:获取第一对象的特征数据;基于特征数据,获取第一对象的多个局部特征向量;确定第一对象的多个局部特征向量,与第二对象的多个局部特征向量之间的相似度;在满足预设条件的情况下,确定第一对象与第二对象具有相似性。本申请中,局部特征向量用于表征第一对象在一个时段内的特征,使得局部特征向量能够更加细致地体现第一对象的特征,在局部特征向量能够表征第一对象的第一状态的情况下,避免后续处理中处于第一状态的局部特征向量与处于第二状态的局部特征向量之间的相互影响,提高后续处理结果的准确度。

    文本匹配方法、装置、电子设备以及存储介质

    公开(公告)号:CN111931477A

    公开(公告)日:2020-11-13

    申请号:CN202011045975.8

    申请日:2020-09-29

    Abstract: 本申请公开了一种文本匹配方法、装置、电子设备以及存储介质,包括:获取包含多个文本单字的待匹配文本以及所述待匹配文本对应的参考词典,所述参考词典为所述待匹配文本的内容所属领域的词典,其中,所述参考词典包括至少一个参考词;对多个文本单字进行组合,得到与至少一个参考词语义关联的候选词;根据所述候选词与至少一个参考词在目标匹配类型下的编辑距离,生成所述候选词与目标参考词之间的匹配度;融合各匹配类型下所述候选词与目标参考词之间的匹配度;根据融合结果从预设参考文本库中选择与所述待匹配文本匹配的参考文本,并输出所述参考文本,该方案可以提高文本匹配的准确性。

    标注数据获取方法、分诊方法、装置、存储介质及设备

    公开(公告)号:CN110534185B

    公开(公告)日:2024-08-20

    申请号:CN201910818358.8

    申请日:2019-08-30

    Abstract: 本申请实施例提供一种标注数据获取方法、分诊方法、装置、存储介质及设备,实现分诊系统所需的标注数据通过从电子病历和已有分诊系统中的电子分诊记录中提取得到,无需专家编写和修正医学相关知识库,也无需进行人工标注,简化了标注数据的获取和维护所需的人力成本,从而降低分诊系统的维护成本。而且,分诊模型充分考虑了疾病和科室之间的隐含的相关性,不仅能够预测科室,还能预测疾病,与现有技术中疾病和科室通过不同的模型进行预测相比,实现成本更低,预测速度更快,准确率更高。

    文本相似度确定方法、装置、设备及存储介质

    公开(公告)号:CN112149414A

    公开(公告)日:2020-12-29

    申请号:CN202011009879.8

    申请日:2020-09-23

    Abstract: 本申请公开了一种文本相似度确定方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取第一文本;确定第一文本中包含的要素词;对于N个要素种类中的目标要素种类,获取第一文本中属于目标要素种类的各个目标要素词与第二文本中属于目标要素种类的各个目标要素词之间的字词相似度;基于字词相似度,确定第一文本与第二文本在目标要素种类上的相似度;基于第一文本与第二文本在N个要素种类上的相似度,确定第一文本与第二文本之间的相似度。本申请实施例提供的技术方案,从要素词相似的角度确定不同文本在各个要素种类上的相似度,进而确定不同文本的相似度,提升了不同文本间相似度确定的准确性,扩大了适用范围。

    一种数据处理方法、装置、智能设备及介质

    公开(公告)号:CN111666477A

    公开(公告)日:2020-09-15

    申请号:CN202010570923.6

    申请日:2020-06-19

    Abstract: 本申请实施例公开了一种数据处理方法、装置、智能设备及计算机可读存储介质。其中方法包括:获取目标用户的描述信息及静态属性信息,将描述信息和静态属性信息作为结合了人工智能及机器学习而构建的数据分析模型的输入,并获取数据分析模型在对描述信息和静态属性信息进行分析处理后输出的分析结果,根据该分析结果输出目标用户的疾病提示信息。本申请实施例结合人工智能及机器学习模型挖掘已有病历数据中隐藏的、具有潜在价值的信息,使得能够基于这些信息和目标用户的描述信息对该目标用户的患病信息进行预测,为目标用户提供就诊参考。

    标注数据获取方法、分诊方法、装置、存储介质及设备

    公开(公告)号:CN110534185A

    公开(公告)日:2019-12-03

    申请号:CN201910818358.8

    申请日:2019-08-30

    Abstract: 本申请实施例提供一种标注数据获取方法、分诊方法、装置、存储介质及设备,实现分诊系统所需的标注数据通过从电子病历和已有分诊系统中的电子分诊记录中提取得到,无需专家编写和修正医学相关知识库,也无需进行人工标注,简化了标注数据的获取和维护所需的人力成本,从而降低分诊系统的维护成本。而且,分诊模型充分考虑了疾病和科室之间的隐含的相关性,不仅能够预测科室,还能预测疾病,与现有技术中疾病和科室通过不同的模型进行预测相比,实现成本更低,预测速度更快,准确率更高。

    医疗文本处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN113673244B

    公开(公告)日:2024-05-10

    申请号:CN202110001747.9

    申请日:2021-01-04

    Inventor: 张先礼 管冲 陈曦

    Abstract: 本申请涉及一种医疗文本处理方法、装置、计算机设备和存储介质。所述方法涉及人工智能的自然语言处理技术,所述方法包括:获取医疗文本中的实体序列;根据医学知识图谱查询实体序列对应的子图序列;对子图序列中各子图进行图卷积操作后,获得子图序列表示;将实体序列中各实体对应的分布式向量表示,和各实体在医学知识图谱中的邻居节点所对应的分布式向量表示进行融合,获得实体序列对应的实体序列表示;基于子图序列表示和实体序列表示,确定医疗文本属于预定类别的概率。采用本方法能够提高确定医疗文本属于预定类别的概率的准确率。

    文本相似度确定方法、装置、设备及存储介质

    公开(公告)号:CN112149414B

    公开(公告)日:2023-06-23

    申请号:CN202011009879.8

    申请日:2020-09-23

    Abstract: 本申请公开了一种文本相似度确定方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取第一文本;确定第一文本中包含的要素词;对于N个要素种类中的目标要素种类,获取第一文本中属于目标要素种类的各个目标要素词与第二文本中属于目标要素种类的各个目标要素词之间的字词相似度;基于字词相似度,确定第一文本与第二文本在目标要素种类上的相似度;基于第一文本与第二文本在N个要素种类上的相似度,确定第一文本与第二文本之间的相似度。本申请实施例提供的技术方案,从要素词相似的角度确定不同文本在各个要素种类上的相似度,进而确定不同文本的相似度,提升了不同文本间相似度确定的准确性,扩大了适用范围。

Patent Agency Ranking