一种关键词提取方法和系统

    公开(公告)号:CN111400484A

    公开(公告)日:2020-07-10

    申请号:CN202010200961.2

    申请日:2020-03-20

    Abstract: 本说明书实施例公开了一种关键词提取方法和系统,所述方法包括:获取目标文本;从所述目标文本中选择目标词语;将所述目标文本的信息以及当前选择的目标词语的位置信息输入关键词提取模型,得到该目标词语的去除或保留操作;执行该目标词语的去除或保留操作,得到操作后的目标文本;判断所述操作后的目标文本中是否存在未被执行所述操作的词语;若是,则以所述操作后的目标文本替换所述目标文本,从所述操作后的目标文本中选择其中一个所述未被执行所述操作的词语,以该词语作为所述当前选择的目标词语,重复执行上述输入关键词提取模型至判断的步骤;若否,则将所述操作后的目标文本中的词语确定为所述目标文本的关键词。

    基于隐私保护的信息推送方法及装置

    公开(公告)号:CN111538906B

    公开(公告)日:2023-06-20

    申请号:CN202010477510.3

    申请日:2020-05-29

    Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。

    一种针对体验声音的标签提取方法、装置以及设备

    公开(公告)号:CN113221533A

    公开(公告)日:2021-08-06

    申请号:CN202110475145.7

    申请日:2021-04-29

    Inventor: 刘佳 陈显玲

    Abstract: 本说明书实施例公开了一种针对体验声音的标签提取方法、装置以及设备。方案包括:获取体验声音对应的待处理文本;获取根据训练语句及其重点内容标注训练过的识别模型,其中,识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;将待处理文本切分字符并对应地输入识别模型,以识别得到待处理文本中的重点语句;根据重点语句,提取标签。

    一种短语分割模型的训练方法和系统

    公开(公告)号:CN111522957A

    公开(公告)日:2020-08-11

    申请号:CN202010384233.1

    申请日:2020-05-09

    Abstract: 本说明书的实施例公开了一种短语分割模型的训练方法和系统,所述方法包括:基于公共知识库获取至少一个目标短语,目标短语包含至少两个词;基于目标短语从公共知识库中获取至少一个第一文本,第一文本包含目标短语;基于第一文本获取非目标短语,非目标短语为第一文本的一部分,且不同于目标短语;将目标短语和第一文本构成的文本对作为正样本,非目标样本和第一文本构成的文本对作为负样本;基于多组正样本和负样本训练得到短语分割模型。

    一种确定用于信息推荐的图谱的方法、系统、及装置

    公开(公告)号:CN111241412B

    公开(公告)日:2020-08-07

    申请号:CN202010329694.9

    申请日:2020-04-24

    Abstract: 本说明书实施例公开了一种确定用于信息推荐的图谱的方法、系统、及装置。所述方法包括:获取构建目标图谱的多个节点;所述节点至少包括词语节点,以及知识点节点;若所述节点为词语节点,将该节点对应的词语的向量表示作为该节点的向量表示;若所述节点为知识点节点,基于与所述知识点节点相关的词语的向量表示,确定对应于所述知识点节点的向量表示;对于任意两个节点:基于所述两个节点的类型,确定所述两个节点之间的边权,并将所述边权作为所述两个节点之间的关联关系;基于节点的向量表示,以及节点与节点之间的关联关系,进行至少一轮图聚合迭代,以更新所述图谱中节点的向量表示。

    一种训练问题识别模型的方法和系统

    公开(公告)号:CN111340218A

    公开(公告)日:2020-06-26

    申请号:CN202010113810.3

    申请日:2020-02-24

    Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。

    一种训练文本关键内容提取模型的方法和系统

    公开(公告)号:CN111309887A

    公开(公告)日:2020-06-19

    申请号:CN202010114332.8

    申请日:2020-02-24

    Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法及系统,所述方法包括:获取多个问题答案对,所述问题答案对包括问题和所述问题对应的答案;从所述多个问题答案对中选取目标问题答案对,并选取其他与所述目标问题答案对不同的问题答案对中的答案作为干扰答案;拼接所述目标问题答案对中的目标答案与所述干扰答案得到拼接答案,将所述拼接答案与所述目标问题答案对中的目标问题作为一组训练样本;所述目标答案为与所述目标问题对应的文本关键内容;所述训练样本的标识为所述目标答案在所述拼接答案中的起点和终点位置;基于多组所述训练样本训练得到文本关键内容提取模型。

Patent Agency Ranking