答案获取方法、装置、计算机设备和存储介质

    公开(公告)号:CN114880469A

    公开(公告)日:2022-08-09

    申请号:CN202210425139.5

    申请日:2022-04-22

    摘要: 本申请涉及一种答案获取方法、装置、计算机设备和存储介质。该方法包括:确定待处理问句的问句向量;使用问句向量在资料描述向量集合中进行向量检索,得到与问句向量匹配的资料描述向量;资料描述向量集合中包括多个候选的资料描述信息对应的资料描述向量;多个候选的资料描述信息所描述的资料中具有至少两种资料类型的资料;基于匹配到的资料描述向量确定目标资料;使用目标资料的资料类型对应的检索技术,从目标资料中检索针对待处理问句的答案。采用本方法能够提高灵活性。

    训练样本的选取方法、装置、计算机设备和存储介质

    公开(公告)号:CN110910864A

    公开(公告)日:2020-03-24

    申请号:CN201911015081.1

    申请日:2019-10-24

    IPC分类号: G10L15/06 G06K9/62 G06N3/08

    摘要: 本申请涉及一种训练样本的选取方法、装置、计算机设备和存储介质。所述方法包括:根据初始训练样本集进行模型训练,得到第一识别模型;所述初始训练样本集中包括多个初始训练样本和各所述初始训练样本对应的标注;基于所述第一识别模型构造至少一个第二识别模型,并将所述第一识别模型和至少一个所述第二识别模型组成识别模型集合;根据所述识别模型集合从多个不具有标注的候选训练样本中选取出目标训练样本,所述目标训练样本为富含信息的训练样本。通过本发明实施例,由识别模型集合从多个候选训练样本中选取目标训练样本,不仅节省时间,而且节省人力成本。

    一种自动生成FAQ相似问句的方法和装置

    公开(公告)号:CN109063004A

    公开(公告)日:2018-12-21

    申请号:CN201810749005.2

    申请日:2018-07-09

    IPC分类号: G06F17/30 G06F17/27

    CPC分类号: G06F17/271 G06F17/2705

    摘要: 本发明涉及一种自动生成FAQ相似问句的方法和装置,所述方法包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。本发明通过自动生成FAQ相似问句,减少了人工标注的投入成本,并且对于新增的FAQ,可以快速地构建出对应的相似问,减少了对机器人知识库增加新的FAQ所需要的前期准备时间;此外,采用自然语言处理方法与句子生成规则相结合的方式来进行文本生成,可以更加有效地提高相似问句生成的质量。

    自动生成相似问句的方法和装置

    公开(公告)号:CN109033390A

    公开(公告)日:2018-12-18

    申请号:CN201810856231.0

    申请日:2018-07-27

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本申请涉及一种自动生成相似问句的方法和装置;所述方法包括获取初始问句;根据所述初始问句生成拓展问句;判断拓展问句是否为相似问句,并根据判断结果标记出相似问句。本申请提出一种利用计算机自动生成相似问句的方法,节省了人工标注相似问句所耗费的人力资源,能够降低机器人客服的成本;并且计算机生成的效率更高、花费时间更短,有利于临时增加FAQ的情况,使用更灵活。

    具有自学习功能的平行客服机器人系统及其自学习方法

    公开(公告)号:CN107239538A

    公开(公告)日:2017-10-10

    申请号:CN201710405870.0

    申请日:2017-06-01

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种具有自学习功能的平行客服机器人系统及其自学习方法,平行客服机器人系统包括用户端、客服机器人、人工客服端和反馈单元,用户端将用户端问句发送给客服机器人、人工客服端和反馈单元;客服机器人根据用户端问句将FAQ推荐数据组发送给人工客服端和反馈单元;人工客服端将应用户端问句的FAQ数据发送给用户端和反馈单元;反馈单元根据接收到的用户端问句、FAQ推荐数据组和修正后的对应该用户端问句的FAQ数据生成反馈数据,并将反馈数据发送给客服机器人;客服机器人根据接收到的反馈数据进行自学习。本发明能够在真实的客服场景中收集整理相似问句,供客服机器人进行学习,减少人工标注的成本投入。

    音画同步的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113792591B

    公开(公告)日:2024-08-13

    申请号:CN202110908928.X

    申请日:2021-08-09

    摘要: 本申请公开了一种音画同步的检测方法、装置、电子设备及存储介质,涉及视频处理技术领域。该方法包括:获取视频中第T帧视频图像中人脸区域的图像特征点,T为正整数;获取视频中与第T帧视频图像对应的音频帧的音频特征;将图像特征点以及音频特征输入至预先训练的打分模型,得到目标相似分数,目标相似分数用于表征视频图像与音频帧之间的对应程度;若基于目标相似分数判定视频满足预设错位条件,确定视频图像和对应的视频图像不同步,并输出用于表征视频中视频图像与对应的音频帧不同步的结果。如此,由于是通过提取视频图像中人脸区域的图像特征点的方式,并基于提取的图像特征点输入模型中,减少了图像质量对目标相似分数的影响,提高了判断视频图像和对应的音频帧是否同步的准确性。

    模型训练及应用方法、装置、计算机设备及存储介质

    公开(公告)号:CN115017973A

    公开(公告)日:2022-09-06

    申请号:CN202210482703.7

    申请日:2022-05-05

    IPC分类号: G06K9/62 G06F17/16

    摘要: 本申请涉及一种模型训练方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取训练样本数据;根据所述训练样本数据,分别构建对应的正向注意力权重矩阵和反向注意力权重矩阵,所述正向注意力权重矩阵用于预测所述训练样本数据中各元素的相邻下一元素,所述反向注意力权重矩阵用于预测所述训练样本数据中各元素的相邻上一元素;根据所述正向注意力权重矩阵和所述反向注意力权重矩阵,构建双向注意力权重矩阵;根据所述双向注意力权重矩阵对预设模型进行训练。本申请可实现同时进行双向编码,提高了对预设模型的训练效率,可节省硬件资源,提高硬件处理速度,提高了模型生成数据的准确性。

    客服机器人知识库歧义检测方法

    公开(公告)号:CN109101579B

    公开(公告)日:2021-11-23

    申请号:CN201810801678.8

    申请日:2018-07-19

    IPC分类号: G06F16/332 G06F16/35 G06K9/62

    摘要: 本申请涉及一种客服机器人知识库歧义检测方法,包括:构建知识库,所述知识库知识库按FAQ划分,每个FAQ设有至少一个相似问句,且每个FAQ为一个类别;将所述知识库划分为深度学习模型的测试集和训练集;在训练集上训练深度学习模型,并利用学习出的所述深度学习模型进行歧义检测;根据歧义检测结果更新所述知识库;重复上述步骤直到学习效果不再提升。本申请根据歧义检测结果更新所述知识库,重复训练步骤直到学习效果达到预期标准,可以辅助人工发现并修正知识库歧义,得到消除歧义的知识库,从消除歧义的知识库中提取数据作为深度学习模型的训练集和测试集,进一步提高深度学习模型学习效果。

    标点符号标注方法、装置、计算机设备和存储介质

    公开(公告)号:CN113449489A

    公开(公告)日:2021-09-28

    申请号:CN202110828958.X

    申请日:2021-07-22

    摘要: 本申请涉及一种标点符号标注方法、装置、计算机设备和存储介质。该方法包括:获取包括多组样本数据的训练数据集,每组样本数据中包括无标点的样本文本和对应的标点符号样本标签序列;根据各样本文本的文本长度,确定待训练的标点预测模型的卷积核数量和各卷积核的长度,对待训练的标点预测模型进行迭代训练,得到标点预测模型;标点预测模型中包括用于获取长距离的上下文信息的第一卷积核和用于获取短距离的上下文信息的第二卷积核;将无标点符号的待标注文本输入至标点预测模型中,输出对应于待标注文本的标点符号标签序列,并将待标注文本和标点符号标签序列整合,生成标注有标号符号的文本。采用本方法能为文本进行更为准确地预测标点符号。