一种基于机器阅读理解的问题答案获取方法及系统

    公开(公告)号:CN110222152A

    公开(公告)日:2019-09-10

    申请号:CN201910455756.8

    申请日:2019-05-29

    Abstract: 本发明实施例提供一种基于机器阅读理解的问题答案获取方法及系统。其中,方法包括:将问题和对应的文档集输入至训练后的神经网络模型,获取训练后的神经网络模型的输出结果;根据输出结果,从文档集中确定问题对应的答案;其中,训练后的神经网络模型根据训练集训练得到,训练集包括多个样本问题以及每个样本问题对应的样本文档集和样本标签集。本发明实施例提供的方法及系统,通过将问题和对应的文档集输入至训练后的神经网络模型,根据训练后的神经网络模型的输出结果,从文档集中确定问题对应的答案。填补了描述类问题机器阅读理解模型的短缺,有效的利用了多文档的特点,保留了更多文档信息,能够更加精准地提取描述类问题的答案。

    一种基于机器阅读理解的问题答案获取方法及系统

    公开(公告)号:CN110222152B

    公开(公告)日:2021-05-14

    申请号:CN201910455756.8

    申请日:2019-05-29

    Abstract: 本发明实施例提供一种基于机器阅读理解的问题答案获取方法及系统。其中,方法包括:将问题和对应的文档集输入至训练后的神经网络模型,获取训练后的神经网络模型的输出结果;根据输出结果,从文档集中确定问题对应的答案;其中,训练后的神经网络模型根据训练集训练得到,训练集包括多个样本问题以及每个样本问题对应的样本文档集和样本标签集。本发明实施例提供的方法及系统,通过将问题和对应的文档集输入至训练后的神经网络模型,根据训练后的神经网络模型的输出结果,从文档集中确定问题对应的答案。填补了描述类问题机器阅读理解模型的短缺,有效的利用了多文档的特点,保留了更多文档信息,能够更加精准地提取描述类问题的答案。

    一种基于商用对话系统的口语语言理解及改写方法

    公开(公告)号:CN110008325A

    公开(公告)日:2019-07-12

    申请号:CN201910249981.6

    申请日:2019-03-29

    Abstract: 一种基于商用对话系统的口语语言理解及改写方法,包括以下步骤:根据用户所输入的话语,识别并获取话语所涉及的领域信息;根据话语所涉及的领域,识别并获取话语所包含的意图信息;根据意图信息检测用户话语中包含的槽位信息,并存储检测到的槽位信息;根据领域信息、意图信息、已存储的槽位信息对用户所输入话语进行改写,补全话语信息;根据用户所输入话语的领域信息和意图信息选择子对话系统提供服务,本方法能够解决商用对话系统中容易出现的语义传递阻塞问题,通过应用本方法,由于用户需求的变化从而导致子对话系统切换时,子对话系统能够根据改写后的用户话语了解用户需求,而不被用户感知,能够最大程度的保证用户的使用体验。

    一种基于商用对话系统的口语语言理解及改写方法

    公开(公告)号:CN110008325B

    公开(公告)日:2020-02-07

    申请号:CN201910249981.6

    申请日:2019-03-29

    Abstract: 一种基于商用对话系统的口语语言理解及改写方法,包括以下步骤:根据用户所输入的话语,识别并获取话语所涉及的领域信息;根据话语所涉及的领域,识别并获取话语所包含的意图信息;根据意图信息检测用户话语中包含的槽位信息,并存储检测到的槽位信息;根据领域信息、意图信息、已存储的槽位信息对用户所输入话语进行改写,补全话语信息;根据用户所输入话语的领域信息和意图信息选择子对话系统提供服务,本方法能够解决商用对话系统中容易出现的语义传递阻塞问题,通过应用本方法,由于用户需求的变化从而导致子对话系统切换时,子对话系统能够根据改写后的用户话语了解用户需求,而不被用户感知,能够最大程度的保证用户的使用体验。

    一种基于轨迹嵌入的轨迹相似度度量方法

    公开(公告)号:CN115062703B

    公开(公告)日:2024-12-24

    申请号:CN202210685534.7

    申请日:2022-06-16

    Abstract: 本发明公开了一种基于轨迹嵌入的轨迹相似度度量方法,涉及轨迹数据挖掘领域;具体包括:首先,对用户通话记录的基站轨迹点进行预处理,对预处理后的轨迹数据进行时空轨迹点的聚类,然后,根据用户时空轨迹聚类簇信息,构建用户之间的关系图,并且挖掘出不同的用户强连通子图;接着,计算各连通子图内用户轨迹间的轨迹先验相似度,基于此,利用用户的轨迹序列和用户间轨迹的共现关系构建训练集,结合用户间的轨迹先验相似度训练不同连通子图内的trajectory2vec模型,得到用户的轨迹嵌入向量;最后,计算用户的轨迹嵌入向量之间的余弦相似度表示用户的轨迹时空相似度。本发明降低了时间复杂度,提高了采样率和采样精度。

    基于多智体强化学习的心智理论模型实现方法及装置

    公开(公告)号:CN115081617A

    公开(公告)日:2022-09-20

    申请号:CN202210635877.2

    申请日:2022-06-06

    Abstract: 本申请提供一种基于多智体强化学习的心智理论模型实现方法及装置,该方法包括:基于心智理论模型建立原始联合心智模型网络以预测多个己方智能体的友方智能体的意图特征信息;建立多智体强化学习的任务场景结合意图特征信息,分级建模场景任务的主目标及其子目标;通过主目标的收敛后的主目标实现算法和子目标的规则化子目标实现算法收集待使用数据,以对原始联合心智模型网络进行训练,通过目标联合心智模型网络预测当前己方智能体的意图信息并将其添加至多智体算法的输入信息,实现己方智能体的协同。本申请实施例提供的基于多智体强化学习的心智理论模型实现方法结合多智体强化学习、心智理论模型和任务场景,提升了多智能体的协同效果。

    一种多源时空知识融合方法

    公开(公告)号:CN112905807B

    公开(公告)日:2022-07-08

    申请号:CN202110320156.8

    申请日:2021-03-25

    Abstract: 本发明公开了一种多源时空知识融合方法,属于知识图谱领域。具体为:首先,选取两种时空精度和采样率都有较大差异的异质时空数据源,分别进行预处理,得到各自对应的时空轨迹序列;并分别构建各自对应的时空知识图谱;接着、利用基于衰减机制的长路径的知识图表示算法对时空知识图谱中的三元组分别进行训练学习,得到每个实体对应的最终低维向量;依次选择第二种时空知识图谱中的未对齐实体S,经过变换函数后与第一种时空知识图谱中的所有实体逐一进行相似度对比,选择相似度最高的实体进行实体对的匹配;最后,按照所有实体对齐的结果,对两种不同的时空数据源进行时空知识的融合;本发明有效的弥补了单一时空数据源中时空知识的不完整性。

    一种基于神经网络的中文字符串图片OCR识别方法

    公开(公告)号:CN110321830A

    公开(公告)日:2019-10-11

    申请号:CN201910576921.5

    申请日:2019-06-28

    Abstract: 本发明公开了一种基于神经网络的中文字符串图片OCR识别方法,属于光学字符识别领域。首先采集若干张待识别图片,将每个图片中的每个像素值分别进行归一化;同时初始化神经网络模型的各类别,初始化每个类别的中心特征向量。然后将每张待识别图片中的归一化像素分别输入到神经网络模型中进行特征提取,得到各图片的深度特征矩阵,通过RoI Pooling进行池化操作后伸展特征,得到长度为L的特征向量。最后将特征向量划分为训练样本和测试样本,训练样本训练神经网络模型;每个测试样本的特征向量分别连接到训练好的神经网络模型的全连接层,输出各测试样本的类别,完成对各图片字符串的整体识别。本发明能够对整张字符串图片进行分类识别,识别精确度更高。

    一种对图片中的字符串进行分割的方法

    公开(公告)号:CN110309769A

    公开(公告)日:2019-10-08

    申请号:CN201910576925.3

    申请日:2019-06-28

    Abstract: 本发明公开了一种对图片中的字符串进行分割的方法,属于计算机视觉领域。首先采集若干字符串图片划分为训练样本和测试样本,将每个训练样本分别进行预处理,得到各训练样本对应的若干子图片;将各个训练样本的每个子图片采用IOBES方式标注为序列。然后利用进行序列标注的训练样本,训练双向长短期记忆神经网络和条件随机场的模型;在测试的时候,将测试样本输入训练好的双向长短期记忆神经网络和条件随机场的模型中,得到分数最高的标签序列。最后,将分数最高的标签序列作为图像分割的分割线,进行测试样本的分割。本发明避免了使用投影法等规则算法进行分割时所需要的人工制定阈值的步骤,不需要其他的先验知识,移植方便。

Patent Agency Ranking