一种基于可控多空间特征解耦的开放域对话生成方法

    公开(公告)号:CN116932726B

    公开(公告)日:2024-05-10

    申请号:CN202310977148.X

    申请日:2023-08-04

    Abstract: 本发明属于开放域聊天技术领域,具体涉及一种基于可控多空间特征解耦的开放域对话生成方法;M‑CVAE模型的预训练过程包括:获取问题文本序列和回复文本序列并将其嵌入到词空间中,将得到的词向量分别对应输入到输入编码器和输出编码器,得到问题文本特征表示和回复文本特征表示;将两种特征表示输入到识别网络和先验网络中进行计算,得到隐变量;采用解码器根据隐变量对参考回复进行处理,生成回复文本;将问题文本特征表示输入到分类器中,得到问题分类类别概率;预训练后进行再训练和测试,获得训练好的模型;将问题文本输入到训练好的M‑CVAE模型中,生成对应的回复文本;本发明能够生成高质量,可解释,一对多的可控对话文本。

    一种基于主动学习的异构信息网络标签标注方法

    公开(公告)号:CN117892786A

    公开(公告)日:2024-04-16

    申请号:CN202410041508.X

    申请日:2024-01-11

    Inventor: 于洪 唐瑾萱 王烨

    Abstract: 本发明属于异构信息网络嵌入技术领域,具体涉及一种基于主动学习的异构信息网络标签标注方法;包括:获取异构信息网络文本数据并构建异构信息网络;对网络进行分解,得到多个同构二部子网络;对同构二部子网络进行嵌入处理,得到异构信息网络的节点嵌入表示;所有存在完整标签的节点构成标记节点集,缺失标签的节点构成未标记节点集;根据两种主动选择策略和异构信息网络的节点嵌入表示计算得到实际查询节点集;两种主动选择策略分别为度中心性主动选择策略和接近中心性主动选择策略;根据实际查询节点集更新标记节点集;将标记节点集输入到全连接层进行处理,得到实际查询节点集中节点的标签;本发明可准确的对异构信息网络的文本数据进行标签标注。

    一种基于有限状态机的自动驾驶决策方法

    公开(公告)号:CN117348415A

    公开(公告)日:2024-01-05

    申请号:CN202311485787.0

    申请日:2023-11-08

    Abstract: 本发明属于自动驾驶技术领域,具体涉及一种基于有限状态机的自动驾驶决策方法;该方法包括:将密集交通场景下的驾驶任务分解为三种驾驶子任务,包括变道、保持和姿态调整;对三种驾驶子任务分别进行马尔可夫建模;使用DQN算法求解马尔可夫决策过程,得到三种驾驶子任务的驾驶动作策略;根据驾驶过程中的任务切换过程构建有限状态机模型;根据有限状态机模型和驾驶动作策略得到驾驶决策并执行;本发明可解决DRL在自动驾驶决策任务中存在的稀疏回报问题,提高自动驾驶车在多样化驾驶环境中的适应能力,从而增强自动驾驶的可靠性和安全性。

    一种由体育赛事解说生成体育战报的方法

    公开(公告)号:CN117313747A

    公开(公告)日:2023-12-29

    申请号:CN202311213587.X

    申请日:2023-09-19

    Abstract: 本发明属于自然语言处理领域,具体涉及一种由体育赛事解说生成体育战报的方法;该方法包括:将体育赛事解说语句逐句输入到去冗器中,得到去冗句子,再将去冗句子输入到重写器中得到生成体育战报;训练过程:将体育赛事解说语句和体育战报语句进行时间上的配对;对时间配对集合中的配对语句赋予标签,得到带有标签的配对句子集合;将带有标签的体育赛事解说句子集合输入到去冗器中进行训练;将配对句子中的命名实体替换为token,将替换后的去冗句子集合输入到重写器中进行训练;本发明可以从体育赛事解说生成更加精确的体育战报,实用性高。

    一种基于混合采样策略的中文电子病历命名实体识别方法

    公开(公告)号:CN115497590A

    公开(公告)日:2022-12-20

    申请号:CN202211295864.1

    申请日:2022-10-21

    Abstract: 本发明属于文本处理领域,提供了一种基于混合采样策略的中文电子病历命名实体识别方法,所述方法包括获取有标记实体的源领域数据集和少量标记实体或无标记实体的目标领域数据集;利用源领域数据集训练命名实体识别模型。运用迁移学习将模型应用到目标源领数据集中,得到实体识别结果;运用混合采样策略的主动学习从实体识别结果中选出最有价值的样本,人工标注后加入到训练集中,重复上述过程,直到目标领域实体识别结果达到要求。本发明通过迁移从源领域中学习的知识到目标领域中,缓解了零标记样本冷启动问题,通过选取最有价值的样本减少了人工标注数据量并减少了单位样本的标注成本,同时提高了中文电子病历对于句子级的命名实体识别准确率。

    一种增强文本特征的对话生成方法和系统

    公开(公告)号:CN115495566A

    公开(公告)日:2022-12-20

    申请号:CN202211238085.8

    申请日:2022-10-11

    Abstract: 本发明涉及人机对话领域,具体涉及一种增强文本特征的对话生成方法和系统;该方法包括获取问题文本和回复文本,通过TextRank算法提取问题文本中的关键词,得到关键词序列;引入关键词编码器,关键词编码器通过注意力机制对每一个关键词进行编码得到对应的关键词向量;将关键词向量与语义向量拼接后输入第一多层感知机,得到包含丰富语义的关键词语义向量;将关键词语义向量与问题文本向量拼接后通过第二多层感知机,得到输入向量;根据输入向量训练对话生成模型,采用损失函数计算损失值并反向传播,调整对话生成模型的参数;本发明加强关键词的权重,增强对文本的特征表达,达到生成更高质量的对话文本的目的。

    一种基于语义感知的一对多对话生成方法及装置

    公开(公告)号:CN114416948A

    公开(公告)日:2022-04-29

    申请号:CN202210052665.1

    申请日:2022-01-18

    Abstract: 本发明涉及对话系统领域,特别涉及一种基于语义感知的一对多对话生成方法及装置,包括获取实时输入问题并送入训练好的对话生成模型,对话生成模型根据输入问题得到多样性的回复,对话生成模型包括输入编码器、输出编码器、识别网络、先验网络、分类器、no emotion解码器、positive解码器、negative解码器;本发明的模型分为预训练和训练两个训练过程,本发明在模型中引入一个能识别出对话的情感或动作的可控变量,通过该可控件变量来选择不同类别的解码器并在训练过程中迫使隐空间特征解耦成不同语义类别的子空间,让相同语义类别的对话能映射到隐空间的相近的位置,进而生成个性化、高质量、可解释、多样性的文本。

    一种基于多粒度遮挡感知的遮挡行人重识别方法

    公开(公告)号:CN114091519A

    公开(公告)日:2022-02-25

    申请号:CN202111255008.9

    申请日:2021-10-27

    Abstract: 本发明属于计算机视觉领域,涉及一种行人重识别方法,尤其涉及一种基于多粒度遮挡感知的遮挡行人重识别方法;该方法包括:实时获取待重识别的行人图像数据;将该数据输入到训练好的基于多粒度遮挡感知的遮挡行人重识别模型中,输出遮挡行人重识别结果;本发明对比固定分割和单一级别的方法,增强了特征多样性;对比仅使用沿高度维度水平分割的方法,添加垂直划分以应对任意分布的语义信息;对比一步预测的方法,在多个级别上进行多步预测以提升精度,实现更精确的遮挡行人重识别。

Patent Agency Ranking