模型训练方法、可控文本的生成方法、系统、设备及介质

    公开(公告)号:CN116383652A

    公开(公告)日:2023-07-04

    申请号:CN202310354856.8

    申请日:2023-04-03

    Inventor: 蔡华

    Abstract: 本发明公开了一种模型训练方法、可控文本的生成方法、系统、设备及介质,该模型训练方法包括:以第一训练样本为输入,训练可控文本生成模型,以确定可控文本生成模型中提示子模型和注意力子模型的参数;可控文本生成模型还包括预先训练的文本生成子模型;在每个时间步中,注意力子模型以之前所有时间步的提示词隐含状态、当前时间步的提示词隐含状态和之前所有时间步的文本隐含状态为输入,以当前时间步的注意力文本矩阵为输出。本发明使用提示子模型引导文本生成子模型,防止可控文本的主题发散,出现与提示词不相关的内容;注意力子模型实现了在每个时间步进行独立提示,防止可控文本的内容不与所有的提示词的内容对应,避免出现提示词的丢失。

    自动回复提问的方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN116340481A

    公开(公告)日:2023-06-27

    申请号:CN202310182371.5

    申请日:2023-02-27

    Inventor: 史可欢 徐清 蔡华

    Abstract: 一种自动回复提问的方法及装置、计算机可读存储介质、终端,方法包括:确定问答库,问答库包含多组问题及每组问题对应的一个或多个回答,每组问题包含一个标准问题及其对应的一个或多个相似问题;确定输入提问的第一句向量与所述问答库每个标准问题的第二句向量之间的第一相似度;如果最大第一相似度小于第一阈值,则基于各个第一相似度对问答库进行筛选,得到待匹配问题集;分别确定第一句向量与待匹配问题集的每个问题的第三句向量之间的第二相似度;如果最大第二相似度大于等于第二阈值,则将最大第二相似度所属的问题对应的至少一个回答,作为输入提问的最终回答;其中,第一阈值小于等于第二阈值。上述方案可以提高回答的效率与准确性。

    一种基于在线百科的知识库快速构建方法及系统

    公开(公告)号:CN115983381A

    公开(公告)日:2023-04-18

    申请号:CN202310182843.7

    申请日:2023-02-28

    Inventor: 李帅帅 蔡华 徐清

    Abstract: 本发明提供一种基于在线百科的知识库快速构建方法及系统,涉及计算机应用技术领域,包括:确定需构建知识库的领域,根据领域构建领域关键词种子库;根据领域关键词种子库确定百科词条,利用已确定的百科词条迭代更新领域关键词种子库,进一步获取百科词条;存储所有百科词条的半结构化信息,经筛选及整理获得领域相关的信息并存储;基于领域相关的信息分别获取节点信息及关系表单信息,遍历关系表单信息中的源节点及目标节点的索引id,创建源节点‑关系‑目标节点的三元组;将三元组批量创建至图数据库中,得到知识库。本发明通过对百科网站上的信息进行提取,将其整理成结构化的知识库,大大提高知识库构建的效率。

    对话内容的生成方法及装置、存储介质、终端

    公开(公告)号:CN115186147A

    公开(公告)日:2022-10-14

    申请号:CN202210612157.4

    申请日:2022-05-31

    Inventor: 蔡华

    Abstract: 一种对话内容的生成方法及装置、存储介质、终端,所述方法包括:获取用户输入的当前话语;读取预先设置的话题转移图和目标话题,其中,话题转移图包括多个节点以及节点之间的连接线,节点和话题一一对应,连接线从第一节点指向第二节点,连接线的权重用于指示从第一节点对应的话题转移至第二节点对应的话题的概率,话题转移图包括目标话题对应的节点;至少根据当前话语、话题转移图和目标话题确定当前话语的回复内容的话题,记为回复话题;至少根据回复话题生成当前话语的回复内容。采用上述方案,可以在人机对话过程中实现话题的主动引导,并将对话自然地将引导至目标话题。

    一种声音信号转换方法、系统、装置和程序产品

    公开(公告)号:CN120018042A

    公开(公告)日:2025-05-16

    申请号:CN202510145075.7

    申请日:2025-02-10

    Abstract: 本发明提供一种声音信号转换方法、系统、装置和程序产品,涉及辅助听力技术领域。其中,声音信号转换方法包括:采用声音采集模块监听周围环境;使用声音识别与分类模块进行声音事件识别;使用信号转换模块将识别到的声音事件转换为感官信号指令;使用信号反馈模块执行感官信号指令,产生感官信号,并传递给用户。本发明提出了一种基于感官反馈的辅助听力解决方案,尤其是利用触觉这一更为直接的感官通道,采用便携装置,配合高灵敏度的声音采集模块和快速的声音识别算法,使聋人在不同的场景下都能迅速感知外接的声音信息,提高了信息反馈的实时性、准确性和可辨识度,可适用于各种场景。

    文档处理方法及装置、存储介质、终端、计算机程序产品

    公开(公告)号:CN118313352B

    公开(公告)日:2025-02-11

    申请号:CN202410373087.0

    申请日:2024-03-28

    Abstract: 一种文档处理方法及装置、存储介质、终端、计算机程序产品,方法包括:确定待处理文档;对待处理文档的每个页面进行解析,以确定内容列表和目录列表,内容列表包含多条段落项,每条段落项包含单个段落,目录列表包含多条标题项,每条标题项包含单个标题;基于目录列表构建目录树;逐层遍历目录树,对遍历的当前节点指示的标题及其同层相邻节点指示的标题,分别与内容列表中的至少一部分段落进行文本匹配,以确定相匹配的两个段落,然后对内容列表中位于相匹配的两个段落之间的所有段落进行拼接,将拼接结果作为当前节点的关联文本块。采用上述方案,可以对文档精准划分文本块并与各标题建立关联关系,以获得树形结构文档。

    文本转结构化查询语言的语句生成方法、系统、设备

    公开(公告)号:CN118820285A

    公开(公告)日:2024-10-22

    申请号:CN202410835072.1

    申请日:2024-06-26

    Abstract: 本公开提供了一种文本转结构化查询语言的语句生成方法、系统、设备,该语句生成方法包括:基于目标查询问题,确定目标查询语句中的数据关键词;基于目标查询问题,得到初始查询语句;基于初始查询语句和数据关键词,生成目标查询语句。本公开根据目标查询问题确定目标查询语句中的数据关键词,数据关键词包括与目标查询问题对应的表名、字段名和字段值中的至少一种;根据目标查询问题得到初始查询语句,初始查询语句为带有占位符和语法结构关键词的查询语句,占位符用于代替所述数据关键词;进而根据初始查询语句和数据关键词,生成目标查询语句,克服了通过模型生成相关列名时容易发生错误的问题,提升了生成的目标查询语句的准确率。

    文档处理方法及装置、存储介质、终端、计算机程序产品

    公开(公告)号:CN118313352A

    公开(公告)日:2024-07-09

    申请号:CN202410373087.0

    申请日:2024-03-28

    Abstract: 一种文档处理方法及装置、存储介质、终端、计算机程序产品,方法包括:确定待处理文档;对待处理文档的每个页面进行解析,以确定内容列表和目录列表,内容列表包含多条段落项,每条段落项包含单个段落,目录列表包含多条标题项,每条标题项包含单个标题;基于目录列表构建目录树;逐层遍历目录树,对遍历的当前节点指示的标题及其同层相邻节点指示的标题,分别与内容列表中的至少一部分段落进行文本匹配,以确定相匹配的两个段落,然后对内容列表中位于相匹配的两个段落之间的所有段落进行拼接,将拼接结果作为当前节点的关联文本块。采用上述方案,可以对文档精准划分文本块并与各标题建立关联关系,以获得树形结构文档。

Patent Agency Ranking