-
公开(公告)号:CN115481645A
公开(公告)日:2022-12-16
申请号:CN202211268116.4
申请日:2022-10-17
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
摘要: 本发明公开了一种基于形态学增强的张量化词嵌入压缩系统,该模型包括语素分割模块、语素索引及嵌入模块、词嵌入生成模块;所述语素分割模块将文本任务的词表中每个词分割成语素,所述语素索引及嵌入模块首先统计语素分割模块的分割结果生成语素表,接着定义语素索引矩阵和多个可训练的语素嵌入矩阵,语素索引矩阵每一行代表词表中对应单词的语素在语素表中的位置,语素嵌入矩阵的每一行代表语素表中对应语素的嵌入向量;词嵌入生成模块对词表中每个词,从语素嵌入矩阵中索引出语素向量并进行张量积,多个张量积的结果相加生成词嵌入向量;本发明克服了一般词嵌入技术参数量及存储空间占用大的问题,以及高倍压缩词嵌入时任务效果损失的问题。
-
公开(公告)号:CN115168549A
公开(公告)日:2022-10-11
申请号:CN202210343005.9
申请日:2022-04-02
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
IPC分类号: G06F16/332 , G06F16/36 , G06N3/04 , G06N3/08
摘要: 本发明公开基于双重感知表示与层级交互记忆网络的任务型对话系统,使用端到端的方法通过捕捉双重感知表示,利用设计的层级交互记忆网络来构造任务型对话系统;包括对话历史和用户需求编码模块、层级交互记忆网络模块、感知表示融合模块、动态记忆解码模块。静态的需求感知表示和动态的知识感知表示作为双重感知表示,静态的需求感知表示能够更好地捕捉到用户最新的需求信息,动态的知识感知表示能够将当前的和过去的知识库信息进行整合进而得到与当前需求相关的知识信息,层级交互记忆网络,能够增强记忆内容在hop‑level和layer‑level上的交互,从而增强对知识的表示能力,使得模型能够更准确地从外部知识库中提取相关的知识信息,以生成更准确更合适的回复。
-
公开(公告)号:CN114841353A
公开(公告)日:2022-08-02
申请号:CN202210460271.X
申请日:2022-04-28
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
IPC分类号: G06N10/60 , G06F40/211 , G06F40/30
摘要: 本发明公开了一种融合句法信息的量子语言模型建模方法,该方法从表示句子的量子系统入手,在模型中引入句法结构信息,以提高量子语言模型的建模能力,包括数据的预处理及句法结构生成模块、句法指导的单词表示模块、语义和语法信息融合的句子表达模块;所述数据的预处理及句法结构生成模块将句子处理成句法结构树的形式;句法指导的词向量表达模块利用每个句子的依存信息,训练单词的词向量表达;语义和语法信息融合的句子表达模块将上一步生成的词向量转换为密度矩阵,进一步得到句法指导的句子表达,以用于下游任务的训练;本发明基于句法结构树重构密度矩阵的生成与表达,利用依存关系建模了句子的词项依赖。
-
公开(公告)号:CN114841353B
公开(公告)日:2024-08-09
申请号:CN202210460271.X
申请日:2022-04-28
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
IPC分类号: G06N10/60 , G06F40/211 , G06F40/30
摘要: 本发明公开了一种融合句法信息的量子语言模型建模方法,该方法从表示句子的量子系统入手,在模型中引入句法结构信息,以提高量子语言模型的建模能力,包括数据的预处理及句法结构生成模块、句法指导的单词表示模块、语义和语法信息融合的句子表达模块;所述数据的预处理及句法结构生成模块将句子处理成句法结构树的形式;句法指导的词向量表达模块利用每个句子的依存信息,训练单词的词向量表达;语义和语法信息融合的句子表达模块将上一步生成的词向量转换为密度矩阵,进一步得到句法指导的句子表达,以用于下游任务的训练;本发明基于句法结构树重构密度矩阵的生成与表达,利用依存关系建模了句子的词项依赖。
-
公开(公告)号:CN118940299A
公开(公告)日:2024-11-12
申请号:CN202411402787.4
申请日:2024-10-09
申请人: 天津中科闻歌科技有限公司 , 北京中科闻歌科技股份有限公司
摘要: 本发明提供了一种提高目标模型的安全性的方法、电子设备及存储介质,涉及模型技术领域,所述方法能够根据指定数据集的总集获取增量权重列表,进一步的获取第四类指令对应的模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,通过更新目标模型的权重来提高目标模型的安全性,可知本发明通过权重组合的方式获取模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,提高目标模型的安全性的同时能够缓解目标模型针对第五类指令的过度防御,第五类指令为与第四类指令有相似的构建方式但不会指导目标模型违反其内部的安全策略并输出不良内容的指令,无需混合大量的通用指令数据,节省了算力时间消耗,对计算机设备的显存要求较低。
-
公开(公告)号:CN116996707B
公开(公告)日:2024-08-13
申请号:CN202310967284.0
申请日:2023-08-02
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: H04N21/234 , H04N21/44 , G06T3/4038 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06T3/4046 , G06V10/82 , G06V40/16
摘要: 本发明提供了一种虚拟角色的视频渲染方法,包括如下步骤:基于目标虚拟角色的第一人脸图像和目标虚拟角色对应的目标音频数据,获取到预设口型图像集;预设口型图像集包括若干个口型图像;根据若干个口型图像和第二人脸图像,获取到拼接人脸图像集;拼接人脸图像集包括若干个拼接人脸图像;根据若干个拼接人脸图像和目标换脸模型,获取到目标人脸图像集;目标人脸图像集包括若干个目标人脸图像;根据若干个目标人脸图像和目标虚拟角色的初始人脸图像,获取到目标虚拟角色对应的目标渲染视频。本发明能够实现虚拟角色视频的实时驱动与渲染,并能够应用于多种语言的语音播报。
-
公开(公告)号:CN116361469B
公开(公告)日:2024-07-19
申请号:CN202310347857.X
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35
摘要: 本发明提供了一种基于预训练模型的话题生成方法,包括:获取待聚类文本中的每个文本的特征向量和关键词,每个文本包括h个关键词;利用设定聚类算法对待聚类文本进行聚类,得到多个话题;对多个话题进行清洗和合并处理,得到处理后的n个话题;对于n个话题中的任一话题,基于预训练生成模型生成对应的话题描述;输出n个话题的话题描述和对应的文本。本发明由于采用预训练生成模型生成话题描述,使得得到的话题描述通顺,可读性强,并且由于对话题进行了清洗和合并,使得聚类结果更加准确。
-
公开(公告)号:CN118069213A
公开(公告)日:2024-05-24
申请号:CN202410345122.8
申请日:2024-03-25
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F8/71
摘要: 本申请涉及云原生应用技术领域,特别是涉及一种基于云原生的模板部署系统,系统包括:待部署服务对应的模板定义信息A、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:解析A中的参数,生成k8s部署资源文件B,根据B,将待部署服务部署到预设的k8s集群中的主机节点,使用监控告警系统持续对所有符合预设监控指标的信息进行监控并更新服务实例状态,本发明将应用服务的部署、管理等功能集成到一个系统中,实现应用服务的一体化管理,提高了应用服务的可靠性和可扩展性,同时降低了部署和管理的复杂度和资源利用率,而且,仅需要模板定义信息即可部署服务,使得开发或运维人员能更容易地融入云原生生态中。
-
公开(公告)号:CN113269125B
公开(公告)日:2024-05-14
申请号:CN202110646314.9
申请日:2021-06-10
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06V40/16 , G06V10/74 , G06F16/583
摘要: 本发明实施例公开了一种人脸识别方法、装置、设备及存储介质。该方法包括:获取人脸识别图库,以及与待识别视频对应的视频人脸集合,人脸识别图库中包括至少一个人脸图像集合,人脸图像集合中各人脸图像具有相同身份标识号;根据视频人脸集合、人脸识别图库和预设识别条件,在视频人脸集合中确定至少一个候选视频人脸图像,并确定与各候选视频人脸图像对应的候选人脸图像集合;根据各候选人脸图像集合对应的身份标识号,在各候选视频人脸图像中确定目标视频人脸图像。本发明实施例的技术方案,解决了当人脸识别图库中具有多个相似人脸图像时,仅进行一次筛选在待识别视频中确定出的人脸图像识别结果准确性差的问题,提高了人脸图像识别的准确性。
-
公开(公告)号:CN113158656B
公开(公告)日:2024-05-14
申请号:CN202011561236.4
申请日:2020-12-25
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F40/279 , G06F40/30 , G06V30/40 , G06V30/18
摘要: 本发明实施例公开了一种讽刺内容识别方法、装置、电子设备以及存储介质。该方法包括:获取待识别的数据内容,并提取所述数据内容的文本内容和图像内容;提取所述图像内容的第一特征信息,其中,所述第一特征信息至少包括所述图像内容中的文本向量特征;提取所述文本内容的第二特征信息,其中,所述第二特征信息至少包括所述文本内容的表情符号特征;将所述图像内容的第一特征信息和所述文本内容的第二特征信息输入至预先训练的讽刺内容识别模型,得到所述数据内容的讽刺识别结果。通过本发明实施例公开的技术方案,实现了更加准确的识别到讽刺内容,更加精准的了解待识别的数据内容的表达含义。
-
-
-
-
-
-
-
-
-