-
公开(公告)号:CN119692335A
公开(公告)日:2025-03-25
申请号:CN202411760336.8
申请日:2024-12-03
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/205 , G06F18/2431 , G06V30/41
Abstract: 本发明提供了一种基于多模型的PDF解析方法、电子设备和存储介质,方法包括利用规则提取、版面分析、表格识别、公式检测、公式识别、多模态大模型chart2text、多模态大模型段落排序等方法获取复杂PDF中可能出现的所有元素类型。本发明能够实现复杂PDF的完整结构化解析以及支持扫描件和非扫描件。
-
公开(公告)号:CN118940299A
公开(公告)日:2024-11-12
申请号:CN202411402787.4
申请日:2024-10-09
Applicant: 天津中科闻歌科技有限公司 , 北京中科闻歌科技股份有限公司
Abstract: 本发明提供了一种提高目标模型的安全性的方法、电子设备及存储介质,涉及模型技术领域,所述方法能够根据指定数据集的总集获取增量权重列表,进一步的获取第四类指令对应的模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,通过更新目标模型的权重来提高目标模型的安全性,可知本发明通过权重组合的方式获取模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,提高目标模型的安全性的同时能够缓解目标模型针对第五类指令的过度防御,第五类指令为与第四类指令有相似的构建方式但不会指导目标模型违反其内部的安全策略并输出不良内容的指令,无需混合大量的通用指令数据,节省了算力时间消耗,对计算机设备的显存要求较低。
-
公开(公告)号:CN116996707B
公开(公告)日:2024-08-13
申请号:CN202310967284.0
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/234 , H04N21/44 , G06T3/4038 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06T3/4046 , G06V10/82 , G06V40/16
Abstract: 本发明提供了一种虚拟角色的视频渲染方法,包括如下步骤:基于目标虚拟角色的第一人脸图像和目标虚拟角色对应的目标音频数据,获取到预设口型图像集;预设口型图像集包括若干个口型图像;根据若干个口型图像和第二人脸图像,获取到拼接人脸图像集;拼接人脸图像集包括若干个拼接人脸图像;根据若干个拼接人脸图像和目标换脸模型,获取到目标人脸图像集;目标人脸图像集包括若干个目标人脸图像;根据若干个目标人脸图像和目标虚拟角色的初始人脸图像,获取到目标虚拟角色对应的目标渲染视频。本发明能够实现虚拟角色视频的实时驱动与渲染,并能够应用于多种语言的语音播报。
-
公开(公告)号:CN113158656B
公开(公告)日:2024-05-14
申请号:CN202011561236.4
申请日:2020-12-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/30 , G06V30/40 , G06V30/18
Abstract: 本发明实施例公开了一种讽刺内容识别方法、装置、电子设备以及存储介质。该方法包括:获取待识别的数据内容,并提取所述数据内容的文本内容和图像内容;提取所述图像内容的第一特征信息,其中,所述第一特征信息至少包括所述图像内容中的文本向量特征;提取所述文本内容的第二特征信息,其中,所述第二特征信息至少包括所述文本内容的表情符号特征;将所述图像内容的第一特征信息和所述文本内容的第二特征信息输入至预先训练的讽刺内容识别模型,得到所述数据内容的讽刺识别结果。通过本发明实施例公开的技术方案,实现了更加准确的识别到讽刺内容,更加精准的了解待识别的数据内容的表达含义。
-
公开(公告)号:CN117828081A
公开(公告)日:2024-04-05
申请号:CN202410008601.0
申请日:2024-01-03
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/30 , G06F40/211
Abstract: 本申请涉及自然语言处理技术领域,尤其涉及一种言论立场检测方法、装置和存储介质。包括:获取待检测文本,并从待检测文本中抽取人物言论;获取第一语义矩阵向量和至少一个第二语义矩阵向量;第一语义矩阵向量为人物言论对应的语义表示向量,第二语义矩阵向量为至少一个立场标签对应的语义表示向量;立场标签为对于预设立场目标的立场表态;计算第一语义矩阵向量和每个第二语义矩阵向量之间的目标相似度;将目标相似度最大的第二语义矩阵向量对应的立场标签,确定为人物言论对于预设立场目标的立场。本申请实施例用于解决言论立场检测的检测效果较差的问题。
-
公开(公告)号:CN116938470A
公开(公告)日:2023-10-24
申请号:CN202310771426.6
申请日:2023-06-27
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
IPC: H04L9/32 , H04L9/00 , H04L67/104
Abstract: 本发明公开了一种基于区块链的安全电子投票系统,属于区块链技术领域;所述系统具体架构组成如下:①应用层:所述应用层用于展示不同功能选择模块;②合约层:所述合约层用于限定投票逻辑和链上逻辑;③共识层:所述共识层用于协调和保证分布式网络中各节点数据记录的一致性;④网络层:所述网络层用于提供网络服务,采用P2P网络;⑤应用链:所述应用链用于验证投票信息的可靠性。本发明通过区块链技术构建投票系统,提供数字身份认证技术和匿名投票技术,以保证投票过程的公平性和投票者的匿名性,并提高投票过程的便捷性。
-
公开(公告)号:CN116797493A
公开(公告)日:2023-09-22
申请号:CN202310964411.1
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像去噪处理系统,包括:含噪人脸图像A、中间素描图像特征集合B=(B1,B2,……,Bn,……,BM)和文本特征C,所述系统实现以下步骤:对A和B1进行下采样得到第一个中间图像特征D1,对Di和Bi进行下采样得到Di+1,对DM和文本特征C进行注意力特征提取得到注意力图像特征E,对E进行上采样得到第一个中间噪声图像特征F1,对Fj和DM‑j进行上采样得到Fj+1,对FM‑1和D1进行上采样得到预测噪声图像G,根据A和G得到去噪人脸图像,将图像模态下的B、文本模态下的C与A进行信息融合,根据双模态的特征信息提高了对A的表征能力,提高了去噪结果的准确性。
-
公开(公告)号:CN115828917A
公开(公告)日:2023-03-21
申请号:CN202211505312.9
申请日:2022-11-28
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F40/295 , G06N3/045 , G06N3/042 , G06N3/096 , G06N5/02
Abstract: 本发明提供了一种融合知识的低资源语种实体抽取系统,包括:目标语种知识库、关联语种知识库、处理器和存储有计算机程序的存储器,当处理器执行计算机程序时,实现如下步骤:获取无标注语料目标语句中的目标实体,将目标实体与目标语种知识库、关联语种知识库进行实体链接,以预测掩码实体为目标获取第一损失函数,以预测实体的上下文为目标获取第二损失函数,以预测实体类型为目标获取第三损失函数,通过最小化三个损失函数的加权求和函数,获取XLM‑RK模型;从而根据XLM‑RK模型在预训练阶段获得的跨语言实体对齐能力,提升目标语种实体识别效果。
-
公开(公告)号:CN115481645A
公开(公告)日:2022-12-16
申请号:CN202211268116.4
申请日:2022-10-17
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
Abstract: 本发明公开了一种基于形态学增强的张量化词嵌入压缩系统,该模型包括语素分割模块、语素索引及嵌入模块、词嵌入生成模块;所述语素分割模块将文本任务的词表中每个词分割成语素,所述语素索引及嵌入模块首先统计语素分割模块的分割结果生成语素表,接着定义语素索引矩阵和多个可训练的语素嵌入矩阵,语素索引矩阵每一行代表词表中对应单词的语素在语素表中的位置,语素嵌入矩阵的每一行代表语素表中对应语素的嵌入向量;词嵌入生成模块对词表中每个词,从语素嵌入矩阵中索引出语素向量并进行张量积,多个张量积的结果相加生成词嵌入向量;本发明克服了一般词嵌入技术参数量及存储空间占用大的问题,以及高倍压缩词嵌入时任务效果损失的问题。
-
公开(公告)号:CN113158656A
公开(公告)日:2021-07-23
申请号:CN202011561236.4
申请日:2020-12-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/30 , G06K9/00 , G06K9/46
Abstract: 本发明实施例公开了一种讽刺内容识别方法、装置、电子设备以及存储介质。该方法包括:获取待识别的数据内容,并提取所述数据内容的文本内容和图像内容;提取所述图像内容的第一特征信息,其中,所述第一特征信息至少包括所述图像内容中的文本向量特征;提取所述文本内容的第二特征信息,其中,所述第二特征信息至少包括所述文本内容的表情符号特征;将所述图像内容的第一特征信息和所述文本内容的第二特征信息输入至预先训练的讽刺内容识别模型,得到所述数据内容的讽刺识别结果。通过本发明实施例公开的技术方案,实现了更加准确的识别到讽刺内容,更加精准的了解待识别的数据内容的表达含义。
-
-
-
-
-
-
-
-
-