一种图像去噪处理系统
    21.
    发明授权

    公开(公告)号:CN116797493B

    公开(公告)日:2024-01-26

    申请号:CN202310964411.1

    申请日:2023-08-02

    Abstract: 本发明涉及图像处理领域,尤其涉及一种图像去噪处理系统,包括:含噪人脸图像A、中间素描图像特征集合B=(B1,B2,……,Bn,……,BM)和文本特征C,所述系统实现以下步骤:对A和B1进行下采样得到第一个中间图像特征D1,对Di和Bi进行下采样得到Di+1,对DM和文本特征C进行注意力特征提取得到注意力图像特征E,对E进行上采样得到第一个中间噪声图像特征F1,对Fj和DM‑j进行上采样得到Fj+1,对FM‑1和D1进行上采样得到预测噪声图像G,根据A和G得到去噪人脸图像,将图像模态下的B、文本模态下的C与A进行信息融合,根据双模态的特征信息提高了对A的表征能力,提高了去噪结果的准确性。

    基于语音驱动和人脸自驱动的虚拟人视频合成方法

    公开(公告)号:CN116528019B

    公开(公告)日:2024-01-26

    申请号:CN202310724745.1

    申请日:2023-06-19

    Abstract: 本发明提供了一种基于语音驱动和人脸自驱动的虚拟人视频合成方法,包括:对原始虚拟人视频素材进行预处理,得到首帧人脸图像为基准人脸图像的第一视频素材;利用设定口型驱动模型驱动所述第一视频素材,得到第二视频素材;将第一视频素材中的首帧人脸图像作为被驱动人脸图像,将第二视频素材中的人脸图像作为口型驱动图像序列,通过设定人脸驱动算法得到第三视频素材;利用第三视频素材中的人脸图像替换原始虚拟人视频素材中对应的人脸图像,得到第四视频素材;将第四视频素材和目标音频文件进行合成,得到虚拟人内容播报视频。本发明能够高清化虚拟人的唇形、牙齿细节,发音和唇形吻合度高,可以对新的人物形象不加训练而快速迁移。

    一种图像生成系统
    23.
    发明公开

    公开(公告)号:CN116823597A

    公开(公告)日:2023-09-29

    申请号:CN202310964424.9

    申请日:2023-08-02

    Abstract: 本发明涉及图像处理领域,尤其涉及一种图像生成系统,包括:目标图像A和A对应的目标语义特征向量B,所述系统实现以下步骤:将A作为待加噪图像A0,初始化加噪次数t=0,通过噪声预测模型对A0和B进行噪声预测,得到噪声预测结果Ct,对A0和Ct进行加权相加,得到加噪图像Dt,以Dt作为A0,迭代得到目标加噪图像E,将E和B输入图像生成模型中进行图像生成,得到生成图像Es,以Es作为E,迭代得到目标生成图像,通过编码噪声的形式提取A中的随机信息、面部细节和语义信息等信息,并在A上多次叠加编码得到的噪声来得到E,进一步对E和B进行多次图像生成处理得到目标生成图像,提高了目标生成图像的准确性。

    知识图谱本体构建方法、装置、设备及可读存储介质

    公开(公告)号:CN114528417A

    公开(公告)日:2022-05-24

    申请号:CN202210377444.1

    申请日:2022-04-12

    Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集,并基于图像数据获取图像领域本体候选集,基于文本领域本体候选集中文本领域本体的本体概念词,确定文本领域本体的层次结构,基于图像领域本体候选集中图像领域本体的图像语义标签,确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构,确定包含文本领域本体和图像领域本体的知识图谱本体,实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。

    一种基于多模态大模型的图表关键信息提取方法

    公开(公告)号:CN120088801A

    公开(公告)日:2025-06-03

    申请号:CN202510250209.1

    申请日:2025-03-04

    Abstract: 本申请涉及电数字数据处理技术领域,特别是涉及一种基于多模态大模型的图表关键信息提取方法。该方法包括:获取初始提示文本;根据目标图表的类型和用户输入的问题的类型获取目标信息类型;获取所述目标信息类型对应的目标信息在目标图表中的位置信息;根据所述初始提示文本中与目标信息类型对应的提示文本以及目标信息类型目标信息类型对应的目标信息在目标图表中的位置信息构建目标提示文本;将目标提示文本和目标图表输入至多模态大模型,根据多模态大模型的输出获取目标图表的与用户输入的问题相关的关键信息。本发明能够根据任务需求精准提取图表的关键信息。

    Agent自主规划多模态大模型内容创作方法、装置及系统

    公开(公告)号:CN119917641A

    公开(公告)日:2025-05-02

    申请号:CN202411988650.1

    申请日:2024-12-31

    Abstract: 本发明提供了一种Agent自主规划多模态大模型内容创作方法、装置及系统,涉及大模型内容创作技术领域,包括:根据写作要求及参考文件生成待创作内容的脉络结构骨架;根据每一段落信息对应的若干待检索问题进行相关信息资料收集,生成每一段落信息对应的段落内容;根据每一锚点信息生成每一锚点信息对应的图表或图片;获取每一段落内容中的每一需要做引用计算的句子,以得到引用句子列表A;遍历相似度列表η,若ηi>η’,则确定Ai无异常;生成用户输入的写作要求对应的多模态长文;对写作内容的校对;本发明中,通过创新性地结合动态知识获取、多模态生成、长篇写作规划及内容可信度保障,显著提升了AI写作的智能性、可靠性及多样性。

    大模型驱动的树索引结构在RAG内容解析中的应用方法

    公开(公告)号:CN119884278A

    公开(公告)日:2025-04-25

    申请号:CN202510070908.8

    申请日:2025-01-16

    Abstract: 本发明提供了大模型驱动的树索引结构在RAG内容解析中的应用方法,所述方法根据原始文本的长度和预设文本长度获取初始文本;根据初始文本对应的中间文本列表,获取中间文本列表对应的树状存储数据,其中,中间文本包括中间段落文本和中间段落文本对应的中间标题路径,中间标题路径中包括若干个标题级别不同的标题文本;获取树状存储数据中的每一个节点对应的属性信息,并将节点对应的属性信息存储到节点中,以使得对树状存储数据进行更新并给树状存储数据分配一个唯一的ID;将树状存储数据和树状存储数据的ID上传到RAG对应的数据库中,能够保证文本的整体结构和初始文本之间的语义联系不被破坏,能够提高RAG的检索效率和生成质量。

    一种针对大语言模型的推理过程的优化方法及装置

    公开(公告)号:CN119849626A

    公开(公告)日:2025-04-18

    申请号:CN202411916870.3

    申请日:2024-12-24

    Abstract: 本申请实施例提供了一种针对大语言模型的推理过程的优化方法及装置,涉及大语言模型技术领域,该方法具体为:接收用户输入的问题文本;获取所述问题文本对应的目标特征集合,并基于所述目标特征集合对所述问题文本进行复杂度量化评估,以获取所述问题文本对应的目标复杂度;所述目标特征集合中的特征用于表征所述问题文本的复杂性;基于所述目标复杂度确定待激活的解码层的目标数量M,并将所述目标数量的解码层进行激活;其中,M为大于等于1的整数;待M个解码层激活之后,利用所述M个解码层对所述问题文本进行解码分析,获取所述问题文本对应的目标答复文本。本申请能够提高大语言模型的推理效率,同时避免资源浪费。

    基于对偶复数的知识图谱推理方法、装置、设备及介质

    公开(公告)号:CN119849625A

    公开(公告)日:2025-04-18

    申请号:CN202411916264.1

    申请日:2024-12-24

    Abstract: 本公开涉及一种基于对偶复数的知识图谱推理方法、装置、设备及介质,该方法包括:从待推理的知识图谱中提取样本三元组;对样本三元组进行负采样,得到负样本三元组;将样本三元组和负样本三元组确定为训练数据输入至用于将实体和关系嵌入至对偶复数空间的向量转换模型,基于向量转换模型输出的第一头实体向量、第一关系向量、第一尾实体向量、第二头实体向量、第二关系向量和第二尾实体向量构建损失函数,并对向量转换模型进行训练;基于训练后的向量转换模型对知识图谱进行推理补全。本公开通过将对偶复数空间应用于知识图谱的向量表示并训练向量转换模型,能够在不牺牲模型表现力的情况下减少参数量,提高知识图谱推理补全任务的运算效率。

    基于大模型的隐私保护方法、装置、设备及介质

    公开(公告)号:CN119830345A

    公开(公告)日:2025-04-15

    申请号:CN202411915119.1

    申请日:2024-12-24

    Abstract: 本公开实施例涉及一种基于大模型的隐私保护方法、装置、设备及介质,该方法包括:获取用户输入文本中的隐私信息以及隐私信息的实体类型标识;根据用户输入文本和实体类型标识,对隐私信息进行基于上下文的编码处理和基于类型的解码处理,得到隐私信息对应的替代信息;基于隐私信息和替代信息之间的对应关系,对用户输入文本进行基于问答模型的脱敏问答并恢复隐私信息,生成用户输入文本的应答文本。从而,提高了替代信息上下文语义的连贯性和完整性,以及替代信息与隐私信息的实体类型一致性,降低了将隐私信息替换为替代信息对脱敏问答的影响,在脱敏问答过程中保护了用户隐私,又使得最终生成的应答文本具有更好的准确性以及文本连贯性。

Patent Agency Ranking