Patent search ap:("北京中科闻歌科技股份有限公司") AND inv:"李军锋" Page 2

11.

发明公开
一种仿人类复杂问题检索方法、电子设备及存储介质审中-公开

公开(公告)号：CN119782463A

公开(公告)日：2025-04-08

申请号：CN202411840111.3

申请日：2024-12-13

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 张帅星 , 徐楠 , 张倩 , 孙雷 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06F16/3329 , G06F16/353 , G06F40/35 , G06N3/045 , G06N5/022

Abstract: 本发明提供了一种仿人类复杂问题检索方法、电子设备及存储介质，该方法包括：对原始问题语句进行拆解处理，以得到若干个原子问题语句；根据若干个原子问题语句之间的关联关系，确定若干个原子问题语句之间的执行顺序；根据每一原子问题语句对应的语句类型，确定每一原子问题语句对应的目标检索信源；根据若干原子问题语句之间的执行顺序，依次通过每一原子问题语句对应的目标检索信源，对该原子问题语句进行检索，得到每一原子问题语句对应的原始答复语句；对若干原始答复语句进行语义整合，得到原始问题语句对应的目标答复语句，以通过意图识别、问题拆解、逻辑规划、扩展生成以及动态执行等多个模块协同工作，有效解决了复杂问题的检索难题。

12.

发明公开
基于语音驱动和人脸自驱动的虚拟人视频合成方法有权

公开(公告)号：CN116528019A

公开(公告)日：2023-08-01

申请号：CN202310724745.1

申请日：2023-06-19

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郑洋 , 陈博 , 徐楠 , 李军锋 , 曹家 , 王磊

IPC: H04N21/81 , G06T13/20 , G06T13/40

Abstract: 本发明提供了一种基于语音驱动和人脸自驱动的虚拟人视频合成方法，包括：对原始虚拟人视频素材进行预处理，得到首帧人脸图像为基准人脸图像的第一视频素材；利用设定口型驱动模型驱动所述第一视频素材，得到第二视频素材；将第一视频素材中的首帧人脸图像作为被驱动人脸图像，将第二视频素材中的人脸图像作为口型驱动图像序列，通过设定人脸驱动算法得到第三视频素材；利用第三视频素材中的人脸图像替换原始虚拟人视频素材中对应的人脸图像，得到第四视频素材；将第四视频素材和目标音频文件进行合成，得到虚拟人内容播报视频。本发明能够高清化虚拟人的唇形、牙齿细节，发音和唇形吻合度高，可以对新的人物形象不加训练而快速迁移。

13.

发明公开
一种基于多模态大模型的图表处理方法审中-公开

公开(公告)号：CN120088802A

公开(公告)日：2025-06-03

申请号：CN202510250211.9

申请日：2025-03-04

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 郝艳妮 , 王庆立 , 徐楠 , 李彤 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06V30/41 , G06V30/19 , G06N5/04

Abstract: 本申请涉及电数字数据处理技术领域，特别是涉及一种基于多模态大模型的图表处理方法。该方法包括：获取目标图表的上下文关键信息；根据用户输入的初始问题获取所述初始问题的问题类型；根据所述初始问题的问题类型和目标图表的类型从目标图表的上下文关键信息中筛选与所述初始问题的问题类型和目标图表的类型关联的信息；根据筛选得到的与所述初始问题的问题类型和目标图表的类型关联的信息和所述初始问题构建与所述初始问题对应的目标问题；将所述目标问题和目标图表输入多模态大模型，将多模态大模型的输出确定为所述初始问题对应的答案。本发明能够提高模型输出结果的准确性和效率。

14.

发明公开
一种基于大模型的树形结构知识构建方法、设备及介质审中-公开

公开(公告)号：CN119886307A

公开(公告)日：2025-04-25

申请号：CN202510070907.3

申请日：2025-01-16

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 夏玉龙 , 李瑞群 , 孙雷 , 徐楠 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06N5/022 , G06N5/02 , G06F16/31 , G06F16/36 , G06F40/205

Abstract: 本发明提供了一种基于大模型的树形结构知识构建方法、设备及介质，涉及人工智能技术领域，所述方法包括：初始化栈，并创建栈的根节点，获取目标文章的第i行文本；若第i行文本是标题，获取目标文章的第i行文本的标题类型，按照从栈顶到栈底的顺序遍历栈中的子节点，若存在子节点与第i行文本的标题类型相同，将该子节点标记为相同类型节点，并将从栈顶到相同类型节点的全部节点出栈，若栈为空，将第i行文本作为根节点的子节点，并将第i行文本入栈；若栈不为空，获取栈的栈顶，将第i行文本作为栈顶的子节点，并将第i行文本入栈，直到目标文章的所有行遍历完成，生成目标文章的解析树；从而更加高效且准确的获取到目标文章的解析树。

15.

发明公开
基于上下文的大语言模型对话处理方法、装置及电子设备审中-实审

公开(公告)号：CN119831045A

公开(公告)日：2025-04-15

申请号：CN202411915111.5

申请日：2024-12-24

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 徐楠 , 肖星琳 , 李庆晓 , 董垚 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06N5/04 , G06F40/30 , G06F18/22 , G06F16/3329 , G06F16/335

Abstract: 本申请实施例公开了一种基于上下文的大语言模型对话处理方法、装置及电子设备，可解决如何提供一种基于上下文相似度分析与智能筛选的动态管理方法来优化大语言模型交互的问题。该方法包括：获取用户输入的当前文本信息；对当前文本信息和预存的多个历史对话信息分别进行编码，得到当前文本向量和多个历史对话向量；根据每个历史对话向量和当前文本向量之间的语义相似度，对多个历史对话向量进行筛选，得到筛选后的目标历史对话信息；将当前文本信息和筛选后的目标历史对话信息进行拼接，得到目标输入文本；将目标输入文本输入到目标语言模型中，得到目标输出响应信息，目标语言模型包括大语言模型。

16.

发明公开
一种大模型问答的知识溯源方法、装置、介质和设备审中-实审

公开(公告)号：CN119829717A

公开(公告)日：2025-04-15

申请号：CN202411905240.6

申请日：2024-12-23

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 邹瑞 , 孙雷 , 徐楠 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06F16/3329 , G06F40/194 , G06F18/214 , G06N5/022

Abstract: 本申请涉及人工智能技术领域，特别是涉及一种大模型问答的知识溯源方法、装置、介质和设备。包括：获取大模型问答生成的待溯源文本；根据目标问题和目标任务模式对应的每一置信数据源，得到初始知识载体列表C；根据待溯源文本和C，得到关键知识载体列表M；根据待溯源文本和M，得到关键知识片段匹配度列表集DP；若MAX(DPj)＜EP；则将Mj从M中删除；否则不删除，以更新M，得到目标知识载体列表G。本申请提高了知识溯源的准确性，减少了溯源的工作量。且节约了计算机资源，能够为待溯源文本提供较为准确的溯源知识载体，使得用户能够获取大模型问答输出结果的知识来源，辅助用户对于大模型问答输出结果的置信度的判断。

17.

发明公开
大模型的优化训练、数据处理方法、装置、设备和介质审中-实审

公开(公告)号：CN119761417A

公开(公告)日：2025-04-04

申请号：CN202411808552.5

申请日：2024-12-10

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 董力维 , 徐楠 , 李庆晓 , 董垚 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/084 , G06N5/04

Abstract: 本申请涉及数据处理技术领域，尤其提供一种大模型的优化训练、数据处理方法、装置、设备和存储介质，首先，针对每条样本指令，将样本指令输入基础模型，得到样本指令的N条候选答案，利用M个不同的奖励模型分别对候选答案进行评分，得到候选答案的M个评分结果；然后对候选答案的M个评分结果进行加权计算，得到候选答案的偏好值；基于候选答案的偏好值从N条候选答案中选取第一答案和第二答案；最后构建偏好样本数据集，偏好样本数据集包括偏好样本，偏好样本包括样本指令以及样本指令对应的第一答案和第二答案，偏好样本数据集用于采用离线方式对基础模型进行优化训练。以减少了对巨量计算资源的消耗，使大模型偏好对齐训练任务更易实施。

18.

发明公开
一种大模型RAG召回策略智能规划方法、装置、介质及设备审中-实审

公开(公告)号：CN119760097A

公开(公告)日：2025-04-04

申请号：CN202411952374.3

申请日：2024-12-27

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 张倩 , 孙雷 , 张帅星 , 徐楠 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06F16/3329 , G06F16/334 , G06F16/338 , G06N3/0455 , G06F16/34 , G06F16/335

Abstract: 本发明涉及智能问答技术领域，尤其涉及一种大模型RAG召回策略智能规划方法、装置、介质及设备，通过引入提示词将初始问题转化为目标问题，对目标问题进行关键信息和向量的多维度处理，以基于预设大模型获取到参考召回数据，将初始场景类别、预设召回路径、目标问题、参考召回数据和预设提示词输入至预设大模型中，获取到目标召回路径，按照顺序依次执行目标召回路径中的所有数据召回环节，获取到目标召回数据，通过为大模型提供多维度参考信息，辅助大模型获取到由多个按顺序排列的数据召回环节构成的目标召回路径，使得数据召回过程更加高效，并能够适应各种复杂多变的应用场景和问题类型，提高了召回方法的准确性和效率。

19.

发明授权
实时问答虚拟人视频生成方法、电子设备及存储介质有权

公开(公告)号：CN116996630B

公开(公告)日：2024-07-12

申请号：CN202310964008.9

申请日：2023-08-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 陈博 , 郑洋 , 李彤 , 徐楠 , 李军锋 , 曹家 , 王磊

IPC: H04N5/262 , G10L21/10 , G10L21/18 , H04N5/265 , G06N3/0475 , G06N3/094 , G06F16/332

Abstract: 本发明提供了一种实时问答虚拟人视频生成方法、电子设备及存储介质，方法包括：基于待播报信息获取对应的场景视频；对音频文件进行特征提取，得到对应的音频特征；基于场景视频和音频特征，生成口型与音频特征相匹配的场景视频，作为初始人脸驱动视频；基于场景视频中的目标图像以及初始驱动视频，获取对应的人脸关键点、人脸深度图和人脸的RGB编码特征；基于获取的人脸关键点、人脸深度图和人脸的RGB编码特征，得到目标人脸驱动视频；利用目标人脸驱动视频中的人脸替换场景视频中的人脸，得到虚拟人视频；将虚拟人视频和音频文件进行合成，得到待播报的虚拟人播报视频。本发明能够提高虚拟人视频的制作效率。

20.

发明授权
逆转图像重建方法、装置、设备及可读存储介质有权

公开(公告)号：CN116862803B

公开(公告)日：2024-05-24

申请号：CN202310864682.X

申请日：2023-07-13

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 徐楠 , 郝艳妮 , 陈博 , 李军锋 , 曹家 , 王磊

IPC: G06T5/60 , G06V10/56 , G06V10/82 , G06N3/0464 , G06V10/44 , G06N3/048

Abstract: 本公开涉及一种逆转图像重建方法、装置、设备及可读存储介质。本公开通过获取待逆转图像，所述待逆转图像包括待逆转的高质量图像和/或待逆转的低质量图像，对所述待逆转图像进行逆转处理，得到逆转图像。由于对所述待逆转图像进行逆转处理，得到逆转图像，进而可以对逆转图像的隐空间特征进行约束，使逆转得到的隐空间特征的分布更符合GAN隐空间中原始隐空间编码的分布，在图像编辑中减少图像伪影的出现，从而提高真实图像的图像编辑的效果。并且，本公开实施例可以适用于高质量图像以及低质量图像，提高了逆转方法的泛化性能，提升了低质量图像逆转的重建效果，保证了GAN逆转方法对图像质量的稳定性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification