Patent search ap:("之江实验室") AND inv:"毛瑞琛" Page 1

1.

发明授权
用于影视智能创作的情景互动的短视频生成方法及系统有权

公开(公告)号：CN115496863B

公开(公告)日：2023-03-21

申请号：CN202211354722.8

申请日：2022-11-01

Applicant: 之江实验室

Inventor： 毛瑞琛 , 马诗洁 , 耿卫东 , 李聪聪 , 杨森

IPC: G06T17/00 , G06T7/40 , G06T5/50 , G06V20/62 , G06V30/19 , G06V40/20

Abstract: 本发明涉及影视创作领域，公开一种用于影视智能创作的情景互动的短视频生成方法和系统，通过预训练的跨模态文本‑图像匹配模型和预训练的语言模型，可以实现场景图片和动作序列的匹配筛选；基于三维深度估计算法，计算出场景图像对应的深度信息，并通过预设的相机内参，估计出该场景图对应的三维信息；基于smpl‑x人体模型，对用户上传的人体进行参数估计和纹理贴图，获取带纹理的人体模型；通过估计的三维信息、动作序列、带纹理的人体模型、场景图片，合成互动者融于该场景图片的短视频。本发明可有效应用于当前影视创作中的分镜稿、故事版及预演动画等智能化生成工作，对影视创造的流程具体革新作用。

2.

发明授权
一种文本控制图像风格的语义图像合成的方法及系统有权

公开(公告)号：CN114610935B

公开(公告)日：2022-08-30

申请号：CN202210511529.4

申请日：2022-05-12

Applicant: 之江实验室

Inventor： 马诗洁 , 吴春琦 , 毛瑞琛

IPC: G06F16/58 , G06F16/583 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种文本控制图像风格的语义图像合成的方法及系统，包括图像离散编码器和风格迁移对抗生成网络联合训练模块、文本和图像联合建模模块和文本和语义图像控制特定风格语义图像合成模块。本发明通过自然语言处理模型以及图像生成模型，将设定的风格语句和表征语义的掩膜图像输入到模型中，自动地生成具有相应风格和语义的图片，以此解决了人们想要依据自己想法，及时获取到相应风格图片的需求。

3.

发明公开
一种基于三条带注意机制的特征图加权方法和装置审中-实审

公开(公告)号：CN114863131A

公开(公告)日：2022-08-05

申请号：CN202210579586.6

申请日：2022-05-25

Applicant: 之江实验室 , 中国科学院自动化研究所

Inventor： 马志豪 , 袁梦轲 , 孟维亮 , 郭建伟 , 毛瑞琛 , 徐士彪 , 张晓鹏

IPC: G06V10/44 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/82

Abstract: 本发明涉及计算机视觉和人工智能领域，具体涉及一种基于三条带注意机制的特征图加权方法和装置，旨在提高深度学习网络特征提取的有效性。本发明提出了一种新的注意力加权机制，它通过加权操作增加特征图的表现力，关注重要特征而抑制非重要特征。首先，采取全局池化操作将原始特征图分离成列条带、行条带和通道条带；其次，对每个条带都采取压缩和扩张的一系列加权操作；然后，将所有的加权后的三个条带分别扩充到原始的特征图尺寸大小，并将这三个加权后的特征图进行相加，随后进行非线性处理。最后，将所得到的加权特征图和原特征图相乘，并将结果作为后续的输入。本发明提出的基于三条带注意机制的特征图加权方法提高了特征图的有效性。

4.

发明授权
一种面向大模型训练的地质图语料标注方法和装置有权

公开(公告)号：CN118865393B

公开(公告)日：2024-12-10

申请号：CN202411343007.3

申请日：2024-09-25

Applicant: 之江实验室

Inventor： 毛瑞琛 , 王欣 , 原崧育 , 王宇轩 , 罗实 , 陈红阳

IPC: G06V20/70 , G06N20/00

Abstract: 本发明提出了一种面向大模型训练的地质图语料标注方法和装置，其方法在待标注地质图中定义了多层级标注要素，并提出了具体标注流程，包括1）对地质图的一级要素进行区域性标注，2）对空间标识包含的二级要素进行标注，3）对图例包含的二级要素进行标注，4）导出标准化标注结果。本发明构造了符合地质图图件要素表达逻辑的标注架构和方法，提高了标注效率，提升地质图的可用性，推动地学研究与人工智能技术的深度融合，为大模型支持地球科学研究提供基础语料的支持。

5.

发明公开
一种手语未登录手语词目映射方法及系统审中-实审

公开(公告)号：CN116561245A

公开(公告)日：2023-08-08

申请号：CN202310496282.8

申请日：2023-05-05

Applicant: 之江实验室

Inventor： 杨纲 , 毛瑞琛 , 黄君豪

IPC: G06F16/31 , G06F16/33 , G06F16/36 , G06F40/289 , G06F40/30

Abstract: 本发明公开了一种手语未登录手语词目映射方法和系统，包括以下步骤：基于HNSW算法构建已录入手语词目的索引信息；基于已录入手语词目的索引信息构建高频未登录手语词目至已录入手语词目的映射表；基于规则建立特殊样式未登录手语词目到已录入手语词目的匹配机制；基于映射表、匹配机制以及索引信息实现待测未登录手语词目的映射。该方法和系统能够实现对未登录词到已录入手语词目的映射，从而使手语词目序列尽可能多得被听障人士所理解。

6.

发明公开
一种面向三维重建的物体多角度图像自动采集装置及系统有权

公开(公告)号：CN113357512A

公开(公告)日：2021-09-07

申请号：CN202110481407.0

申请日：2021-04-30

Applicant: 之江实验室 , 中国科学院自动化研究所

Inventor： 孟维亮 , 余挺 , 毛瑞琛 , 徐士彪 , 张晓鹏

IPC: F16M11/42 , F16M11/04 , F16M11/10 , F16M11/18 , G06T17/00

Abstract: 本发明公开了一种面向三维重建的物体多角度图像自动采集装置及系统，装置包括：俯仰模块、升降模块、旋转模块、支撑模块；俯仰模块包括分别与连杆机构和升降模块连接的舵机，连杆机构与摄像头一端活动连接，摄像头另一端与升降模块活动连接，图传模块与摄像头连接；旋转模块包括分别与支撑模块固定连接的内圈台面、步进电机，小齿轮设置在步进电机上，大齿轮与小齿轮啮合，外圈台面与大齿轮固定连接，餐桌轴承分别与外圈台面、内圈台面连接，旋转模块步进电机驱动器分别与驱动步进电机、旋转模块单片机控制板和旋转模块电池连接；升降模块分别与俯仰模块和外圈台面连接。系统：包括采集装置和软件控制模块，软件控制模块用于控制采集装置。

7.

发明授权
一种电影场景内镜头视频排序系统及方法有权

公开(公告)号：CN115022711B

公开(公告)日：2024-05-31

申请号：CN202210460469.8

申请日：2022-04-28

Applicant: 之江实验室

Inventor： 马诗洁 , 陈萌 , 毛瑞琛

IPC: H04N21/44 , H04N21/845 , G06N3/0464 , G06N3/0455 , G06N3/084

Abstract: 本发明属于视频制作领域，公开了一种电影场景内镜头视频排序系统及方法，包括电影数据预处理模块、镜头特征提取模块、镜头排序模块；电影数据预处理模块包括镜头检测与分割，用于将输入的整个电影按照镜头进行切分；镜头特征提取模块用于提取单个镜头的多个关键帧图像的内容特征；镜头排序模块，用于将一个场景下的图像时序特征进行组合为一组特征图，多个场景的多组特征图进行输入；选定一个视频片段作为初始片段，预测出下一个视频片段是其中的哪一个镜头，直至完成所有视频片段的排序。本发明可实现以每一个分镜的多个镜头作为输入，自动的从中选择一个最符合此视频风格的镜头并将其串联成一个完整的视频。

8.

发明公开
一种人工反馈强化学习优化文本生成图像模型的方法及系统审中-实审

公开(公告)号：CN116955972A

公开(公告)日：2023-10-27

申请号：CN202310938023.6

申请日：2023-07-28

Applicant: 之江实验室

Inventor： 黄君豪 , 毛瑞琛 , 向宗元 , 陈群 , 杨纲

IPC: G06F18/21 , G06N3/092 , G06N3/0455

Abstract: 一种人工反馈强化学习优化文本生成图像模型的方法及系统，其方法包括：1)准备一个用于文本生成图片的text2image初始模型和用于对文本图片对进行打分的reward初始模型；2)用步骤1)的生成模型生成文本对应的图像并进行人工标注，包括在线标注和离线标注两种方式；3)基于步骤2)得到的人工标注的文本‑图像数据集，以reward初始模型为预训练模型训练一个能对文本图片匹配度打分的reward模型；4)基于步骤3)训练好的reward模型，并准备好训练用的输入文本数据集，采用人工反馈强化学习方法对text2image初始模型进行微调。本发明通过人工对原模型生成的数据进行标注，再利用标注好的数据微调原模型，来纠正以上问题，使得模型的生成结果更符合语义信息。

9.

发明授权
一种面向三维重建的物体多角度图像自动采集装置及系统有权

公开(公告)号：CN113357512B

公开(公告)日：2023-03-24

申请号：CN202110481407.0

申请日：2021-04-30

Applicant: 之江实验室 , 中国科学院自动化研究所

Inventor： 孟维亮 , 余挺 , 毛瑞琛 , 徐士彪 , 张晓鹏

IPC: F16M11/42 , F16M11/04 , F16M11/10 , F16M11/18 , G06T17/00

Abstract: 本发明公开了一种面向三维重建的物体多角度图像自动采集装置及系统，装置包括：俯仰模块、升降模块、旋转模块、支撑模块；俯仰模块包括分别与连杆机构和升降模块连接的舵机，连杆机构与摄像头一端活动连接，摄像头另一端与升降模块活动连接，图传模块与摄像头连接；旋转模块包括分别与支撑模块固定连接的内圈台面、步进电机，小齿轮设置在步进电机上，大齿轮与小齿轮啮合，外圈台面与大齿轮固定连接，餐桌轴承分别与外圈台面、内圈台面连接，旋转模块步进电机驱动器分别与驱动步进电机、旋转模块单片机控制板和旋转模块电池连接；升降模块分别与俯仰模块和外圈台面连接。系统：包括采集装置和软件控制模块，软件控制模块用于控制采集装置。

10.

发明授权
一种基于序列预测的车道线检测系统、装置和方法有权

公开(公告)号：CN114677442B

公开(公告)日：2022-10-28

申请号：CN202210583847.1

申请日：2022-05-26

Applicant: 之江实验室

Inventor： 华炜 , 邱奇波 , 毛瑞琛 , 黄刚 , 韩正勇 , 马也驰 , 高海明 , 冯权 , 张顺

IPC: G06T7/73 , G06N3/04 , G06V20/58 , G06V10/44 , G06V10/82

Abstract: 本发明公开了一种基于序列预测的车道线检测系统、装置和方法，所述方法对待检测的图像数据进行归一化操作得到归一化后的图像，并查找相应的预测关键点序列；提取归一化后的图像的特征向量，对该特征向量进行降维得到降维特征，将该降维特征按高宽维度展开，得到图像序列特征；基于降维特征的维度计算图像位置编码，将图像序列特征和图像位置编码相加，再共同进行编码得到编码记忆；对预测关键点序列进行特征提取得到解码序列特征；对编码记忆、预测关键点序列的位置编码与解码序列特征进行解码，得到待预测关键点的隐状态向量；将待预测关键点的隐状态向量转化为关键点的坐标。本发明提高了车道线的密集关键点的预测准确率，并实现快速预测。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification