-
公开(公告)号:CN119670291A
公开(公告)日:2025-03-21
申请号:CN202411741356.0
申请日:2024-11-29
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F30/17 , G06F30/23 , G01M13/021 , G06F119/14
Abstract: 本发明提供一种齿轮对啮合接触变形计算方法、系统、存储介质和程序产品,属于齿轮传动系统动力学分析领域。其中方法包括:设置齿轮模型参数,根据参数建立齿轮模型;基于齿轮模型,设置网格划分计划,建立一个全六面体剖分模型;建立力与位移的方程式,得到总体的刚度矩阵;确定齿轮接触线,获取齿轮接触线上的载荷点信息;按顺序遍历每个载荷点及其下一个载荷点,针对相邻的两个载荷点信息构成的不同情况,拼装方程式,得到最终方程;求解最终方程得到各个节点的位移,使用有限元框架插值获得各个载荷点的法向位移,得到齿轮对啮合接触变形结果。本发明不用针对某个时刻的接触载荷位置对网格进行额外剖分处理,简化了齿轮啮合分析的计算。
-
公开(公告)号:CN118965628A
公开(公告)日:2024-11-15
申请号:CN202411158862.7
申请日:2024-08-22
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F30/17 , G06F30/23 , G06F119/14
Abstract: 本公开提供了一种斜齿轮啮合的形变分析方法、系统、设备及介质。该形变分析方法包括获取目标齿轮的六面网格模型和啮合齿数量;基于所述啮合齿数量从所述六面网格模型中得到对应的啮合齿底面图;基于所述啮合齿底面图扩展得到所述目标齿轮的啮合齿计算区域;基于所述啮合齿计算区域计算得到所述目标齿轮的啮合齿形变值。通过将目标齿轮进行的啮合齿部分计算区域提取,能在减少计算量的前提下尽可能的保留齿的完整度,能够精确捕捉该区域的形变和应力分布,而且区域提取工作与网格剖分工作完全解耦,使两部分任务可由不同的进程来完成,提高对齿轮的分析效率。
-
公开(公告)号:CN118379321A
公开(公告)日:2024-07-23
申请号:CN202410476312.3
申请日:2024-04-19
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T7/194
Abstract: 本公开提供了一种抠图模型训练方法、图像抠图处理方法、装置及介质,其中,抠图模型训练方法包括以下步骤:将样本图像分别输入人像抠图模型和物体抠图模型中,得到对应的第一图像和第二图像,所述第一图像为包含人像的抠图蒙版,所述第二图像为包含物体的抠图蒙版;对所述第一图像和所述第二图像执行与操作得到所述样本图像对应的标签,所述标签为同时包含人像和物体的抠图蒙版;利用所述样本图像以及所述样本图像对应的所述标签对目标抠图模型进行训练,通过样本图像和样本图像对应的标签构建同时包含人像和物体的多主体数据集对抠图模型进行训练,使抠图模型在面对人像和物体这种多主体抠图的场景下能够得到更加准确的抠图结果。
-
公开(公告)号:CN118233697A
公开(公告)日:2024-06-21
申请号:CN202410464923.6
申请日:2024-04-17
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/44 , H04N21/4402 , H04N21/845 , G06V40/16 , G06N3/08
Abstract: 传统的视频数据集切分方法主要依赖于手工标注,这一过程耗时耗力,且难以适应大规模视频数据处理的需求。本发明提供一种基于深度学习的自动切分新闻主播视频数据集的方法、系统及电子设备,包括:获取用户提交的新闻视频;对所述新闻视频进行第一次筛查,得到新闻主播视频和采访观众视频;对所述新闻主播视频和所述采访观众视频进行第二次筛查,过滤所述采访观众视频,得到过滤后的新闻主播视频;使用深度模型对所述过滤后的新闻主播视频进行逐帧筛查,得到精确的新闻主播视频切分结果。以实现高精度、全自动的新闻主播视频切分。
-
公开(公告)号:CN120086567A
公开(公告)日:2025-06-03
申请号:CN202510149612.5
申请日:2025-02-11
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F18/213 , G06F18/214 , G06N3/04
Abstract: 本发明公开一种文字驱动数字人的方法、系统及程序产品,属于AIGC技术领域;该方法包括:输入驱动文字、参考声音和形象图片;对参考声音进行识别,得到相应的参考文字;对参考声音进行特征提取,得到声音特征向量;根据驱动文字、声音特征向量和参考文字,得到驱动文字特征;根据驱动文字特征和形象图片,生成连续的图片结果;根据驱动文字特征,生成合成声音;根据连续的图片结果和合成声音,得到视频。本发明利用不同模态特征之间的关系,提高了驱动数字人的效果和效率。
-
公开(公告)号:CN118052911B
公开(公告)日:2025-02-18
申请号:CN202410281747.2
申请日:2024-03-12
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/00 , G06N3/0475
Abstract: 本申请提供一种基于深度学习和手部变换的语音驱动手部动作图像生成方法及系统、计算机可读存储介质。技术方案包括如下步骤:获取音频和相应的包含手部的人物图像;将所述音频输入变换网络得到相应的手部变换参数;将所述包含手部的人物图像输入分割网络得到相应的手部分层图像和背景图片;将所述手部变换参数带入到所述手部分层图像,得到相应的手部变换图像;将所述手部变换图像和所述背景图片输入生成网络得到最终的图像。针对生成和语音相匹配的手部动作经常会存在手部截断、错位等效果不佳的问题,本发明采用手部变换来刻画手部运动,并通过深度网络,有效、准确地生成带手部动作的图像。
-
公开(公告)号:CN118233697B
公开(公告)日:2025-02-07
申请号:CN202410464923.6
申请日:2024-04-17
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/44 , H04N21/4402 , H04N21/845 , G06V40/16 , G06N3/08
Abstract: 传统的视频数据集切分方法主要依赖于手工标注,这一过程耗时耗力,且难以适应大规模视频数据处理的需求。本发明提供一种切分新闻主播视频数据集的方法、系统及电子设备,包括:获取用户提交的新闻主播视频;对所述新闻主播视频进行快速筛查,得到包含新闻主播和采访观众的人脸数据库;对所述包含新闻主播和采访观众的人脸数据库进行过滤,过滤掉采访观众的人脸数据,得到仅含新闻主播的人脸数据库;根据所述仅含新闻主播的人脸数据库,使用深度模型对所述新闻主播视频进行逐帧筛查,得到精确的新闻主播视频切分结果。以实现高精度、全自动的新闻主播视频切分。
-
公开(公告)号:CN119313789A
公开(公告)日:2025-01-14
申请号:CN202411304862.3
申请日:2024-09-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/40 , G06F18/2431 , G06F18/21 , G06N3/0464 , G06N3/08 , G10L25/63 , G10L25/57
Abstract: 本发明提供一种带表情的数字人生成方法、系统、存储介质和程序产品,其中方法包括以下步骤:输入音频和相应图片;将音频输入到音频情绪提取网络提取相应的情绪类别;根据情绪类别从表情模板中抽取对应的模板;将模板和图片一起输入到生成网络生成相应的带表情基础图片;将基础图片经过处理以后,提取图像特征,同时对音频进行音频特征提取;将图像特征和音频特征输入到解码网络得到带表情的图片。本发明提供一种带表情的数字人生成方法、系统、存储介质和程序产品,能够通过引入相应的音频情绪提取和表情模板,实现对于带表情的,并且是多种表情变化的数字人生成任务。
-
公开(公告)号:CN118646938A
公开(公告)日:2024-09-13
申请号:CN202410706471.8
申请日:2024-06-03
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/81 , H04N21/845 , H04N21/4402 , G06V40/20 , G06N3/0475 , G06N3/09
Abstract: 本公开提供了一种关键点生成方法及其模型的训练方法、视频生成方法。训练方法包括:获取训练样本;将训练样本输入关键点生成模型,根据关键点生成模型输出第一视频帧至第三视频帧之间的视频帧的关键点预测数据;根据目标关节点的运动约束条件、关键点样本数据和关键点预测数据计算损失误差;运动约束条件包括多个目标关节点中相邻两个目标关节点在各视频帧中的相对位置关系不变;根据损失误差调整关键点生成模型的网络参数,直至满足迭代停止条件。本公开通过关键点生成模型预测两帧视频帧中人物动作关键点,并根据目标关节点的运动约束条件、关键点样本数据和关键点预测数据计算损失误差,使关键点生成模型预测值与真实值更接近,预测更准确。
-
公开(公告)号:CN118052911A
公开(公告)日:2024-05-17
申请号:CN202410281747.2
申请日:2024-03-12
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/00 , G06N3/0475
Abstract: 本申请提供一种基于深度学习和手部变换的语音驱动手部动作图像生成方法及系统、计算机可读存储介质。技术方案包括如下步骤:获取音频和相应的包含手部的人物图像;将所述音频输入变换网络得到相应的手部变换参数;将所述包含手部的人物图像输入分割网络得到相应的手部分层图像和背景图片;将所述手部变换参数带入到所述手部分层图像,得到相应的手部变换图像;将所述手部变换图像和所述背景图片输入生成网络得到最终的图像。针对生成和语音相匹配的手部动作经常会存在手部截断、错位等效果不佳的问题,本发明采用手部变换来刻画手部运动,并通过深度网络,有效、准确地生成带手部动作的图像。
-
-
-
-
-
-
-
-
-