-
公开(公告)号:CN118196474A
公开(公告)日:2024-06-14
申请号:CN202410133229.6
申请日:2024-01-30
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/28 , G06T7/00
Abstract: 本申请提供了一种图像缺陷分类方法及装置、存储介质、计算设备,该图像缺陷分类方法包括:获取原始图像,并将原始图像划分为N个区域块,原始图像中部分区域块具有缺陷,N为正整数;提取N个区域块的第一视觉特征;对各个区域块的第一视觉特征进行编码,以得到各个区域块的第二视觉特征;至少根据各个区域块的第二视觉特征计算各个区域块对应的目标权重;根据各个区域块的第二视觉特征以及对应的目标权重进行特征融合,以获得融合特征;根据融合特征计算原始图像的缺陷类别。本申请提供了一种提升缺陷图像的缺陷分类准确性的方案。
-
公开(公告)号:CN118113845A
公开(公告)日:2024-05-31
申请号:CN202410269522.5
申请日:2024-03-08
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/332 , G06F16/35 , G06F18/214
Abstract: 本发明提供一种生成式大语言模型选择题评测的方法及系统,其中方法包括以下步骤:获取选择题;对所述选择题进行重构和扩充,得到扩充后的选择题;对各个所述扩充后的选择题进行大模型回答文本匹配和大模型token约束回答,得到大模型答案;对所述大模型答案进行综合评分。本发明能够更全面更有效地检验大模型是否真正理解并拥有解答问题的能力,使得能力评估的分数更为客观准确,对由于模型输出内容不符合规范或者模型输出内容无法被正则模板匹配命中的问题进行补偿,有效地避免大模型直接回答问题时需要二次解析的情况,有效弥补了模型缺乏各个选项之间信息交互的问题,并且支持多选题评测。
-
公开(公告)号:CN118052911A
公开(公告)日:2024-05-17
申请号:CN202410281747.2
申请日:2024-03-12
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/00 , G06N3/0475
Abstract: 本申请提供一种基于深度学习和手部变换的语音驱动手部动作图像生成方法及系统、计算机可读存储介质。技术方案包括如下步骤:获取音频和相应的包含手部的人物图像;将所述音频输入变换网络得到相应的手部变换参数;将所述包含手部的人物图像输入分割网络得到相应的手部分层图像和背景图片;将所述手部变换参数带入到所述手部分层图像,得到相应的手部变换图像;将所述手部变换图像和所述背景图片输入生成网络得到最终的图像。针对生成和语音相匹配的手部动作经常会存在手部截断、错位等效果不佳的问题,本发明采用手部变换来刻画手部运动,并通过深度网络,有效、准确地生成带手部动作的图像。
-
公开(公告)号:CN118035409A
公开(公告)日:2024-05-14
申请号:CN202410084376.9
申请日:2024-01-19
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本申请提供了一种问答方法及装置、存储介质、计算设备,该问答方法包括:获取问题,并提取所述问题的关键词,以得到至少一个主题实体;根据所述至少一个主题实体在知识图谱中搜索相关的候选关系和候选实体,形成至少一个候选路径;将所述至少一个候选路径输入至大语言模型,以供所述大语言模型生成所述问题的答案。本申请提供了一种提升大语言模型的问答准确率的方案。
-
公开(公告)号:CN117372553B
公开(公告)日:2024-05-10
申请号:CN202311085684.5
申请日:2023-08-25
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,方法包括:确定人脸图像生成模型,包括图像编码子模型、音频编码子模型、音频映射子模型以及解码子模型;将驱动音频输入音频编码子模型,得到音频编码特征,以及将下半部分被遮挡的人脸图像输入图像编码子模型,得到人脸图像编码特征;将音频编码特征输入音频映射子模型,得到权重向量;采用权重向量,对预设的多个记忆口型编码特征进行加权运算,得到融合口型特征,其中,多个记忆口型编码特征对应于不同类型的口型;将音频编码特征、人脸图像编码特征以及融合口型特征,输入解码子模型,得到人脸生成图像。上述方案有助于提高人脸生成图像与驱动音频的口型匹配度。
-
公开(公告)号:CN117933058A
公开(公告)日:2024-04-26
申请号:CN202311630918.X
申请日:2023-11-30
Applicant: 华院计算技术(上海)股份有限公司 , 宝钢工程技术集团有限公司
IPC: G06F30/27 , G06N20/00 , G06N3/08 , G06F111/04
Abstract: 本公开提供了一种连铸工艺参数的调整方法、系统及模型生成方法、系统,该模型生成方法通过构建连铸工艺参数训练集,基于所述连铸工艺参数训练集对初始网络模型进行训练,得到连铸质量预测模型,基于连铸工艺评价标准和所述连铸质量预测模型,生成所述连铸工艺参数自适应优化模型,其中,所述连铸工艺参数自适应优化模型用于对所述连铸工艺参数进行自适应调整。本公开结合了连铸工艺评价标准对连铸工艺参数进行自适应调整,使调整后的连铸工艺参数更趋近于连铸质量要求,确保连铸产品质量,有效提高了连铸产品质量的良率。
-
公开(公告)号:CN117893579A
公开(公告)日:2024-04-16
申请号:CN202410098078.5
申请日:2024-01-23
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T7/269 , G06T3/4038 , G06V10/80 , G06T5/50 , G06N3/0464 , G06N3/08 , G06F17/16
Abstract: 一种人物插帧图像生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取第一图像的像素矩阵和第二图像的像素矩阵,并拼接得到第一拼接矩阵,所述第一图像和所述第二图像包含相同的目标人物;根据所述第一拼接矩阵预测得到所述目标人物的人体预测特征,以及对所述第一拼接矩阵进行特征提取,得到图像特征,所述人体预测特征包含所述目标人物在人物插帧图像所属时刻的预测人体信息;对所述目标人物的人体预测特征和所述图像特征进行特征融合,得到融合特征;对所述融合特征进行解码,得到所述人物插帧图像。上述方案有助于获得清晰度更高、质量更佳的人物插帧图像。
-
公开(公告)号:CN116664746B
公开(公告)日:2024-04-02
申请号:CN202310620674.0
申请日:2023-05-29
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 一种人脸重建方法及装置、计算机可读存储介质、终端,所述方法包括:分别对原始人脸图像及其深度图像进行特征提取,得到人脸特征矩阵以及深度图特征矩阵;对所述人脸特征矩阵以及所述深度图特征矩阵进行拼接处理,得到融合特征矩阵;将所述融合特征矩阵输入预测模型,得到优化形状矩阵和优化表情矩阵;基于所述优化形状矩阵和所述优化表情矩阵,对初始化纹理矩阵和初始化光照控制矩阵进行迭代优化,以确定优化纹理矩阵和优化光照控制矩阵。采用上述方案有助于改进人脸重建的效果。
-
公开(公告)号:CN115203361B
公开(公告)日:2024-04-02
申请号:CN202210663427.4
申请日:2022-06-13
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/30 , G06N3/0464 , G06N3/08 , G06Q10/0631
Abstract: 一种事件分拨方法及装置、存储介质、终端,所述方法包括:获取待分拨事件的事件文本;根据所述事件文本确定目标地址和目标类别,其中,目标地址为所述待分拨事件的发生地址,所述目标类别为所述待分拨事件所属的类别;根据所述目标地址和目标类别,确定所述待分拨事件的目标部门;读取归属于所述目标部门的多个可选人员的用户画像,所述用户画像包括:所述可选人员与各种类别的匹配度;根据所述目标类别和所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待分拨事件分拨至所述目标人员绑定的终端。采用上述方案,可以更加高效、精准地对事件进行分拨。
-
公开(公告)号:CN116384412B
公开(公告)日:2024-03-29
申请号:CN202310172048.X
申请日:2023-02-24
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F40/35 , G06F40/30 , G06N3/0455
Abstract: 一种对话内容生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取用户输入的当前话语;获取预设人物的多条偏好数据,所述多条偏好数据用于描述所述预设人物的行为偏好和/或认知偏好;根据所述多条偏好数据、所述当前话语和对话上下文历史,生成输入文本;将所述输入文本输入至预先训练得到的回复生成模型,得到所述回复生成模型输出的所述当前话语的回复内容。通过本申请提供的方案,能够在多轮对话中生成对话风格统一的回复内容。
-
-
-
-
-
-
-
-
-