-
公开(公告)号:CN117994390A
公开(公告)日:2024-05-07
申请号:CN202410190061.2
申请日:2024-02-20
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种针对指定目标的图像生成方法、装置和存储介质,包括:将目标场景图像、指定目标的第一文本描述和用于标记目标位置区域的位置信息输入预先训练好的文生图模型;所述文生图模型从所述目标场景图像中去除所述目标位置区域内的图像,得到第一场景图像;对所述第一场景图像和所述第一文本描述分别进行图像特征提取和文本特征提取,并将提取得到的图像特征和文本特征进行融合,得到融合后的特征;基于融合后的特征生成目标图像;训练所述文生图模型时,基于目标图像与第一训练图像之间的一致性差别来进行文生图模型的参数更新,以缩小该一致性差别。应用本申请,能够将文本描述的指定目标融合到场景图中。
-
公开(公告)号:CN117573697A
公开(公告)日:2024-02-20
申请号:CN202311705843.7
申请日:2023-12-12
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F16/242 , G06F16/245
Abstract: 本发明涉及数据处理技术领域,公开了一种数据搜索方法、设备、存储介质及装置,该方法包括:从搜索输入信息中提取搜索输入特征,将搜索输入特征与数据库中的多个数据分别进行局部匹配和全局匹配,获得局部相似度和全局相似度,对局部相似度和/或全局相似度进行相似度补偿,根据补偿后的局部相似度和/或全局相似度在数据库中进行搜索,获得数据搜索结果;由于本发明通过对局部相似度和/或全局相似度进行相似度补偿消除局部匹配与全局匹配之间的相似度差距,使得局部匹配和全局匹配在数据搜索时能够起到相同作用,从而能够同时兼容目标级和场景级数据搜索,进而能够满足用户的数据搜索需求。
-
公开(公告)号:CN117809106A
公开(公告)日:2024-04-02
申请号:CN202311855769.7
申请日:2023-12-28
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/762 , G06V10/25
Abstract: 本发明公开了一种目标标定方法,包括:利用广域类别数据库对应的广域类别特征分支替换初始模型中的初始类别特征分支,得到预标定模型;将通过已标定数据获得的已标定特征分支添加至所述预标定模型中,获得优化标定模型;利用所述优化标定模型的广域类别分支对待标定数据进行目标标定,得到联想预测结果;利用所述优化标定模型的已标定特征分支对所述待标定数据进行目标标定,得到已确认预测结果。本发明还提供一种电子设备和一种计算机可读介质。
-
公开(公告)号:CN116128610A
公开(公告)日:2023-05-16
申请号:CN202310204556.1
申请日:2023-02-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种数据生成方法、装置、设备及存储介质,所述数据生成方法包括:获取第一用户图像、带有目标服饰的模特图像和目标姿态图像;基于第一用户图像和模特图像,确定第一用户姿态图像、模特姿态图像、第一用户分割图像和模特分割图像;基于第一用户图像、第一用户姿态图像、第一用户分割图像和目标姿态图像,生成带有目标姿态的第二用户图像、第二用户图像的第二用户姿态图像和第二用户分割图像;基于第二用户图像、第二用户姿态图像、第二用户分割图像、模特图像、模特姿态图像和模特分割图像,确定带有目标服饰的第三用户图像。本申请通过输入不同目标姿态信息,可控制生成不同姿态的人体虚拟试衣结果,以此提高虚拟试衣的效果。
-
公开(公告)号:CN119418413A
公开(公告)日:2025-02-11
申请号:CN202510018274.1
申请日:2025-01-06
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V40/20 , G06V10/46 , G06V10/82 , G06N3/042 , G06N3/0464
Abstract: 本申请实施例提供了一种跳绳动作识别方法、装置、电子设备及存储介质。方法包括:从目标视频的各目标视频帧中,检测得到位于预设图像区域的目标人员;分别从各目标视频帧中提取目标人员的人体关键点,作为各目标视频帧对应的目标关键点;将各目标视频帧对应的目标关键点输入至第一图神经网络,得到第一图神经网络输出的跳绳动作状态,作为目标视频帧对应的跳绳动作状态;响应于从多个目标视频帧中检测到满足预设跳绳条件的连续多个目标视频帧,将连续多个目标视频帧对应的目标关键点输入至第二图神经网络,得到第二图神经网络输出的跳绳动作类型。可以实现对正常跳绳动作与异常跳绳动作的准确区分,提高跳绳计数的准确率。
-
公开(公告)号:CN118897888B
公开(公告)日:2025-01-21
申请号:CN202411390311.3
申请日:2024-09-30
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F40/205 , G06V10/40 , G06V10/774 , G06N20/00
Abstract: 本申请提供一种问题指引交互方法、装置、设备及存储介质。在一个示例中,该方法包括:获取用户输入信息;在所述用户输入信息包括文本问题描述信息以及问题示例信息的情况下,对所述文本问题描述信息进行特征提取,得到问题描述特征信息;以及,对所述问题示例信息进行智能统计,依据智能统计结果确定建议提示信息,并对所述建议提示信息进行特征提取,得到建议提示特征信息;依据所述问题描述特征信息,以及,所述建议提示特征信息,利用多模态大模型,在知识库中进行相似检索,确定答案指引。该方法可以提高智能问答中问题回答的准确性。
-
公开(公告)号:CN118897888A
公开(公告)日:2024-11-05
申请号:CN202411390311.3
申请日:2024-09-30
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/205 , G06V10/40 , G06V10/774 , G06N20/00
Abstract: 本申请提供一种问题指引交互方法、装置、设备及存储介质。在一个示例中,该方法包括:获取用户输入信息;在所述用户输入信息包括文本问题描述信息以及问题示例信息的情况下,对所述文本问题描述信息进行特征提取,得到问题描述特征信息;以及,对所述问题示例信息进行智能统计,依据智能统计结果确定建议提示信息,并对所述建议提示信息进行特征提取,得到建议提示特征信息;依据所述问题描述特征信息,以及,所述建议提示特征信息,利用多模态大模型,在知识库中进行相似检索,确定答案指引。该方法可以提高智能问答中问题回答的准确性。
-
公开(公告)号:CN116310454A
公开(公告)日:2023-06-23
申请号:CN202310225288.1
申请日:2023-03-03
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/762 , G06V10/40 , G06V10/778 , G06V10/80
Abstract: 本申请实施例公开了一种相机点位的聚类方法、挑选方法以及相关装置。该聚类方法包括:采用预先训练的特征提取模型,提取图像集内各图像的特征;将特征基于原型聚类为多个第一父级聚类簇;以及分别将各第一父级聚类簇内各图像的特征基于密度聚类为多个子级聚类簇;确定各子级聚类簇内各图像的特征的中心点对应的特征,将各中心点对应的特征基于密度聚类为多个第二父级聚类簇;融合多个第二父级聚类簇和各子级聚类簇,得到图像集的相机点位的聚类结果。通过本申请,解决了相关技术中由于不同采集人员、不同时间段采集、未记录点位等因素,导致大多图像集难以获取到准确的点位信息的技术问题,达到了获取准确的点位信息的技术效果。
-
-
-
-
-
-
-