-
公开(公告)号:CN117076614B
公开(公告)日:2024-02-02
申请号:CN202311324461.X
申请日:2023-10-13
Abstract: 本申请适用于检索技术领域,提供了一种基于迁移学习的跨语种文本检索方法及终端设备,包括:基于预设语种专利数据库构建第一训练集;对跨语种专利检索模型进行训练时,通过跨语种专利检索模型确定每条样本数据对应的高维标签向量、第一高维文本向量及第二高维文本向量,计算每条样本数据对应的高维标签向量与第一高维文本向量之间的第一匹配度,每条样本数据对应的高维标签向量与第二高维文本向量之间的第二匹配度,基于预设损失函数、预设匹配条件及每条样本数据对应的第一匹配度和第二匹配度,对模型参数进行调整;通过训练好的跨语种专利检索模型输出通过目标语种描述的,与检索表达式相匹配的专利公开文本,提高了跨语种文本检索的匹配度。
-
公开(公告)号:CN117456104A
公开(公告)日:2024-01-26
申请号:CN202311547274.8
申请日:2023-11-17
IPC: G06T17/00 , G06V10/26 , G06N3/0895 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于结构功能分析的室内场景三维建模方法,包括:获取场景三维建模,将精细化的场景三维建模进行标注,将标注的点云划分为训练集和验证集,并使用所述验证集获取平均交并比指标,对模型分割质量进行量化评估;进行语义分割网络的训练,利用训练好的语义分割模型,构建三维模型库和分类模型;将粗略的场景三维建模,输入到训练好的语义分割模型,利用生成的语义分割结果,构建目标场景三维建模。本发明还公开了一种基于结构功能分析的室内场景三维建模系统。本发明选取的是基于弱监督学习的室内场景点云语义分割方法,可以充分利用一部分精细化的建模和产出的三维模型库,提高了实际建模的效率。
-
公开(公告)号:CN115240120A
公开(公告)日:2022-10-25
申请号:CN202211148927.0
申请日:2022-09-21
Abstract: 本申请适用于设备管理技术领域,提供了一种基于对抗网络的行为识别方法、装置、电子设备及存储介质,方法包括:接收待识别的目标视频数据;从目标视频数据中提取多个关键视频帧,并将关键视频帧上传至云端服务器,以通过部署于云端服务器的行为指导网络生成第一行为数据;将目标视频数据导入预设的帧间动作提取网络,得到帧间动作特征数据;将目标视频数据导入上下文注意力网络,确定目标视频数据中目标对象的第二行为数据;接收云端服务器反馈的第一行为数据,并根据动作特征信息、第一行为数据以及第二行为数据,确定目标对象的行为类别。采用上述方法能够在确保行为识别准确性的同时,能够减少本地运算的运算量。
-
公开(公告)号:CN114783002A
公开(公告)日:2022-07-22
申请号:CN202210710345.0
申请日:2022-06-22
Abstract: 本申请适用于科技服务技术领域,提供了一种应用于科技服务领域的对象智能匹配方法,包括:确定待识别图像序列的各个图像帧对应的行人轮廓图像;基于行人轮廓图像确定图像帧中的行人的步态能量图像;步态能量图像用于描述步态的时空特征;采用预设滤波器组对步态能量图像进行滤波处理,基于滤波处理后的步态能量图像确定行人的步态特征向量;预设滤波器组包括n×m个线性滤波器,每行线性滤波器的方向不同,每列线性滤波器的尺度不同,n和m均为正整数;将步态特征向量导入预设科技服务对象识别模型中,得到行人与预设科技服务对象的匹配结果。该方案可以提高科技服务领域中的对象匹配的鲁棒性。
-
公开(公告)号:CN112040313B
公开(公告)日:2021-04-09
申请号:CN202011217518.2
申请日:2020-11-04
Applicant: 中山大学深圳研究院
Inventor: 周凡
IPC: H04N21/44 , H04N21/439 , H04N21/234 , H04N21/233 , G10L15/26 , G10L15/04 , G10L25/57 , G06K9/62 , G06K9/46
Abstract: 本申请适用于视频处理技术领域,提供了一种视频内容结构化方法、装置、终端设备及介质,所述方法包括:获取目标视频的视觉通道信息,基于所述视觉通道信息将所述目标视频划分为多个场景单元,所述多个场景单元包括多个场景边界;将所述目标视频的语音转换为语音文本,并将所述语音文本分割为多个文本块;基于所述多个文本块,将所述目标视频划分为多个语音单元,所述多个语音单元包括多个语音边界;根据所述多个场景边界和所述多个语音边界,确定所述目标视频的视频主题边界;根据所述视频主题边界,将所述目标视频划分为多个主题单元。通过上述方法,能够提高视频内容结构化的准确性。
-
公开(公告)号:CN112040313A
公开(公告)日:2020-12-04
申请号:CN202011217518.2
申请日:2020-11-04
Applicant: 中山大学深圳研究院
Inventor: 周凡
IPC: H04N21/44 , H04N21/439 , H04N21/234 , H04N21/233 , G10L15/26 , G10L15/04 , G10L25/57 , G06K9/62 , G06K9/46
Abstract: 本申请适用于视频处理技术领域,提供了一种视频内容结构化方法、装置、终端设备及介质,所述方法包括:获取目标视频的视觉通道信息,基于所述视觉通道信息将所述目标视频划分为多个场景单元,所述多个场景单元包括多个场景边界;将所述目标视频的语音转换为语音文本,并将所述语音文本分割为多个文本块;基于所述多个文本块,将所述目标视频划分为多个语音单元,所述多个语音单元包括多个语音边界;根据所述多个场景边界和所述多个语音边界,确定所述目标视频的视频主题边界;根据所述视频主题边界,将所述目标视频划分为多个主题单元。通过上述方法,能够提高视频内容结构化的准确性。
-
公开(公告)号:CN109143248A
公开(公告)日:2019-01-04
申请号:CN201810797143.8
申请日:2018-07-19
Applicant: 中山大学深圳研究院
Abstract: 本发明公开了一种基于超声波测距的VR交互现实防碰撞方法。本方法基于超声波测量距离并根据距离与人进行人机交互来防止碰撞。本方法利用超声波进行距离测量,克服了通过红外线测量距离所造成的测量结果受光线影响以及距离短的限制;利用多个传感器测量四个方位的距离,克服了以往只有单一方位距离测量导致其他方位无法防止碰撞的弊端,使用者可以更加随心所欲地进行VR活动;通过不同距离不同方案提示使用者的方式防止用户发生碰撞,在保证安全性的同时,避免了使用者在进行VR活动过程中沉浸感的降低。
-
公开(公告)号:CN119624783A
公开(公告)日:2025-03-14
申请号:CN202311174816.1
申请日:2023-09-12
IPC: G06T3/4076 , G06T5/70 , G06T5/73 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种任意尺度的特征解相关图像超分辨率重建方法与系统。对真实超分辨率图像ISR进行数据增强,得到低分辨率图像ILR;把ILR输入到提取特征的神经网络g(·)中,得到特征图Z'=g(ILR);对Z'进行均值降维和随机傅里叶特征解相关,得到解相关特征图Z;建立用于超分辨率重建的位置投影模块和权重预测网络#imgabs0#构造损失函数,对g(·)以及权重预测网络#imgabs1#进行优化训练,得到训练后的#imgabs2#与权重预测网络#imgabs3#用户输入待处理的低分辨率图像到神经网络#imgabs4#中,并利用权重预测网络#imgabs5#和位置投影模块共同重建出超分辨率图像。本发明可以实现面向真实世界任意尺度超分辨率重建,满足了任意尺度的超分辨重建需求,且采用特征解相关,从理论上保证了学习到图像的本质特征。
-
公开(公告)号:CN117112734A
公开(公告)日:2023-11-24
申请号:CN202311350169.5
申请日:2023-10-18
IPC: G06F16/33 , G06F16/35 , G06F16/583 , G06F16/532 , G06F16/55 , G06F18/25 , G06F18/24 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06F40/30
Abstract: 本申请适用于深度学习技术领域,提供了一种基于语义的知识产权文本表示与分类方法及终端设备,包括:基于外观专利数据库构建第一训练集;在采用第一训练集对外观专利分类模型进行训练的过程中,针对各条训练数据,通过外观专利分类模型确定外观专利的专利名称对应的文本特征编码、专利草图对应的图像特征编码、专利名称和专利草图对应的融合特征编码及训练数据对应的预测分类概率分布,并基于目标损失函数及每条训练数据对应的文本特征编码、图像特征编码、融合特征编码以及预测分类概率分布,对外观专利分类模型的模型参数进行调整;通过训练好的外观专利分类模型对外观专利申请文本进行分类,提高了外观专利分类的效率和准确性。
-
公开(公告)号:CN117095273A
公开(公告)日:2023-11-21
申请号:CN202311324584.3
申请日:2023-10-13
Abstract: 本申请实施例适用于计算机技术领域,提供了一种在线协同的工业视觉检测方法及终端设备,应用于任一计算节点,每个所述计算节点对应一个图像组别;所述方法包括:将服务器发送的关于所述图像组别的待检测图像输入至预设的工业视觉检测模型,生成关于所述待检测图像的安全检测结果;待检测图像是所述任一计算节点对应的所述图像组别中的图像;将安全检测结果发送至所述服务器,并接收所述服务器反馈的工业检测结果;工业检测结果由所述服务器基于N个计算节点发送的安全检测结果生成;工业检测结果用于确定所有所述工业图像中的待检测物体是否符合所述工业安全指标。通过本实施例提供的方法,可以提高工业视觉检测的效率。
-
-
-
-
-
-
-
-
-