-
公开(公告)号:CN113409157B
公开(公告)日:2022-06-28
申请号:CN202110545701.3
申请日:2021-05-19
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种跨社交网络用户对齐方法及装置,方法包括:导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据社交网络用户数据对训练模型进行优化处理,得到优化模型,导入待测社交网络用户数据,通过优化模型对待测社交网络用户数据进行对齐处理,得到用户对齐结果。本发明能够提取区分性语义特征,减少网络结构信息的稀疏性,大大地提高了跨社交网络用户对齐的准确性。
-
公开(公告)号:CN114596523A
公开(公告)日:2022-06-07
申请号:CN202210167890.X
申请日:2022-02-23
Applicant: 桂林电子科技大学
IPC: G06V20/40 , G06K9/62 , G06F16/738 , G06V10/80 , G06V10/774
Abstract: 本发明提供一种多特征融合的视频描述方法、装置及存储介质,导入数据集,数据集包括多个数据组,各个数据组包括视频与描述信息;分别对各个数据组中的视频进行特征提取,得到运动特征和全局特征,将运动特征和全局特征进行特征拼接,得到各个视频对应的视频特征,分别提取各个数据组中描述信息对应的对象特征,并计算贡献值,根据各个贡献值计算对应视频中所有视频帧的区域特征和;分别将各个视频对应的特征输入训练模型中进行融合训练,得到融合特征;分别将各个所述视频对应的描述信息转换为文本特征;分别将各个所述视频对应的文本特征和各个所述视频对应的融合特征输入到预设的transformer语言模型中,输出视频描述语句。
-
公开(公告)号:CN114495220A
公开(公告)日:2022-05-13
申请号:CN202210060310.7
申请日:2022-01-19
Applicant: 桂林电子科技大学
IPC: G06V40/16 , G06V20/52 , G06V20/40 , G06K9/62 , G06V10/774
Abstract: 本发明提供一种目标身份识别方法、装置以及存储介质,属于图像识别技术领域,方法包括:S1:导入多个目标行人图片,分别对各个目标行人图片的人脸检测得到目标脸部图片;S2:分别对各个目标行人图片以及各个目标脸部图片的特征提取得到行人特征以及人脸特征;S3:构建训练模型,通过训练模型对多个行人特征以及多个人脸特征的身份识别分析得到目标身份识别结果。相比于现有的单用人脸或行人进行身份识别,本发明的目标身份识别准确率更高,且目标识别结果具有更强的可靠性,并且能够很好的适用于视频监控场景下,解决了不同质量特征对目标身份决策的影响不同的问题。
-
公开(公告)号:CN113191262A
公开(公告)日:2021-07-30
申请号:CN202110476061.5
申请日:2021-04-29
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种视频描述数据处理方法、装置及存储介质,方法包括:导入视频序列,并将所述视频序列分割为多个视频图片;通过预设的卷积神经网络对所有的所述视频图片进行特征分割分析,得到多个镜头数据集;通过所述预设的卷积神经网络对所有的所述镜头数据集进行合并分析,得到多个合并后的镜头数据集;通过所述预设的卷积神经网络对多个所述合并后的镜头数据集进行特征提取,得到视频描述特征序列;通过预设的视频描述模型将所述视频描述特征序列转换为视频描述信息。本发明能够不需要每个镜头数据都生成文字描述后结合生成最终描述,直接将自然语言的问题转化为图像问题,减少了生成描述的冗余度,提高了文字描述的流畅度。
-
公开(公告)号:CN109256135B
公开(公告)日:2021-05-18
申请号:CN201810988567.2
申请日:2018-08-28
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种端到端说话人确认方法、装置及存储介质,其方法包括构建说话人确认端到端网络,所述说话人确认端到端网络包括前端的ResCNN残差卷积神经网络模型和后端的,ResCNN残差卷积神经网络模型用于提取语音帧级别特征,阈值再加权注意力模型对语音帧级别特征转化为句子级别特征,从而完成对所述说话人确认端到端网络的训练;通过训练得到的说话人确认端到端网络,以确定测试语音的注册人;本发明实现了端到端处理,阈值再加权注意力模型通过赋予权重的形式提取出关键语音帧级别特征,将非关键语音帧级别特征筛除,再进行加权平均处理来放大关键语音帧级别特征,从帧级别特征转化为句子级别特征,极大的提高了语音识别度。
-
公开(公告)号:CN112069291A
公开(公告)日:2020-12-11
申请号:CN202010882958.3
申请日:2020-08-28
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种关系预测方法及系统,方法包括:对原始训练数据进行向量化处理,得到路径关系向量组;对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;对所述关系特征表述向量进行模型构建,得到特征模型;根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组并进行模型解码处理得到预测数据。本发明有效的提高预测准确性,并具有良好的鲁棒性,能够合理准确的预测出目标节点的关系,实现了以少部分数据为依托去预测推理其它同类数据的关系或标签。
-
公开(公告)号:CN110765755A
公开(公告)日:2020-02-07
申请号:CN201911032492.1
申请日:2019-10-28
Applicant: 桂林电子科技大学
IPC: G06F40/194 , G06F40/30 , G06F40/289 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于双重选择门的语义相似度特征提取方法,涉及自然语言处理领域,技术方案为,首先对输入句子对进行分词并且进行向量化表示得到词向量,将得到的词向量序列输入双向长短时记忆网络中,得到两条句子的上下文信息向量,其次通过双重选择门分别获得句子对的核心特征向量,然后将向量输入多角度语义特征匹配网络,得到句子对的特征匹配向量,最后,将匹配向量分别通过双向长短时记忆网络聚合层合并两个语义特征匹配向量,并进行句子对的相似性预测。本方法有效缓解了信息冗余导致匹配效率低的问题,同时又避免了人工提取核心信息的成本问题。
-
公开(公告)号:CN110222839A
公开(公告)日:2019-09-10
申请号:CN201910390150.0
申请日:2019-05-10
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种网络表示学习的方法、装置及存储介质,该方法包括:获取网络中各个节点的结构信息,基于所述结构信息建立结构转移矩阵;获取所述网络中各个节点的属性信息,基于所述属性信息建立属性转移矩阵;将所述结构转移矩阵以及所述属性转移矩阵进行融合,得到偏向转移矩阵;对所述偏向转移矩阵中的每个节点进行采样,获得多个游走序列;建立神经网络模型,将所述游走序列输入至所述神经网络模型中进行网络表示学习,获得所述游走序列对应的节点的表示向量。本发明可以无缝结合不同源的信息及降低计算的复杂度,提高网络表示的质量,以增强表示向量在网络分析任务上的效果。
-
公开(公告)号:CN109784477A
公开(公告)日:2019-05-21
申请号:CN201910035379.2
申请日:2019-01-15
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种用于对比神经网络训练的采样的方法及系统,包括:采集数据样本;搭建卷积神经网络,在全连接层的输出序列建立对比信息输出层和对比信息损失层;在所述对比信息输出层通过对比算法对数据样本进行计算,得到对比信息和对比标签;通过对对比信息和对比标签进行重新采样,得到重采样结果;在所述对比信息损失层通过损失算法对所述重采样结果进行损失值计算,得到训练时的损失值;根据所述损失值调整所述卷积神经网络的参数,以便使所述卷积神经网络学习所述数据样本的表达特征,完成所述卷积神经网络的训练。
-
公开(公告)号:CN106897667A
公开(公告)日:2017-06-27
申请号:CN201710036083.3
申请日:2017-01-17
Applicant: 桂林电子科技大学
CPC classification number: G06K9/00228 , G06K9/6256
Abstract: 本发明涉及一种人脸检索方法和系统,其方法包括:搭建人脸检索的网络构架,对其行优化;根据反向传播的方式调节网络构架中的参数;将各训练样本图片输入调节后的网络构架中生成测试用例;根据sign函数对所述测试用例进行量化计算得到测试用例的二值编码,并通过二值编码计算训练样本图片对之间的汉明距离;根据汉明距离对各训练样本的近似度进行排序,从而完成对人脸检索的网络构架的训练;将待检索人脸图片输入完成训练的人脸检索的网络构架中进行检索,得到近似度排序的待检索人脸图片。本发明从以上几个方面对网络和输出的特征进行优化,使得在大规模人脸数据库下也能保证在准确率持平或者尽可能小范围降低的情况下能快速进行人脸图像的检索。
-
-
-
-
-
-
-
-
-