一种语义相似度处理方法、装置、系统以及存储介质

    公开(公告)号:CN115329883A

    公开(公告)日:2022-11-11

    申请号:CN202211006720.X

    申请日:2022-08-22

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种语义相似度处理方法、装置、系统以及存储介质,属于语言处理领域,方法包括:对原始句子数据集的筛选得到多个待测句子组;对待测句子组的提取关键字分析得到句子关键信息组以及意图信息组;对待测句子组、句子关键信息组以及意图信息组的隐藏层计算得到待测句子隐藏层、句子关键信息隐藏层以及意图信息隐藏层;根据待测句子隐藏层、句子关键信息隐藏层以及意图信息隐藏层的目标相似度分数评价分析得到语义相似度处理结果。本发明能够免受匹配语句长度的分歧,利用关键信息和潜在意图判断句子语义相似,以及利用最优化中的单纯形法保证了最优化句子匹配,提高了语义相似度结果的准确率,使得匹配的结果更加理想。

    一种基于视频的人脸识别方法、装置及存储介质

    公开(公告)号:CN113408348B

    公开(公告)日:2022-08-19

    申请号:CN202110529827.1

    申请日:2021-05-14

    Inventor: 蔡晓东 周美欣

    Abstract: 本发明提供一种基于视频的人脸识别方法、装置及存储介质,方法包括:导入视频数据集,视频数据集包括多个视频数据;分别对各个视频数据进行转换,得到与各个视频数据对应的多个视频帧;分别对各个视频帧进行特征提取,得到与视频帧对应的人脸特征向量和权重,并集合所有的人脸特征向量得到人脸特征向量集;对人脸特征向量集和所有的权重进行评价分析,得到最优特征向量,并将最优特征向量作为人脸识别结果。本发明避免了噪声样本的干扰,且无需参考评估和额外的训练评估模型,简化了处理步骤,减少了对数据数量的依赖性,实现了识别结果与特征表达能力相关,提高了在视频中进行人脸识别的准确性。

    一种视频描述数据处理方法、装置及存储介质

    公开(公告)号:CN113191262B

    公开(公告)日:2022-08-19

    申请号:CN202110476061.5

    申请日:2021-04-29

    Inventor: 蔡晓东 黄庆楠

    Abstract: 本发明提供一种视频描述数据处理方法、装置及存储介质,方法包括:导入视频序列,并将所述视频序列分割为多个视频图片;通过预设的卷积神经网络对所有的所述视频图片进行特征分割分析,得到多个镜头数据集;通过所述预设的卷积神经网络对所有的所述镜头数据集进行合并分析,得到多个合并后的镜头数据集;通过所述预设的卷积神经网络对多个所述合并后的镜头数据集进行特征提取,得到视频描述特征序列;通过预设的视频描述模型将所述视频描述特征序列转换为视频描述信息。本发明能够不需要每个镜头数据都生成文字描述后结合生成最终描述,直接将自然语言的问题转化为图像问题,减少了生成描述的冗余度,提高了文字描述的流畅度。

    一种段落的语义信息处理方法、装置及存储介质

    公开(公告)号:CN114881040A

    公开(公告)日:2022-08-09

    申请号:CN202210517950.6

    申请日:2022-05-12

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明涉及一种段落的语义信息处理方法、装置及存储介质,属于语义信息处理技术领域;方法包括:导入原始段落、语义逻辑切割模型和语义理解及表达模型;将原始段落输入语义逻辑切割模型中进行逻辑切割,得到原始段落的逻辑切割跨度信息;将原始段落的逻辑切割跨度信息输入语义理解及表达模型中进行语义处理,得到原始段落的逻辑切割跨度信息的语义信息;将逻辑切割跨度信息的语义信息添加到原始段落中,得到完整段落;根据语义逻辑切割模型和语义理解及表达模型对完整段落进行更新迭代处理,得到最终的语义信息。本发明能够得到准确而全面的段落语义信息,且通过关注段落上下文的逻辑界线来提高段落语义理解和表达的准确性。

    一种语义相似度匹配方法、装置及存储介质

    公开(公告)号:CN112560502B

    公开(公告)日:2022-05-13

    申请号:CN202011579327.0

    申请日:2020-12-28

    Inventor: 蔡晓东 田文靖

    Abstract: 本发明提供一种语义相似度匹配方法、装置及存储介质,方法包括:导入第一待分析样本和第二待分析样本,分别对所述第一待分析样本和所述第二待分析样本进行词向量化处理,得到与所述第一待分析样本对应的第一词向量矩阵和与所述第二待分析样本对应的第二词向量矩阵;构建训练网络,通过所述训练网络分别对所述第一词向量矩阵和所述第二词向量矩阵进行特征融合处理,得到与所述第一词向量矩阵对应的第一融合向量矩阵和与所述第二词向量矩阵对应的第二融合向量矩阵。本发明解决了特征损失和句子间交互不充分以及网络梯度消失的问题,丰富了句子的语义特征,也让句子间信息交互更为准确丰富,能够捕获到更多句子对的语义信息。

    一种跨社交网络用户对齐方法以及装置

    公开(公告)号:CN113409157A

    公开(公告)日:2021-09-17

    申请号:CN202110545701.3

    申请日:2021-05-19

    Inventor: 蔡晓东 王鑫岚

    Abstract: 本发明提供一种跨社交网络用户对齐方法及装置,方法包括:导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据社交网络用户数据对训练模型进行优化处理,得到优化模型,导入待测社交网络用户数据,通过优化模型对待测社交网络用户数据进行对齐处理,得到用户对齐结果。本发明能够提取区分性语义特征,减少网络结构信息的稀疏性,大大地提高了跨社交网络用户对齐的准确性。

    一种基于视频的人脸识别方法、装置及存储介质

    公开(公告)号:CN113408348A

    公开(公告)日:2021-09-17

    申请号:CN202110529827.1

    申请日:2021-05-14

    Inventor: 蔡晓东 周美欣

    Abstract: 本发明提供一种基于视频的人脸识别方法、装置及存储介质,方法包括:导入视频数据集,视频数据集包括多个视频数据;分别对各个视频数据进行转换,得到与各个视频数据对应的多个视频帧;分别对各个视频帧进行特征提取,得到与视频帧对应的人脸特征向量和权重,并集合所有的人脸特征向量得到人脸特征向量集;对人脸特征向量集和所有的权重进行评价分析,得到最优特征向量,并将最优特征向量作为人脸识别结果。本发明避免了噪声样本的干扰,且无需参考评估和额外的训练评估模型,简化了处理步骤,减少了对数据数量的依赖性,实现了识别结果与特征表达能力相关,提高了在视频中进行人脸识别的准确性。

    一种视频描述方法及装置
    78.
    发明公开

    公开(公告)号:CN113191263A

    公开(公告)日:2021-07-30

    申请号:CN202110476064.9

    申请日:2021-04-29

    Inventor: 蔡晓东 王湘晴

    Abstract: 本发明提供一种视频描述方法及装置,方法包括:导入待测视频,对所述待测视频进行时序语义特征分割,得到多个镜头数据;通过预设视频描述模型分别对各个所述镜头数据进行转换分析,得到与各个所述镜头数据对应的镜头描述信息;对多个所述镜头描述信息进行语句融合分析,得到视频描述信息。本发明能够确保了视频里信息的不丢失,且不会产生镜头语义冗余,能对每个镜头都进行描述,有助于提高在线视频的索引和搜索质量,并提高了视频检索的效率和精确性,拥有了更强的鲁棒性,且有可能使视力受损者受益。

    一种用于对比神经网络训练的采样的方法及系统

    公开(公告)号:CN109784477B

    公开(公告)日:2021-05-18

    申请号:CN201910035379.2

    申请日:2019-01-15

    Inventor: 蔡晓东 曹艺

    Abstract: 本发明公开了一种用于对比神经网络训练的采样的方法及系统,包括:采集图像数据样本;搭建卷积神经网络,在全连接层的输出序列建立对比信息输出层和对比信息损失层;在所述对比信息输出层通过对比算法对图像数据样本进行计算,得到对比信息和对比标签;通过对对比信息和对比标签进行重新采样,得到重采样结果;在所述对比信息损失层通过损失算法对所述重采样结果进行损失值计算,得到训练时的损失值;根据所述损失值调整所述卷积神经网络的参数,以便使所述卷积神经网络学习所述图像数据样本的表达特征,完成所述卷积神经网络的训练。

    一种交通流预测方法、装置及存储介质

    公开(公告)号:CN112712695A

    公开(公告)日:2021-04-27

    申请号:CN202011608620.5

    申请日:2020-12-30

    Inventor: 蔡晓东 王鑫岚

    Abstract: 本发明提供一种交通流预测方法、装置及存储介质,方法包括:导入历史交通流量数据集,历史交通流量数据集包括时间片数据集和额外因素数据集;将时间片数据集输入至编码器中,通过编码器对时间片数据集进行特征提取,得到多个原始短期时间特征隐状态向量和多个长期时间特征隐状态向量;将额外因素数据集、多个原始短期时间特征隐状态向量和多个长期周期性时间特征隐状态向量一并输入解码器中,进行预测值分析,得到交通流预测结果。本发明获取了交通流间的时间依赖关系,从而实现了准确的实时交通流量预测,而且具有可解释性。

Patent Agency Ranking