跨模态隐私语义检索方法、系统及存储介质

    公开(公告)号:CN114519202B

    公开(公告)日:2025-01-21

    申请号:CN202210089487.X

    申请日:2022-01-25

    Abstract: 本发明公开了一种跨模态隐私语义检索方法、系统及存储介质,涉及数据处理技术领域,方法包括:客户端基于多模态联合表征模型对多模态数据进行语义特征提取得到语义表征向量,对语义表征向量进行加密获得密态语义表征向量;服务器接收客户端发送的密态语义表征向量,根据预设检索索引表,确定与密态语义表征向量关联的语义检索关键词,在预设检索索引表中查找与语义检索关键词对应的数据地址,获得密态语义检索结果,并将密态语义检索结果发送至客户端;客户端对密态语义检索结果进行解密和显示。本发明解决了现有技术存在检索准确性较低的问题,实现了在保障查询隐私和存储数据隐私的前提下,提升语义检索结果的准确性的效果。

    文本过滤方法、设备及计算机存储介质

    公开(公告)号:CN112818110B

    公开(公告)日:2024-05-24

    申请号:CN202011645385.9

    申请日:2020-12-31

    Abstract: 本发明公开了一种文本过滤方法、设备及计算机存储介质,该方法包括以下步骤:基于语言模型获得文本流畅度;基于自定义构建的有效词词典,获得有效词率;当所述文本流畅度满足第一预设阈值且所述有效词率满足第二预设阈值,则对所述文本执行过滤操作;本发明解决人工筛选过滤文本耗时耗力、效率低、成本高且质量低的问题,提高语料库中语义级别,以及字符级别的文本筛选质量,从而提升训练模型和服务质量,降低计算开销。

    句子噪声设计方法、设备及计算机存储介质

    公开(公告)号:CN112380845B

    公开(公告)日:2021-04-09

    申请号:CN202110051556.3

    申请日:2021-01-15

    Abstract: 本发明公开了一种句子噪声设计方法、设备及计算机存储介质,该方法包括以下步骤:对原始文本进行预处理,生成第一噪声文本;基于自适应滑动窗口计算所述第一噪声文本与预加载语料库中的文本之间句子结构相似度,并利用所述句子结构相似度对所述第一噪声文本执行流畅度优化处理,获得流畅度符合预设条件的第二噪声文本;采用深度学习模型对所述第二噪声文本进行预测,若预测值与采用深度学习模型对原始文本的预测值不同,则以所述第二噪声文本为目标结果。本发明解决了噪声文本流畅度不高的问题,实现在基于迭代方式定位与噪声词注入攻击基础上,加入了生成噪声流畅度优化算法,使得生成的噪声文本更加符合正确语法与人类阅读习惯。

    跨模态隐私语义表征方法、装置、设备及存储介质

    公开(公告)号:CN114528588A

    公开(公告)日:2022-05-24

    申请号:CN202210089691.1

    申请日:2022-01-25

    Abstract: 本发明公开了一种跨模态隐私语义表征方法、装置、设备及存储介质,涉及数据处理技术领域,方法包括:获取多模态数据;根据多模态数据,获得对应的文本数据;对文本数据进行关键词提取和加密,得到密态关键词;根据密态关键词,对预设知识图谱进行分割,得到密态子图;对密态子图进行图嵌入,得到与密态关键词对应的密态表征向量,以得到多模态数据的语义表征结果。本发明解决了现有技术中存在密态关键词之间的语义关联性较差的问题,实现了不仅可以保证密态关键词之间的语义关联,还可以为后续进行隐私语义的检索提供准确的语义表征的效果。

    句子噪声设计方法、设备及计算机存储介质

    公开(公告)号:CN112380845A

    公开(公告)日:2021-02-19

    申请号:CN202110051556.3

    申请日:2021-01-15

    Abstract: 本发明公开了一种句子噪声设计方法、设备及计算机存储介质,该方法包括以下步骤:对原始文本进行预处理,生成第一噪声文本;对所述第一噪声文本执行流畅度优化处理,获得流畅度符合预设条件的第二噪声文本;采用深度学习模型对所述第二噪声文本进行预测,若预测值与采用深度学习模型对原始文本的预测值不同,则以所述第二噪声文本为目标结果。本发明解决了噪声文本流畅度不高的问题,实现在基于迭代方式定位与噪声词注入攻击基础上,加入了生成噪声流畅度优化算法,使得生成的噪声文本更加符合正确语法与人类阅读习惯。

    跨模态隐私语义表征方法、装置、设备及存储介质

    公开(公告)号:CN114528588B

    公开(公告)日:2025-03-07

    申请号:CN202210089691.1

    申请日:2022-01-25

    Abstract: 本发明公开了一种跨模态隐私语义表征方法、装置、设备及存储介质,涉及数据处理技术领域,方法包括:获取多模态数据;根据多模态数据,获得对应的文本数据;对文本数据进行关键词提取和加密,得到密态关键词;根据密态关键词,对预设知识图谱进行分割,得到密态子图;对密态子图进行图嵌入,得到与密态关键词对应的密态表征向量,以得到多模态数据的语义表征结果。本发明解决了现有技术中存在密态关键词之间的语义关联性较差的问题,实现了不仅可以保证密态关键词之间的语义关联,还可以为后续进行隐私语义的检索提供准确的语义表征的效果。

    跨模态隐私语义检索方法、系统及存储介质

    公开(公告)号:CN114519202A

    公开(公告)日:2022-05-20

    申请号:CN202210089487.X

    申请日:2022-01-25

    Abstract: 本发明公开了一种跨模态隐私语义检索方法、系统及存储介质,涉及数据处理技术领域,方法包括:客户端基于多模态联合表征模型对多模态数据进行语义特征提取得到语义表征向量,对语义表征向量进行加密获得密态语义表征向量;服务器接收客户端发送的密态语义表征向量,根据预设检索索引表,确定与密态语义表征向量关联的语义检索关键词,在预设检索索引表中查找与语义检索关键词对应的数据地址,获得密态语义检索结果,并将密态语义检索结果发送至客户端;客户端对密态语义检索结果进行解密和显示。本发明解决了现有技术存在检索准确性较低的问题,实现了在保障查询隐私和存储数据隐私的前提下,提升语义检索结果的准确性的效果。

    文本过滤方法、设备及计算机存储介质

    公开(公告)号:CN112818110A

    公开(公告)日:2021-05-18

    申请号:CN202011645385.9

    申请日:2020-12-31

    Abstract: 本发明公开了一种文本过滤方法、设备及计算机存储介质,该方法包括以下步骤:基于语言模型获得文本流畅度;基于自定义构建的有效词词典,获得有效词率;当所述文本流畅度满足第一预设阈值且所述有效词率满足第二预设阈值,则对所述文本执行过滤操作;本发明解决人工筛选过滤文本耗时耗力、效率低、成本高且质量低的问题,提高语料库中语义级别,以及字符级别的文本筛选质量,从而提升训练模型和服务质量,降低计算开销。

Patent Agency Ranking