文本分类模型的攻击方法、装置、电子设备以及存储介质

    公开(公告)号:CN116089868A

    公开(公告)日:2023-05-09

    申请号:CN202211462734.2

    申请日:2022-11-21

    Abstract: 本发明提供一种文本分类模型的攻击方法、装置、电子设备以及存储介质,涉及人工智能安全技术领域,所述方法包括:获取待分类文本以及预先训练好的目标生成器,所述目标生成器基于第一训练数据对原始生成器进行训练得到,所述原始生成器基于掩码语言模型构建;将所述待分类文本输入至所述目标生成器中,得到所述待分类文本对应的目标错分文本;将所述目标错分文本输出至待攻击分类模型中,得到所述待分类文本对应的目标错分结果,以解决现有技术中对文本分类模型的攻击效率低以及生成的错分文本的语义质量低的技术问题。

    未标注文本的确定方法、装置和电子设备

    公开(公告)号:CN115827876A

    公开(公告)日:2023-03-21

    申请号:CN202310032603.9

    申请日:2023-01-10

    Abstract: 本申请提供一种未标注文本的确定方法、装置和电子设备,涉及数据处理技术领域。该方法包括:获取多个未标注文本、多个已标注文本以及多个已标注文本各自的类别标签;分别将多个未标注文本和多个已标注文本输入至文本类别分析模型的特征提取网络中,根据得到的多个未标注文本各自对应的特征向量和多个已标注文本各自对应的特征向量,从多个未标注文本中确定多个候选未标注文本;根据多个候选未标注文本各自对应的类别标签分布熵值,从多个候选未标注文本中确定目标未标注文本,目标未标注文本用于训练文本类别分析模型,可以准确地选择未标注文本,从而提高了训练得到的文本类别分析模型的泛化能力。

    基于大数据的旅游产业推广方法及系统

    公开(公告)号:CN109446405B

    公开(公告)日:2021-04-30

    申请号:CN201811064693.5

    申请日:2018-09-12

    Abstract: 本发明涉及一种基于大数据的旅游产业推广方法及系统,包括:对特定区域内关于旅游产业的异构跨媒体信息进行采集;对异构跨媒体信息进行浅层分析处理,得到多个标准词汇;对各标准词汇进行语义解析,得到针对互联网内容表征的情感及观点;根据情感及观点,分析网络信息所体现的对对各旅游产业的舆论倾向;根据舆论倾向,调整对应旅游产业的推广方案。本发明通过对特定区域内关于旅游产业的异构跨媒体信息进行采集,进而通过对异构跨媒体信息进行浅层分析处理、语义解析,确定网络信息所体现的对各旅游产业的舆论倾向,从而可在大量数据中发现用户的消费偏好和需求,进而确定个性化、差异化的旅游产业推广方案,提高推广的精准度。

    文本隐含语义激活方法及系统

    公开(公告)号:CN107577656A

    公开(公告)日:2018-01-12

    申请号:CN201710565733.3

    申请日:2017-07-12

    Abstract: 本发明涉及文本隐含语义激活方法及系统,所述激活方法包括:获取待测文本的待测词项信息;根据文本集合知识库及所述待测文本的待测词项信息,确定所述文本集合知识库的词表中每个参考词项的激活系数;所述文本集合知识库包括多个参考词项共同构成的词表、对应各参考词项的参考词向量及参考词频;根据各激活系数,选取对应的参考词项构成待测文本的隐含语义集合;将所述隐含语义集合添加到所述待测文本中进行语义扩充。从而能够准确确定待测文本的隐含信息,准确度高。

    离线元强化学习模型训练方法、装置、设备、介质及产品

    公开(公告)号:CN119250156B

    公开(公告)日:2025-03-21

    申请号:CN202411758866.9

    申请日:2024-12-03

    Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品,涉及人工智能技术领域,方法包括:基于不同训练任务之间的相似度对上下文编码器进行训练,以最小化相似度高于阈值的训练任务的表示向量之间的距离,最大化相似度低于阈值的训练任务的表示向量之间的距离;基于保守Q学习对Q函数网络进行训练,以最小化标准贝尔曼误差,和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距;基于行为正则化演员评判家对策略网络进行训练,以限制训练策略与行为策略之间的差异;根据训练好的上下文编码器、Q函数网络和策略网络,得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。

    离线元强化学习模型训练方法、装置、设备、介质及产品

    公开(公告)号:CN119250156A

    公开(公告)日:2025-01-03

    申请号:CN202411758866.9

    申请日:2024-12-03

    Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品,涉及人工智能技术领域,方法包括:基于不同训练任务之间的相似度对上下文编码器进行训练,以最小化相似度高于阈值的训练任务的表示向量之间的距离,最大化相似度低于阈值的训练任务的表示向量之间的距离;基于保守Q学习对Q函数网络进行训练,以最小化标准贝尔曼误差,和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距;基于行为正则化演员评判家对策略网络进行训练,以限制训练策略与行为策略之间的差异;根据训练好的上下文编码器、Q函数网络和策略网络,得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。

    语音转录文本聚类方法、装置、电子设备和存储介质

    公开(公告)号:CN115238068A

    公开(公告)日:2022-10-25

    申请号:CN202210709135.X

    申请日:2022-06-21

    Abstract: 本发明提供一种语音转录文本聚类方法、装置、电子设备和存储介质,所述方法包括:提取各语音转录文本的向量表示;将各语音转录文本的向量表示输入至文本聚类模型,得到文本聚类模型输出的各语音转录文本的聚类结果;本发明以最小化相同样本语音转录文本的向量表示之间的距离,最大化不同样本语音转录文本的向量表示之间的距离,最小化样本语音转录文本的向量表示与其所属类别的语义向量之间的距离以及最大化样本语音转录文本的向量表示与其它类别的语义向量之间的距离为目标迭代更新训练得到文本聚类模型,最终使得文本聚类模型能够从文本层面和类别层面对各语音转录文本进行聚类,进而准确得到聚类结果。

    一种基于多智能体的话题建模和观点演化仿真方法、电子设备以及存储介质

    公开(公告)号:CN118821950A

    公开(公告)日:2024-10-22

    申请号:CN202411073811.4

    申请日:2024-08-07

    Abstract: 本发明提供了一种基于多智能体的话题建模和观点演化仿真方法、电子设备以及存储介质,可以应用于数据挖掘技术领域。该方法包括:利用智能体的行为集和观点集以及交互集构建观点演化模型,并通过对观点演化模型的运算得到针对目标话题的观点优化目标;基于智能体的观点集以及交互集,通过引入固执系数和逆火系数重构针对目标话题的观点动力学方程;基于观点优化目标,利用观点动力学方程生成智能体的行为信息和交互信息,并利用所生成信息更新智能体的行为集和交互集;利用更新后的智能体的行为集和交互集,通过期望最大化算法对智能体的观点集进行参数最大化操作,得到更新后的智能体的观点集。

    时序知识图谱补全方法、装置、电子设备和存储介质

    公开(公告)号:CN116882493A

    公开(公告)日:2023-10-13

    申请号:CN202310788771.0

    申请日:2023-06-29

    Abstract: 本发明提供一种时序知识图谱补全方法、装置、电子设备和存储介质,方法包括:获取四元组形式的时序知识图谱,以及时序知识图谱对应的历史信息,时序知识图谱以预设比例划分为训练集、验证集、测试集;基于训练集,进行有监督学习得到教师补全模型;基于验证集,对教师补全模型和学生补全模型进行知识蒸馏学习,并对学生补全模型进行有监督学习,得到当前时刻的补全模型;基于补全模型,应用历史信息确定测试集的预测结果;基于预测结果,对测试集进行图谱补全。本发明提供的方法、装置,提升了补全模型的可塑性,实现了从新的事件信息中完成准确的图谱补全的功能,同时在没有新的事件信息时,仍能稳定的进行图谱补全,提升了补全模型的稳定性。

Patent Agency Ranking