-
公开(公告)号:CN115409203A
公开(公告)日:2022-11-29
申请号:CN202210879263.9
申请日:2022-07-25
Applicant: 中国科学院信息工程研究所
IPC: G06N20/20 , G06F16/9535 , G06F16/958
Abstract: 本发明公开了一种基于模型无关元学习的联邦推荐方法及系统。本方法为:1)服务器选取多个客户端,并将所选推荐模型发送至每一客户端;2)各客户端将本地数据划分为支持集和查询集;3)各客户端基于本地支持集训练并更新收到的推荐模型;4)各客户端将更新后的推荐模型在查询集上验证并计算模型梯度;5)服务器收集各客户端计算的梯度,基于平均梯度更新推荐模型并将其发送给各客户端进行下一轮次的训练;6)重复步骤3)~5)直到设定条件,各客户端得到一公共的推荐模型;7)每一客户端利用本地数据训练该公共的推荐模型,得到各自的个性化推荐模型;8)客户端m将目标应用场景中的交互数据输入个性化推荐模型,获取个性化推荐结果。
-
公开(公告)号:CN118132710B
公开(公告)日:2025-01-24
申请号:CN202410273102.4
申请日:2024-03-11
Applicant: 中国科学院信息工程研究所
IPC: G06F16/3329 , G06F40/30 , G06F18/213
Abstract: 本发明提出了一种基于多尺度滑动窗口与动态聚合的对话级情感分析方法,涉及自然语言处理领域。本方法首先对评论对话构造对话树,通过滑动窗口构造多尺度话语窗口;然后利用预训练语言模型编码多尺度话语窗口;再基于对话情感预测模型根据编码的多尺度话语窗口特征表示进行预测,生成多尺度话语窗口预测结果并进行动态聚合;利用多任务学习,构造窗口级、线程级和对话级损失函数,训练优化对话情感预测模型。本方法在无需设计复杂网络的情况下提高在由多轮对话情感分析的预测效果。
-
公开(公告)号:CN118228733B
公开(公告)日:2024-12-17
申请号:CN202410221099.1
申请日:2024-02-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/30 , G06F40/211 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/042 , G06F18/25
Abstract: 本发明提出一种基于图神经网络的微博评论对话情感分析方法及系统,涉及自然语言处理和图神经网络领域。首先利用图卷积神经网络分析每条评论的词性和依赖关系,获得单个评论的局部句法信息,同时利用图注意力神经网络对评论之间的关系进行建模得到具有全局特征的语义信息。最后经过融合模块将局部的句法信息和全局的语义信息进行融合,获得含有丰富对话信息的特征,提升了对话级情感分析的准确性。
-
公开(公告)号:CN118228733A
公开(公告)日:2024-06-21
申请号:CN202410221099.1
申请日:2024-02-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/30 , G06F40/211 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/042 , G06F18/25
Abstract: 本发明提出一种基于图神经网络的微博评论对话情感分析方法及系统,涉及自然语言处理和图神经网络领域。首先利用图卷积神经网络分析每条评论的词性和依赖关系,获得单个评论的局部句法信息,同时利用图注意力神经网络对评论之间的关系进行建模得到具有全局特征的语义信息。最后经过融合模块将局部的句法信息和全局的语义信息进行融合,获得含有丰富对话信息的特征,提升了对话级情感分析的准确性。
-
公开(公告)号:CN118132710A
公开(公告)日:2024-06-04
申请号:CN202410273102.4
申请日:2024-03-11
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F40/30 , G06F18/213
Abstract: 本发明提出了一种基于多尺度滑动窗口与动态聚合的对话级情感分析方法,涉及自然语言处理领域。本方法首先对评论对话构造对话树,通过滑动窗口构造多尺度话语窗口;然后利用预训练语言模型编码多尺度话语窗口;再基于对话情感预测模型根据编码的多尺度话语窗口特征表示进行预测,生成多尺度话语窗口预测结果并进行动态聚合;利用多任务学习,构造窗口级、线程级和对话级损失函数,训练优化对话情感预测模型。本方法在无需设计复杂网络的情况下提高在由多轮对话情感分析的预测效果。
-
公开(公告)号:CN119248766A
公开(公告)日:2025-01-03
申请号:CN202411113873.3
申请日:2024-08-14
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/2455 , G06F18/243 , G06N20/20 , G06N5/01
Abstract: 本发明公开了一种基于机器学习的数据表复合主键发现方法,其步骤包括:1)对于一样本集,首先识别每一样本的最小UCC的列表;其中,每一样本为一数据表,将不包含重复内容且可用于索引的组合列称为唯一组合列UCC,将不包含其他UCC的UCC定义为最小唯一组合列,即最小UCC;2)对样本的每一最小UCC进行特征提取组合,得到该样本的每一最小UCC的特征向量;3)利用各样本的特征向量训练分类器;4)针对一个待处理数据表A,获取数据表A的各最小UCC对应的特征向量并输入随机森林分类器,得到数据表A的用于生成复合主键的最小UCC,据此生成数据表A的复合主键。本发明仅靠数据表内在信息即可实现复合主键的识别。
-
公开(公告)号:CN117349694A
公开(公告)日:2024-01-05
申请号:CN202311097475.2
申请日:2023-08-29
Applicant: 中国科学院信息工程研究所
IPC: G06F18/24 , G06F18/213 , G06F18/25 , G06N3/0499 , G06N3/0895
Abstract: 本发明涉及一种支持多模态数据弱监督分类的方法和系统。该方法包括:对图像、文本分别进行特征抽取,获得图像特征、文本特征,对图像特征、文本特征进行特征融合,获得融合特征;将图像特征、文本特征和融合特征输入基于Mixmatch的多模态弱监督分类模型中进行分类;将基于Mixmatch的多模态弱监督分类模型得到的分类结果放入分类器中获取最终的分类结果。本发明实现了一种充分利用少量有标注的多模态数据与大量无标注的多模态数据的分类方案,能够解决多模态数据标注稀缺的问题,提高对互联网中多种模态数据的利用率,在互联网数据处理领域具有很强的实用性和应用范围,具有很广泛的应用前景。
-
-
-
-
-
-