-
公开(公告)号:CN118227782A
公开(公告)日:2024-06-21
申请号:CN202211643171.7
申请日:2022-12-20
Applicant: 中国科学院信息工程研究所 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/242 , G06F40/186 , G06N3/047 , G06N3/049 , G06N3/09
Abstract: 本发明涉及一种基于提示学习范式的少样本事件时序关系抽取方法和装置。该方法的第一阶段为事件时序关系模板配置阶段;第二阶段为时序标签映射器配置阶段,通过硬映射与软映射方式实现从预训练语言模型的词典到事件时序关系标签集合的映射;第三阶段为事件时序关系分类器训练阶段,分类器包含事件时序关系模板和时序标签映射器两个主要部件;第四阶段为事件时序关系预测阶段,利用训练完成的事件时序关系分类器判断事件之间的时序关系。本发明能够有效降低时序关系的抽取难度,减少训练所需的数据规模,达到很好的时序关系抽取效果,并且能够实现对事件时序关系识别任务的快速建模和数据适应,有效地缓解训练语料缺乏导致的模型训练不足的问题。
-
公开(公告)号:CN113626685B
公开(公告)日:2024-05-03
申请号:CN202110773341.2
申请日:2021-07-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06N3/0464 , G06N3/08 , G06F18/214 , G06Q50/00
Abstract: 本发明涉及一种面向传播不确定性的谣言检测方法及装置,包括:获取社交网络中源博文与转发博文的文本数据及若干传播数据;基于文本数据提取的文本特征,利用传播数据分别构建传播方向的初始传播图G′TD及扩散方向的初始传播图G′BU;对于初始传播图G′TD与初始传播图G′BU,分别利用图卷积网络对边的可靠性进行评估,生成传播图GTD与传播图GBU;基于传播图GTD与传播图GBU中的节点表示HTD与HBU,生成源博文的最终特征表示,以获取谣言检测结果。本发明能够缓解传播结构中不可靠传播关系带来的不确定性问题,有效提高谣言检测的准确率和F1值。
-
公开(公告)号:CN110647904B
公开(公告)日:2022-09-23
申请号:CN201910707010.1
申请日:2019-08-01
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62 , G06F16/903
Abstract: 本发明提出一种基于无标记数据迁移的跨模态检索方法及系统,将经过聚类的无标注信息的单模态图像和文本数据作为迁移源域,有标注信息的跨模态数据集作为目标域,通过迁移学习将源域迁移至目标域的跨模态数据集,扩大训练数据规模,增加跨模态数据的语义信息,学得一个更好的共同空间。本发明很好地解决了跨模态数据集数据规模小的问题,更加符合实际用户查询不在预定义类别范围内的情况;同时,可以更好地提取不同模态数据的上层语义信息,克服模态之间的异构性差异,增加模态之间的相似性,提高跨模态检索准确率。
-
公开(公告)号:CN113268733B
公开(公告)日:2022-05-03
申请号:CN202110436719.X
申请日:2021-04-22
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于神经网络的容器挖矿异常检测方法及系统,属于容器入侵检测领域,通过构建挖矿容器的运行环境,采集挖矿容器的系统调用数据,对其中的系统调用序列进行分析,获得挖矿行为模式数据集,并与已公开的或自行采集的系统调用数据集进行整合形成一全量数据集,利用全量数据集训练基于神经网络的挖矿行为检测模型,利用训练好的模型进行挖矿容器的异常行为检测,能够解决现有容器挖矿数据缺失和异常检测精度低的不足的问题,实现云环境的安全防护。
-
公开(公告)号:CN110569355B
公开(公告)日:2022-05-03
申请号:CN201910671527.X
申请日:2019-07-24
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/33 , G06F40/289
Abstract: 本发明提出一种基于词块的观点目标抽取和目标情感分类联合方法及系统,具体为:对于每个连续词块,设计词块级别的特征以此来充分利用多个词之间的整体信息;计算每个词块的情感信息而非单独计算每一个词的情感信息,这样保证词块里多个词的情感倾向的一致性。本发明一是通过有效利用多个词整体信息,二是通过为多个词组成的词块计算一个情感信息表示来避免情感不一致的问题,来提升抽取和分类的准确率,具有良好的实用性。
-
公开(公告)号:CN113095063A
公开(公告)日:2021-07-09
申请号:CN202010018333.2
申请日:2020-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F40/216 , G06F40/279 , G06K9/62
Abstract: 本发明涉及一种基于遮蔽语言模型的两阶段情感迁移方法和系统。该方法包括:利用基于注意力机制的情感分类器和基于相对频率的融合方法,计算语料库中的所有词的得分,根据得分构建情感标记词的词库;利用情感标记词的词库对语料进行遮蔽处理,得到遮蔽语料;将遮蔽语料输入遮蔽语言模型中,利用遮蔽语言模型在遮蔽语料的遮蔽位置进行填空,得到迁移语料;将迁移语料输入预训练的情感分类器中,输出情感置信度分值,并使用预训练的情感分类器的梯度信号来优化遮蔽语言模型。本发明通过显式分割情感迁移任务,先找出句子中的情感信息进行遮蔽,再填入能代表目标情感信息的情感词,通过分解任务降低难度,能够达到更好的效果。
-
公开(公告)号:CN112308734A
公开(公告)日:2021-02-02
申请号:CN202011162740.7
申请日:2020-10-27
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种IT设备非IT能耗的计量、费用分摊方法及电子装置,适用于至少两台同类IT设备与非IT设备组成的系统,包括:将采集的各IT设备信息,输入到特征提取网络,提取相邻服务器之间的交互特征;将交互特征输入到自动编码器网络,得到各IT设备的非IT能耗计量结果。本发明解决了现有技术中存在经验式的、仅基于服务器/虚拟机的能耗粗略地推算出其对应的非IT能耗,未充分考虑其他影响因素的问题,从而提高计量结果的准确率和可靠性。
-
公开(公告)号:CN111191851A
公开(公告)日:2020-05-22
申请号:CN202010005008.2
申请日:2020-01-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于知识图谱的数据中心能效优化方法,其步骤包括:1)构建数据中心能效知识图谱;2)对于数据中心的一实体设备i,依据所述数据中心能效知识图谱抽取与该实体设备i相关实体的属性信息,作为该实体设备i的感知数据;3)根据设定的能效模型,从所述数据中心能效知识图谱获取该能效模型所涉及实体设备的感知数据,训练该能效模型;4)根据训练后的能效模型及其所涉及的实体设备的实时状态,从能效优化方案库中选取一节能方案,对数据中心进行能效优化。本发明大大提高了资源优化效率,可用于资源感知、能效模型建立、能效评估和节能策略的推导等应用。
-
公开(公告)号:CN118673163A
公开(公告)日:2024-09-20
申请号:CN202410753368.9
申请日:2024-06-12
Applicant: 中国科学院信息工程研究所
IPC: G06F16/432 , G06F16/435 , G06F16/48 , G06F16/45 , G06F40/30
Abstract: 本发明公开一种基于细粒度多源知识增强的多模态事实核查方法及系统,属于信息检测技术领域。所述方法包括:获取推文信息和证据信息;从推文信息和证据信息中抽取细粒度的知识信息;提取推文信息、证据信息和知识信息的文本信息语义隐表示和图片信息语义隐表示;基于文本信息语义隐表示和图片信息语义隐表示,构建包含所述推文信息、所述证据信息和所述知识信息的异质图;基于图注意力网络计算所述异质图的新结点表示;对所述异质图的新结点表示进行分类,得到所述推文信息的多模态事实核查结果。本发明可以对推文的真实性进行更准确地预测。
-
公开(公告)号:CN118394878A
公开(公告)日:2024-07-26
申请号:CN202410320930.9
申请日:2024-03-20
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于结构对抗网络的传播冷启动虚假新闻检测方法及系统,涉及数据挖掘技术领域。本发明获取社交网络的新闻内容数据和传播结构数据,通过内容编码模块、传播结构编码模块分别提取得到语义级隐表示、结构级隐表示,再通过结构判别模块预测当前的隐表示是否包含结构属性的概率,通过虚假新闻分类模块预测新闻的类别标签概率;基于传播结构对抗联合损失优化目标对抗训练各个模块的网络参数,训练完成后用于传播冷启动的虚假新闻检测。本发明拜托了对传播结构数据的依赖,能够利用以往信息传播中隐含的结构知识增强传播冷启动新闻检测能力,更适用于实际场景的虚假新闻检测。
-
-
-
-
-
-
-
-
-