-
公开(公告)号:CN113095063B
公开(公告)日:2024-07-19
申请号:CN202010018333.2
申请日:2020-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F40/216 , G06F40/279 , G06F16/35 , G06N3/045 , G06N3/0442 , G06N3/09 , G06N3/048
Abstract: 本发明涉及一种基于遮蔽语言模型的两阶段情感迁移方法和系统。该方法包括:利用基于注意力机制的情感分类器和基于相对频率的融合方法,计算语料库中的所有词的得分,根据得分构建情感标记词的词库;利用情感标记词的词库对语料进行遮蔽处理,得到遮蔽语料;将遮蔽语料输入遮蔽语言模型中,利用遮蔽语言模型在遮蔽语料的遮蔽位置进行填空,得到迁移语料;将迁移语料输入预训练的情感分类器中,输出情感置信度分值,并使用预训练的情感分类器的梯度信号来优化遮蔽语言模型。本发明通过显式分割情感迁移任务,先找出句子中的情感信息进行遮蔽,再填入能代表目标情感信息的情感词,通过分解任务降低难度,能够达到更好的效果。
-
公开(公告)号:CN111382276B
公开(公告)日:2023-06-20
申请号:CN201811631236.X
申请日:2018-12-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/36 , G06F16/332
Abstract: 本发明公开了一种事件发展脉络图生成方法。本方法为:1)对语料库中的每一新闻文本,生成该新闻文本的向量表示并抽取该新闻文本中的实体、事件隐含话题;2)计算目标事件的新闻文本与语料库中各新闻文本之间的实体相似性、话题相似性和向量表示相似性,并根据计算结果选取该目标事件的新闻集合;3)将该新闻集合中的每一篇新闻文本看作该目标事件的事件发展脉络图中的一节点,并计算节点之间的相似度,如果两节点的相似度大于设定阈值,则生成一连接该两节点的边,从而生成该新闻集合的新闻文本关系图;4)对该新闻文本关系图进行子事件划分,得到若干子事件阶段;5)根据每个子事件阶段对应的代表性文档生成该目标事件的事件发展脉络图。
-
公开(公告)号:CN116226545A
公开(公告)日:2023-06-06
申请号:CN202211739135.0
申请日:2022-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06F16/9535 , G06F16/9538
Abstract: 本发明公开了一种基于传播森林的虚假信息检测方法、装置及设备,所述方法包括:针对待检测的源博文集合,获取每一源博文在社交网络中博文的传播数据,传播数据包括:传播内容和传播关系;提取传播内容的文本特征;将源博文集合根据文本特征划分为K个类簇后,计算传播原型并构建传播树;基于传播原型和传播树,构建传播森林;聚合传播森林中的节点邻域表示,以得到节点的嵌入表示;针对源博文节点与后续传播博文节点,分别根据相应的文本特征和嵌入表示,计算增强嵌入表示;对源博文节点与后续传播博文节点的增强嵌入表示应用检测模型进行分类,得到源博文集合中各源博文的虚假检测结果。本发明可以提高虚假信息检测任务的性能。
-
公开(公告)号:CN114510319A
公开(公告)日:2022-05-17
申请号:CN202111635865.1
申请日:2021-12-29
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于Kubernetes集群GPU空间共享的方法,涉及计算机技术领域,针对当前数据处理集群中GPU资源利用率低的问题,提出了关于GPU显存与活跃线程相结合的打分规则,并为了能够有效调度GPU资源,在集群中添加了Scheduler Extender和Device Plugin,进一步改变了以往调度策略中的静态调度方案,使用改进的蚁群算法,能够有效提高集群资源利用率,降低企业使用成本,提高效益。
-
公开(公告)号:CN109857866B
公开(公告)日:2021-05-25
申请号:CN201910031772.4
申请日:2019-01-14
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/33 , G06F16/332
Abstract: 本发明涉及一种面向事件查询建议的关键词抽取方法和事件查询建议生成方法及检索系统。该关键词抽取方法首先从文本中抽取事件的关键元素,并根据事件的关键元素获取事件特征;然后对文本与事件特征进行双向聚类,得到与事件对应的事件关键词。该事件查询建议生成方法将事件关键元素与事件关键词进行组合,生成查询建议。该检索系统包括:在线模块,负责将用户提交的查询映射到对应的事件上;离线模块,包含事件查询建议生成装置,负责根据对应的事件给用户提供相应的查询建议。本发明将事件识别与关键词抽取两个任务同时进行,使得两个任务相互配合与相互受益,同时得到事件及其对应的事件关键词,该事件关键词具有区分相似主题的事件的能力。
-
公开(公告)号:CN109902223B
公开(公告)日:2020-12-04
申请号:CN201910032064.2
申请日:2019-01-14
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06K9/62
Abstract: 本发明提出了一种基于多模态信息特征的不良内容过滤方法,将文本集划分为训练集与测试集,将分词结果和关键词输入到分类算法,提取文本特征,训练分类器;将训练好的分类器用于预测测试集,得到文本分类结果;将文本集和关键词集转为图像数据,将数据图像集与文本集相对应,划分为对应的训练集与测试集,进行相似度计算,得到相似度最大值集合以及最大值对应的关键词集合,如果该关键词集合的关键词满足阈值约束,则匹配成功,则该关键词为相似度最大值对应的关键词,作为图像分类结果;对比文本分类结果与图像分类结果,根据判别条件得到最终的类别预测结果,以过滤该不良内容。
-
公开(公告)号:CN109800066B
公开(公告)日:2020-11-03
申请号:CN201811524080.5
申请日:2018-12-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种数据中心节能调度方法及系统,通过获取当前数据中心内所有服务器的资源利用率、任务队列中待调度任务的资源需求以及当前外部环境参数,利用预设的预测模型来预测所述待调度任务在任意一台服务器上部署后数据中心总功耗以及机房空调设置参数;依据预测结果确定符合预设条件的数据中心节能调度方案,并且按照该方案对数据中心总能耗进行调度。本发明通过机器学习的方法联合调度服务器系统与机房空调系统的能耗,解决了相关技术中存在针对单一层面优化、采用不准确能耗模型、基于CFD仿真调度而导致的节能效率低的问题,达到了跨层统一优化数据中心总能耗的效果。
-
公开(公告)号:CN111581326A
公开(公告)日:2020-08-25
申请号:CN202010238159.2
申请日:2020-03-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F16/332
Abstract: 本发明提出一种基于异构外部知识源图结构抽取答案信息的方法,属于自然语言处理领域,为了提升问答返回的答案质量,本方法结合使用结构化知识和非结构化知识这两种异构的知识源,在获得相应的知识以后,使用结构化技术对知识进行建图处理,并结合图卷积网络技术学习图的表示,结合文本和图的信息来对从后台文本数据中返回能够正确回答用户问题的答案。本方法能够根据问题和答案的匹配程度对答案进行重排,将用户关心和期待的答案展示在最前面,使搜索结果更具针对性,使用户能够在更短的查询时间内得到更想要的答案。
-
公开(公告)号:CN111382276A
公开(公告)日:2020-07-07
申请号:CN201811631236.X
申请日:2018-12-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/36 , G06F16/332
Abstract: 本发明公开了一种事件发展脉络图生成方法。本方法为:1)对语料库中的每一新闻文本,生成该新闻文本的向量表示并抽取该新闻文本中的实体、事件隐含话题;2)计算目标事件的新闻文本与语料库中各新闻文本之间的实体相似性、话题相似性和向量表示相似性,并根据计算结果选取该目标事件的新闻集合;3)将该新闻集合中的每一篇新闻文本看作该目标事件的事件发展脉络图中的一节点,并计算节点之间的相似度,如果两节点的相似度大于设定阈值,则生成一连接该两节点的边,从而生成该新闻集合的新闻文本关系图;4)对该新闻文本关系图进行子事件划分,得到若干子事件阶段;5)根据每个子事件阶段对应的代表性文档生成该目标事件的事件发展脉络图。
-
公开(公告)号:CN110569355A
公开(公告)日:2019-12-13
申请号:CN201910671527.X
申请日:2019-07-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于词块的观点目标抽取和目标情感分类联合方法及系统,具体为:对于每个连续词块,设计词块级别的特征以此来充分利用多个词之间的整体信息;计算每个词块的情感信息而非单独计算每一个词的情感信息,这样保证词块里多个词的情感倾向的一致性。本发明一是通过有效利用多个词整体信息,二是通过为多个词组成的词块计算一个情感信息表示来避免情感不一致的问题,来提升抽取和分类的准确率,具有良好的实用性。
-
-
-
-
-
-
-
-
-