-
公开(公告)号:CN114048395A
公开(公告)日:2022-02-15
申请号:CN202111305785.X
申请日:2021-11-05
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06Q50/00 , G06F40/194 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于时间感知与关键信息抽取的用户转发预测方法和系统。该方法的步骤包括:根据用户与目标推文的原作者的全部历史发布内容的相关性,以及用户与原作者发布内容所关注的主题随时间迁移的特性,得到融合用户及原作者的全局和层级历史内容后的目标推文特征表示;使用Topk‑Mask机制动态地抽取用户的朋友圈信息关键词,使用Tweet‑Mask机制学习用户的每条朋友圈推文的权重,并将两种机制输出的结果合并,得到用户的朋友圈特征表示;根据融合用户及原作者的全局和层级历史内容后的目标推文特征表示,以及用户的朋友圈特征表示,预测用户是否会对目标推文进行转发。本发明能够有效提高用户转发预测的准确率。
-
公开(公告)号:CN113963341A
公开(公告)日:2022-01-21
申请号:CN202111034219.X
申请日:2021-09-03
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/75 , G06K9/62
Abstract: 本发明公开一种基于多层感知机掩膜解码器的文字检测系统及方法,涉及图像文本检测领域,利用多层感知机掩膜解码器来有效区分不同实例,多层感知机的掩膜解码器取消了权重共享,减小了掩膜分支中的学习混淆问题,同时,由于其全局建模和更多上下文信息的引入,得到预测结果也更为紧致,可以有效区分密集文本。
-
公开(公告)号:CN113849623A
公开(公告)日:2021-12-28
申请号:CN202111186856.9
申请日:2021-10-12
Applicant: 中国传媒大学 , 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/126 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 提供一种文本视觉问答方法和装置,该方法包括:通过文本视觉问答模型中的文字表征获取模块从图像获得视觉增强的文字表征,文字表征获取模块包括OCR模块和TVS模块;通过文本视觉问答模型中的物体表征获取模块从图像获得语义导向的物体表征;通过文本视觉问答模型中的预训练的语言模型从与图像对应的问题语句获得问题表征;通过文本视觉问答模型中的第一多模态交互网络模块从视觉增强的文字表征、语义导向的物体表征、问题表征以及先前解码向量获得与视觉增强的文字表征对应的文字表征增强特征和与先前解码向量对应的当前预测解码向量;通过文本视觉问答模型中的答案预测模块从文字表征增强特征和当前预测解码向量获得与问题语句对应的预测答案。
-
公开(公告)号:CN113095319A
公开(公告)日:2021-07-09
申请号:CN202110235490.3
申请日:2021-03-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于全卷积角点修正网络的多向场景文字检测方法及装置,包括:依据图片的视觉特征,获取融合特征;根据融合特征,分别得到初始特征、初始分数与初始包围框偏移;将初始包围框偏移进行线性变换,得到角点感知卷积的采样网格,并依据该采样网格,对初始特征进行卷积,产生角点感知特征;依据角点感知特征,获取修正分数与修正包围框偏移;根据初始包围框偏移、修正包围框偏移及预定义参考点进行解码运算,获取修正包围框,从而得到多向场景文字检测结果。本发明利用多向场景文本的几何特性进行特征采样,通过角点感知的卷积模块,扩大了有效感受野且没有冗余信息引入,解决了密集长文本和高质量检测的问题,获取更优秀的性能。
-
公开(公告)号:CN112637130A
公开(公告)日:2021-04-09
申请号:CN202011378206.X
申请日:2020-11-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于消费队列的数据交换方法及系统,包括:接收外网服务器发送的客户端数据查询请求;解析客户端数据查询请求,将得到的订阅任务发送至元数据库,以得到消费队列;转换接收的内部订阅任务数据,将得到的外部订阅任务数据经外网服务器返回至相应客户端,其中所述内部订阅任务数据是通过消费客户端消费消息队列而得到。本发明客户端与内网订阅服务通过HTTP交互,不直接接触MQ数据;可通过客户端循环请求,获取数据。
-
公开(公告)号:CN112348048A
公开(公告)日:2021-02-09
申请号:CN202011040925.0
申请日:2020-09-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种多结构多任务深度神经网络及其训练、分类方法。本网络包括M个特征提取单元,一个用于识别样本子类类别的分类分支CCB和由K个用于对超类进行分类的超类分类器组成的超类分类分支MSCBs;每一超类分类器分别与一特征提取单元连接,用于基于提取的样本特征识别样本的超类类别;网络的损失函数为其中LCCB为CCB的损失函数,为第k个超类分类器的损失函数,分别是CCB、第k个超类分类器对样本x预测的子类和超类,c、是第k个分层标记结构Hk中的子类真实值、超类真实值。
-
公开(公告)号:CN112256982A
公开(公告)日:2021-01-22
申请号:CN202010967453.7
申请日:2020-09-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9537 , G06F16/9536 , G06F16/2458
Abstract: 本发明提供一种基于稀疏采样时空数据的目标同行关系分析方法及电子装置,包括采集目标用户E0各关联设备Uk的时空数据,依据各关联设备Uk出现记录,计算与其他设备Vj的两两同行组合集合,选取符合设定的其他设备Vj组成关联设备Uk的候选设备集合Sk;通过候选设备集合Sk中各其他设备Vj时空数据获取的出现记录,计算与相应设备Ul的两两同行组合集合,选取符合设定的相应设备Vl组成若干设备集合S′k,j;若设备集合S′k,j包含关联设备Uk,则目标用户E0与用户Ej存在同行行为,得到关联设备Uk同行设备列表Qk;依据各同行设备列表Qk,得到同行用户列表Y。本发明通过多种过滤与排序机制,可以挖掘出有效的目标同行关系,同时支持不同类型数据之间的融合使用。
-
公开(公告)号:CN106909624B
公开(公告)日:2020-05-22
申请号:CN201710043943.6
申请日:2017-01-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/172 , G06F16/17 , G06F16/2453 , G06F16/2455 , G06F16/2457 , G06F16/9535
Abstract: 本发明公开了一种海量数据实时排序优化方法。本方法为:1)设置一集群级节点、若干节点级节点和若干文件级节点;2)集群级节点将收到的检索排序请求发送给各节点级节点,各节点级节点将该检索排序请求发送给本节点的文件级节点;3)各文件级节点根据该检索排序请求,将与本节点相关的日志文件排序后输出有序数据给节点级节点;4)各节点级节点根据该检索排序请求将本节点上符合时间范围和分区条件的日志数据排序后输出给该集群级节点;5)该集群级节点将各节点级节点发送过来的有序数据流进行排序汇总。在任意的排序场景中,本方法都能有效降低内存使用量。
-
公开(公告)号:CN110674807A
公开(公告)日:2020-01-10
申请号:CN201910720688.3
申请日:2019-08-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于半监督与弱监督学习的曲形场景文字检测方法,用于减少曲形文字检测算法所需要的人工标注,同时让整个算法框架更加简洁,利用少量精确的像素级标注数据及大量的无标注或由水平包围框标注的数据,就能训练得到一个准确的曲形文字检测器,能够对场景曲形文字进行准确检测。
-
公开(公告)号:CN110569338A
公开(公告)日:2019-12-13
申请号:CN201910660759.5
申请日:2019-07-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种生成式对话系统解码器训练方法及解码方法。本方法为:1)对于问句编码集合中的每一问句编码,使用前向、后向神经网络对该问句编码进行预测分别得到一向量表示结果;2)计算前向、后向神经网络每一步预测结果的差异,作为生成式对话系统编码器的损失函数;3)计算前向、后向神经网络每一步状态的差异,作为二者的局部差异;4)计算前向、后向神经网络所生成向量表示结果的句子向量表示,并计算两句子向量表示的差异,作为二者的整体性差异;5)将局部差异和整体性差异作为惩罚项函数加入损失函数中,得到整体惩罚函数作为生成式对话系统编码器的损失函数;6)采用训练后的前向神经网络对问句编码进行预测,生成回复内容。
-
-
-
-
-
-
-
-
-