-
公开(公告)号:CN116383381A
公开(公告)日:2023-07-04
申请号:CN202310263872.6
申请日:2023-03-17
Applicant: 中国科学院微电子研究所
IPC: G06F16/35 , G06F16/36 , G06F18/25 , G06F18/22 , G06F40/295 , G06N3/0455 , G06N3/045 , G06N3/048 , G06N3/0464
Abstract: 本发明公开一种虚假新闻检测方法、装置和电子设备,涉及智能检测技术领域,获取待检测的多模态虚假新闻数据;提取与所述多模态虚假新闻数据匹配的外部知识信息,得到组合多模态数据;确定所述组合多模态数据的模态间相似性得分;基于所述模态相似性得分和预设相似性得分阈值确定对应的检测结果,将待检测的多模态虚假新闻数据中新闻帖子里图像和文本中的实体信息融入了外部知识图谱对应匹配的外部知识信息,有效利用背景知识信息检测虚假新闻,实现好的检测效果,保证了虚假新闻检测的可靠性和稳定性。
-
公开(公告)号:CN116310984A
公开(公告)日:2023-06-23
申请号:CN202310263781.2
申请日:2023-03-13
Applicant: 中国科学院微电子研究所
IPC: G06V20/40 , H04N21/488 , G06V10/771 , G06V10/82 , G06F40/258 , G06N3/0455 , G06N3/0464 , G06N3/047
Abstract: 本发明涉及一种基于Token采样的多模态视频字幕生成方法,属于人工智能技术领域,解决了现有技术中延迟过高,计算速率慢的问题。具体包括:对视频中各帧图像进行CNN卷积处理得到处理后的各图像;获取各图像的多个一维图片向量,将每个一维图片向量作为一个Token;将所有Token输入到Transformer中,利用Transformer中的多个Encoder块对Token提取高级语义特征,在特征提取过程中对Token进行剪枝;将最后一个Encoder块输出的特征输入至Transformer中的Decode中进行解码,得到视频中各帧图像对应的文本信息。实现了降低计算开销的目的。
-
公开(公告)号:CN118195916A
公开(公告)日:2024-06-14
申请号:CN202410184163.3
申请日:2024-02-19
Applicant: 中国科学院微电子研究所
Abstract: 本公开提出一种图像增强方法、装置、计算机设备及存储介质,该图像增强方法包括:生成原始图像的频域显著图和空域信噪比图像;将频域显著图和空域信噪比图像进行融合得到参考图像;基于频域显著图和原始图像的第一特征图,生成原始图像的第二特征图,第二特征图中包括原始图像的多个尺度的显著区域特征;基于参考图像对第一特征图中显著区域间的关联性进行增强处理,生成原始图像的第三特征图;将第二特征图和第三特征图进行融合,生成第四特征图;第四特征图用于生成原始图像的增强图像。本公开实施例能够克服弱光条件下图像质量低的问题,输出低光照图像的增强图像。
-
公开(公告)号:CN116310984B
公开(公告)日:2024-01-30
申请号:CN202310263781.2
申请日:2023-03-13
Applicant: 中国科学院微电子研究所
IPC: G06V20/40 , H04N21/488 , G06V10/771 , G06V10/82 , G06F40/258 , G06N3/0455 , G06N3/0464 , G06N3/047
Abstract: 本发明涉及一种基于Token采样的多模态视频字幕生成方法,属于人工智能技术领域,解决了现有技术中延迟过高,计算速率慢的问题。具体包括:对视频中各帧图像进行CNN卷积处理得到处理后的各图像;获取各图像的多个一维图片向量,将每个一维图片向量作为一个Token;将所有Token输入到Transformer中,利用Transformer中的多个Encoder块对Token提取高级语义特征,在特征提取过程中对Token进行剪枝;将最后一个Encoder块输出的特征输入至Transformer中的Decode中进行解码,得到视频中各帧图像对应的文本信息。实现了降低计算开销的目的。(56)对比文件Sehoon Kim 等.Learned Token Pruningfor Transformers《.https://arxiv.org/pdf/2107.00910.pdf》.2022,全文.
-
-
-