-
公开(公告)号:CN115221858B
公开(公告)日:2025-04-29
申请号:CN202210707469.3
申请日:2022-06-21
Applicant: 中国科学院自动化研究所
IPC: G06F40/205 , G06F16/35 , G06N20/00
Abstract: 本发明提供一种剧本事件抽取方法、装置、电子设备及存储介质,首先获取待抽取剧本文本;然后对待抽取剧本文本进行依存关系分析,确定待抽取剧本文本对应的依存关系图;最后将依存关系图输入至事件抽取模型,得到待抽取剧本文本在目标事件类型下目标事件结构元素的目标类别。该方法针对剧本事件结构元素具有层级相关关系的特点,引入依存关系分析确定依存关系图,并采用依存关系分析、注意力机制以及图注意力机制相结合的方式,对依存关系图中的词语进行语义补充,实现剧本事件抽取,确定剧本文本中的事件类型以及具体事件类型下各事件结构元素的类别,可以具有很好的普适性,增强了特征向量的语义表达能力,提高了剧本事件抽取的准确度。
-
公开(公告)号:CN119537693A
公开(公告)日:2025-02-28
申请号:CN202411595213.3
申请日:2024-11-08
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06F16/9536 , G06Q50/00
Abstract: 本公开涉及一种基于用户评论分析的产品使用场景确定方法、装置、电子设备、存储介质和计算机程序产品,所述基于用户评论分析的产品使用场景确定方法包括:获取目标产品的目标评论数据;将目标评论数据和预先构建的提示词模板输入到大语言模型,得到针对目标评论数据的场景识别结果;基于场景识别结果从预先构建的场景数据库中进行检索,得到与场景识别结果的相似度值最高的目标场景,以将目标场景确定为目标产品的使用场景,其中,场景数据库是基于待分析品类的多个产品的评论数据预先构建的,待分析品类与目标产品的品类相同;能够通过用户的评论数据确定产品的真实使用场景,并可以进一步提升产品的设计效率、提升产品的使用舒适度。
-
公开(公告)号:CN109493271A
公开(公告)日:2019-03-19
申请号:CN201811366097.2
申请日:2018-11-16
Applicant: 中国科学院自动化研究所
IPC: G06T1/00
Abstract: 本发明公开了一种图像差值量化水印嵌入方法和提取方法、设备及计算机可读存储介质,本发明方法利用DCT变换域中某些系数之间差值的稳定性,设计了一个差值量化方案,能够有效克服量化方法难以抵抗缩放攻击的缺陷;理论推导出量化阈值与峰值信噪比之间的关系,利用所述关系式,可根据不同的载体图像自适应地调节量化阈值,使每幅图像在嵌入水印前后都能获得指定的峰值信噪比,这不仅最大化了水印方法的鲁棒性还能同时保证每幅图像中水印的不可见性。本发明执行高效,不仅能够克服量化方法难以抵抗缩放攻击的缺陷,对各种常见的攻击也能够表现出很好的鲁棒性,并且还能使所有嵌入图像中的水印都获得良好的不可见性。
-
公开(公告)号:CN104199923B
公开(公告)日:2017-09-12
申请号:CN201410440852.2
申请日:2014-09-01
Applicant: 中国科学院自动化研究所
Abstract: 一种基于最优K均值哈希算法的大规模图像库检索方法,包括:从待检索图像库中选取部分图像作为训练图像集,首先提取训练集图像的GIST特征;对训练集的特征数据进行特征值分配预处理;将经过预处理的特征数据划分成多个子空间;对每一个子空间训练出该子空间的码本和码本的编码;对待检索图像库和查询图像中特征数据的处理与训练过程对应,分别提取检索图像和查询图像的GIST特征,然后计算待检索图像和查询图像特征的哈希编码,之后计算待检索图像特征编码和查询图像特征编码两者之间的汉明距离,由此快速检索相似图像。本发明具有很好的普适性,既减少了数据的存储空间又提高了查询的检索效率。
-
公开(公告)号:CN106126572A
公开(公告)日:2016-11-16
申请号:CN201610437729.4
申请日:2016-06-17
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F16/583
Abstract: 本发明公开了一种基于区域验证的图像检索方法。其中,该方法可以包括分别提取图像库中的图像和待检索图像的局部特征和区域特征;根据图像库中图像的局部特征和区域特征来构建特征索引;确定待检索图像与图像库中图像之间的局部特征匹配对;再基于特征索引并利用第一区域特征和第二区域特征对局部特征匹配对进行验证,确定匹配得分;根据匹配得分,确定图像库中图像与待检索图像之间的相似度;根据相似度反馈检索结果。本发明实施例具有很好的普适性,能够弥补局部描述子用于图像检索时的不足,减少了图像中遮挡、杂质等干扰项的影响,提高了图像检索的准确度。
-
公开(公告)号:CN118537265A
公开(公告)日:2024-08-23
申请号:CN202410522635.1
申请日:2024-04-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及机器学习技术领域,提供一种人脸盲修复方法、装置、设备和介质,包括将待修复低质人脸图像输入至目标人脸盲修复模型,得到目标人脸盲修复模型输出的高质人脸图像;目标人脸盲修复模型是通过将高质人脸训练图像与高质人脸训练图像匹配的低质人脸训练图像,先依次经过一阶扩散模型进行第一次修复、高维流形映射、特征压缩与幻觉修正后,再经过二阶扩散模型进行第二次修复后得到高质人脸预测图像;基于低质人脸训练图像到高质人脸预测图像之间的损失函数对二阶扩散模型的参数进行迭代优化,直至达到预设收敛条件得到的。实现了一种能够有效恢复高分辨率人脸纹理细节、过滤退化模式并处理复杂遮挡和语义缺失场景的人脸盲修复方法。
-
公开(公告)号:CN117059123A
公开(公告)日:2023-11-14
申请号:CN202310928326.X
申请日:2023-07-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于手势动作图的小样本数字人语音驱动动作重演方法,方法包括:对参考讲话数据进行节奏点检测、关键词检测和运动连续性检测,分别得到第一节奏点的位置、第一关键词和对应的位置和非自然帧间连续关系;基于第一节奏点位置、第一关键词和对应的位置以及非自然帧间连续关系,构建手势运动图;对测试讲话数据进行节奏点检测、关键词检测,分别得到第二节奏点位置、第二关键词和对应的位置;基于第二节奏点位置、第二关键词和对应的位置,确定搜索分段,并基于搜索分段得到重演手势;基于手势风格融合网络输出融合手势,基于融合手势和节奏性手势,确定最终手势,基于最终手势驱动数字人动作重演,提高了动作重演的准确性和可靠性。
-
公开(公告)号:CN116524074A
公开(公告)日:2023-08-01
申请号:CN202310296375.6
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明实施例提供了一种数字人手势生成的方法、装置、设备和存储介质,该方法包括:获取待生成数字人手势的目标音频文件;基于脚本生成模型,确定所述目标音频文件对应的动作发生序列;基于所述动作发生序列以及手势生成模型,控制生成的代表性手势和节奏性手势合成为所述目标音频文件对应的数字人手势。本发明提供的方法通过由脚本生成模型确定的目标音频文件对应的动作发生序列,有效控制同步语音下的数字人手势合成,将手势解耦并建模得到代表性手势生成模型和节奏性手势生成模型,结合手势生成模型分别得到的代表性手势和节奏性手势,可以生成更自然且丰富的手势,使数字人手势的效果更真实。
-
公开(公告)号:CN113487476A
公开(公告)日:2021-10-08
申请号:CN202110558894.6
申请日:2021-05-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种在线更新的图像盲超分辨率重建方法和装置,其中方法包括:初始化学习网络中的降质估计模块和超分重建模块;每隔一个学习周期,将待重建图像输入至超分重建模块进行超分辨率重建,得到多个候选超分重建图像;基于多个候选超分重建图像的视觉效果,确定待重建图像的超分重建图像;其中,在每一学习周期内,交替优化降质估计模块和超分重建模块,以学习待重建图像的降质方式,并学习基于降质方式进行超分辨率重建。本发明不依赖于低分辨率‑高分辨率样本对,能够根据不同低分辨率测试图片的降质方式进行模型参数优化,获得特定于测试图片降质方式的模型,从而对待重建图像进行针对性地超分重建,提高了超分辨率重建的效果和鲁棒性。
-
公开(公告)号:CN106650751B
公开(公告)日:2020-07-28
申请号:CN201611056326.1
申请日:2016-11-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种图像特征提取方法及数字媒体版权管理方法。所述图像特征提取方法包括:判断图像是否经历过几何变换,对经历过几何变换的图像进行校正;对图像进行一次尺寸标准化;对一次尺寸标准化后的图像进行规范化操作以及再次尺寸标准化;对规范化后的图像提取特征。所述数字媒体版权管理方法包括:获取数字媒体的版权信息;采用所述图像特征提取方法提取其特征序列;将版权信息与特征序列在数据库中进行对应的登记注册;利用登记注册信息进行数字媒体的版权管理。本发明提高了图像特征提取过程中抵抗常见图像处理攻击和几何攻击的能力,适用于基于图像特征的多媒体检索等领域,并为数字媒体版权管理模式提供了一种新的解决方案和途径。
-
-
-
-
-
-
-
-
-