-
公开(公告)号:CN116797493A
公开(公告)日:2023-09-22
申请号:CN202310964411.1
申请日:2023-08-02
申请人: 北京中科闻歌科技股份有限公司
摘要: 本发明涉及图像处理领域,尤其涉及一种图像去噪处理系统,包括:含噪人脸图像A、中间素描图像特征集合B=(B1,B2,……,Bn,……,BM)和文本特征C,所述系统实现以下步骤:对A和B1进行下采样得到第一个中间图像特征D1,对Di和Bi进行下采样得到Di+1,对DM和文本特征C进行注意力特征提取得到注意力图像特征E,对E进行上采样得到第一个中间噪声图像特征F1,对Fj和DM‑j进行上采样得到Fj+1,对FM‑1和D1进行上采样得到预测噪声图像G,根据A和G得到去噪人脸图像,将图像模态下的B、文本模态下的C与A进行信息融合,根据双模态的特征信息提高了对A的表征能力,提高了去噪结果的准确性。
-
公开(公告)号:CN116862803A
公开(公告)日:2023-10-10
申请号:CN202310864682.X
申请日:2023-07-13
申请人: 北京中科闻歌科技股份有限公司
摘要: 本公开涉及一种逆转图像重建方法、装置、设备及可读存储介质。本公开通过获取待逆转图像,所述待逆转图像包括待逆转的高质量图像和/或待逆转的低质量图像,对所述待逆转图像进行逆转处理,得到逆转图像。由于对所述待逆转图像进行逆转处理,得到逆转图像,进而可以对逆转图像的隐空间特征进行约束,使逆转得到的隐空间特征的分布更符合GAN隐空间中原始隐空间编码的分布,在图像编辑中减少图像伪影的出现,从而提高真实图像的图像编辑的效果。并且,本公开实施例可以适用于高质量图像以及低质量图像,提高了逆转方法的泛化性能,提升了低质量图像逆转的重建效果,保证了GAN逆转方法对图像质量的稳定性。
-
公开(公告)号:CN112866586B
公开(公告)日:2023-03-07
申请号:CN202110003232.2
申请日:2021-01-04
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: H04N5/265 , G10L13/04 , G10L13/047 , G10L21/10 , G10L25/57
摘要: 本发明实施例公开了一种视频合成方法、装置、设备及存储介质。获取的待合成文本可以是任意语种的文本,待合成视频可以是用户选择的包括任意主播形象的视频片段,根据获取的待合成文本自动生成音频流,基于待合成视频中的无音视频流生成视频特征和唇部特征,并根据音频流生成音频特征和口型特征,基于口型特征和唇部特征确定口唇映射关系,根据口唇映射关系生成口唇一致的视频序列,进一步地,根据融合后的视频序列,生成目标合成视频,使整个目标合成视频中的人脸和唇部动作保持一致,并使目标合成视频中的主播唇动保持自然一致,并生成符合用户意愿的目标合成视频,提高用户观看体验。
-
公开(公告)号:CN113688310A
公开(公告)日:2021-11-23
申请号:CN202110839324.4
申请日:2021-07-23
申请人: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC分类号: G06F16/9535 , G06Q50/00
摘要: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN113052413A
公开(公告)日:2021-06-29
申请号:CN201911368970.6
申请日:2019-12-26
申请人: 北京中科闻歌科技股份有限公司
摘要: 本申请提供了一种风险旅客评估方法,包括:获取多个待评估旅客的信息,每个待评估旅客的信息包括多个出行信息和多个属性信息;根据出行信息计算每个待评估旅客的第一风险值,并将第一风险值超过第一预设阈值的待评估旅客纳入第一候选旅客集合;将出行信息输入梯度提升决策树,输出待评估旅客的第二风险值,并将第二风险值超过第一预设阈值的待评估旅客纳入第二候选旅客集合;根据第一候选旅客集合与第二候选旅客集合得到第三候选旅客集合;根据第三候选旅客集合中的第三候选旅客的身份信息,计算第三风险值,并确定第三风险值超过第二预设阈值的第三候选旅客为风险旅客,采用多方信息和梯度提升决策树对风险旅客进行评估,增加了评估的准确性。
-
公开(公告)号:CN109840687A
公开(公告)日:2019-06-04
申请号:CN201811604779.2
申请日:2018-12-26
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06Q10/06
摘要: 本发明涉及一种品牌影响力指数构建方法、系统及存储介质。现有品牌影响力指数构建方法效率低、误差大的问题,本发明获取企业影响力和产品影响力,并分别获取企业影响力权重和产品影响力权重,根据企业影响力、产品影响力和企业影响力权重和产品影响力权重计算品牌影响指数。本发明针对采集的品牌数据,采用机器的方法对设计的品牌影响指标定量评价并量化计算方法进行量化评估,从而大大提高品牌评估的准确性和有效性,可更好地服务于现有品牌的评估量化工作,准确性高,误差小,实用性强。
-
公开(公告)号:CN113536763B
公开(公告)日:2024-11-05
申请号:CN202110821206.0
申请日:2021-07-20
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F40/194 , G06F16/335
摘要: 本公开涉及一种信息处理方法、装置、设备及存储介质。其中,信息处理方法包括:获取待处理文本;确定待处理文本与已存储文本之间的文本相似度;基于待处理文本的发布时间和已存储文本的发布时间,对文本相似度进行修正,得到修正后的文本相似度;在修正后的文本相似度大于或等于预设相似度阈值的情况下,将已存储文本作为待处理文本的相似文本。根据本公开实施例,可以提高重复信息的查找精度和效率且节约设备资源,以进一步提高重复信息的处理效果和效率,降低文本内容的重复性,进而使得用户快速且准确的从网络平台中查找感兴趣信息的需求,提高用户查看信息的体验且节约设备资源。
-
公开(公告)号:CN116862803B
公开(公告)日:2024-05-24
申请号:CN202310864682.X
申请日:2023-07-13
申请人: 北京中科闻歌科技股份有限公司
摘要: 本公开涉及一种逆转图像重建方法、装置、设备及可读存储介质。本公开通过获取待逆转图像,所述待逆转图像包括待逆转的高质量图像和/或待逆转的低质量图像,对所述待逆转图像进行逆转处理,得到逆转图像。由于对所述待逆转图像进行逆转处理,得到逆转图像,进而可以对逆转图像的隐空间特征进行约束,使逆转得到的隐空间特征的分布更符合GAN隐空间中原始隐空间编码的分布,在图像编辑中减少图像伪影的出现,从而提高真实图像的图像编辑的效果。并且,本公开实施例可以适用于高质量图像以及低质量图像,提高了逆转方法的泛化性能,提升了低质量图像逆转的重建效果,保证了GAN逆转方法对图像质量的稳定性。
-
公开(公告)号:CN117409431B
公开(公告)日:2024-04-26
申请号:CN202311412797.1
申请日:2023-10-27
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06V30/413 , G06V30/146 , G06V30/19
摘要: 本发明提供了多模态大型语言模型训练方法、电子设备和存储介质,涉及计算机技术应用领域,包括:利用第一训练样本对图文对齐模型进行训练,得到训练后的图文对齐模型;第二训练样本对大型语言模型进行训练,第一训练样本对包含一个第一图像样本和对应的原始文本;第一图像样本仅包括自然图像;第二训练样本集包括多个第二训练样本对,每个第二训练样本对包含一个第二图像样本和对应的问答对文本,其中,第二图像样本中设置有目标检测框,第二图像样本至少包括文档、表格、图表和自然图像。本发明能够理解不同种类的图表和文档数据,且具有对图片中的区域准确定位的能力,能够解锁更加多样的多模态能力。
-
公开(公告)号:CN117407754B
公开(公告)日:2024-04-19
申请号:CN202311415357.1
申请日:2023-10-27
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F18/24 , G06F18/214 , G06F18/22 , G06N3/09
摘要: 本发明提供了一种多模态大模型训练策略确定方法、电子设备及介质,涉及多模态大模型训练策略确定领域,所述方法包括:获取初始多模态大模型对应的状态列表A;使用预设的一阶段训练策略,对初始多模态大模型进行训练,以得到第一中间多模态大模型列表B;使用预设的两阶段训练策略,分别对处于A中每一状态的初始多模态大模型进行训练,以得到第二中间多模态大模型列表C;获取B对应的第一性能参数列表α=(α1,α2,α3)以及C对应的第二性能参数列表β=(β1,β2,β3);若α1<β1、α2<β2且α3<β3,则将预设的两阶段训练策略确定为初始多模态大模型对应的目标训练策略;本发明能够达到确定出最佳的模型训练策略的目的。
-
-
-
-
-
-
-
-
-