-
公开(公告)号:CN115942046B
公开(公告)日:2024-05-31
申请号:CN202211572783.1
申请日:2022-12-08
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/4402 , H04N21/44
Abstract: 本发明提供了一种智能裁剪视频的方法及存储介质,其包括如下步骤:对待裁剪视频进行拆帧处理,获取待处理视频帧中的第一目标视频对象信息列表,按照预设规则划分目标区域,获取第一目标视频对象信息组合列表,获取每一第一目标视频对象信息组合的第一得分,当待处理视频帧中包含的所有第一目标视频对象对应的优先等级均为空时,获取第一得分列表中最高得分对应的目标区域进行裁剪,获取裁剪后视频帧,否则,获取包含该优先等级不为空的完整的第一目标视频对象信息的第二目标视频对象信息组合及其对应的第二得分列表,获取第二得分列表中最高的第二得分对应的目标区域进行裁剪,获取裁剪后视频帧,从而实现对视频的从横屏到竖屏的剪裁。
-
公开(公告)号:CN116862803B
公开(公告)日:2024-05-24
申请号:CN202310864682.X
申请日:2023-07-13
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种逆转图像重建方法、装置、设备及可读存储介质。本公开通过获取待逆转图像,所述待逆转图像包括待逆转的高质量图像和/或待逆转的低质量图像,对所述待逆转图像进行逆转处理,得到逆转图像。由于对所述待逆转图像进行逆转处理,得到逆转图像,进而可以对逆转图像的隐空间特征进行约束,使逆转得到的隐空间特征的分布更符合GAN隐空间中原始隐空间编码的分布,在图像编辑中减少图像伪影的出现,从而提高真实图像的图像编辑的效果。并且,本公开实施例可以适用于高质量图像以及低质量图像,提高了逆转方法的泛化性能,提升了低质量图像逆转的重建效果,保证了GAN逆转方法对图像质量的稳定性。
-
公开(公告)号:CN118013054A
公开(公告)日:2024-05-10
申请号:CN202410198070.6
申请日:2024-02-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/38 , G06F16/33 , G06F16/31 , G06F16/338
Abstract: 本公开涉及一种文本搜索提速方法、装置、设备及存储介质,该方法包括:基于预设的质量分数规则,计算各个待检索文本对应的质量分数;按照各个待检索文本对应的质量分数从高到低的顺序,将各个待检索文本插入对应的索引;响应于文本搜索请求,在所述文本搜索请求对应的索引中命中预设数量的待检索文本,则停止搜索;将所述预设数量的待检索文本确定为搜索结果并返回。本公开通过对待检索文本预排序,在搜索文本时基于预排序结果,在确定预设数量的待检索文本时停止搜索,通过预排序,能够将搜索过程中的实时计算前置,同时通过请求截断避免扫描全量数据,减小请求遍历深度,大大减少搜索花费的时间和计算资源,在海量数据中,满足实时业务需求。
-
公开(公告)号:CN116361468B
公开(公告)日:2024-05-03
申请号:CN202310347374.X
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN117409431B
公开(公告)日:2024-04-26
申请号:CN202311412797.1
申请日:2023-10-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V30/413 , G06V30/146 , G06V30/19
Abstract: 本发明提供了多模态大型语言模型训练方法、电子设备和存储介质,涉及计算机技术应用领域,包括:利用第一训练样本对图文对齐模型进行训练,得到训练后的图文对齐模型;第二训练样本对大型语言模型进行训练,第一训练样本对包含一个第一图像样本和对应的原始文本;第一图像样本仅包括自然图像;第二训练样本集包括多个第二训练样本对,每个第二训练样本对包含一个第二图像样本和对应的问答对文本,其中,第二图像样本中设置有目标检测框,第二图像样本至少包括文档、表格、图表和自然图像。本发明能够理解不同种类的图表和文档数据,且具有对图片中的区域准确定位的能力,能够解锁更加多样的多模态能力。
-
公开(公告)号:CN117407754B
公开(公告)日:2024-04-19
申请号:CN202311415357.1
申请日:2023-10-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/22 , G06N3/09
Abstract: 本发明提供了一种多模态大模型训练策略确定方法、电子设备及介质,涉及多模态大模型训练策略确定领域,所述方法包括:获取初始多模态大模型对应的状态列表A;使用预设的一阶段训练策略,对初始多模态大模型进行训练,以得到第一中间多模态大模型列表B;使用预设的两阶段训练策略,分别对处于A中每一状态的初始多模态大模型进行训练,以得到第二中间多模态大模型列表C;获取B对应的第一性能参数列表α=(α1,α2,α3)以及C对应的第二性能参数列表β=(β1,β2,β3);若α1<β1、α2<β2且α3<β3,则将预设的两阶段训练策略确定为初始多模态大模型对应的目标训练策略;本发明能够达到确定出最佳的模型训练策略的目的。
-
公开(公告)号:CN117786750A
公开(公告)日:2024-03-29
申请号:CN202311868316.8
申请日:2023-12-29
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种保护隐私的联邦查询方法、装置、设备及介质。该方法包括:接收用户终端发送的查询请求;将所述查询请求转发给目标数据库,以使目标数据库根据所述查询请求进行数据查询,得到本地查询结果;接收所述目标数据库返回的本地查询结果,并根据所述本地查询结果确定联邦查询结果;选取所述联邦查询结果对应的脱敏规则对所述联邦查询结果进行数据脱敏,得到脱敏后的联邦查询结果;将所述脱敏后的联邦查询结果发送给所述用户终端。本公开通过对联邦查询结果进行脱敏加强联邦查询的隐私保护。
-
公开(公告)号:CN117764062A
公开(公告)日:2024-03-26
申请号:CN202311671334.7
申请日:2023-12-07
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06N5/022
Abstract: 本发明提供了一种基于大语言模型的统一信息抽取方法、介质及设备,涉及信息抽取技术领域,包括:获取待处理文本以及目标指令,将待处理文本和目标指令拼接后输入目标信息抽取模型,以得到目标信息抽取模型输出的信息抽取结果。目标信息抽取模型,通过以下步骤得到:获取若干原始文本集,对若干原始文本集中的每一原始文本,进行目标训练样本生成处理,以得到目标训练样本集,根据目标训练数据集对预设大语言模型进行训练,以得到目标信息抽取模型。本发明能够使得目标信息抽取模型具备抽取不同任务类型信息的能力,提高信息抽取的效率,并可以降低模型的发散性。
-
公开(公告)号:CN113220823B
公开(公告)日:2024-03-01
申请号:CN202010072425.9
申请日:2020-01-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F16/31 , G06F40/30 , G06F40/242 , G06F40/289 , G06F40/205 , G06Q50/00 , G06Q50/26
Abstract: 本申请涉及一种面向社交媒体公共言论的情感、话题及观点分析方法和装置,该方法包括:获取与公共事件对应的媒体报道信息以及公众舆论内容;按照第一预设策略分析所述媒体报道信息得到第一分析结果,按照第二预设策略分析所述公众舆论内容得到第二分析结果;对比所述第一分析结果和第二分析结果确定所述媒体报道信息与所述公众舆论内容的差异程度;根据所述差异程度规划所述公共事件的报道议程。该技术方案通过对网络公共事件的媒体报道信息以及公众舆论进行对比分析,能够得到公众对公众事件的观点以及情感倾向,并根据公众的观点以及情感倾向规划公共事件的报道议程,以此不仅(56)对比文件杨雨丹.言论差异与媒体公共性的建构——以都市报时评为中心的研究《.中国博士学位论文全文数据库 信息科技辑》.2013,(第2期),I141-11.
-
公开(公告)号:CN116797493B
公开(公告)日:2024-01-26
申请号:CN202310964411.1
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像去噪处理系统,包括:含噪人脸图像A、中间素描图像特征集合B=(B1,B2,……,Bn,……,BM)和文本特征C,所述系统实现以下步骤:对A和B1进行下采样得到第一个中间图像特征D1,对Di和Bi进行下采样得到Di+1,对DM和文本特征C进行注意力特征提取得到注意力图像特征E,对E进行上采样得到第一个中间噪声图像特征F1,对Fj和DM‑j进行上采样得到Fj+1,对FM‑1和D1进行上采样得到预测噪声图像G,根据A和G得到去噪人脸图像,将图像模态下的B、文本模态下的C与A进行信息融合,根据双模态的特征信息提高了对A的表征能力,提高了去噪结果的准确性。
-
-
-
-
-
-
-
-
-