-
公开(公告)号:CN119314075A
公开(公告)日:2025-01-14
申请号:CN202411201444.1
申请日:2024-08-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种视频内容标签确定方法、装置、电子设备及产品,该方法通过检测视频数据中的视频镜头边界,对视频数据进行切割,得到至少一个视频镜头对应的视频片段;基于视频片段中相邻图像帧之间的差异,从视频片段中提取出关键图像帧;对关键图像帧进行识别,生成关键图像帧的描述文本,并基于关键图像帧的描述文本,提取视频数据对应的视频内容标签。采用本申请的技术方案,能够从视频数据中的关键图像帧中提取出图像的描述文本,描述文本能够覆盖视频的细节,以使根据描述文本提取出的视频内容标签准确度更高,并且自动提取视频数据的视频内容标签,提高了确定视频内容标签的效率。
-
公开(公告)号:CN117371950A
公开(公告)日:2024-01-09
申请号:CN202311384959.5
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种机器人流程自动化方法、装置、一体机和存储介质,其中方法包括:获取需求文本;对所述需求文本进行意图分类,得到意图分类结果;在所述意图分类结果为执行业务的情况下,基于机器人流程自动化RPA大模型,执行所述需求文本对应的业务。本发明提供的机器人流程自动化方法、装置、一体机和存储介质,能够提高流程自动化任务的执行效率和准确性,提升用户体验感。
-
公开(公告)号:CN114254138A
公开(公告)日:2022-03-29
申请号:CN202111528642.5
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种多媒体资源分类方法、装置、电子设备和存储介质,所述方法包括:确定待分类的多媒体资源中的图像,以及多媒体资源中的展示文本和/或语音文本;语音文本是对多媒体资源中的音频进行语音识别后得到的;基于图像,以及展示文本和/或语音文本,得到多媒体资源的分类结果。本发明提供的多媒体资源分类方法、装置、电子设备和存储介质,能够进一步提高多媒体资源分类的精度。
-
公开(公告)号:CN112686390A
公开(公告)日:2021-04-20
申请号:CN202011582882.9
申请日:2020-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06N20/00
Abstract: 本申请公开了一种联合建模方法、系统、装置及具有存储功能的装置,应用于第三方鉴权节点的所述联合建模方法包括:获取第一设备传输的第一用户标识列表以及第二设备传输的第二用户标识列表;对第一用户标识列表和第二用户标识列表进行匹配、排序和添加噪声标识,以分别获得第一标识样本列表和第二标识样本列表,其中,第一标识样本列表和第二标识样本列表中代表同一用户的排序序号相同;将加密后的第一标识样本列表和第二标识样本列表发送至对应的第一设备和第二设备,以使得第一设备和第二设备分别利用对应的标识样本列表进行模型训练。通过上述方式,能够解决联合建模时匹配攻击的技术问题。
-
公开(公告)号:CN118365752A
公开(公告)日:2024-07-19
申请号:CN202410536818.9
申请日:2024-04-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种图像生成方法及相关装置,涉及图像处理技术领域,图像生成方法包括:获取目标图像;对目标图像进行去背景处理;获取去背景图像对应的图像描述文本,图像描述文本至少包括去背景图像的内容描述文本;根据去背景图像和去背景图像对应的图像描述文本,生成指定风格的图像;将生成的图像处理成尺寸和背景满足用户要求的图像。本申请公开的图像生成方法可自动生成与目标图像中的目标具有较高相似度的指定风格的图像。
-
公开(公告)号:CN119169123A
公开(公告)日:2024-12-20
申请号:CN202411176576.3
申请日:2024-08-26
Applicant: 科大讯飞股份有限公司
Abstract: 本说明书实施例提供了一种图像生成方法,该方法通过获取图像生成提示词,并对图像生成提示词进行拆分,基于拆分得到的形象提示词进行形象生成,以得到对象图像;然后基于行动提示词进行交互动作的配置,以得到动作图像;进而根据场景提示词为动作图像配置图像背景,以得到目标图像。从而实现基于不同维度提示词的图像生成过程,通过对提示词的拆分,可以分别对图像元素进行生成,实现多对象交互下的精准控制,避免了提示词信息的遗漏,提高图像生成的准确性。
-
公开(公告)号:CN117055981A
公开(公告)日:2023-11-14
申请号:CN202311031190.9
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
IPC: G06F9/448 , G06F18/214 , G06N3/008
Abstract: 本申请实施例公开了一种信息处理方法、装置、设备及存储介质,获得输入的用于指示对目标软件执行目标操作的第一交互信息后,至少对第一交互信息和目标软件的源码进行处理,以生成原子能力清单;该原子能力清单中至少包括对应目标软件的不同可操作元素的不同原子能力;获得原子能力清单中的各个原子能力对应的函数,得到函数清单;依次执行函数清单中的各个函数以对各个原子能力对应的可操作元素进行处理,得到处理结果;该处理结果为响应结果,或者,该处理结果用于确定响应结果。本申请在生成原子能力清单时考虑了目标软件的源码,从而提高了RPA机器人的智能性。
-
公开(公告)号:CN118890499A
公开(公告)日:2024-11-01
申请号:CN202411159990.3
申请日:2024-08-22
Applicant: 科大讯飞股份有限公司
IPC: H04N21/234 , H04N21/44 , H04N21/845
Abstract: 本申请公开了一种视频混剪方法及相关装置,涉及视频处理技术领域,视频混剪方法包括:获取视频脚本以及与视频脚本相关的视频素材;对视频脚本进行分镜,得到若干个分镜脚本;对视频素材进行切分,得到若干个视频片段;从若干个视频片段中筛选与每个分镜脚本语义相关的视频片段,得到若干个分镜脚本分别对应的视频片段集;将每个分镜脚本对应的视频片段集中的视频片段拼接,得到每个分镜脚本对应的视频;将若干个分镜脚本分别对应的视频拼接,得到视频脚本对应的混剪视频。本申请公开的视频混剪方法,可自动对视频脚本和视频素材进行处理,最终可获得与视频脚本契合的混剪视频,该方法无需人工参与,具有较高的视频混剪效率。
-
公开(公告)号:CN112686390B
公开(公告)日:2023-11-17
申请号:CN202011582882.9
申请日:2020-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06N20/00
Abstract: 本申请公开了一种联合建模方法、系统、装置及具有存储功能的装置,应用于第三方鉴权节点的所述联合建模方法包括:获取第一设备传输的第一用户标识列表以及第二设备传输的第二用户标识列表;对第一用户标识列表和第二用户标识列表进行匹配、排序和添加噪声标识,以分别获得第一标识样本列表和第二标识样本列表,其中,第一标识样本列表和第二标识样本列表中代表同一用户的排序序号相同;将加密后的第一标识样本列表和第二标识样本列表发送至对应的第一设备和第二设备,以使得第一设备和第二设备分别利用对应的标识样本列表进行模型训练。通过上述方式,能够解决联合建模时匹配攻击的技术问题。
-
公开(公告)号:CN115953205A
公开(公告)日:2023-04-11
申请号:CN202211736650.3
申请日:2022-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06Q30/0251 , G06Q30/0201 , G06Q30/0202 , G06F18/22 , G06Q30/0241
Abstract: 本发明提供一种广告点击预测方法、装置、电子设备和存储介质,涉及数据处理技术领域,其中,广告点击预测方法包括:获取广告物料数据和用户的历史广告数据;历史广告数据包括点击过的至少一个历史图像素材数据的第一类别信息;广告物料数据包括目标广告的图像素材数据;确定图像素材数据中的图像特征和语义特征,并将图像特征和语义特征进行融合,得到多模态特征;基于多模态特征确定图像素材数据的第二类别信息;基于每个第一类别信息和第二类别信息,确定用户对目标广告的点击率。本发明考虑的因素不仅包括图像特征,还包括语义特征,从而提高了点击率预测的准确性。
-
-
-
-
-
-
-
-
-