一种用于智慧视频生成的视频数据采集方法及系统

    公开(公告)号:CN118646834B

    公开(公告)日:2024-11-08

    申请号:CN202411107806.0

    申请日:2024-08-13

    IPC分类号: H04N5/265 G06V20/40 G06F40/10

    摘要: 本发明公开一种用于智慧视频生成的视频数据采集方法及系统,涉及视频生成技术领域,所述方法包括:使用爬虫技术采集各网络平台上的视频数据;提取视频数据中的音频轨道,并将音频轨道转化为文本序列;创建文本拆分算法,并基于文本拆分算法将文本序列转化为文本分镜片段集;创建视觉拆分算法,并基于视觉拆分算法将视频数据的帧序列转化为视觉分镜片段集;基于文本分镜片段集与视觉分镜片段集生成最终的素材集。本发明实现的有益效果如下:实现对视频内容的视觉和文本拆分,生成高质量的分镜文本与视频素材配对数据,为智能视频生成模型的训练提供可靠的数据支持。

    一种文本处理网络、神经网络训练的方法以及相关设备

    公开(公告)号:CN111797589B

    公开(公告)日:2024-10-18

    申请号:CN202010478969.5

    申请日:2020-05-29

    摘要: 本申请涉及人工智能领域中的序列数据的处理技术,公开了一种文本处理网络、神经网络训练的方法以及相关设备。文本处理网络包括相似度计算模块和生成模块;相似度计算模块,用于接收输入的至少两个第一字符,对至少两个第一字符进行特征提取,得到与至少两个第一字符对应的第一特征信息,并根据第一特征信息计算至少两个第一字符在维度级的第一相似度信息,第一特征信息包括第一字符在至少一个维度的特征信息;生成模块,用于根据第一相似度信息,生成与至少两个第一字符对应的第二特征信息。能够一次性处理两个或两个以上的字符,提供了一种更高效的文本处理网络;第二特征信息中融合了维度级的信息,提高了整个文本处理网络的精度。

    一种用于智慧视频生成的视频数据采集方法及系统

    公开(公告)号:CN118646834A

    公开(公告)日:2024-09-13

    申请号:CN202411107806.0

    申请日:2024-08-13

    IPC分类号: H04N5/265 G06V20/40 G06F40/10

    摘要: 本发明公开一种用于智慧视频生成的视频数据采集方法及系统,涉及视频生成技术领域,所述方法包括:使用爬虫技术采集各网络平台上的视频数据;提取视频数据中的音频轨道,并将音频轨道转化为文本序列;创建文本拆分算法,并基于文本拆分算法将文本序列转化为文本分镜片段集;创建视觉拆分算法,并基于视觉拆分算法将视频数据的帧序列转化为视觉分镜片段集;基于文本分镜片段集与视觉分镜片段集生成最终的素材集。本发明实现的有益效果如下:实现对视频内容的视觉和文本拆分,生成高质量的分镜文本与视频素材配对数据,为智能视频生成模型的训练提供可靠的数据支持。

    一种基于文本处理的页面工作流构建方法及装置

    公开(公告)号:CN110188335B

    公开(公告)日:2024-03-01

    申请号:CN201910442158.7

    申请日:2019-05-24

    发明人: 张志一 李德彦

    IPC分类号: G06F8/34 G06F16/958 G06F40/10

    摘要: 本申请公开了一种基于文本处理的页面工作流构建方法及装置。启动操作框架页面;在操作界面中,建立主流程,所述主流程包括:起始节点,以及,结束节点;获取用户选定的目标组件,确定目标组件的调用流程;构建页面工作流,所述页面工作流包括:主流程,目标组件,目标组件的调用流程。本方案用户只需要选定需要调用的算法组件,调整好他们之间的调用流程,即可完成算法组件的装配工作,构建出一个页面工作流。也就是说,这个过程用户仅仅需要与计算机进行少量的交互,故而大大简化了页面工作流的构建过程,的用户,也可以完成这项工作,降低了页面工作流开发的门槛,减小了页面工作流开发的人力成本。

    具有音频接口的智能通信助手

    公开(公告)号:CN111226276B

    公开(公告)日:2024-01-16

    申请号:CN201880068007.3

    申请日:2018-10-10

    IPC分类号: G10L15/22 G06F40/10

    摘要: 呈现了用于具有音频接口的智能通信助手的方法、系统、和计算机程序。一种方法包括用于得到寻址到用户的消息的操作。所述消息来自于一个或多个消息源并且每个消息包括包含文本的消息数据。该方法还包括用于进行以下动作的操作:分析该消息数据以确定每个消息的含义,基于每个消息的相应消息数据和含义来为每个消息生成得分,并且基于所述消息的消息得分和含义来为所述消息生成文本概要。话音概要是基于该文本概要来创建的,并且该话音概要接着被发送至与该用户相关联的扬声器。该音频接口还允许该用户针对所述消息口头请求动作。

    一种基于汽车社区的文本自动分类方法

    公开(公告)号:CN117312561A

    公开(公告)日:2023-12-29

    申请号:CN202311270575.0

    申请日:2023-09-28

    摘要: 本发明涉及一种基于汽车社区的文本自动分类方法,包括如下步骤:获取汽车社区文本的数据集;得到词向量和文本特征向量,作为双层聚类模型的输入值;对词向量和文本特征向量进行聚类计算分别生成词汇分类和文本分类,从而形成双层聚类模型。当新文本进入时:计算新文本的词向量和文本特征向量;计算新文本每个词向量的词汇分类,并计算每个分类下的词频;计算新文本的文本分类;根据新文本每个词向量的词汇分类、词频和文本分类进行动态分析,当新文本产生的现有词汇分类以外的词汇数量及词频达到阈值时,则更新双层聚类模型。因此本发明能够在全流程上实现对汽车社区文本的自动分类,提升分类准确性及效率,并形成闭环管理。

    一种格式文书的生成方法
    7.
    发明公开

    公开(公告)号:CN117217231A

    公开(公告)日:2023-12-12

    申请号:CN202311191351.0

    申请日:2023-09-15

    摘要: 本发明公开了一种格式文书的生成方法,属于格式文书生成方法技术领域,包括以下步骤:S1:制作不同格式的公务文书的标准模板并保存;S2:将标准模板和电子文档分别复制到格式文书生成控件的关键词和文本语义分割区域中,对标准模板内的关键词进行分割提取,基于语义分割的关键词对电子文档的文本段进行语义分割,得到与关键词一一对应的文本段,将文本段依次对应复制到标准模板关键词位置替换关键词生成格式文书,弹出确认弹窗,并在工作人员点击确认后将生成的格式文书按照工作人员设定的保存路径保存在指令的文件夹内;本发明能够实现格式文书的自动生成,无需工作人员逐篇录入和编辑,缩短工作人员工作时间的同时减轻工作人员工作强度。

    一种Web版文档化蒙文电子病历编辑器

    公开(公告)号:CN117217171A

    公开(公告)日:2023-12-12

    申请号:CN202311185587.3

    申请日:2023-09-14

    摘要: 本发明提供一种Web版文档化蒙文电子病历编辑器,支持蒙古文输入和显示,包括:文档结构模块,用于实现蒙文电子病历编辑器横向分页,以及页眉页脚和主体内容竖向录入与显示;编码模块,用于构建一套标准化的编码转换器,以满足多类型编码的自动转换和显示,多类型编码包括蒙文标准编码、蒙科立编码。本发明实现Web版蒙文电子病历文书横向分页模式、竖向书写模式、统一编码处理,解决了现有技术中使用汉字编写的电子病历不便于蒙古族地区使用的问题。

    一种文字提取方法、图像处理设备和计算机可读存储介质

    公开(公告)号:CN111695550B

    公开(公告)日:2023-12-08

    申请号:CN202010225359.4

    申请日:2020-03-26

    发明人: 李佳 杨阳 刘旭东

    IPC分类号: G06F40/10 G06F40/151

    摘要: 本发明公开了一种文字提取方法、图像处理设备和计算机可读存储介质。该方法包括:获取待提取图像;将待提取图像的每个像素点的R值、G值和B值调整为灰度值,生成灰度图像;获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像;根据具有第一数值的像素点的行坐标对二值图像进行行提取,获取行文字图像;获取每个文字的宽度,根据每个文字的宽度获取行文字图像中的单个文字图像;提取单个文字图像中的待提取文字。通过上述方式,本发明能够有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。

    开放版式文档OFD中附件内容的查看方法及装置

    公开(公告)号:CN116776031A

    公开(公告)日:2023-09-19

    申请号:CN202311050407.0

    申请日:2023-08-21

    发明人: 宋敏 方俊

    IPC分类号: G06F16/958 G06F40/10

    摘要: 本发明提供一种开放版式文档OFD中附件内容的查看方法及装置,涉及计算机技术领域,该方法包括:对获取的OFD文档进行解析,得到解析后的OFD文档;在所述解析后的OFD文档包括至少一种格式的附件的情况下,确定需要查看的目标附件;基于对所述目标附件的查看请求,确定所述目标附件的类型;基于所述目标附件的类型,调用所述类型对应的查看方式,对所述目标附件进行查看,实现对OFD文档中不同格式的附件进行查看,不需要跳转至其他应用,保证了用户操作的一致性,提升了用户的查看效率,同时,能够提升用户的阅读体验。