一种视频边录边传的实现方法、计算机程序产品及系统

    公开(公告)号:CN118368472A

    公开(公告)日:2024-07-19

    申请号:CN202410796727.9

    申请日:2024-06-20

    发明人: 王先来

    摘要: 本发明涉及视频传输技术领域,特别涉及一种视频边录边传的实现方法及系统。在实时录制视频过程中实现视频边录边传,将视频内容以数据块形式同步上传服务器,记录各个数据块的校验值。录制结束时,再次计算各个数据块的校验值,校验值变化说明该数据块信息变更。将发生变更的数据块的增量以及完整视频文件校验值上传服务器。服务器接收更新的数据块,生成完整视频文件并计算其校验值。服务器比较接收和计算的两个校验值,若两者一致则认为成功接收视频,通知业务后台完成视频传输,完成业务闭环。该视频边录边传的实现方法,视频录制完成后只需更新数据块增量,无需等视频录制结束后再上传完整视频文件,解决了实时录制并上传的时效性问题。

    一种适用于多场景的视频会议系统

    公开(公告)号:CN113099155B

    公开(公告)日:2023-11-03

    申请号:CN202110196967.1

    申请日:2021-02-22

    IPC分类号: H04N7/15

    摘要: 本发明公开了一种适用于多场景的视频会议系统,包括:服务器、视频终端、会议管理模块、消息管理模块、互动白板模块、文档共享模块和会议录制模块;视频终端包括数据采集模块,数据采集模块用于采集音视频数据,并将音视频数据传输至服务器;服务器用于接收音视频数据,并将音视频数据传输至指定视频终端;消息管理模块用于将所有视频终端的通信信息,根据视频终端的需求传输通信信息;会议录制模块用于根据视频终端的控制指令,在任意时间开始或结束视频录制。本发明能够有效解决异地沟通效率较低的问题;满足不同网络环境、不同参会人数要求,有效解会议参会人数受限、安全性低、多渠道多平台参会困难和无法满足多种应用场景的问题。

    基于AI的签字动作识别定位方法、识别训练方法及系统

    公开(公告)号:CN115880782B

    公开(公告)日:2023-08-08

    申请号:CN202310119903.0

    申请日:2023-02-16

    发明人: 王先来

    摘要: 本发明公开了一种基于AI的签字动作识别训练方法、识别定位方法、系统及计算机可读存储介质。该基于AI的签字动作识别定位方法通过基于AI的签字动作识别训练方法训练得到的AI签字动作识别定位模型从视频数据中识别具有签字动作的视频帧,然后通过视频帧计数步骤和签字动作标记步骤对视频帧进行处理得到起始帧和终止帧,并将起始帧到终止帧之间连续的视频段作为当前视频数据的签字动作视频段,最后以签字动作定位步骤输出的帧索引作为该签字动作的跳转标签,完成对签字动作的识别定位。本方法通过单一的识别定位模型进行视频帧识别,能避免多模型联动带来的误差累加和延迟问题,减少内存占用量、提升系统的计算速度,提高签字动作识别效率。

    一种基于数字人视频的业务办理方法、存储介质及系统

    公开(公告)号:CN116308212A

    公开(公告)日:2023-06-23

    申请号:CN202310526947.5

    申请日:2023-05-11

    发明人: 王先来

    摘要: 本发明提供一种基于数字人视频的业务办理方法、存储介质及系统,该方法根据业务话术信息生成第一数字人视频并向用户展示,获取用户的第一响应信息,然后识别出匹配度最高的业务标准信息,若最高匹配度不小于第一预设低值且不大于第二预设值,则意味着第一响应信息语义模糊,故需进行用户意愿核实,根据匹配度最高的业务标准信息生成指引话术信息及第二数字人视频并向用户展示,获取用户的第二响应信息,若第二响应信息与匹配度最高的业务标准信息一致,则能明确用户本意符合业务办理要求,故进行业务办理流程,若第二响应信息与匹配度最高的业务标准信息不一致,则能明确用户本意不符合业务办理要求,故结束业务办理流程。

    一种基于IoT设备的视频通信方法、存储介质及系统

    公开(公告)号:CN115988258B

    公开(公告)日:2023-06-23

    申请号:CN202310256987.2

    申请日:2023-03-17

    发明人: 王先来

    摘要: 本发明提供一种基于IoT设备的视频通信方法、存储介质及系统,其供IoT设备与其它设备进行通信,将来自其它设备的至少两路待混流视频流进行混流生成画中画或并列画面的混流视频,IoT设备通过该方法生成的一个混流视频中包含有多个待混流视频流内容,相当于以一对一的视频通信形式进行一对多的视频通信,该视频通信形式能够被IoT设备支持,可用于IoT平台音视频通信的场景,改善了目前IoT平台音视频通信的功能不足问题,在低性能的IoT设备上实现一对多音视频通信,扩展了IoT平台音视频通信的场景,提升了IoT设备上音视频通话的体验与实用性,为IoT设备的音视频通话进行赋能。

    一种AI虚拟背景实现方法、系统及计算机可读存储介质

    公开(公告)号:CN116029895A

    公开(公告)日:2023-04-28

    申请号:CN202310153669.3

    申请日:2023-02-23

    发明人: 王先来

    摘要: 本发明公开了一种AI虚拟背景实现方法、系统及介质,该方法通过深度卷积神经网络识别原始图片中的人脸区域,根据人脸区域定位人像位置,将原始图片转换为二值图片以计算人像位置的坐标范围和人脸区域的坐标信息,根据计算得到的人脸区域的坐标信息连续进行两次向下延伸的感兴趣区域处理以分别得到人体区域和底部区域,通过像素值聚类算法对人脸区域进行背景分割处理,通过边缘查找算法分别对人体区域和底部区域进行背景分割处理,对人脸区域、人体区域和底部区域一起进行二值图相加合成生成与背景分割的整体前景人像二值图,最后将整体前景人像和新的背景图片进行融合操作,生成最终的视频帧图像数据替换原始图片,快速完成视频背景处理。

    基于人工智能的人脸图像美颜处理方法及系统

    公开(公告)号:CN115908119A

    公开(公告)日:2023-04-04

    申请号:CN202310011437.4

    申请日:2023-01-05

    IPC分类号: G06T3/00 G06V10/82 G06V40/16

    摘要: 本发明涉及人工智能技术领域,涉及一种基于人工智能的人脸图像美颜处理方法及系统。本发明采集构建待分析人脸图像的人脸图像关系分布网;基于多帧参考人脸图像中的至少一帧参考人脸图像和对应的真实人脸图像标识信息,对初始神经网络进行网络优化处理得到目标神经网络并利用目标神经网络输出待美颜的待分析人脸图像识别结果。本发明利用图像处理神经网络搭建人脸图像美颜处理系统,更便于后续对待分析人脸图像识别结果进一步进行美颜处理,从而使得该基于人工智能的人脸图像美颜处理系统实现了跨平台多终端实时运行的目的,提高了人脸图像美颜处理效率,使人脸图像美颜美型美妆呈现更加自然。

    基于AI的签字动作识别定位方法、识别训练方法及系统

    公开(公告)号:CN115880782A

    公开(公告)日:2023-03-31

    申请号:CN202310119903.0

    申请日:2023-02-16

    发明人: 王先来

    摘要: 本发明公开了一种基于AI的签字动作识别训练方法、识别定位方法、系统及计算机可读存储介质。该基于AI的签字动作识别定位方法通过基于AI的签字动作识别训练方法训练得到的AI签字动作识别定位模型从视频数据中识别具有签字动作的视频帧,然后通过视频帧计数步骤和签字动作标记步骤对视频帧进行处理得到起始帧和终止帧,并将起始帧到终止帧之间连续的视频段作为当前视频数据的签字动作视频段,最后以签字动作定位步骤输出的帧索引作为该签字动作的跳转标签,完成对签字动作的识别定位。本方法通过单一的识别定位模型进行视频帧识别,能避免多模型联动带来的误差累加和延迟问题,减少内存占用量、提升系统的计算速度,提高签字动作识别效率。

    文档智能采集分拣方法、调取方法、存储介质和系统

    公开(公告)号:CN115830613A

    公开(公告)日:2023-03-21

    申请号:CN202310023136.3

    申请日:2023-01-09

    发明人: 王先来

    IPC分类号: G06V30/19 G06V30/14

    摘要: 本发明公开了一种文档智能采集分拣方法、调取方法、存储介质和系统。该方法包括步骤:A.对材料图像进行文本检测获得文本行位置;B. 对前n行文本行进行文字识别得出所述文本识别结果;或对前、后n行文本行进行文字识别得出所述文本识别结果;C.将文本识别结果与各个文档类别的预设关键词进行匹配,若匹配成功,则将该文本识别结果所属的材料图像分拣为对应匹配的文档类别。该分拣方法能够实现文档智能采集分拣,减少文字识别量,缩短识别时长,提高识别、分拣效率,并且便于柜员在业务办理流程启动时一次性采集业务办理所需的全部材料,避免了在业务办理过程中分散采集文档所带来的不便。

    一种音视频质检处理方法及系统

    公开(公告)号:CN115631448A

    公开(公告)日:2023-01-20

    申请号:CN202211629368.5

    申请日:2022-12-19

    摘要: 本发明提供的一种音视频质检处理方法及系统,涉及数据处理技术领域。在本发明中,对待质检音视频数据进行数据分离处理,输出待质检视频数据和待质检音频数据;对待质检视频数据进行分帧处理及对象识别处理,输出每一帧待质检视频帧对应的对象识别信息;对待质检音频数据进行语音识别处理,输出待质检文本数据,对待质检文本数据进行质检处理,输出音频质检信息;基于每一帧待质检视频帧对应的对象识别信息和待质检音频数据对应的音频质检信息分析出待质检音视频数据对应的融合质检信息。本发明先将音视频进行分离识别质检再融合判断,提高了音视频中的文本信息、行为动作以及语音识别等质检项目的精度,进一步提高了音视频的质检效率。