基于深度学习的数字人面部驱动方法

    公开(公告)号:CN118379779B

    公开(公告)日:2024-10-22

    申请号:CN202410831374.1

    申请日:2024-06-26

    发明人: 朱光辉 赵衍维

    摘要: 本申请涉及数字人面部驱动技术领域,具体涉及基于深度学习的数字人面部驱动方法,该方法包括:采集目标数据点、模型数据点,获取各邻域数据点;获取法向量方向变异度;进而获取数字人面部方向梯度;计算各目标数据点的面部皱纹强度指数;计算面部肌肉表情强度指数,进而获取各模型数据点的脸肌区域内稀疏点云权重;基于面部肌肉表情强度指数和脸肌区域内稀疏点云权重对数字人面部进行驱动。本申请在保证计算速度的情况下提高表情驱动的真实感。

    基于语音识别的数字人嘴型智能驱动方法

    公开(公告)号:CN118212934B

    公开(公告)日:2024-09-06

    申请号:CN202410628938.1

    申请日:2024-05-21

    发明人: 朱光辉 王钦才

    IPC分类号: G10L21/10 G10L15/02 G10L15/16

    摘要: 本申请涉及语音识别技术领域,具体涉及基于语音识别的数字人嘴型智能驱动方法,该方法包括:采集低信噪比音频数据,分解后得到各音频分信号,分析低信噪比音频数据的分形维信号及各音频分信号的分形维信号中元素的分布,得到各分信号分形维语音特征度,获取各音频分信号的分形维信号各位置的分信号分形维突变度,结合各分信号分形维语音特征度及各分信号分形维突变度得到低信噪比音频数据各位置的原始信号突变点分布值,根据原始信号突变点分布值获取低信噪比音频数据的各音素向量,结合神经网络模型完成数字人嘴型智能驱动。本申请旨在提高低信噪比音频数据进行数字人嘴型驱动的准确度。

    一种语音驱动数字人的方法和系统

    公开(公告)号:CN118338092A

    公开(公告)日:2024-07-12

    申请号:CN202410750052.4

    申请日:2024-06-12

    发明人: 朱光辉 赵衍维

    摘要: 本发明公开了一种语音驱动数字人的交互方法和系统,其中该方法包括:设置关联关系,使得数字人行为音频数据、视频数据分别是人物音频数据、视频数据的一一对应的虚拟化表达;监听并识别预设语音指令,进入任务准备状态;当采集到的主播的人物行为视频数据与虚线框重合度未超过阈值,返回监听和识别预设语音指令步骤;当采集到的主播的人物行为视频数据与虚线框重合度超过阈值,则解除所述关联关系且数字人开始执行与预设语音指令对应的任务,在执行任务过程中,数字人行为音频数据、视频数据由其执行的所述任务确定。这样能够使得直播间输出内容固定、重复的情况下,提高直播任务完成效率。

    一种基于船联网的细粒度定位方法和系统

    公开(公告)号:CN117119021A

    公开(公告)日:2023-11-24

    申请号:CN202311384684.5

    申请日:2023-10-25

    发明人: 王钦才

    摘要: 本发明公开了一种基于船联网的细粒度定位方法和系统,该方法包括:获取船舶的船体结构信息,船体结构信息包括船外区域信息、船内公共区域信息、船内保密区域信息中的至少一种;基于船舶的船体结构信息构建船体BIM模型;基于船体结构信息中确定的目标的坐标信息,在船体BIM模型中标示目标位置,并将船体BIM模型输出至船舶中控系统;对船体结构信息中确定的目标的坐标信息进行数字签名加密,并与获取的船舶AIS数据进行融合后,作为AIS数据的数据段内容进行广播;远程控制系统获取AIS数据,并解密得到AIS数据段对应的目标的坐标信息。通过上述基于船联网的细粒度定位方法实现船舶目标定位,并能够达到定位信息保密性,利于高效管理。

    业务流数据同步处理方法和系统、电子设备和存储介质

    公开(公告)号:CN116319836B

    公开(公告)日:2023-08-01

    申请号:CN202310576865.1

    申请日:2023-05-22

    发明人: 赵衍维

    摘要: 本发明公开了一种业务流数据同步处理方法和系统、电子设备和存储介质,该方法包括在固定水域内设置数据同步节点,固定水域内的第一水面对象上传业务流数据至数据同步节点,所述业务流数据包括第一AIS系统数据及临接船舶数据,数据同步节点基于船舶标志信息在船舶状态列表中进行匹配,基于匹配结果更新船舶数据项;响应于接收到周期同步信号,多个数据同步节点向调度控制中心上传同步数据,完成船舶业务流数据同步。通过采用新的船联网数据实时填补AIS系统数据缺项,稳定地实现船舶业务流数据同步。

    一种船货高效智能匹配的存储方法

    公开(公告)号:CN114416788A

    公开(公告)日:2022-04-29

    申请号:CN202111561226.5

    申请日:2021-12-16

    发明人: 王钦才

    摘要: 本申请公开了一种船货高效智能匹配的存储方法,通过对数据进行有效的组织利用,相互关联,可以在发布时就已经进行了高效的匹配过程,达到发布即匹配,有效解决了大数据匹配的速度问题;同时数据存储在高速缓存中,避免频繁读取数据库,减少访问数据库服务器的压力,可以极大地提高系统性能及智能匹配速度。

    基于深度学习的数字人面部驱动方法

    公开(公告)号:CN118379779A

    公开(公告)日:2024-07-23

    申请号:CN202410831374.1

    申请日:2024-06-26

    发明人: 朱光辉 赵衍维

    摘要: 本申请涉及数字人面部驱动技术领域,具体涉及基于深度学习的数字人面部驱动方法,该方法包括:采集目标数据点、模型数据点,获取各邻域数据点;获取法向量方向变异度;进而获取数字人面部方向梯度;计算各目标数据点的面部皱纹强度指数;计算面部肌肉表情强度指数,进而获取各模型数据点的脸肌区域内稀疏点云权重;基于面部肌肉表情强度指数和脸肌区域内稀疏点云权重对数字人面部进行驱动。本申请在保证计算速度的情况下提高表情驱动的真实感。

    基于语音识别的数字人嘴型智能驱动方法

    公开(公告)号:CN118212934A

    公开(公告)日:2024-06-18

    申请号:CN202410628938.1

    申请日:2024-05-21

    发明人: 朱光辉 王钦才

    IPC分类号: G10L21/10 G10L15/02 G10L15/16

    摘要: 本申请涉及语音识别技术领域,具体涉及基于语音识别的数字人嘴型智能驱动方法,该方法包括:采集低信噪比音频数据,分解后得到各音频分信号,分析低信噪比音频数据的分形维信号及各音频分信号的分形维信号中元素的分布,得到各分信号分形维语音特征度,获取各音频分信号的分形维信号各位置的分信号分形维突变度,结合各分信号分形维语音特征度及各分信号分形维突变度得到低信噪比音频数据各位置的原始信号突变点分布值,根据原始信号突变点分布值获取低信噪比音频数据的各音素向量,结合神经网络模型完成数字人嘴型智能驱动。本申请旨在提高低信噪比音频数据进行数字人嘴型驱动的准确度。

    基于人工智能的无绿幕人像自动抠图方法

    公开(公告)号:CN118134955A

    公开(公告)日:2024-06-04

    申请号:CN202410552490.X

    申请日:2024-05-07

    发明人: 朱光辉 王钦才

    摘要: 本申请涉及图像数据处理技术领域,具体涉及基于人工智能的无绿幕人像自动抠图方法,该方法包括:获取需要进行抠图的人像图像,记为目标人像图像;获取目标人像图像的各感兴趣区域;计算各感兴趣区域的整体纹理密度因子;计算目标人像图像的各感兴趣区域的紧密性细节特征值;计算目标人像图像的各感兴趣区域的背景判断因子;计算目标人像图像中各感兴趣区域的尺度参数;实现无绿幕的人像自动抠图。本申请针对图像增强过程中可能出现的边缘过度锐化和不自然效果的问题,基于分析构建背景判断因子实现目标人像图像的有效增强,并结合神经网络完成无绿幕人像自动抠图。

    一种基于船联网的细粒度定位方法和系统

    公开(公告)号:CN117119021B

    公开(公告)日:2024-01-26

    申请号:CN202311384684.5

    申请日:2023-10-25

    发明人: 王钦才

    摘要: 管理。本发明公开了一种基于船联网的细粒度定位方法和系统,该方法包括:获取船舶的船体结构信息,船体结构信息包括船外区域信息、船内公共区域信息、船内保密区域信息中的至少一种;基于船舶的船体结构信息构建船体BIM模型;基于船体结构信息中确定的目标的坐标信息,在船体BIM模型中标示目标位置,并将船体BIM模型输出至船舶中控系统;对船体结构信息中确定的目标的坐标信息进行数字签名加密,并与获取的船舶AIS数据进行融合后,作为AIS数据的数据段内容进行广播;远程控制系统获取AIS数据,并解密得到AIS数据段对应的目标的坐标信息。通过(56)对比文件Xu Chunbo“.Design and application ofreal-time monitoring system for Marinefishing nets”《.2022 IEEE 2ndInternational Conference on ElectronicTechnology, Communication and Information(ICETCI)》.2022,第386-390页.