单通检测方法及装置
    61.
    发明授权

    公开(公告)号:CN107846520B

    公开(公告)日:2020-02-11

    申请号:CN201711015585.4

    申请日:2017-10-26

    Abstract: 本发明实施例提供一种单通检测方法及装置,属于移动通信领域。该方法包括:获取进行语音通话的第一终端和第二终端,所分别对应的第一通话记录和第二通话记录;基于语音通话参数分别对第一通话记录及第二通话记录进行检测,根据检测结果确定第二终端是否发生感知单通。本发明实施例通过获取进行语音通话的第一终端和第二终端,所分别对应的第一通话记录和第二通话记录。基于语音通话参数分别对第一通话记录及第二通话记录进行检测,根据检测结果确定第二终端是否发生感知单通。由于可按照多种类型的语音通话参数,在语音语义层面上对用户行为进行分析,从而在降低单通误判率的同时,提升了单通检测效果。

    表格版面分析与提取方法及相关装置

    公开(公告)号:CN110598575A

    公开(公告)日:2019-12-20

    申请号:CN201910773607.6

    申请日:2019-08-21

    Abstract: 本申请实施例公开了一种表格版面分析与提取方法及相关装置,方法包括:获取包含表格版面的图片;确定图片中符合表格线约束条件的多个单连通链集合,多个单连通链集合中每个单连通链集合包括至少一条单连通链,单连通链对应于图片中的横向或竖向的短线段,表格线约束条件是指单连通链的方向相同且处于同一直线;根据每个单连通链集合包含的至少一条单连通链,生成每个单连通链集合对应的参考表格线;根据多个单连通链集合对应的多个参考表格线,生成图片的表格版面。本申请有利于提高表格版面提取的效率和准确率。

    一种文本行提取方法及装置

    公开(公告)号:CN109657629A

    公开(公告)日:2019-04-19

    申请号:CN201811582999.X

    申请日:2018-12-24

    Abstract: 本申请公开了一种文本行提取方法及装置,该方法包括:通过对文档图像中的字符进行检测,形成包含字符的各个候选文字框,再使各个候选文字框聚合成一或多个目标文本区域,该目标文本区域包括至少一个候选文字框且该至少一个候选文字框中的字符属于文档图像的至少一个文本行,最后提取出目标文本区域中的每一文本行。可见,本申请通过候选文字框聚合的方式,将文档图像的各个候选文字框聚合成目标文本区域,再从该目标文本区域中提取出每一文本行,而无需根据颜色、尺寸等先验知识设置各种规则来定义哪些候选文字框可以被合并成文本行,因此,本申请的这种文本行提取方式,不但提高了文本行的提取结果的准确性、还提高了检测效率。

    水印添加方法、水印检测方法及水印添加模型训练方法

    公开(公告)号:CN119962541A

    公开(公告)日:2025-05-09

    申请号:CN202510437524.5

    申请日:2025-04-09

    Abstract: 本发明提供一种水印添加方法、水印检测方法及水印添加模型训练方法,涉及计算机视觉技术领域,引入拆分模型,用于根据历史词元确定词元分类参数,使文本生成模型的不同次输出对应的词元字典中相同类别的词元的占比不同,可以适用于多种情况下的生成文本,避免强硬地设置固定占比破坏文本生成模型的生成内容的准确性和可用性,使水印添加效果稳定,进而保证了后续的水印检测效果。而且,还引入偏差模型,以根据历史词元确定词元字典中不同词元类别的概率偏差参数,进而使水印添加模块结合概率偏差参数和词元分类参数对第一词元概率分布进行更新,可以改变词元字典中不同词元类别的词元被选中的概率值,进一步提升后续的水印检测效果。

    合成视频的方法、电子设备及计算机程序产品

    公开(公告)号:CN119323625B

    公开(公告)日:2025-05-09

    申请号:CN202411866722.5

    申请日:2024-12-18

    Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。

    视频生成方法、装置、电子设备和计算机程序产品

    公开(公告)号:CN119922351A

    公开(公告)日:2025-05-02

    申请号:CN202411771790.3

    申请日:2024-12-04

    Abstract: 本申请提出一种视频生成方法、装置、电子设备和计算机程序产品,该方法能够基于复刻对象的音频和参考图像,生成复刻对象的虚拟形象视频。具体可以根据音频和参考图像,生成复刻对象口唇区域的动态图像,结合口唇区域的动态图像、参考图像和音频对应的情绪状态,得到复刻对象的动态图像;或者,从音频和参考图像中提取得到复刻特征,根据复刻特征和音频对应的情绪状态生成复刻对象的动态图像,然后根据音频和复刻对象的动态图像,生成复刻对象的虚拟形象视频,实现复刻特定对象的虚拟形象的目的。

    行为识别方法、装置及车辆
    67.
    发明公开

    公开(公告)号:CN119851342A

    公开(公告)日:2025-04-18

    申请号:CN202411860754.4

    申请日:2024-12-17

    Abstract: 本发明提供一种行为识别方法、装置及车辆,所述方法包括:对待识别图像进行人脸检测,提取得到目标人物的人脸图像;基于待识别图像的全图特征,以及人脸图像的人脸特征,确定目标人物的视线落点区域;在视线落点区域在待识别图像范围内的情况下,在视线落点区域内,对待识别图像进行目标检测;基于目标检测结果,确定目标人物的行为识别结果。本发明提供的行为识别方法、装置及车辆,不再需要处理复杂的空间映射关系,简化了系统架构和算法复杂度,提高了行为识别的准确性和实时性。

    图像生成方法、装置、电子设备和存储介质

    公开(公告)号:CN119784879A

    公开(公告)日:2025-04-08

    申请号:CN202510279975.0

    申请日:2025-03-11

    Abstract: 本发明涉及图像处理技术领域,提供了一种图像生成方法、装置、电子设备和存储介质,其中方法包括:获取图像描述文本,并确定所述图像描述文本中的领域知识和通用知识,以及领域知识和通用知识分别对应的路由权重;基于领域知识,从领域知识库中进行知识检索,得到参考图像;领域知识库动态更新;基于参考图像、通用知识,以及领域知识和通用知识分别对应的路由权重进行图像生成,得到生成的目标图像;其中,路由权重用于反映对应知识在目标图像上的呈现度,利用动态知识检索的优势进行特定领域的知识检索,可以为特定领域的知识生成提供参考,同时借助动态路由策略进行图像生成,不仅保证了生成的图像的准确性,也增强了多样性和细节丰富性。

    一种操作意图识别方法、交互方法及相关装置

    公开(公告)号:CN119536609A

    公开(公告)日:2025-02-28

    申请号:CN202411654731.8

    申请日:2024-11-19

    Abstract: 本申请公开了一种操作意图识别方法、交互方法及相关装置,涉及人机交互技术领域,操作意图识别方法包括:获取目标用户的多模态数据,多模态数据包括手部图像数据和语音数据;根据目标用户的多模态数据,获取手指端点三维坐标、手指指向向量弧度、目标操作以及操作置信度;根据操作置信度,确定目标用户是否有操作意图;若目标用户有操作意图,则根据手指端点三维坐标和手指指向向量弧度,确定目标操作对应的操作对象,以得到包含目标操作以及目标操作对应的操作对象的操作意图识别结果。本申请公开的操作意图识别方法能够较为准确地识别出操作意图,进而能够提升交互准确率,从而能够提升用户体验。

    一种笔迹识别方法及笔迹识别模型的训练方法

    公开(公告)号:CN119399779A

    公开(公告)日:2025-02-07

    申请号:CN202411343916.7

    申请日:2024-09-25

    Abstract: 本发明公开一种笔迹识别方法及笔迹识别模型的训练方法,所述识别方法包括:获取待识别图像;待识别图像包括目标识别对象;将待识别图像输入目标笔迹识别模型进行特征提取,得到目标识别对象对应的待识别特征信息;基于目标笔迹识别模型,对待识别特征信息进行特征处理,得到特征筛选信息和待分类识别信息;基于特征筛选信息对待分类识别信息进行筛选,得到特征筛选结果;基于目标笔迹识别模型和特征筛选结果,对待分类识别信息进行分类识别,得到目标识别对象对应的目标识别结果。本发明应用笔迹识别模型,通过提取目标识别对象的特征,进而对待识别特征进行多分支识别,并对识别结果进行对齐,以生成目标识别结果,能够提高对象识别的准确性。

Patent Agency Ranking