车载环境下基于图卷积神经网络的异常驾驶行为识别方法

    公开(公告)号:CN112329689A

    公开(公告)日:2021-02-05

    申请号:CN202011280953.X

    申请日:2020-11-16

    Abstract: 本发明提供了一种车载环境下基于图卷积神经网络的异常驾驶行为识别方法,涉及计算机视觉技术领域,能够对人体细微行为和相似性行为做出有效识别,提高异常驾驶行为的识别能力;该方法采用改进型时空卷积网络和新型循环神经网络相结合的方式识别人体行为;改进型时空卷积网络在原有时空卷积网络的基础上进一步增加关节数量来改进空间拓扑图,提取多帧骨架序列片段的时空特征信息,再使用引入了长短期记忆的神经网络提取不同骨架序列片段的时间语义信息,以提取出的所有信息为依据进行驾驶行为的识别。本发明提供的技术方案适用于人体行为识别的过程中。

    一种图像数据检测方法、装置以及计算机可读存储介质

    公开(公告)号:CN111126243A

    公开(公告)日:2020-05-08

    申请号:CN201911320665.X

    申请日:2019-12-19

    Abstract: 本申请公开了一种图像数据检测方法、装置以及计算机可读存储介质,该方法包括:获取检测图像,从检测图像中获取包含目标对象的情景图像;获取情景图像中的像素点对应的位置特征矩阵;位置特征矩阵中包括像素点针对目标对象的位置特征元素;根据情景图像中的目标对象的对象排版特征,生成用于调整位置特征矩阵中的位置特征元素的注意力机制矩阵;根据位置特征矩阵中的位置特征元素和注意力机制矩阵,确定像素点对应的预测区域,将像素点对应的预测区域添加至预测区域集合;在预测区域集合中,选择与目标对象在检测图像中的对象位置和对象尺寸相匹配的预测区域,作为目标区域。采用本申请,可提高针对目标对象的检测准确性。

    一种基于生物医学文献的知识问答系统及方法

    公开(公告)号:CN109829042A

    公开(公告)日:2019-05-31

    申请号:CN201811623339.1

    申请日:2018-12-28

    Abstract: 本发明提供了一种基于生物医学文献的知识问答系统及方法,所述系统包括问题分析模块、文档检索模块和片段检索模块,所述问题分析模块通过所述文档检索模块与所述片段检索模块连接,所述方法首先进行问题分析,组合查询精炼和查询扩展技术,通过问题分析获取问题信息并生成查询条件,然后进行文档检索,利用检索方法查找相关医学文档,通过特定规则将N个排名靠前的文档的标题和摘要分割成句子合集,形成候选片段合集,最后进行片段检索,查找可以用来回答医学问题的相关句子并返回给用户,本发明融合了SDM,FSDM和PDFR检索方法,不仅对全局进行检索,还对不同文本域分配不同的权重进行检索,有效地提高了文档检索效果。

    人窗相对距离的确定方法、装置、电子设备及存储介质

    公开(公告)号:CN119963483A

    公开(公告)日:2025-05-09

    申请号:CN202411908740.5

    申请日:2024-12-23

    Abstract: 本公开涉及安全监测领域,更具体地,本公开涉及一种人窗相对距离的确定方法、装置、电子设备及存储介质。方法包括:通过预训练的目标检测模型识别目标图像,获得第一检测框和第二检测框的检测框信息,其中所述第一检测框用于标记人体在所述目标图像中对应的区域,所述第二检测框用于标记窗户在所述目标图像中对应的区域;分别确定人体和窗户在所述目标图像中的深度信息;根据所述检测框信息和深度信息确定人体和窗户的相对距离。

    基于双路径Transformer的生成对抗网络协同手势合成方法及装置

    公开(公告)号:CN118334247B

    公开(公告)日:2024-12-13

    申请号:CN202410477682.9

    申请日:2024-04-19

    Abstract: 本发明公开了一种基于双路径Transformer的生成对抗网络协同手势合成方法及装置,涉及人机交互技术领域。包括:获取文本数据、音频数据以及说话者身份数据,输入到构建好的基于Transformer的跨模态融合网络模型,得到手势合成结果;其中,基于Transformer的跨模态融合网络模型包括:前端单模态编码器模块、跨模态融合模块以及手势翻译模块。本发明引入了一种创新性的多模态融合机制,实现端到端的协同语音手势生成。融合机制通过并行定向跨模态Transformer和交互式级联二维注意力模块的协同作用进行,填补了单个模态的不足,有助于模型将焦点集中在与手势相关的上下文和语音信息上。实现了无需预定义的三维手势生成,而非仅限于简单地预测手势类别,并在实现上取得了最优效果。

Patent Agency Ranking