一种基于人体网格恢复的三维重建方法

    公开(公告)号:CN117726770A

    公开(公告)日:2024-03-19

    申请号:CN202311737029.3

    申请日:2023-12-18

    Abstract: 一种基于人体网格恢复的三维人体重建方法,包括:将包含一系列帧的视频序列作为输入,在视频帧中检测和提取人体特征,根据提取的人体特征,使用三维重建算法预测重建人体的形状和姿态,恢复出人体三维网格模型;其中,将所述视频序列以中间帧为界分为过去帧和未来帧两部分,分别提取过去帧和未来帧的信息,将未来帧进行时域翻转,使用过去帧和时域翻转的未来帧为中间帧的参数预测提供过去和未来的信息;从而引入对比学习来增强特征提取。本发明引入对比学习来增强特征提取器的性能,提高模型对视频中人体姿态和形状的精确估计能力。

    一种快速双目立体匹配方法
    32.
    发明公开

    公开(公告)号:CN117649436A

    公开(公告)日:2024-03-05

    申请号:CN202311701827.0

    申请日:2023-12-12

    Abstract: 一种快速双目立体匹配方法,包括:S1、将左右视图输入基于ResNet的特征提取网络,提取左右视图特征,下采样获得不同分辨率的上下文特征金字塔;S2、利用左右视图特征计算相关性特征,对相关量的候选匹配维度进行下采样,得到相关量金字塔;S3、根据视差估计和预设的偏移值,在相关性金字塔的各个层级中查找各像素的相关性区域内的特征向量;将各层级查找到的向量沿着特征通道维度拼接起来;拼接后的特征与当前视差估计通过卷积进行聚合,然后沿着特征通道维度连接,形成相关性特征;S4、将相关性特征、上下文特征金字塔输入多尺度高效GRU模块进行视差优化和更新,迭代获得最终的估计视差。由此,提高了对精细结构的还原效果并提高了视差估计精确度。

    一种难正负样本在线挖掘方法和人脸识别方法

    公开(公告)号:CN114764942B

    公开(公告)日:2022-12-09

    申请号:CN202210555142.9

    申请日:2022-05-20

    Abstract: 本发明公开了一种难正负样本在线挖掘方法,用于人脸识别模型的训练过程,包括如下步骤:S1、获取由第一图形处理器从样本人脸对提取到的特征向量对;S2、根据所述特征向量对计算所述样本人脸对的损失函数;S3、根据所述损失函数,对所述样本人脸对进行难正负样本挖掘,得到包含难正负样本人脸对的目标样本集;S4、计算所述目标样本集中各所述难正负样本人脸对的梯度,并将所述梯度传送到第二图形处理器,以使所述第二图形处理器通过所述梯度进行反向传播,对模型参数进行调整,并将调整后的模型参数共享给所述第一图形处理器。

    利率数据预测方法和装置、电子设备及存储介质

    公开(公告)号:CN120088072A

    公开(公告)日:2025-06-03

    申请号:CN202510572166.9

    申请日:2025-05-06

    Abstract: 本申请实施例提供了一种利率数据预测方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:对多模态大语言模型训练数据集进行特征提取,得到多模态融合特征;基于多模态大语言模型训练数据集、多模态融合特征及金融语料数据集,训练目标利率影响因素提取模型;基于目标利率影响因素提取模型,对多模态大语言模型训练数据集进行特征提取,得到利率影响因素特征;基于利率影响因素特征及多模态回归模型训练数据集,训练目标利率预测模型;基于目标利率影响因素提取模型及目标利率预测模型,对多模态当前市场数据集进行利率预测,得到当前利率预测数据。本申请实施例能够提高利率数据预测的准确率。

    基于大语言模型与强化学习的状态表征方法及装置

    公开(公告)号:CN118504612A

    公开(公告)日:2024-08-16

    申请号:CN202410426712.3

    申请日:2024-04-10

    Applicant: 清华大学

    Abstract: 本申请涉及大语言模型与强化学习技术领域,特别涉及一种基于大语言模型与强化学习的状态表征方法及装置,其中,方法包括:利用自然语言的描述器将强化学习的源状态表征转换为一定大语言模型的状态表征,其中,一定大语言模型的状态表征包括任务描述、状态细节、输出要求和反馈信息中的至少之一;将其输入一定大语言模型后生成强化学习智能体增强的状态表征函数和内在奖励函数;基于增强的状态表征函数和内在奖励函数以更新维护对应的利普西茨数组,产生满足一定平滑条件的状态表征。由此,解决了相关技术中,不仅需要大量的样本进行学习,样本利用率与学习效率均较低,而且还需要与大语言模型进行频繁交互,时间成本开销较高,适用性不足等问题。

    一种基于单相机的多视角生物特征采集装置

    公开(公告)号:CN114898414A

    公开(公告)日:2022-08-12

    申请号:CN202210413280.3

    申请日:2022-04-20

    Abstract: 本发明公开了一种基于单相机的多视角生物特征采集装置,包括光源模块、相机模块和移动模块,其中,所述光源模块包括生物特征置放块和光源单元,所述生物特征置放块的上表面设有生物特征置放部,且在所述生物特征置放部处设有多个透光孔,所述光源单元设置于所述生物特征置放块的下方以通过多个所述透光孔透出光;所述相机模块固定连接在所述移动模块上,所述移动模块用于带动所述相机模块移动以使得所述相机模块能够静置于所述生物特征置放块的上方的多个位置处,以从多个视角对所述生物特征置放块上放置的生物特征进行拍摄。本发明不仅实现了多视角图像拍摄,而且大幅度地降低了设备成本和操作复杂性。

    一种多视角手指静脉图像采集设备

    公开(公告)号:CN113989861A

    公开(公告)日:2022-01-28

    申请号:CN202111162648.5

    申请日:2021-09-30

    Abstract: 一种多视角手指静脉图像采集设备,包括摄像模块、照明模块、驱动模块和支撑模块,支撑模块上设置有旋转轨道,驱动模块包括电机和转柄,电机安装在支撑模块上,转柄安装在电机上,摄像模块和照明模块相对设置并分别与转柄相连,摄像模块和照明模块还分别通过滑轮安装在旋转轨道上,摄像模块和照明模块之间设置有供手指放入的空间,电机驱动转柄转动,转柄带动摄像模块和照明模块沿旋转轨道同步旋转,摄像模块对手指进行多视角摄像,照明模块在多视角摄像时对手指提供对应视角的照明。本发明只使用单个相机实现对手指静脉多视角全方位的灵活采集,大大减少了投入成本,简化了设备结构和控制程序,以低成本实现了高质量易操作的多视角指静脉采集。

    基于鼾声信号的睡眠呼吸暂停监测方法及装置

    公开(公告)号:CN111685735B

    公开(公告)日:2022-01-21

    申请号:CN202010511665.4

    申请日:2020-06-08

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于鼾声信号的睡眠呼吸暂停监测方法及装置,该方法包括:从多导睡眠图中提取原始鼾声信号;采用滑动框沿原始鼾声信号滑动,统计每个滑动框内的信号顶点数;根据每个滑动框内的信号顶点数,筛选出信号顶点数大于预设阈值的滑动框对应的一个或多个鼾声信号备选片段;检测各个鼾声信号备选片段之前预设时间段内是否发生呼吸暂停事件;根据检测结果,将筛选出的各个鼾声信号备选片段标记为与睡眠呼吸暂停有关的第一类鼾声信号,或与睡眠呼吸暂停无关的第二类鼾声信号。本发明利用多导睡眠图中提取的鼾声信号,充分分析鼾声信号与呼吸信号之间的关联性,能够监测出与睡眠呼吸暂停有关的鼾声信号,以及与睡眠呼吸暂停无关的鼾声信号。

    一种改进型图像传感器读取方法

    公开(公告)号:CN110278390A

    公开(公告)日:2019-09-24

    申请号:CN201810212665.7

    申请日:2018-03-15

    Abstract: 本发明公开了一种改进型图像传感器读取方法,具体方法如下:像素阵列包括n*m个像素,即包括m个行选择电路和n个列读取电路,每行像素都公用一个行选择电路,每列像素都公用一个列读取电路;本发明设计合理,不仅降低了行方向一半的有效像素个数,但是也降低了行方向的噪声,提高了图像质量。同时系统还提高了一倍的读取速度(由每次读取一行变成每次读取两行),降低了一半的行选择电路功耗(一半的行选择电路不工作),而且也降低了列方向一半的有效像素个数,但是也降低了列方向的噪声,提高了图像质量。同时系统降低了一半的列读取电路功耗(一半的列读取电路不工作)。

    一种数显仪表判读方法
    40.
    发明授权

    公开(公告)号:CN102254159B

    公开(公告)日:2014-07-02

    申请号:CN201110189650.1

    申请日:2011-07-07

    Abstract: 本发明公开了一种数显仪表判读方法,包括如下步骤:分别提取数显仪表图像的水平边缘和竖直边缘,判断出显示屏区域的水平边缘和竖直边缘,进而提取出显示屏区域图像;用卷积模板对提取的显示屏区域图像进行卷积和量化,并对量化结果进行二值化处理,得到二值化显示屏图像;提取二值化显示屏图像中的字符串,确定字符串的上下、左右边界后再将每个字符分割出来;利用根据字符所处的矩形设定的直线与字符的相交次数和相交位置进行识别字符。本发明有很好的鲁棒性和很高的识别准确率。

Patent Agency Ranking