通过影像查询定位视频中未预习的活动的方法

    公开(公告)号:CN110378269A

    公开(公告)日:2019-10-25

    申请号:CN201910621444.X

    申请日:2019-07-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种通过影像查询定位视频中未预习的活动的方法。该方法通过相对位置编码设计了一种新颖的区域自注意力方法来学习细粒度图像的区域表示,从而可以消除在影像查询中语义上不必要内容的影响;使用了一种多层堆叠的转换器编码器,建立了影像与视频内容的多步融合与推理,从而处理了不精确的影像查询的模糊定位;使用了一个顺序敏感定位器去直接检索时间的边界,从而可以精确确定目标片段的边界;相比于一般的动作定位方法,本方法突破了预定义动作的限制,并且可通过影像查询定位到视频中未经预习的活动。本发明在对未修饰视频进行动作定位中所取得的效果相比于传统方法更好。

    一种基于自监督语音表征的方言分类方法和系统

    公开(公告)号:CN116631375A

    公开(公告)日:2023-08-22

    申请号:CN202310733281.0

    申请日:2023-06-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于自监督语音表征的方言分类方法,属于语音识别领域。获取不同方言的音频样本,提取原始波形序列;使用预训练模型进一步提取语音表征序列并降采样,得到帧级别输入序列;使用Transformer编码器对帧级别输入序列进行编码;使用注意力聚合方法将编码结果进行池化统计,得到句子级别编码序列;对句子级别编码序列线性投影,得到样本预测概率;训练Transformer编码器、以及注意力聚合方法和线性投影中的可训练参数,基于训练后的参数预测音频中的方言类型。本发明使用自监督语音表征作为输入特征并在Transformer中引入基于内容的自注意力机制来提取音频的全局和局部信息,提高了分类准确率。

    一种基于机器人流程自动化的供用电合同生成方法和系统

    公开(公告)号:CN114971187B

    公开(公告)日:2025-03-14

    申请号:CN202210442004.X

    申请日:2022-04-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于机器人流程自动化的供用电合同生成方法和系统,属于合同自动生成领域。本发明使用了融合统一规制与个性化信息的多种内容形式的合同文本生成方法,引入了任务保险机制、关键元素等待机制、重启与恢复机制来保证在合同自动生成流程遇到失败任务时能顺利进行。本发明能在国网应用场景下快速生成各种有效的业务合同,极大降低了人工操作,提高了办公效率。

Patent Agency Ranking