一种基于形态学增强的张量化词嵌入压缩系统

    公开(公告)号:CN115481645A

    公开(公告)日:2022-12-16

    申请号:CN202211268116.4

    申请日:2022-10-17

    IPC分类号: G06F40/58 G06F40/30

    摘要: 本发明公开了一种基于形态学增强的张量化词嵌入压缩系统,该模型包括语素分割模块、语素索引及嵌入模块、词嵌入生成模块;所述语素分割模块将文本任务的词表中每个词分割成语素,所述语素索引及嵌入模块首先统计语素分割模块的分割结果生成语素表,接着定义语素索引矩阵和多个可训练的语素嵌入矩阵,语素索引矩阵每一行代表词表中对应单词的语素在语素表中的位置,语素嵌入矩阵的每一行代表语素表中对应语素的嵌入向量;词嵌入生成模块对词表中每个词,从语素嵌入矩阵中索引出语素向量并进行张量积,多个张量积的结果相加生成词嵌入向量;本发明克服了一般词嵌入技术参数量及存储空间占用大的问题,以及高倍压缩词嵌入时任务效果损失的问题。

    基于弱监督学习的多对象场景时空动作定位方法及装置

    公开(公告)号:CN115147925A

    公开(公告)日:2022-10-04

    申请号:CN202210765837.X

    申请日:2022-07-01

    摘要: 本发明公开了一种基于弱监督学习的多对象场景时空动作定位方法及装置,计算原始数据集中的个体集的多个体包标签,并通过个体的特征向量计算出动作预测结果,计算多个体包标签与动作预测结果间的交叉熵损失;对于帧t寻找与其在一定范围内的临近帧,以阈值进行筛选,对合格的个体生成伪标签,考察无标签个体,计算其最大预测值与最可能的标签值之间的交叉熵损失,以阈值为标准进行筛选,将合格的个体新增为锚定个体;综合考虑交叉熵损失函数,以作为总损失函数,利用原始训练集以及伪标签后的新数据集进行参数更新,在完成指定轮训练后停止;将待识别视频分解为若干帧,将其逐帧输入训练完成的网络中进行动作识别,输出视频帧中所有个体的动作类别。

    针对包含边框的视频拷贝检测方法及装置

    公开(公告)号:CN113971770B

    公开(公告)日:2024-10-29

    申请号:CN202010648949.8

    申请日:2020-07-07

    摘要: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。

    税收预测方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN115796389A

    公开(公告)日:2023-03-14

    申请号:CN202310045255.9

    申请日:2023-01-30

    IPC分类号: G06Q10/04 G06Q40/10

    摘要: 本公开涉及一种税收预测方法、装置、设备及计算机可读存储介质,该方法包括:获取目标税收主体的税收样本数据以及所述税收样本数据的演化模式标注结果;基于所述税收样本数据以及所述演化模式标注结果进行模型训练,得到训练好的税收演化模式匹配模型;将目标税收主体的历史税收数据输入所述税收演化模式匹配模型,得到所述目标税收主体的税收演化模式预测结果;基于所述税收演化模式预测结果,生成所述目标税收主体的衍生特征向量;将所述目标税收主体的衍生特征向量输入预先训练好的多模式税收预测模型,得到所述目标税收主体的税收预测结果。本公开通过为目标税收主体匹配最佳的税收演化模式,显著提升了预测的精准性。

    迁出风险企业的税源管理方法、装置、设备及存储介质

    公开(公告)号:CN115660796A

    公开(公告)日:2023-01-31

    申请号:CN202211577616.6

    申请日:2022-12-09

    IPC分类号: G06Q40/00 G06Q40/10

    摘要: 本公开涉及一种迁出风险企业的税源管理方法、装置、设备及存储介质,涉及数据分析技术领域,迁出风险企业的税源管理方法包括:获取目标企业的经营数据;对经营数据进行特征提取处理,得到目标企业与企业迁出行为相关的特征;将特征输入预设的企业迁出风险监控模型,基于企业迁出风险监控模型,对目标企业进行迁出风险检测。本公开实施例可以通过预设的企业迁出风险监控模型对存在迁出风险的企业进行精准稳定地的识别与预警,无需依靠人为经验,缩短企业迁出风险税前监控的时间,提高对重点税源流失预警响应的时效性和准确性。

    摘要生成方法、装置、设备及介质

    公开(公告)号:CN114722836A

    公开(公告)日:2022-07-08

    申请号:CN202210516005.4

    申请日:2022-05-12

    发明人: 赵菲菲

    摘要: 本公开涉及一种摘要生成方法、装置、设备及介质,在获取多个目标文本后,能够从与语义距离相关的多个视角提取每个目标文本的文本特征;并基于文本特征,对多个目标文本进行议题聚类,得到多个第一文本集合,进而针对各个第一文本集合分别进行议题摘要的抽取,由于用于对目标文本进行议题聚类的文本特征具有与语义距离相关的多个视角类型,使得进行议题聚类时所参考的信息特征比较丰富,能够从多个视角综合的对多个目标文本进行议题聚类,提高了议题聚类的准确性,进而使得抽取到的议题摘要也更加准确、有效。

    针对包含边框的视频拷贝检测方法及装置

    公开(公告)号:CN113971770A

    公开(公告)日:2022-01-25

    申请号:CN202010648949.8

    申请日:2020-07-07

    摘要: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。