-
公开(公告)号:CN115481645A
公开(公告)日:2022-12-16
申请号:CN202211268116.4
申请日:2022-10-17
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
摘要: 本发明公开了一种基于形态学增强的张量化词嵌入压缩系统,该模型包括语素分割模块、语素索引及嵌入模块、词嵌入生成模块;所述语素分割模块将文本任务的词表中每个词分割成语素,所述语素索引及嵌入模块首先统计语素分割模块的分割结果生成语素表,接着定义语素索引矩阵和多个可训练的语素嵌入矩阵,语素索引矩阵每一行代表词表中对应单词的语素在语素表中的位置,语素嵌入矩阵的每一行代表语素表中对应语素的嵌入向量;词嵌入生成模块对词表中每个词,从语素嵌入矩阵中索引出语素向量并进行张量积,多个张量积的结果相加生成词嵌入向量;本发明克服了一般词嵌入技术参数量及存储空间占用大的问题,以及高倍压缩词嵌入时任务效果损失的问题。
-
公开(公告)号:CN115147925A
公开(公告)日:2022-10-04
申请号:CN202210765837.X
申请日:2022-07-01
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
摘要: 本发明公开了一种基于弱监督学习的多对象场景时空动作定位方法及装置,计算原始数据集中的个体集的多个体包标签,并通过个体的特征向量计算出动作预测结果,计算多个体包标签与动作预测结果间的交叉熵损失;对于帧t寻找与其在一定范围内的临近帧,以阈值进行筛选,对合格的个体生成伪标签,考察无标签个体,计算其最大预测值与最可能的标签值之间的交叉熵损失,以阈值为标准进行筛选,将合格的个体新增为锚定个体;综合考虑交叉熵损失函数,以作为总损失函数,利用原始训练集以及伪标签后的新数据集进行参数更新,在完成指定轮训练后停止;将待识别视频分解为若干帧,将其逐帧输入训练完成的网络中进行动作识别,输出视频帧中所有个体的动作类别。
-
公开(公告)号:CN116743343B
公开(公告)日:2024-01-23
申请号:CN202310763263.7
申请日:2023-06-26
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
IPC分类号: H04L9/00 , H04L9/32 , H04L67/565
摘要: 本发明公开了一种面向复杂网络环境的高性能区块链共识方法,属于区块链技术领域;本发明提出了一种能满足在大规模复杂广域网条件下的高性能低延迟的共识方法,通过对区块结构进行了重新设计,满足了异步区块传输、流式区块执行的需求;同时设计了异步区块传输协议,避免了节点带宽不同,网络波动所带来的性能影响;更进一步地,设计了区块流式区块执行协议,在保证执行结果正确的前提下,加速了大部分区块交易的确认延时。
-
公开(公告)号:CN116743343A
公开(公告)日:2023-09-12
申请号:CN202310763263.7
申请日:2023-06-26
申请人: 天津大学 , 北京中科闻歌科技股份有限公司
IPC分类号: H04L9/00 , H04L9/32 , H04L67/565
摘要: 本发明公开了一种面向复杂网络环境的高性能区块链共识方法,属于区块链技术领域;本发明提出了一种能满足在大规模复杂广域网条件下的高性能低延迟的共识方法,通过对区块结构进行了重新设计,满足了异步区块传输、流式区块执行的需求;同时设计了异步区块传输协议,避免了节点带宽不同,网络波动所带来的性能影响;更进一步地,设计了区块流式区块执行协议,在保证执行结果正确的前提下,加速了大部分区块交易的确认延时。
-
公开(公告)号:CN113971770B
公开(公告)日:2024-10-29
申请号:CN202010648949.8
申请日:2020-07-07
申请人: 北京中科闻歌科技股份有限公司
摘要: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。
-
公开(公告)号:CN115796389A
公开(公告)日:2023-03-14
申请号:CN202310045255.9
申请日:2023-01-30
申请人: 北京中科闻歌科技股份有限公司
摘要: 本公开涉及一种税收预测方法、装置、设备及计算机可读存储介质,该方法包括:获取目标税收主体的税收样本数据以及所述税收样本数据的演化模式标注结果;基于所述税收样本数据以及所述演化模式标注结果进行模型训练,得到训练好的税收演化模式匹配模型;将目标税收主体的历史税收数据输入所述税收演化模式匹配模型,得到所述目标税收主体的税收演化模式预测结果;基于所述税收演化模式预测结果,生成所述目标税收主体的衍生特征向量;将所述目标税收主体的衍生特征向量输入预先训练好的多模式税收预测模型,得到所述目标税收主体的税收预测结果。本公开通过为目标税收主体匹配最佳的税收演化模式,显著提升了预测的精准性。
-
公开(公告)号:CN115660796A
公开(公告)日:2023-01-31
申请号:CN202211577616.6
申请日:2022-12-09
申请人: 北京中科闻歌科技股份有限公司
摘要: 本公开涉及一种迁出风险企业的税源管理方法、装置、设备及存储介质,涉及数据分析技术领域,迁出风险企业的税源管理方法包括:获取目标企业的经营数据;对经营数据进行特征提取处理,得到目标企业与企业迁出行为相关的特征;将特征输入预设的企业迁出风险监控模型,基于企业迁出风险监控模型,对目标企业进行迁出风险检测。本公开实施例可以通过预设的企业迁出风险监控模型对存在迁出风险的企业进行精准稳定地的识别与预警,无需依靠人为经验,缩短企业迁出风险税前监控的时间,提高对重点税源流失预警响应的时效性和准确性。
-
公开(公告)号:CN114722836A
公开(公告)日:2022-07-08
申请号:CN202210516005.4
申请日:2022-05-12
申请人: 北京中科闻歌科技股份有限公司
发明人: 赵菲菲
IPC分类号: G06F40/30 , G06F40/44 , G06K9/62 , G06F40/289 , G06F40/268
摘要: 本公开涉及一种摘要生成方法、装置、设备及介质,在获取多个目标文本后,能够从与语义距离相关的多个视角提取每个目标文本的文本特征;并基于文本特征,对多个目标文本进行议题聚类,得到多个第一文本集合,进而针对各个第一文本集合分别进行议题摘要的抽取,由于用于对目标文本进行议题聚类的文本特征具有与语义距离相关的多个视角类型,使得进行议题聚类时所参考的信息特征比较丰富,能够从多个视角综合的对多个目标文本进行议题聚类,提高了议题聚类的准确性,进而使得抽取到的议题摘要也更加准确、有效。
-
公开(公告)号:CN113971770A
公开(公告)日:2022-01-25
申请号:CN202010648949.8
申请日:2020-07-07
申请人: 北京中科闻歌科技股份有限公司
摘要: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。
-
公开(公告)号:CN113379169B
公开(公告)日:2021-11-23
申请号:CN202110924546.6
申请日:2021-08-12
申请人: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
摘要: 本公开涉及一种信息处理方法、装置、设备及介质。其中,信息处理方法包括:获取目标社会实体的目标社会实体信息;从目标社会实体信息中提取目标社会实体的与登记注册相关的目标特征向量;将目标特征向量输入预先训练好的梯度提升树模型,得到预先训练好的梯度提升树模型输出的目标社会实体的预测信用评分;若目标社会实体的预测信用评分符合预设的空壳实体检测条件,则确定目标社会实体为空壳实体。根据本公开实施例,能够提高对目标社会实体进行空壳实体检测的准确性,以满足税务稽查、风控预警等部门的实际业务需求。
-
-
-
-
-
-
-
-
-