-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN117541955A
公开(公告)日:2024-02-09
申请号:CN202311368194.6
申请日:2023-10-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V20/62 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多维度视频特征的短视频平台账号智能判定方法,属于短视频平台账号智能判定领域,具体包括:1)提取视频帧文本信息,利用差分法抽取视频中不同的关键帧,获取关键帧中的文本信息。2)视频整体特征提取,通过使用3D卷积网络端到端的获取视频的整体特征。3)融合多维度特征对视频进行判定,将视频整体特征与文本特征进行融合,通过引入Sigmoid函数输出每一类别对应的置信度,完成对视频的类别判断。4)账户类别判定,通过设计赋值加权平均的方法完成对账户多视频类别的综合判定,从而得到准确的账户类别。本发明解决了短视频平台账户人力成本的消耗,在短视频平台发展的过程中具有极大的应用价值。
-
公开(公告)号:CN118135446A
公开(公告)日:2024-06-04
申请号:CN202311376700.6
申请日:2023-10-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明是一种基于数据增强的轻量化短视频场景分类方法,属于短视频分类技术。本发明包括:利用余弦相似度算法进行短视频关键帧抽取;进行图像预处理,在训练阶段进行数据增强以丰富样本数据;基于ResNet50模型设计轻量化的场景分类模型,对预处理后的图像进行场景分类;采用置信度阈值和平均机制进行帧间结果后处理,输出最终短视频场景分类结果。本发明的轻量化的场景分类模型降低了模型参数量,同时利用多感受野的特征融合,获取更全面的信息,改善模型对复杂场景的理解和分类能力,实现了视频场景分类准确度和推理速度的平衡,具有更高的泛化能力和鲁棒性,可以应用于短视频场景分类、实时视频处理等领域,具有广阔的应用前景。
-
公开(公告)号:CN116112763A
公开(公告)日:2023-05-12
申请号:CN202211425782.4
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: H04N21/8405 , H04N21/234 , H04N21/44 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及短视频短视频标签构建技术领域,具体公开了一种自动化生成短视频内容标签的方法及系统,包括:S100,视频信息输入,将待处理视频导入系统中;S200数据预处理及关键帧提取,将视频信息进行切帧预处理,并对相邻的将两帧图像进行差分,得到图像的平均像素强度可以用来衡量两帧图像的变化大小,基于帧间差分的平均强度,每当视频中的某一帧与前一帧画面内容产生了大的变化,提取作为关键帧;S300图像描述生成,关键帧进行分析处理并输出描述关键词作为图像标签;S400描述统计等内容;本发明采用视频关键帧提取算法,相比全部帧比对的方法提高了处理速度,同时相比随机抽帧的方式提高了准确性。
-
公开(公告)号:CN119760081A
公开(公告)日:2025-04-04
申请号:CN202411871416.0
申请日:2024-12-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/3329 , G06F16/334 , G06F40/242 , G06F40/30 , G16H20/70
Abstract: 一种融合多源知识的情感支持对话回复生成模型及方法,属于自然语言处理领域,包括:结合常识知识补充用户外在处境认知知识,结合心理健康对话样例知识补充用户内在情感状态认知知识;面向多源认知知识与情感支持回复策略的相互约束建模;基于编码上下文与常识知识建模每个对话回合级的细粒度过渡信息;通过修改预训练语言模型Blenderbot解码器,将上下文隐藏状态分别与多因素进行交叉注意力计算,生成最终的情感支持回复。本发明联合提高了模型的知识选择能力、策略预测能力与情感认知能力,实现了细粒度的情感理解,辅助对话模型深入理解用户外在处境与内在情感状态,填补情感支持对话模型在情感认知能力上的缺失。
-
公开(公告)号:CN119739851A
公开(公告)日:2025-04-01
申请号:CN202411872070.6
申请日:2024-12-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F40/247 , G06F40/279 , G06F40/30 , G06F18/214 , G06N3/08 , G06Q30/0241
Abstract: 本发明涉及广告检测技术领域,特别是一种基于大模型数据增强和深度学习的广告检测方法,采用分层抽样策略,对初始标注数据进行抽样,基于抽样数据集微调大模型,提升其在广告文本上的分类能力。利用筛选规则筛选具有明显语义特征的广告文本数据,利用微调后的大模型的语义理解能力对满足条件的广告文本数据进行预标注,再进行人工校对,以确保数据的准确性和一致性。利用人工校对后的数据进行BERT模型的训练,通过对大规模数据进行分类和识别,显著提高广告检测的效果和应用价值。
-
公开(公告)号:CN119377495A
公开(公告)日:2025-01-28
申请号:CN202411424443.3
申请日:2024-10-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/951 , G06N3/042 , G06N3/0455 , G06N3/084 , G06Q50/20 , G06F18/214 , G06F18/23213
Abstract: 本发明涉及信息检索技术领域,具体公开了一种基于异构学术网络的社区发现方法及系统,通过基于元路径嵌入和标签传播的异构图表示学习算法,利用多层图神经网络学习与节点有关的全部元路径嵌入,然后融合元路径嵌入以得到语义信息充分的节点表示,从而解决节点表示语义信息不足的问题。再提出基于伪标签指导的对比学习社区发现算法,该算法解决节点表示区分度不足的问题以及主流模型的节点表示结构信息不足的问题;设计并实现学术网络中学者社区发现系统,利用本文提出的异构图表示学习模型和社区发现模型,学习由开源学术数据构成的学术网络中学者节点的表示,并进行学者社区发现,最后通过可视化技术展示了学者社区。
-
公开(公告)号:CN116112763B
公开(公告)日:2024-10-22
申请号:CN202211425782.4
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: H04N21/8405 , H04N21/234 , H04N21/44 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及短视频短视频标签构建技术领域,具体公开了一种自动化生成短视频内容标签的方法及系统,包括:S100,视频信息输入,将待处理视频导入系统中;S200数据预处理及关键帧提取,将视频信息进行切帧预处理,并对相邻的将两帧图像进行差分,得到图像的平均像素强度可以用来衡量两帧图像的变化大小,基于帧间差分的平均强度,每当视频中的某一帧与前一帧画面内容产生了大的变化,提取作为关键帧;S300图像描述生成,关键帧进行分析处理并输出描述关键词作为图像标签;S400描述统计等内容;本发明采用视频关键帧提取算法,相比全部帧比对的方法提高了处理速度,同时相比随机抽帧的方式提高了准确性。
-
-
-
-
-
-
-