-
公开(公告)号:CN119598054A
公开(公告)日:2025-03-11
申请号:CN202510143768.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06V30/19
Abstract: 本发明涉及人工智能技术领域,提供一种网站类型识别方法、装置、电子设备和存储介质,其中方法包括:获取待识别网站的网址,并基于所述待识别网站的网址,获取所述待识别网站内所有的待分类图像;基于特征提取模型,对各待分类图像进行特征提取,得到所述各待分类图像的图像特征;基于文本特征库中的各文本特征和所述各待分类图像的图像特征,确定所述各待分类图像的类别;基于所述各待分类图像的类别,确定所述待识别网站的类型。本发明通过结合图像特征和文本特征,实现了基于图像和文本描述的多模态特征的检索式分类判断,可以有效提高网站类型识别的准确率。
-
公开(公告)号:CN118520929B
公开(公告)日:2024-10-29
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN117768343B
公开(公告)日:2024-08-30
申请号:CN202311587718.0
申请日:2023-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/02 , H04L43/062 , H04L47/70
Abstract: 本发明提供一种针对隧道流量的关联方法和装置,其中所述方法包括:获取预建立的网络隧道的多个入口节点流和多个出口节点流;确定与每个出口节点流对应的候选入口节点流,分别计算多个候选入口节点流的累计传输量距离;将每个出口节点流输入至自编码网络,输出对应的映射入口节点流,分别计算映射入口节点流和多个候选入口节点流的降噪距离;将多个候选入口节点流输入至优化表示生成器,分别输出多个候选入口节点流之间的优化表示距离;根据多个候选入口节点流的累计传输量距离、和映射入口节点流的降噪距离以及多个候选入口节点流之间的优化表示距离,对候选入口节点流进行筛选,确定每个出口节点流对应的目标入口节点流。
-
公开(公告)号:CN119940368A
公开(公告)日:2025-05-06
申请号:CN202510008588.3
申请日:2025-01-03
Applicant: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC: G06F40/30 , G06F40/194 , G06F40/16 , G06N3/045 , G06N3/0475 , G06N3/042 , G06N3/0464 , G06F18/22 , G06F18/23211
Abstract: 本发明涉及文本数据分析技术领域,尤其涉及一种面向生成式大模型的文本同源性分析方法,包括以下步骤:S1:对面向生成式大模型的文本数据进行预处理后,将文本数据转化为高维语义嵌入向量,引入混合距离度量进行相似度分析;S2:采用基于密度峰值的动态聚类算法进行动态聚类分析,生成初步的同源文本簇,引入多重迭代映射与动态梯度扰动机制进一步分析,得到优化的同源文本簇;S3:将优化的同源文本簇进行多模态融合,利用图结构对融合后的多模态同源文本簇进行分析,应用时间序列分析方法,得到文本的同源性分析与来源追踪结果,本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性,增强了文本表示的鲁棒性和准确性。
-
公开(公告)号:CN119759719A
公开(公告)日:2025-04-04
申请号:CN202411830029.2
申请日:2024-12-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/34 , G06N3/0475 , G06N3/0455 , G06N3/08 , G06N5/022 , G06N5/04
Abstract: 一种基于提示学习的大模型测评数据生成方法及系统,属于机器学习模型领域,包括以下步骤:从提示模板集合中获取初始提示模板;对初始提示模板进行变异操作;接收输入;将变异后的提示模板和接收的输入相结合组成若干完整提示,将这些完整提示输入到生成模型中得到测评数据;评估测评数据的生成质量,将能生成高质量测评数据的提示模板放入提示模板集合中,供下一次测评数据生成使用。与现有技术相比,本发明具有测评数据生成质量高、测评数据生成成本低、测评数据生成速度快、测评场景丰富、测评数据生成容易实现等优点。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
公开(公告)号:CN118365673A
公开(公告)日:2024-07-19
申请号:CN202410446799.0
申请日:2024-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种运动目标检测方法、装置、电子设备和可读存储介质,涉及图像处理和目标检测技术领域,其中,运动目标检测方法,包括:根据多个目标视角下目标场景的图像进行三维立体重建,得到所述目标场景对应的残缺点云,所述目标视角的数量小于视角总数;对所述残缺点云进行点云补全处理,得到所述目标场景对应的完整稀疏点云;对所述完整稀疏点云进行点云稠密化处理,得到所述目标场景对应的完整稠密点云;根据所述完整稠密点云进行运动目标检测,得到所述目标场景中的运动目标。本发明可以提高运动目标检测的准确性。
-
公开(公告)号:CN117768343A
公开(公告)日:2024-03-26
申请号:CN202311587718.0
申请日:2023-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/02 , H04L43/062 , H04L47/70
Abstract: 本发明提供一种针对隧道流量的关联方法和装置,其中所述方法包括:获取预建立的网络隧道的多个入口节点流和多个出口节点流;确定与每个出口节点流对应的候选入口节点流,分别计算多个候选入口节点流的累计传输量距离;将每个出口节点流输入至自编码网络,输出对应的映射入口节点流,分别计算映射入口节点流和多个候选入口节点流的降噪距离;将多个候选入口节点流输入至优化表示生成器,分别输出多个候选入口节点流之间的优化表示距离;根据多个候选入口节点流的累计传输量距离、和映射入口节点流的降噪距离以及多个候选入口节点流之间的优化表示距离,对候选入口节点流进行筛选,确定每个出口节点流对应的目标入口节点流。
-
公开(公告)号:CN116628515A
公开(公告)日:2023-08-22
申请号:CN202310538586.6
申请日:2023-05-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F17/16
Abstract: 本发明涉及社交网络技术领域,尤其为基于同空间用户特征传递的多网络身份对齐系统及方法,包括:数据采集模块:用于采集社交网络中的用户数据;身份学习模块:用于通过搭建网络拓扑结构与采集的用户数据相结合进行用户的多社交网络身份学习;身份传递模块:用于通过网络拓扑结构将用户数据进行多社交网络传递;向量生成模块:用于通过所述网络拓扑结构和用户数据获取多社交网络用户在同一个空间上的用户向量;身份对齐模块:用于通过相似度算法实现对未标注的潜在锚链路进行用户身份对齐。本发明利用自注意力机制,对用户的不同属性特征进行学习、融合,进行锚链路对齐判别,对用户的不同属性信息进行有效地整合与协调,进一步提高了用户身份的对齐准确性。
-
-
-
-
-
-
-
-