-
公开(公告)号:CN112508049B
公开(公告)日:2023-11-17
申请号:CN202011211533.6
申请日:2020-11-03
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
IPC: G06V10/762 , G06V10/40
Abstract: 本发明提供的一种基于组稀疏优化的类聚方法,首先是数据的处理,其目的在于获得数据集样本间的相似度矩阵目标矩阵、误差最小项和稀疏约束项;第二,构建基于组稀疏约束的优化模型,其目的在于利用更为强力的组稀疏约束来抑制噪声影响;之后,本发明提供一种基于交替方向乘子(Alternating Direction Method of Multipliers)的优化算法来快速求解所构建的优化模型;最后,本发明提供一种快速的优化聚类算法,其目的是合并冗余的聚类结果,进一步提升性能。本发明的方法约束每个样本只能由一个样本近似表示,从而可以有效的提升算法鲁棒性;另一方面,所得到的目标矩阵无需再进行谱聚类分析,从而达到端到端的聚类效果。
-
公开(公告)号:CN104978395B
公开(公告)日:2019-05-21
申请号:CN201510267106.2
申请日:2015-05-22
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
Abstract: 本发明实施例提供了一种视觉词典的构建及应用方法和装置。包括:确定训练图像数据集,提取所述训练图像数据集中全部训练图像的局部描述符,得到第一局部描述符集;根据设定的分解方式将所述第一局部描述符集分解成若干第一子局部描述符集;对每个所述第一子局部描述符集分别进行聚类,分别得到每个所述第一子局部描述符集对应的第一视觉子词集,由所有所述第一视觉子词集构成视觉词典。通过本发明实施例,在构建视觉词典的过程中,提高了为实现图像检索所需要的运算时间以及内存占用。
-
公开(公告)号:CN105912524A
公开(公告)日:2016-08-31
申请号:CN201610218407.0
申请日:2016-04-09
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
Abstract: 本发明实施例提供了一种基于低秩矩阵分解的文章话题关键词提取方法和装置。该方法主要包括:使用将词表征为实数值向量的工具训练数据预处理后的文章文本,得到词向量化文件,使用基于文本图模型的关键词抽取算法抽取数据预处理后的文章文本中的特定话题下每个事件的关键词,根据抽取的关键词查询词向量化文件,建立特定话题下的关键词矩阵;采用增广拉格朗日乘子算法求解关键词矩阵的低秩分解问题,得到关键词低秩矩阵,最终生成所述数据预处理后的文章文本中所述特定话题下的关键词。本发明采用低秩矩阵分解的方法生成微博等文章话题的关键词,有效的解决了微博等文章话题关键词的稀疏性问题,大大降低了非关键词数据噪声的干扰。
-
公开(公告)号:CN108154080B
公开(公告)日:2020-09-01
申请号:CN201711205432.6
申请日:2017-11-27
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
IPC: G06K9/00
Abstract: 本发明提供了一种视频设备快速溯源的方法,该方法通过获取每个设备相机的一段视频,通过处理视频并且计算视频的相机指纹特征的方式计算出相机特征,建立数据库,每一部设备有自己独立的相机特征。同样方式计算待测视频的相机特征值,通过计算这个值与相机特征数据库中的特征值相关性来判断这个视频来自于哪部设备。本发明利用了相机指纹这种难以被修改和伪造的设备物理硬件特征在计算过程中以迭代处理,采用多种高效的识别方法实现设备高效溯源。
-
公开(公告)号:CN108154080A
公开(公告)日:2018-06-12
申请号:CN201711205432.6
申请日:2017-11-27
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
IPC: G06K9/00
Abstract: 本发明提供了一种视频设备快速溯源的方法,该方法通过获取每个设备相机的一段视频,通过处理视频并且计算视频的相机指纹特征的方式计算出相机特征,建立数据库,每一部设备有自己独立的相机特征。同样方式计算待测视频的相机特征值,通过计算这个值与相机特征数据库中的特征值相关性来判断这个视频来自于哪部设备。本发明利用了相机指纹这种难以被修改和伪造的设备物理硬件特征在计算过程中以迭代处理,采用多种高效的识别方法实现设备高效溯源。
-
公开(公告)号:CN105975478A
公开(公告)日:2016-09-28
申请号:CN201610218382.4
申请日:2016-04-09
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
Abstract: 本发明实施例提供了一种基于词向量分析的网络文章所属事件的检测方法和装置。该方法主要包括:建立典型训练集;对典型训练集中的每一条网络文章样本进行分词,去无用词预处理,得到规范化的网络文章样本文本;将每一条规范化的网络文章样本文本分别用word2vec算法和LDA算法提取特征,得到每一条网络文章样本文对应的多维词向量;将每一条网络文章样本文本对应的多维词向量和事件标签输入到随机森林算法,该随机森林算法输出事件的分类模型,利用所述事件的分类模型对待识别的网络文章文本进行识别,判断出所述待识别的网络文章文本所属的事件。本发明实施例充分利用了网络文本样本的信息,提高了网络文本样本所属事件分类的准确度。
-
公开(公告)号:CN112508049A
公开(公告)日:2021-03-16
申请号:CN202011211533.6
申请日:2020-11-03
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
IPC: G06K9/62
Abstract: 本发明提供的一种基于组稀疏优化的类聚方法,首先是数据的处理,其目的在于获得数据集样本间的相似度矩阵目标矩阵、误差最小项和稀疏约束项;第二,构建基于组稀疏约束的优化模型,其目的在于利用更为强力的组稀疏约束来抑制噪声影响;之后,本发明提供一种基于交替方向乘子(Alternating Direction Method of Multipliers)的优化算法来快速求解所构建的优化模型;最后,本发明提供一种快速的优化聚类算法,其目的是合并冗余的聚类结果,进一步提升性能。本发明的方法约束每个样本只能由一个样本近似表示,从而可以有效的提升算法鲁棒性;另一方面,所得到的目标矩阵无需再进行谱聚类分析,从而达到端到端的聚类效果。
-
公开(公告)号:CN105912524B
公开(公告)日:2019-08-20
申请号:CN201610218407.0
申请日:2016-04-09
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
Abstract: 本发明实施例提供了一种基于低秩矩阵分解的文章话题关键词提取方法和装置。该方法主要包括:使用将词表征为实数值向量的工具训练数据预处理后的文章文本,得到词向量化文件,使用基于文本图模型的关键词抽取算法抽取数据预处理后的文章文本中的特定话题下每个事件的关键词,根据抽取的关键词查询词向量化文件,建立特定话题下的关键词矩阵;采用增广拉格朗日乘子算法求解关键词矩阵的低秩分解问题,得到关键词低秩矩阵,最终生成所述数据预处理后的文章文本中所述特定话题下的关键词。本发明采用低秩矩阵分解的方法生成微博等文章话题的关键词,有效的解决了微博等文章话题关键词的稀疏性问题,大大降低了非关键词数据噪声的干扰。
-
公开(公告)号:CN119337018A
公开(公告)日:2025-01-21
申请号:CN202411536868.3
申请日:2024-10-31
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Inventor: 蔡亚莉 , 陈祖泉 , 杜刚 , 张晨 , 侯晓琳 , 秦本源 , 陈文驰 , 杜雪涛 , 陈燕雷 , 赵蓓 , 雷涛 , 周顶 , 刘逸哲 , 李岩 , 林达 , 于雷 , 于少中 , 刘胜兰 , 易佩迪 , 李小勇
IPC: G06F16/958 , G06F16/955 , G06F18/214 , G06F18/213 , G06F18/24 , G06N3/0455 , G06N3/08 , G06N5/04 , G06N5/022
Abstract: 本发明提供一种网站的多维度检测方法、装置、电子设备及存储介质,其中方法包括:获取待检测网站的网站链接,并获取待检测网站的网站数据;基于第一大语言模型,对网站数据进行多种数据维度的分析,确定网站数据需要扩充的目标数据维度;基于目标数据维度,调用第二大语言模型,对网站数据进行扩充,得到扩充后的网站数据;调用第三大语言模型,对扩充后的网站数据进行异常识别,确定是否为异常网站。通过结合大语言模型对待检测网站的网站数据进行多种数据维度的分析,实现了对网站数据的多维度分析过程。基于不同的大语言模型承担不同的职责的解耦分析方式,实现了待检测网站的高精度异常识别过程。
-
公开(公告)号:CN118869264A
公开(公告)日:2024-10-29
申请号:CN202410857621.5
申请日:2024-06-28
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: H04L9/40
Abstract: 本发明公开了一种用户操作日志数据异常识别方法、装置、介质及产品,通过将获取的用户操作日志数据中不同日志作为网络节点,计算不同节点间的互信息;根据不同节点间的互信息大小确定无向边,构建无向最小支撑树,对所述无向最小支撑树中的节点进行定向,确定初步的最小支撑树结构;在所述最小支撑树结构中进行节点序搜索得到节点序群,将不同节点序作为初始种群中的不同个体,计算不同个体在所述初始种群中的适应度;根据不同个体的适应度以及预设的种群寻优策略对所述初始种群进行更新;将更新后的种群中适应度最大的个体的节点序作为用户操作异常日志。本申请方案能够提高寻优的效率和寻优精度。
-
-
-
-
-
-
-
-
-