-
公开(公告)号:CN117520289A
公开(公告)日:2024-02-06
申请号:CN202311528377.X
申请日:2023-11-15
Applicant: 中国电力科学研究院有限公司 , 国网山西省电力公司电力科学研究院 , 山西电力交易中心有限公司 , 南京信息工程大学
Inventor: 龙苏岩 , 曹阳 , 徐占洋 , 王哲 , 徐骏 , 岳紫玉 , 王一凡 , 郭艳敏 , 盛祥祥 , 周天翔 , 杨争林 , 冯树海 , 李宏杰 , 李晓嘉 , 弓建华 , 安邦 , 冯凯 , 黄文渊 , 黄春波 , 史新红 , 程海花 , 曾丹 , 暴悦爽 , 陈丹阳 , 皮军
IPC: G06F16/18 , G06N3/045 , G06N3/0442 , G06F40/186 , G06F40/194 , G06F40/205
Abstract: 本发明涉及信息处理技术领域,提供一种在线日志解析方法、系统、设备及介质,包括:获取日志消息及对应的日志消息长度;根据日志消息长度对日志消息进行分组,在同一组内将相似的日志消息分为一类,统计该组中同一类日志消息非公共序列每个位置的不同标记的数量,小于阈值就对该组进行类中分组操作;分组后在每个组内使用频率分析,构建日志消息模板树。通过正则表达式来识别琐碎的动态变量标记;通过计算日志消息相似性来创建相似日志事件组;对同一组的实例进行频率分析以区分常量和变量标记;通过构建日志消息模板树,提高日志消息的模板提取效率。对原始的日志数据进行分析,给出了日志解析的方法,可以有效地解析出日志数据中的日志模板。
-
公开(公告)号:CN116108894A
公开(公告)日:2023-05-12
申请号:CN202310230121.4
申请日:2023-03-10
Applicant: 南京信息工程大学
IPC: G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种神经网络模型优化方法、装置、电子设备及存储介质,属于深度学习技术领域,方法包括:根据神经网络模型的特征,构建增广拉格朗日目标函数;根据所述增广拉格朗日目标函数,确定所述神经网络模型中每个优化变量对应的优化子问题的目标函数;对所述神经网络模型的各参数进行初始化设置;根据所述优化子问题的目标函数,对所述神经网络模型进行优化变量的更新,以实现对所述神经网络模型的优化。该方法能够弥补基于梯度优化器所涉及的对初始数据敏感和梯度消失的缺陷,解决ADMM算法对非严格凸目标函数表现不好且优化效率低的问题。
-
公开(公告)号:CN115909369A
公开(公告)日:2023-04-04
申请号:CN202310116030.8
申请日:2023-02-15
Applicant: 南京信息工程大学 , 江苏少儿春互联教育科技有限公司
IPC: G06V30/28 , G06V30/19 , G06V30/162 , G06V30/18 , G06V30/164 , G06V30/148 , G06V30/168 , G06V10/762
Abstract: 本发明公开了一种汉字字体二值化切片图像的提取方法及系统,包括:对获取的RGB习字格书法图片进行处理得到灰度图片;从灰度图片提取最大的四边形轮廓,并对轮廓之外的噪声背景进行屏蔽处理;采用LSD直线检测算法在已屏蔽噪声背景的图片中提取水平和竖直方向上的习字格边框线条,剔除习字格虚线噪声的影响,得到水平习字格线条标记图和竖直习字格线条标记图;确定实际的习字格交叉关键点,得到各习字格的RGB切片图;对各切片图的灰度值进行聚类分析,得到二值化切片图像。本发明能够规避习字格辅助虚线、各种涂抹、拍照光线等因素的影响,对RGB习字格书法图片进行准确切片,同时对切片图进行二值化,准确地提取出手写汉字字体。
-
公开(公告)号:CN115497108B
公开(公告)日:2023-03-14
申请号:CN202211433849.9
申请日:2022-11-16
Applicant: 南京信息工程大学 , 江苏少儿春互联教育科技有限公司
Abstract: 本发明公开一种基于椭圆离心率的汉字骨架角点检测方法,基于汉字单像素骨架图像中每个黑色像素的8邻域黑色像素,从汉字单像素骨架图像中提取交叉点;将汉字的骨架从交叉点处截断,得到多个笔画段;将笔画段的两个端点作为椭圆两焦点;遍历笔画段所有黑色像素;将笔画段所有黑色像素分别与椭圆两焦点构成椭圆;筛选获得椭圆离心率最小的椭圆;将小于设定离心率阈值的椭圆离心率最小的椭圆对应的黑色像素,作为拟角点;利用参数方程拟合曲线,设定曲率阈值;筛选曲率大于曲率阈值的拟角点,得到角点。本发明不仅能找到局部特征不明显的角点,还能有效排除特征接近角点的非角点,准确定位角点,从而提高角点检测率。
-
公开(公告)号:CN117708247A
公开(公告)日:2024-03-15
申请号:CN202311697969.4
申请日:2023-12-12
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种清算数据逻辑关系确定方法、系统、存储介质及设备,本发明针对不同结构的清算数据,分别采用语法规则匹配方式和语言模型抽取数据中的实体关系,构建血缘图谱,将数据血缘和知识图谱的结合,能够有效地识别清算数据之间的源头、流向和关联关系,即清算数据的逻辑关系,为电力清算系统的数据管理和分析提供了有力支持。
-
公开(公告)号:CN115471849B
公开(公告)日:2023-06-06
申请号:CN202211365489.3
申请日:2022-11-03
Applicant: 南京信息工程大学 , 江苏少儿春互联教育科技有限公司
IPC: G06V30/22 , G06V30/19 , G06V30/164
Abstract: 本发明公开了一种手写汉字图像评估方法及系统,首先获取手写汉字图像和模板汉字图像,进行去噪和二值化处理,得到预处理图像;再进行笔画类型确定处理,将得到手写汉字图像的笔画类型和模板汉字图像的笔画类型进行比较,获得手写汉字图像的相似度值,用于评估手写汉字图像,本发明将手写汉字精确到笔画层级评估,方便进行全面性评价。
-
公开(公告)号:CN113920516A
公开(公告)日:2022-01-11
申请号:CN202111487332.3
申请日:2021-12-08
Applicant: 南京信息工程大学
IPC: G06V30/226 , G06V30/164 , G06V30/19 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于孪生神经网络的书法字骨架匹配方法及系统,获取待匹配的两张书法字图像;分别对两张书法字图像进行预处理后得到两张预处理图像;对两张预处理图像进行细化,得到两张书法字图像骨架;利用预先训练好的基于孪生神经网络的书法字骨架匹配模型对两张书法字图像骨架进行相似度判断,若相似度大于预先设定的阈值则判定为同一个书法字,若相似度不大于预先设定的阈值则判定为不同的书法字。优点:通过书法字骨架提取与孪生神经网络结合的策略,对两张图片上的书法字进行精准高效相似度匹配;有效区分每个汉字骨架的图像特征,在对海量书法字数据基于内容检索时,检索样本和被检索数据库中的数据进行匹配可以达到更快更精准的效果。
-
公开(公告)号:CN106991433A
公开(公告)日:2017-07-28
申请号:CN201710131334.6
申请日:2017-03-07
Applicant: 南京信息工程大学
IPC: G06K9/62
CPC classification number: G06K9/6223 , G06K9/6288
Abstract: 本发明公开了基于优化簇相关矩阵的聚类融合方法,主要针对一般二进制簇相关矩阵的稀疏性和离散性特点,对矩阵进行优化。从得到的M个聚类成员出发,计算聚类成员间簇与簇的关系、聚类成员内簇与簇的关系和簇的稳定度,用数据所在簇与其它簇的关系代表数据出现在其它簇的概率,改善二进制簇相关矩阵的离散性和稀疏性,减少0值的出现,同时加入簇的稳定度,对基本的二进制簇相关矩阵进行优化,从而更好的利用聚类成员的特征,提高聚类融合的准确度和精度。
-
公开(公告)号:CN118467489A
公开(公告)日:2024-08-09
申请号:CN202410574463.2
申请日:2024-05-10
Applicant: 南京信息工程大学
IPC: G06F16/18 , G06F11/07 , G06N3/0464 , G06N3/0442 , G06N3/08 , G06F40/30
Abstract: 本发明公开了一种基于语义嵌入和混合神经网络的日志异常检测方法,包括:获取实时日志数据并利用固定解析树结构解析实时日志数据,提取获得日志事件模板;对日志事件模板进行序列化处理形成日志模板序列;基于预训练的RoBERTa模型和改进平滑逆频率算法由日志模板序列提取日志事件模板的语义特征;使用多尺度卷积神经网络、高效通道注意力机制和形变门控循环单元构建所述混合神经网络模型;将日志事件模板的语义特征输入至训练后的混合神经网络模型获得日志检测结果;本发明能够更好地解析变长日志,提取语义特征,并通过混合神经网络模型提高异常检测的准确性和鲁棒性。
-
公开(公告)号:CN115909369B
公开(公告)日:2023-06-06
申请号:CN202310116030.8
申请日:2023-02-15
Applicant: 南京信息工程大学 , 江苏少儿春互联教育科技有限公司
IPC: G06V30/28 , G06V30/19 , G06V30/162 , G06V30/18 , G06V30/164 , G06V30/148 , G06V30/168 , G06V10/762
Abstract: 本发明公开了一种汉字字体二值化切片图像的提取方法及系统,包括:对获取的RGB习字格书法图片进行处理得到灰度图片;从灰度图片提取最大的四边形轮廓,并对轮廓之外的噪声背景进行屏蔽处理;采用LSD直线检测算法在已屏蔽噪声背景的图片中提取水平和竖直方向上的习字格边框线条,剔除习字格虚线噪声的影响,得到水平习字格线条标记图和竖直习字格线条标记图;确定实际的习字格交叉关键点,得到各习字格的RGB切片图;对各切片图的灰度值进行聚类分析,得到二值化切片图像。本发明能够规避习字格辅助虚线、各种涂抹、拍照光线等因素的影响,对RGB习字格书法图片进行准确切片,同时对切片图进行二值化,准确地提取出手写汉字字体。
-
-
-
-
-
-
-
-
-