-
公开(公告)号:CN103699695A
公开(公告)日:2014-04-02
申请号:CN201410014995.7
申请日:2014-01-14
Applicant: 吉林大学
IPC: G06F17/30
CPC classification number: G06F17/30705
Abstract: 基于中心法的自适应文本聚类算法是一种迭代分割聚类算法,迭代之前,算法首先初始化相关参数,然后随机将数据集分割为大小相同的一组聚簇,并计算每个聚簇的CFC向量;在此之后,算法进入迭代过程,在进入迭代过程之后,每次迭代过程包括下列主要步骤:根据每个文本和不同聚簇的CFC向量的相似度重新组织每个文本,以得到新的一组聚簇;在重新组织每个文本之后,重新计算每个非空聚簇的CFC向量;判定算法是否满足终止条件,若满足则终止,否则继续进行迭代过程;具有如下主要优点:(1)方法简单,易于实现;(2)具有自适应性。
-
公开(公告)号:CN119578486A
公开(公告)日:2025-03-07
申请号:CN202411619169.5
申请日:2024-11-13
Applicant: 吉林大学
IPC: G06N3/08 , G06N3/0464 , G06N3/0455
Abstract: 本发明提供一种基于预训练网络的动态系统序列表示学习方法及装置,涉及人工智能技术领域。该方法包括:获取动态系统的观测数据;观测数据包括:动态系统的对象的观测值;将观测值分为第一序列和第二序列;对第一序列添加高斯噪声,通过归一化处理,获得归一化处理后的第一序列;构建动态系统建模的预训练模型;采用线性数据投影模块对归一化处理后的第一序列进行数据投影,获得线性投影后的序列;采用预训练的语言模型对线性投影后的序列进行重构,获得重构后的序列和预测序列;采用最小化重构损失构建模型的损失函数;根据损失函数进行训练,获得动态系统建模的预训练模型。采用本发明可提高动态系统建模的精准度。
-
公开(公告)号:CN117251756A
公开(公告)日:2023-12-19
申请号:CN202310934749.2
申请日:2023-07-27
Applicant: 吉林大学
IPC: G06F18/2337 , G06F18/2135
Abstract: 本发明提供一种基于去冗余和密度约束的模糊均值聚类方法及系统,涉及机器学习技术领域,包括:基于传统PCA降维原理,构建去冗余算法PCAW算法;通过PCAW算法去除冗余;对去除冗余后的数据,计算出每个数据点的密度;将每个数据点中关于所有簇的隶属度之和由1改为数据点的密度值函数,根据初始化聚类中心更新隶属度;基于更新后的隶属度,对聚类中心进行更新,判断更新后的聚类中心函数是否满足收敛条件,若不满足,则依次对隶属度和聚类中心进行更新。若满足则完成聚类。针对冗余特征、噪声点和异常值造成模糊聚类算法性能下降问题,提出PCAW去冗余方法和密度约束,去除冗余特征并抑制噪声点和离群点在更新聚类中心时的作用,从而提高聚类精度。
-
公开(公告)号:CN116702748A
公开(公告)日:2023-09-05
申请号:CN202310656359.3
申请日:2023-06-05
Applicant: 吉林大学
IPC: G06F40/205 , G06F40/216 , G06F40/30 , G06N3/045 , G06N3/094 , G06N3/088 , G06N3/0464 , G06F40/194
Abstract: 本发明涉及自然语言处理,特别是指一种无监督句子表示方法及装置,所述方法包括:输入待表示的文本句子;使用优化策略优化训练完成的预训练语言模型,对所述待表示的文本句子进行无监督句子表示,所述优化策略包括:基于对抗训练的策略和基于信息理论的不完整句子检测策略的策略。采用本发明,能够克服预训练语言模型因为存在各项异性问题而导致的无监督句子表示的相似性偏差和信息偏差的问题,更好地进行无监督句子表示。
-
公开(公告)号:CN116563600A
公开(公告)日:2023-08-08
申请号:CN202310348587.4
申请日:2023-04-04
Applicant: 吉林大学
IPC: G06V10/764 , G06V10/77 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多尺度融合和注意力机制的中餐多标签识别方法,包括:构建中餐识别网络模型,其包括:卷积神经网络、注意力模块和分类模块;卷积神经网络包括依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块;注意力模块包括全局注意力模块和两个局部注意力模块;获取中餐图片,通过卷积神经网络对中餐图片进行信息提取;通过两个局部注意力模块分别提取第三卷积块、第四卷积模块输出的特征图的注意力特征;通过全局注意力模块提取第五卷积块输出的特征图的注意力特征;对两个局部注意力模块的提取结果和全局注意力模块的提取结果进行拼接,得到拼接向量;通过分类模块对拼接向量进行分类,得到中餐图片中的食物种类。
-
公开(公告)号:CN116338651A
公开(公告)日:2023-06-27
申请号:CN202310201235.6
申请日:2023-03-03
Applicant: 吉林大学
Abstract: 本发明涉及自动驾驶技术领域,具体是涉及一种模拟雪天激光雷达点云雪噪点的方法和相关装置。本发明根据雪花尺度谱分布函数和光束的包络空间体积,确定光束内所包含雪粒子的粒子总数,再根据每个雪花粒子相对激光发射器的距离、粒子尺度及反射率,计算每个雪花粒子造成激光束能量的衰减。根据接收能量与激光雷达的接收机的灵敏度阈值比较,得到模拟的点云雪噪点。本发明的点云雪噪点是一组数据,用于记录模拟的由雪花粒子造成的激光雷达检测点。本发明能够准确计算粒子总数,从而使得计算出的粒子总数吻合于光束实际涵盖的雪粒子总数,进而使得模拟出的点云雪噪点吻合于真实的点云雪噪点。
-
公开(公告)号:CN114881231A
公开(公告)日:2022-08-09
申请号:CN202210312688.1
申请日:2022-03-28
Applicant: 吉林大学
Abstract: 本发明公开了一种基于最优传输的变分分布确定方法、系统及终端设备,所述方法包括:获取变分分布与先验分布,基于最优传输理论度量所述变分分布与所述先验分布的距离,并构建变分目标函数;确定正则化最优传输距离的对偶形式,并基于Sinkhorn算法计算所述正则化最优传输距离的对偶变量;基于随机优化策略对所述变分目标函数进行优化,更新变分参数,并基于更新后的变分参数获得目标变分分布,并将所述目标变分分布作为后验分布的近似。本发明基于最优传输距离构建了一个更具鲁棒性的变分目标函数,适用于支撑集不重叠的分布,避免了由不恰当的先验分布导致的近似精度问题,提高了变分推理计算贝叶斯模型的准确性。
-
-
-
-
-
-