-
公开(公告)号:CN116186518A
公开(公告)日:2023-05-30
申请号:CN202310215869.7
申请日:2023-03-08
Applicant: 重庆邮电大学
IPC: G06F18/213 , G06F18/10 , G06F18/241 , G06N3/08 , G01C21/00 , G06N3/0464
Abstract: 本发明涉及一种轨迹分类对抗样本的防御方法及系统,属于数据挖掘领域。首先根据时空轨迹数据样本,进行轨迹数据特征的提取,提取基本的轨迹数据特征(经度,纬度,时间,速度,加速度,轨迹角度等)。利用差分隐私保护机制进行对抗防御,根据设定模型鲁棒性的原理,在轨迹特征中生成拉普拉斯噪声,根据拉普拉斯概率密度函数及尺度参数得到噪声关系的表达式,之后使用迭代搜索算法搜索更小的噪声数据值,在模型中加入噪声,经过卷积网络作用进行轨迹分类获取该模型的防御效果,最后根据低频滤波技术进行特征去噪。
-
公开(公告)号:CN116150619A
公开(公告)日:2023-05-23
申请号:CN202310148841.6
申请日:2023-02-22
Applicant: 重庆邮电大学
IPC: G06F18/214 , G06F18/24 , G06N20/00 , G06F21/62
Abstract: 本发明涉及一种梯度扰动的机器学习公平性方法及系统,属于机器学习领域。该方法具体为:获取数据集,分为训练集和测试集,并进行预处理,其中预处理包括计算样本不平衡比率、数据转换以及改善数据集的平衡性;进行参数设置,参数包括隐私保护强度和梯度裁剪阈值;确定公平性规则,具体包括确定群体、设置公平性度量方法以及设置公平性约束;选择模型类别,定义模型结构和初始化参数,并训练模型;进行模型评估并调整优化模型。本发明在保证差分隐私的同时实现了机器学习公平,本发明适用的模型种类广,并且具有实施简单易操作的特点。
-
公开(公告)号:CN115101153A
公开(公告)日:2022-09-23
申请号:CN202111503616.7
申请日:2021-12-09
Applicant: 重庆邮电大学
Abstract: 本发明属于医疗检测领域,具体涉及一种基于散列桶邻域的慢病分类标记方法,该方法包括:获取待测用户的个人信息数据,得到医学条件属性集;确定散列函数,采用散列函数将患者空间中的患者样本依次划分到邻域诊断桶中,得到基于邻域诊断慢病的散列桶序列;确定待测用户的诊断邻域;根据待测用户的诊断邻域采用多数投票原则计算每个待测用户被预测患病的概率;根据待诊患者邻域中满足多数投票原则的若干最大概率慢病标签,计算选择距离度最大的慢病标签,根据慢病标签对患者进行分类;通过采用本发明使用的方法,医疗人员可根据预测结果辅助判断患者是否患有慢病,能够极大的提高慢病预测效率与医学诊断质量。
-
公开(公告)号:CN113919512B
公开(公告)日:2022-09-23
申请号:CN202111139211.X
申请日:2021-09-26
Applicant: 重庆邮电大学
IPC: G06N20/20
Abstract: 本发明涉及一种基于计算资源逻辑分层的联邦学习通信优化方法及系统,属于联邦机器学习领域,首先,云中心根据所有终端参与设备的本地计算资源大小将其划分为多个计算资源大小均衡的计算簇,并在每个计算簇中筛选一个计算资源最多的终端设备作为簇的Head节点,构建基于“云中心‑Head节点‑终端设备”一体的分层通信架构,实现粗粒度的簇间计算资源均衡。然后,在每个簇中,设计加权平均全局模型更新机制,将混合权重设置为Staleness的函数,使计算资源丰富的终端设备能够与Head节点进行更多轮通信,从而实现簇内协作训练,进而以细粒度的方式对计算资源进行再分配。本发明从本质上解决了联邦学习技术中的高通信代价问题。
-
公开(公告)号:CN114298314A
公开(公告)日:2022-04-08
申请号:CN202210006319.X
申请日:2022-01-04
Applicant: 重庆邮电大学
Abstract: 本发明属于电子病历因果关系抽取与推理领域,具体涉及一种基于电子病历的多粒度因果关系推理方法,该方法包括:获取电子病历资源,获取资料上的文本信息,提取文本信息的多粒度语义特征;将该特征输入到SVM三支决策分类器,得到第一阶段的因果关系抽取和推理结果;将SVM三支决策分类器对训练集中产生的中间域样本输入到BiLSTM‑CRF分类器中,得到第二阶段因果关系抽取和推理结果;本发明利用相应的数学知识来对电子病历进行科学的分析与预测,形成对电子病历因果关系抽取和推理,可以提升医生的服务质量与效率,与此同时减轻医生的就诊负担。
-
公开(公告)号:CN113627185A
公开(公告)日:2021-11-09
申请号:CN202110864136.7
申请日:2021-07-29
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06F16/35 , G06N20/20 , G16H50/70
Abstract: 本发明属于自然语言处理领域,具体涉及一种用于肝癌病理文本命名的实体识别方法,该方法包括:实时获取肝癌病理文本信息,对该文本信息进行预处理;将预处理后的文本信息输入到训练好的肝癌病理文本命名实体模型,得到肝癌病理文本信息识别结果;根据识别结果对肝癌病理文本信息进行分类标记;本发明可对肝癌病理文本的十类关键实体进行精准的识别抽取,实体识别效果较好。
-
公开(公告)号:CN112396507A
公开(公告)日:2021-02-23
申请号:CN202010903303.X
申请日:2020-09-01
Applicant: 重庆邮电大学
Abstract: 本发明涉及信用监测技术领域,具体涉及一种基于阴影划分的集成SVM个人信用评估方法,包括:对训练数据进行预处理,进行特征选择,识别边界样本并对样本空间进行阴影划分,对训练数据进行采样,形成多组训练集以训练集成SVM模型,将待预测样本输入到训练好的集成SVM预测模型中,训练好的集成SVM预测模型通过m个基分类器投票的方式对待预测样本进行分类,每个基分类器投1票,所有基分类器投票完毕后,将待预测样本分到投票数最多的类中,输出信用评级,同时将数据存入数据库中。本发明对用户的信用评分进行科学的预测与评估,通过有效特征与样本的提取和筛选,有效提高用户信用监测的精度,有利于有效降低信贷或金融企业的信贷风险。
-
公开(公告)号:CN108921188B
公开(公告)日:2020-11-17
申请号:CN201810500016.7
申请日:2018-05-23
Applicant: 重庆邮电大学
IPC: G06K9/62 , G06N20/00 , G06F16/182 , G06F16/27
Abstract: 本发明请求保护一种基于Spark大数据平台的并行CRF算法,涉及数据挖掘技术和自然语言处理技术。首先,读取大规模数据集,进行数据初始化处理,将数据集划分为训练集和测试集。其次,获取特征模板,创建分布式训练数据集RDD和分布式特征模型RDD。再次,利用flatMap特征模型将训练数据转换成特征,通过整合相同的特征得到特征RDD,从而生成并行特征。然后,通过梯度计算更新特征权值,直到所有训练数据RDD更新完成,得到特征权值向量。最后,从HDFS上读取训练好的模型数据和测试数据,将测试数据执行特征抽取操作,利用特征权值向量计算得到最优预测标记序列,将输出存在HDFS中。本发明提高了CRF算法的高迭代效率。
-
公开(公告)号:CN106682116B
公开(公告)日:2020-08-04
申请号:CN201611120326.3
申请日:2016-12-08
Applicant: 重庆邮电大学
IPC: G06F16/2455 , G06F16/2458 , G06F16/27 , G06F16/28
Abstract: 本发明提供一种基于Spark大数据平台的OPTICS聚类算法,涉及计算机信息获取和处理技术。本发明通过对并行数据结构划分,得到最优数据集划分并生成对应的RDD,并行计算邻居样本数量和核心距离,对每个分区并行执行OPTICS算法得到每个分区的簇排序并持久化存储,通过簇排序给每个分区赋予簇后,通过合并分区,每个样本能够得到全局的簇号。利用Spark分布式并行技术,找到最优的划分结构,并行计算得到每个分区的簇排序。通过OPTICS的簇排序,用户可以从不同层次结构进行观察数据集的内在聚类结构。该方法可以处理串行算法不能处理的大规模的数据集,并大幅度提高得到聚类结果的时间。
-
公开(公告)号:CN111159389A
公开(公告)日:2020-05-15
申请号:CN201911405669.8
申请日:2019-12-31
Applicant: 重庆邮电大学
IPC: G06F16/335 , G06F16/33 , G06Q50/18 , G06K9/62
Abstract: 本申请实施例公开了一种基于专利要素的关键词提取方法、终端、计算机可读存储介质,其中方法包括:输入专利文本;将所述专利文本进行预处理,得到所述专利文本的词语集合;根据所述专利文本的专利要素和所述专利文本生成关键词候选集,所述专利要素是指专利文本中包含的专利信息;根据所述关键词候选集以及所述专利文本的词语集合进行相似度计算,根据相似度计算结果确定出所述专利文本的关键词集合。通过上述方法可以提高专利文本领域中关键词提取结果的准确性。
-
-
-
-
-
-
-
-
-