一种用于病理文本命名的多粒度实体识别方法

    公开(公告)号:CN115587595A

    公开(公告)日:2023-01-10

    申请号:CN202211380333.2

    申请日:2022-11-03

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种用于病理文本命名的多粒度实体识别方法,该方法包括:获取病理文本信息,对病理文本按照字粒度、词粒度进行切分;对切分后的文本进行随机mask掩码和向量初始化,使用两个参数共享的Bert模型对随机mask掩码和向量初始化后的文本进行编码;给每个类别的每个实体预设中心代替词和中心代替字;使用KL loss和CE loss对字粒度和词粒度构造损失函数,CE loss针对替换后的字粒度计算损失进行优化,KE loss对替换后词粒度计算损失进行优化,得到实体识别结果。本发明通过字粒度,词粒度构建模板进行预测,可对病理文本的实体进行精准的识别抽取,实体识别效果较好。

    一种基于响应时间实时均衡的联邦学习高效通信方法

    公开(公告)号:CN115392481A

    公开(公告)日:2022-11-25

    申请号:CN202210975053.X

    申请日:2022-08-15

    Abstract: 本发明涉及一种基于响应时间实时均衡的联邦学习高效通信方法,属于联邦机器学习领域。首先,在预先设定的簇迭代训练中,每个响应的终端设备分别根据自身的本地模型计算时间,均衡的划分至预先设定的计算簇中,构建基于“云服务器‑Head节点‑终端设备”一体的分层通信架构,从通信结构上间接增加了低响应设备的模型训练参与度。然后,使响应快的设备能够帮助响应慢的设备进行训练。本发明通过对异构的计算设备动态分组,自适应构建分层的逻辑通信架构,并在计算簇内设计加权的协作训练机制,间接提高了低响应设备的模型训练参与度,从本质上解决了联邦机器学习技术中,由于资源异构所导致的通信等待延时问题,提高了训练模型的精确度。

    一种入侵检测系统中的实时特征过滤方法

    公开(公告)号:CN113010884B

    公开(公告)日:2022-08-26

    申请号:CN202110200444.X

    申请日:2021-02-23

    Abstract: 本发明属于数据挖掘领域,具体涉及一种入侵检测系统中的实时特征过滤方法,该方法包括:周期性获取入侵检测数据,对获取的数据进行预处理;提取预处理后入侵检测数据的特征,计算t时刻流入系统特征与目标决策类的相关性数值;将计算出的相关性数值与设定的阈值进行比较,根据比较结果对入侵检测数据执行不同的策略;本发明针对不同特征采取不同的特征执行策略,进一步对不满足“高相关”特征准则的,采用特征互补检测策略,可以使得模型选择更多有价值的特征,提升模型的分类精度。

    一种基于时空融合的煤矿瓦斯浓度缺失值填充方法

    公开(公告)号:CN112948743B

    公开(公告)日:2022-05-03

    申请号:CN202110325141.0

    申请日:2021-03-26

    Abstract: 本发明属于数据处理领域,具体涉及一种基于时空融合的煤矿瓦斯浓度缺失值填充方法,该方法包括:对噪声数据进行识别及处理;基于时间维度对数据的缺失值进行填充;基于空间维度对数据的缺失值进行填充;将时间和空间维度的填充结果进行融合,从而得到最终结果;本发明将离线数据作为模型构建的训练集,并将生成的模型应用于生产环境中的数据,能够综合利用各种煤矿瓦斯浓度监测数据,提高模型泛化能力,降低填充误差。

    基于多粒度特征融合和不确定去噪的实体识别方法及系统

    公开(公告)号:CN113627172A

    公开(公告)日:2021-11-09

    申请号:CN202110845130.5

    申请日:2021-07-26

    Abstract: 本发明涉及信息提取领域,尤其涉及一种基于多粒度特征融合和不确定去噪的实体识别方法及系统,包括使用Transformer对语料文本进行字粒度的多级局部特征提取,得到局部字粒度特征;使用jieba工具进行分词,并使用Glove预训练的词向量将得到的分词进行向量嵌入,得到全局词粒度特征;对分词后得到的词集进行编码,得到文本的词结构编码向量;将Transformer得到的局部字粒度特征、Glove得到的全局词粒度特征与词结构编码特征进行融合;将融合后得到的文本特征送入BiGRU+CRF的序列标注模型中,最终得到识别的实体结果;本发明可对病理领域中文文本进行精准、全面的实体抽取,抽取效果较好。

    基于粗糙集的职务犯罪社会关系网络智能分析方法及系统

    公开(公告)号:CN109918544B

    公开(公告)日:2021-03-12

    申请号:CN201910191833.3

    申请日:2019-03-14

    Abstract: 本发明属于职务犯罪领域,涉及社会关系网络分析,具体为一种基于粗糙集的职务犯罪社会关系网络智能分析方法及系统,所述方法包括通过对已结案中犯罪人员的社会关系网络进行分类,并基于粗糙集对社会关系网络进行智能分析,发现其中对案件起关键作用的线索,并去除其中的无关线索;基于已结案件数据,采用粗糙集方法,从多种数据中筛选出对案件分析起作用的数据,去除对案件分析不起作用的冗余数据,并对各种数据源进行重要性排序,从而为实际办案提供辅助。

    一种基于快速构建邻域覆盖的个人信用风险评估方法

    公开(公告)号:CN112288571A

    公开(公告)日:2021-01-29

    申请号:CN202011329953.4

    申请日:2020-11-24

    Abstract: 本发明属于计算机科学与技术领域,具体涉及一种基于快速构建邻域覆盖的个人信用风险评估方法,该方法包括:获取贷款人的个人信息数据,对该信息数据进行预处理;采用K‑means聚类算法对预处理后的数据进行聚类,构建邻域覆盖序列;计算邻域覆盖序列中的邻域中心局部密度和相对距离;根据邻域中心的局部密度和相对距离对邻域进行排序;对排序后的邻域进行选择,并对选择的邻域进行风险评估预测,得到预测结果;根据风险评估结果确定是否对贷款人进行贷款;本发明通过邻域中心的局部密度与相对距离的乘积对邻域进行选择,能够更好的评估邻域的分类能力,使得在更少的邻域下得到更高的精度。

    一种基于属性聚类的邻域粗糙集集成学习方法

    公开(公告)号:CN105760888A

    公开(公告)日:2016-07-13

    申请号:CN201610100024.3

    申请日:2016-02-23

    CPC classification number: G06K9/6227 G06K9/6221

    Abstract: 本发明请求保护一种基于属性聚类的邻域粗糙集集成学习方法,涉及数据挖掘技术。首先,通过属性聚类将决策系统中的条件属性分成多个聚类簇,使得属性聚类簇内的属性关联性较大,而不同属性聚类簇之间的关联性较小;其次,利用各个聚类簇的差异性来训练集成不同的基分类器,在训练集成基分类器的过程中,加入了邻域粗糙集的指导,根据基分类器对邻域粗糙集中边界域的样本不同的识别能力来分配基分类器的权重,从而得到最终的集成分类器;最后,利用得到的集成分类器对测试集分类。本发明结合了邻域粗糙集和集成学习理论,充分利用了决策表中条件属性的相关性和差异性,并使不同基分类器之间取长补短,能够从不同角度有效挖掘决策系统中的知识。

    一种基于混合图卷积网络的方面级情感分析方法

    公开(公告)号:CN118468855A

    公开(公告)日:2024-08-09

    申请号:CN202410583783.4

    申请日:2024-05-11

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于混合图卷积网络的方面级情感分析方法;包括:对情感文本进行预处理,得到句子表示;采用自注意力机制和方面感知注意力机制对句子表示进行处理,得到语义语法加强感知矩阵;采用语法掩码层对语义语法加强感知矩阵进行处理,得到增强句法特征信息矩阵;采用GCN网络对增强句法特征信息矩阵和句子表示进行处理,得到GCN特征;将GCN特征和语义语法加强感知矩阵输入到Mixhop网络中,得到Mixhop特征;对语义语法加强感知矩阵和Mixhop特征进行跨注意力机制处理,得到注意力向量;拼接注意力向量、Mixhop特征和GCN特征后输入到分类器中得到方面级情感分类结果;本发明可加强语法感知,缓解平滑问题,提高分类结果准确性。

    一种基于邻域粗糙集的电影三支推荐方法

    公开(公告)号:CN111814046B

    公开(公告)日:2023-10-13

    申请号:CN202010631881.2

    申请日:2020-07-03

    Abstract: 本发明属于计算机科学与技术领域,特别涉及一种基于邻域粗糙集的电影三支推荐方法,包括获取历史数据并对数据进行预处理;构建用户与用户之间的相似性矩阵;以目标用户为中心构建邻域,且令邻域内的用户都与邻域中心的用户相似,将邻域中的用户作为近邻用户;计算训练数据集的全局领域半径和每个用户的最优邻域半径,若用户最优邻域半径大于全局邻域半径则用户属于正区域或负区域用户,否则用户为边界区域用户;根据边界区域用户隶属目标概念的隶属度构造阴影集,由阴影集模型得到推荐阈值;根据待推荐数据的隶属度与推荐阈值的关系进行三支推荐;本发明解决了传统推荐方法根据预测评分实施推荐带来了更多的不确定造成推荐质量降低的问题。

Patent Agency Ranking