一种基于改进TF‑IDF关键词提取算法

    公开(公告)号:CN107145476A

    公开(公告)日:2017-09-08

    申请号:CN201710369600.9

    申请日:2017-05-23

    CPC classification number: G06F17/211 G06F17/271 G06F17/277

    Abstract: 本发明公开一种基于改进TF‑IDF关键词提取算法,其包括以下步骤:S1:将文本的输入形式统一格式化;S2:对Stanford NLP加载配置文件;S3:在配置文件中得到文本中的所有句子集合Sentences;S4:每次从Sentences中取一句子;S5:获取当前的句子中所有词语集合Tokens;S6:每次从Tokens中取一token;S7:得到当前token的字/词语和词性,并赋予不同词性权值;S8:计算当前句子中字/词语的总数及其位置百分比;S9:获取文本中所有字/词语集合Words;S10:每次从Words取一word;S11:计算当前word的TF和IDF;S12:计算所有word词语的权重W,依据词语的权重W选取关键词。本发明增加词性因子,提高提取准确度,解决构造Pat‑tree等空间复杂的问题。

    角色对称加密所有权证明的方法及系统

    公开(公告)号:CN106961431A

    公开(公告)日:2017-07-18

    申请号:CN201710159514.5

    申请日:2017-03-17

    Abstract: 本发明涉及一种角色对称加密所有权证明的方法及系统,依次通过角色密钥管理步骤、文件密钥生成步骤、数据加密步骤、数据上传步骤、数据存储步骤、所有权证明挑战步骤和所有权证明验证步骤,既实现了对文件的角色访问控制又能满足文件的授权去重要求,并且能够利用灵活的角色访问控制机制和合适的对称加密算法降低系统开销,达到了安全高效的设计目标,适用于大规模推广使用,能应用到实际生产生活过程中。

    基于专家系统及机器学习的职业健康检查结果预测方法

    公开(公告)号:CN119920468A

    公开(公告)日:2025-05-02

    申请号:CN202510003338.0

    申请日:2025-01-02

    Abstract: 本发明公开了基于专家系统及机器学习的职业健康检查结果预测方法,方法为:获取体检档案信息进行清洗规范后加入就诊次数信息形成原始数据集,经深度学习提取重要特征重新组合得到新数据集;识别新数据集中每个体检人员的所有危害因素种类;根据职业卫生标准对每个危害因素进行逻辑判断得到对应预测标签以形成决策集合;对决策集合分别标记职业禁忌症及疑似职业病,并标记结果对应的特征SOD和特征OC加入新数据集;将经过专家系统环节的新数据集随机分成训练集和测试集,并选取两种以上机器学习模型分别利用训练集进行训练得到各自的预测结果;通过加权投票的方法将两种以上模型的预测结果加权平均得到最终的输出结果。本发明更有效地识别职业健康风险。

    基于同义词生成及哈希运算的文本水印方法

    公开(公告)号:CN117786629A

    公开(公告)日:2024-03-29

    申请号:CN202410013402.9

    申请日:2024-01-04

    Abstract: 本发明公开基于同义词生成及哈希运算的文本水印方法,针对每个单句找出关键词。判断关键词相邻位置的单词的词性是否在词性排除列表;如果是,则选择句中与关键词存在最高语法依赖关系的单词作为相关词,生成相关词同义词候选集;否则,以相邻词作为相关词生成同义词候选集;使用随机数生成方法生成数值r作为索引从同义词候选集中选择同义词替换相关词。将关键词和被选中的同义词进行拼接并执行hash运算,再对4求余得到的数值转换成第一二进制编码。找到可疑文本的关键词和相关词,采用相同方法计算第二二进制编码。将第二二进制编码与第一二进制编码进行比对,计算比特错误率;当错误率小于阈值则声明对可疑文本的所有权。本发明便于提取多比特水印信息。

    基于全同态加密的隐私保护语音分类方法及系统

    公开(公告)号:CN117456989A

    公开(公告)日:2024-01-26

    申请号:CN202311304321.6

    申请日:2023-10-10

    Abstract: 本发明涉及一种基于全同态加密的隐私保护语音分类方法及系统。发送方将原始语音预处理为语谱数据并加密为密文语谱数据,模型提供方将卷积神经网络模型参数加密为密文参数数据,两个密文数据发送第一服务器;用户公开公钥,利用安全信道将私钥发送给第二服务器;第一服务器使用随机掩码将所持有两个密文数据进行混淆处理,两台服务器交互地使用安全乘法函数执行安全卷积操作以及安全全连接操作,两台服务器交互地使用安全指数函数、安全倒数函数以及安全比较函数执行安全激活操作;最后接收方分别接收到来自第一服务器的输出结果,并进行解密以及解码操作,得到明文分类结果。本发明有利于提高隐私保护语音分类的正确性和图像隐私性。

    基于后门的联邦深度强化学习的知识产权保护方法

    公开(公告)号:CN117350372A

    公开(公告)日:2024-01-05

    申请号:CN202311350234.4

    申请日:2023-10-18

    Abstract: 本发明公开基于后门的联邦深度强化学习的知识产权保护方法,包括以下步骤:步骤S1:由协调服务器将初始全局模型以及全网唯一密钥分发给在线数据节点;步骤S2:各个节点在训练中,使用带水印的状态以及修改后的奖励值训练,使得模型学习到各个节点留下的后门;步骤S3:模型聚合得到该轮次完整的联邦聚合模型;步骤S4:在模型达到停止调节后,聚合全局模型并且分发给各个数据节点;步骤S5:通过在于环境交互得到的状态中嵌入水印,记录模型的性能与水印动作执行比例;步骤S6:若模型性能急剧下降,且水印动作执行比例达到一定阈值,则该模型为受保护模型;否则,该模型为非受保护模型。本发明有助于保护联邦深度强化学习模型。

    适用于深度强化学习智能体的模型同步共享方法

    公开(公告)号:CN116384483A

    公开(公告)日:2023-07-04

    申请号:CN202211734605.4

    申请日:2022-12-31

    Abstract: 本发明涉及一种适用于深度强化学习智能体的模型同步共享方法,包括:协调服务器将初始全局模型分发给在线数据节点,所述在线数据节点包含深度强化学习智能体;在每一轮联邦强化学习过程中,在线数据节点使用深度强化学习智能体与环境进行交互,获得经验数据并优化自身的策略,即更新本地模型参数;协调服务器收集到足够而非全部的本地模型参数后,执行模型聚合算法形成全局模型,完成本轮联邦强化学习;在下一轮联邦强化学习的开始,协调服务器将全局模型再次发送给在线数据节点以进行本地训练;聚合‑分发‑训练‑聚合过程迭代执行,直至全局模型达到设定条件或联邦强化学习的轮次达到指定数量。该方法有利于在保护隐私的同时实现安全数据共享。

    基于隐私保护VGG的密态图像识别方法及系统

    公开(公告)号:CN110807484B

    公开(公告)日:2023-05-23

    申请号:CN201911051284.6

    申请日:2019-10-31

    Abstract: 本发明涉及一种基于隐私保护VGG的密态图像识别方法及系统,该方法首先发送方将原始图像加密成两个密态分量图像,并分别发送给第一服务器和第二服务器;而后可信服务器公开VGG网络的预训练参数、微调训练参数以及预设的超参数,生成并分发随机安全参数给第一服务器和第二服务器;然后第一服务器和第二服务器分别对两个密态分量图像执行安全卷积、激活、池化和全连接层操作;最后接收方分别接收到来自第一服务器和第二服务器的输出结果,并进行解密操作,得到密态图像的特征提取和识别结果。该方法及系统有利于提高密态图像识别的准确性和图像隐私性。

    基于隐私保护CNN的密态图像识别方法及系统

    公开(公告)号:CN110991462B

    公开(公告)日:2023-04-07

    申请号:CN201911051308.8

    申请日:2019-10-31

    Abstract: 本发明涉及一种基于隐私保护CNN的密态图像识别方法,该方法首先发送方将原始图像加密成两个密态分量图像,并分别发送给第一服务器和第二服务器;而后可信服务器公开卷积神经网络训练参数,生成并分发随机安全参数给两台服务器;第一服务器、第二服务器分别使用有偏置、无偏置的卷积核参数执行安全卷积操作,两台服务器交互地使用安全比较函数执行安全激活操作,两台服务器交互地使用安全减法函数执行安全池化操作,第一服务器、第二服务器分别使用有偏置、无偏置的连接参数执行安全全连接操作;最后接收方分别接收到两服务器的输出结果,并进行解密操作,得到密态图像的识别结果。该方法及系统有利于提高密态图像识别的正确性和图像隐私性。

Patent Agency Ranking