-
公开(公告)号:CN116628199A
公开(公告)日:2023-08-22
申请号:CN202310520566.6
申请日:2023-05-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/33 , G06F40/30 , G06F18/2415 , G06F18/22 , G06N3/0455 , G06N3/047 , G06N3/0895
Abstract: 本发明公开一种一种标签语义增强的弱监督文本分类方法及系统,属于机器学习领域,基于BERT弱监督文本分类框架,在类别词表构建阶段,基于Zipf定律加权类别表示实现类别词去噪,利用了语义相似度递减特性去除类别词表中的无关词;在样本标注阶段,基于MASK机制的词类别标注,然后基于自训练模块进行优化分类模型,以样本中的类别指示性单词为桥梁,建立“样本句‑指示词‑类别标签”跨层级语义关联。本发明在词表构建与样本弱标注生成阶段引入了更多降低标签噪声的算法,以达到标签语义增强的效果,在不同语种环境中显著提升文本分类效果。
-
公开(公告)号:CN114462379A
公开(公告)日:2022-05-10
申请号:CN202110265366.1
申请日:2021-03-11
Applicant: 中国科学院信息工程研究所
IPC: G06F40/205 , G06F40/30 , G06N3/04
Abstract: 本发明涉及一种改进的基于事件演化图的脚本学习方法和装置。该方法包括:利用由具体事件链构成的具体事件网络构建抽象的事件演化图;挖掘事件演化图中蕴含的事件演化知识,以学习上下文事件和候选事件的初始嵌入表示;将上下文事件和候选事件的初始嵌入表示输入双向LSTM网络,得到上下文事件和候选事件的更新后的嵌入表示,其中包含事件链的时序信息以及事件演化图中蕴含的事件演化知识;利用更新后的嵌入表示对上下文事件和候选事件进行相似度计算,得到每一个候选事件的相似度得分,将相似度得分概率化,选择概率最高的候选事件作为最终预测的事件。本发明对于脚本事件预测具有较高的准确度,能够用于隐私窃取攻击事件预测等领域。
-
公开(公告)号:CN111949877A
公开(公告)日:2020-11-17
申请号:CN202010816756.9
申请日:2020-08-14
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9537 , G06N3/04
Abstract: 本发明公开了一种个性化兴趣点推荐方法及系统。本方法包括:1)根据用户及兴趣点的历史签到信息,获取用户集合、兴趣点集合和每个用户兴趣点集合;2)将每个兴趣点信息进行编码得到兴趣点向量;3)根据兴趣点签到时间信息,编码得到对应用户的时间特征向量;4)根据兴趣点签到天气信息,编码得到对应用户的天气特征向量;5)根据兴趣点签到信息,编码得到对应用户是空间特征向量;6)根据用户的上述向量,得到对应用户兴趣点矩阵;7)根据用户兴趣点矩阵训练LSTM-Autoencoder模型,对签到序列进行修正,得到用户兴趣点访问偏好;8)根据目标用户的兴趣点访问偏好,给定时间信息、天气信息,向目标用户进行兴趣点推荐。
-
公开(公告)号:CN104571950B
公开(公告)日:2018-03-23
申请号:CN201410814839.9
申请日:2014-12-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种外设存储介质的口令鉴别方法,在外设存储介质与主机电连接后,先向主机呈现一个包括口令接收虚拟文件的虚拟磁盘分区,该口令接收虚拟文件用于用户输入鉴别信息,当用户输入了正确的鉴别信息后,外设存储介质才向主机返回外设存储介质的物理非易失存储器件实际的数据结构信息,响应主机发出的读写命令,由此实现只有授权人员才能使用磁盘,磁盘存储的数据无法泄露,提高存储数据的安全性。
-
-
-