-
公开(公告)号:CN103795592A
公开(公告)日:2014-05-14
申请号:CN201410027720.7
申请日:2014-01-21
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN116910195A
公开(公告)日:2023-10-20
申请号:CN202310462381.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/30 , G16H80/00
Abstract: 本发明涉及一种层次化细粒度医疗对话标注方法和系统。该方法选取待标注的文本片段,对待标注的文本片段的话语意图进行标注,并采用层级化语义内容标注体系对待标注的文本片段的语义内容进行标注。所述层级化语义内容标注体系包含三个层级:第一层级是对于话语所处的对话阶段的标注;第二层级是关于话语内容对应的信息类别的标注;第三层级是对具体内容的标注。本发明从句法‑语义、对话级‑句子级多角度构建了逻辑清晰的层次化标注体系,同时设置了更加细粒度的槽位信息,针对医疗对话数据的否定语义和条件语义的特点提出了状态和条件的标注标签,形成了综合、全面的标注规范,能够实现更加完善、更加细粒度的语义内容标注。
-
公开(公告)号:CN116738998A
公开(公告)日:2023-09-12
申请号:CN202310462367.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F40/30 , G06F16/332 , G16H80/00
Abstract: 本发明涉及一种基于Web的医疗对话多粒度语义标注系统和方法。该系统包括文件管理模块、对话展示模块、语句模块和标注模块;所述文件管理模块用于进行文件的管理;所述对话展示模块用于展示对话语句和对应说话者的角色信息;所述语句模块用于显示标注者当前选择的待标注语句及其来源;所述标注模块用于根据设计的标注规范进行标注功能的设置,并采用多层次的标注框架进行标注。本发明针对医疗对话领域的数据特征和应用需求设计开发了高效简洁的标注系统,具备多轮多角色数据展示、多粒度文本自由划选、层次化复杂语义数据标注等功能,对于标注具有更强的规范性和完备性。本发明设计的标注流程能够降低数据标注难度,提高标注效率。
-
公开(公告)号:CN110233938B
公开(公告)日:2020-12-22
申请号:CN201910398052.1
申请日:2019-05-14
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于可疑性度量的团伙诈骗电话识别方法,采用无监督的方式,利用电话号码之间的呼叫记录信息,为每个电话号码定义可疑性度量,采用风险等级量化的方式识别团伙诈骗电话。本方法不需引入用户的主观标记结果,不仅能避免主观判断带来的缺陷,还能在较短时间内完成模型训练与线上使用,为用户遭受团体诈骗提供了一种简单、实用的识别方法,有效地缓解了滞后性所带来的问题。
-
公开(公告)号:CN112000818A
公开(公告)日:2020-11-27
申请号:CN202010663328.7
申请日:2020-07-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/432 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向文本和图像的跨媒体检索方法及电子装置,提取一设定长度语音信息的g维MFCC特征,并将长度为m的g维MFCC特征转换为一维语音特征;对一设定文本进行编码,获取词级别文本表示,并将词级别文本表示中每一个词与一维语音特征进行拼接,得到语音引导文本特征;提取每一图片的区域特征,计算区域特征与语音引导文本特征的相似性分数,判断该图片是否包含设定语音信息及设定文本信息,得到检索结果。本发明利用语音信息的停顿信息,以及语音信息与图像和文本间的关联关系来提升图像-文本匹配任务的性能,建模了融合语音信息的文本特征表示,引入基于局部注意力机制的细粒度特征融合方式进行跨模态特征融合,提升图文匹配效果。
-
公开(公告)号:CN109560966B
公开(公告)日:2020-05-22
申请号:CN201811466080.4
申请日:2018-12-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于社会传感器优化的网络级联传播早期发现方法。本方法为:对于目标领域的网络图G,设置一目标函数,并对该目标函数进行求解,得到一社会传感器集合S;其中,社会传感器集合S中的每一社会传感器对应于该目标领域的网络中的一节点;将该网络中该社会传感器集合S对应的节点作为信息采集节点,然后根据各所述信息采集节点采集的信息识别该网络中的级联信息。本方法重点在于区别对待网络中不同重要性的级联信息,减弱重要性低的级联信息对方法的影响,从而使用高效利用网络中的社会传感器更快、更全的发现重要的级联信息。
-
公开(公告)号:CN110399261A
公开(公告)日:2019-11-01
申请号:CN201910508755.5
申请日:2019-06-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于共现图的系统告警聚类分析方法。本方法为:1)利用历史系统告警信息构建通用共现图;根据通用共现图中节点之间的距离将各系统告警信息聚为若干故障簇,并为每一故障簇设置一生命周期;2)对于一新产生的系统告警信息a,计算系统告警信息a与处于生命周期内的各个故障簇之间的距离;当系统告警信息a与一故障簇的距离小于设定阈值时,则将系统告警信息a加入到该故障簇中,否则为该系统告警信息a新建一个故障簇;3)在过去的一设定时间段内如果有新的系统告警信息纳入一故障簇,则维持该故障簇处于生命周期内,否则删除对应的故障簇。本发明能更准确得将有内在联系的系统告警聚到同一故障簇中。
-
公开(公告)号:CN109560966A
公开(公告)日:2019-04-02
申请号:CN201811466080.4
申请日:2018-12-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于社会传感器优化的网络级联传播早期发现方法。本方法为:对于目标领域的网络图G,设置一目标函数,并对该目标函数进行求解,得到一社会传感器集合S;其中,社会传感器集合S中的每一社会传感器对应于该目标领域的网络中的一节点;将该网络中该社会传感器集合S对应的节点作为信息采集节点,然后根据各所述信息采集节点采集的信息识别该网络中的级联信息。本方法重点在于区别对待网络中不同重要性的级联信息,减弱重要性低的级联信息对方法的影响,从而使用高效利用网络中的社会传感器更快、更全的发现重要的级联信息。
-
公开(公告)号:CN103745002B
公开(公告)日:2017-01-18
申请号:CN201410035139.X
申请日:2014-01-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于行为特征与内容特征融合的水军识别方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据;利用马尔可夫链蒙特卡罗随机模型进行行为特征维度和内容特征维度的融合,组成用户特征向量;利用用户特征向量进行DBN模型训练,得到DBN模型;对DBN模型进行检测,判断检测结果是否达到预定标准,如果是则结束;否则根据检测结果生成相应的调节命令,分别调节特征融合阶段和DBN模型训练阶段的相关参数;在DBN训练过程中根据识别准确率不断优化行为特征与内容特征的比例分配,具体特征的选取,以及对DBN模型训练过程中迭代次数的调整,达到较优的训练效果,最终提高识别准确率和识别方法的自适应性。
-
公开(公告)号:CN103729678B
公开(公告)日:2016-10-05
申请号:CN201310681479.5
申请日:2013-12-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于改进DBN模型的水军检测方法,具体包括以下步骤:步骤1:采用已分类数据集对原始DBN深度信念网络模型进行训练和检测,构成改进DBN深度信念网络模型;步骤2:将待分类数据集中的数据输入改进DBN深度信念网络模型进行分类,完成对水军用户的识别。本发明结合DBN深度信念网络和PSO粒子群算法对“苍蝇水军”进行识别,然后构造DBN模型,用已分类数据集对模型进行训练,最后用得到的模型对待分类用户数据进行分类,即实现了“苍蝇水军”的识别。该方法是对BP神经网络算法的改进,既可以保证较高的判定准确率,又具有较短的训练时间,且不易陷入局部最优解。
-
-
-
-
-
-
-
-
-