-
公开(公告)号:CN114077705A
公开(公告)日:2022-02-22
申请号:CN202111120139.6
申请日:2021-09-24
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/9536
Abstract: 本发明实施例提供了一种对社交平台上的媒体账号进行画像的方法和系统,该方法包括:获取社交平台的账号信息,识别其中符合第一筛选条件的媒体账号以构建第一集合,采集第一集合内的媒体账号的属性数据和历史贴文数据并存储于数据库,第一筛选条件包括地域条件和媒体类型条件;标注种子媒体账号,根据种子媒体账号从数据库检索符合第二筛选条件的关联媒体账号以共同构建第二集合,第二筛选条件从粉丝数、活跃度、双向信息交流的频次、新闻相关性中的至少一个方面进行筛选;基于第二集合中各个媒体账号的属性数据和历史贴文数据,从多个维度对相应媒体账号进行画像,得到多个维度的指标,并根据多个维度的指标计算媒体价值指数以标识媒体价值。
-
公开(公告)号:CN114065749A
公开(公告)日:2022-02-18
申请号:CN202111332368.4
申请日:2021-11-11
Applicant: 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/289 , G06F40/216 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种面向文本的粤语识别系统的训练方法,所述方法包括:A1、获取粤语和普通话文本语料,对语料所属语种进行人工标注以获得标注数据集,采用改进停用词表过滤标注数据集并进行分词获得训练数据集;A2、利用步骤A1中获得的训练数据集,训练浅层网络至收敛以获得粤语识别模型;A3、构建粤语特色词表,以步骤A1中获得的训练数据集中的语料为输入、以语料是否为粤语的判断结果为输出,基于粤语特色词表构建用于检索语料是否命中粤语特色词表的规则匹配模型;A4、以步骤A1中获得的训练数据集中的语料为输入、以语料是否为繁体中文的判断结果为输出构建简繁识别模型;A5、以粤语识别模型、规则匹配模型和简繁识别模型的输出训练融合模块。
-
公开(公告)号:CN113139098A
公开(公告)日:2021-07-20
申请号:CN202110308958.7
申请日:2021-03-23
Applicant: 中国科学院计算技术研究所
IPC: G06F16/901 , G06N3/04
Abstract: 本发明提出一种同质关系大图的摘要提取方法及系统,包括:获取待摘要提取的关系图数据作为当前图数据,且该关系图数据为同质关系大图,并将该当前图数据中每个节点均看作超点;根据该当前图数据的邻接矩阵,通过局部敏感哈希对该当前图数据中节点进行分组;从组中随机选择多个超点对,分别计算该超点对若合并后和该关系图数据之间的差距,选择差距最小的超点对进行合并,得到重构图数据;输出该重构图数据作为摘要提取结果。
-
公开(公告)号:CN105975504A
公开(公告)日:2016-09-28
申请号:CN201610273082.6
申请日:2016-04-28
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F16/951 , G06N3/0454 , G06N3/08 , G06Q50/01
Abstract: 本发明提出一种基于循环神经网络(Recurrent Neural Network,RNN)的社交网络消息爆发检测方法及系统,涉及在线社交网络中内容的流行度预测技术领域,该方法包括获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列;对所述历史消息与所述历史转发时间序列进行循环神经网络训练,并生成预测模型;实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列,将所述转发时间序列输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
-
公开(公告)号:CN118840123A
公开(公告)日:2024-10-25
申请号:CN202310472240.0
申请日:2023-04-23
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
IPC: G06Q30/018 , G06Q40/04 , G06F18/25 , G06F18/243 , G06N3/0464 , G06N3/048 , G06N3/0475 , G06N3/094 , G06N3/084
Abstract: 本申请提供了一种信息验证方法、设备、装置及计算机可读存储介质;方法包括:获取待验证信息和训练好的信息验证模型,待验证信息包括至少两个待验证对象标识和信息内容,不同的待验证对象标识对应有不同的角色信息;从构建好的对象图数据中确定出待处理对象图数据;将待处理对象图数据在训练好的信息验证模型中进行传播学习,得到各个待验证对象标识对应的对象表示向量;基于信息内容确定信息属性向量,将各个对象表示向量和所述信息属性向量进行拼接处理,得到信息初始表示向量;利用训练好的信息层图神经网络模型对信息初始表示向量进行预测处理,得到验证结果。通过本申请,能够提高信息验证的效率和准确率。
-
公开(公告)号:CN118445392A
公开(公告)日:2024-08-06
申请号:CN202410577965.0
申请日:2024-05-10
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F16/33 , G06F40/284 , G06F40/30
Abstract: 本发明提出一种面向网页的阅读理解模型的训练方法、装置、存储介质,该方法包括:获取网页基于DOM树结构的路径信息,利用该路径信息表征网页的逻辑结构信息表示;获取网页基于网页快照的坐标信息,利用该坐标信息表征网页的空间结构信息表示;获取网页中的提示词,利用该提示词对初始问题文本进行信息增强,得到目标问题文本;将该逻辑结构信息表示与该空间结构信息表示融合,输入到网页阅读理解模型中;以及将该目标问题文本与该网页内容文本拼接,输入到该网页阅读理解模型中,获取答案。该方法提升了模型的网页理解能力,进而提高答案的准确性和相关性。
-
公开(公告)号:CN118194305A
公开(公告)日:2024-06-14
申请号:CN202410459109.5
申请日:2024-04-16
Applicant: 中国科学院计算技术研究所
IPC: G06F21/57 , G06F18/213 , G06N3/0464 , G06N3/045 , G06V10/82 , G06N3/048
Abstract: 本发明提出一种基于神经网络表示的神经网络模型后门检测方法和装置,包括:根据神经网络模型中每个操作单元的操作类型和在计算流图中的位置,提取该神经网络模型的结构特征;根据神经网络模型中每个操作单元的参数矩阵,提取该神经网络模型的参数特征;结合该结构特征和该参数特征,得到该神经网络模型的表示特征;使用该表示特征训练后门检测器,将待后门检测的神经网络模型的表示特征输入训练完成后的后门检测器,得到其是否具有后门的后门检测结果。本发明可应用于图像识别领域,以提高图像分类模型的分类准确性和安全性,避免图像分类模型对特殊图像给出错误图像分类结果。
-
公开(公告)号:CN118193995A
公开(公告)日:2024-06-14
申请号:CN202410323557.2
申请日:2024-03-20
Applicant: 中国科学院计算技术研究所
IPC: G06F18/21 , G06F18/22 , G06F18/241 , G06Q30/0601 , G06F16/532 , G06F16/583 , G06F16/9532 , G06N3/0499 , G06N3/084
Abstract: 本发明提出一种人工智能模型的个体公平性度量方法,包括:根据人工智能模型的数据的输入数据范围,构建人工智能模型的输入样本集合;从输入样本集合中选择样本构成样本对,计算样本对中两样本间的样本相似性,将样本对中样本分别输入人工智能模型,得到样本对经过人工智能模型处理的结果对,计算结果对中结果间的结果相似性,判断结果相似性和样本相似性的差异绝对值是否低于阈值,若是则为样本对分配代表公平对待的公平性度量结果,否则为样本对分配代表不公平对待的公平性度量结果;重复多次公平性确定步骤,得到公平性报告,公平性报告包含多个样本对及各样本对的公平性度量结果。本发明可揭示和证明人工智能模型算法中存在的个体不公平现象。
-
公开(公告)号:CN118014752A
公开(公告)日:2024-05-10
申请号:CN202410245083.4
申请日:2024-03-04
Applicant: 中国科学院计算技术研究所
IPC: G06Q50/00 , G06N3/0464 , G06N3/08 , G06F18/241
Abstract: 本发明提供一种基于类别的社交机器人检测方法及检测系统,该检测方法包括以下步骤:依据行为模式和目的将社交机器人分成n个类别,其中n为正整数;基于所述类别构建通用模型加专用模型的集成学习检测框架;获取社交平台的用户数据作为样本,将所述样本输入所述集成学习检测框架并依据一投票模式判定所述样本是否为社交机器人。本发明的检测方法形成了行为模式更加鲜明的社交机器人分类,在将社交机器人归类的同时辅以相应的集成学习检测框架,识别泛化性和准确性均有提升。
-
公开(公告)号:CN117273073A
公开(公告)日:2023-12-22
申请号:CN202211061838.2
申请日:2022-08-31
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/049 , G06N3/084 , G06N3/0895 , G06N3/094
Abstract: 本发明实施例公开了基于网络表示的训练方法、系统及存储介质和终端设备,应用于信息处理技术领域。基于网络表示的训练系统会将动态网络表示模型分为两个部分,即稳定特征模块和动态特征模块,从而通过多个时刻的样本网络来分别调整稳定特征模块和动态特征模块,从而通过稳定特征模块获取动态网络中各节点的稳定特征,通过动态特征模块获取动态网络中各节点的动态特征。训练的动态网络表示模型中的稳定特征模块和动态特征模块,针对性地对动态网络的各个节点中基于时序不变的特征与基于时序可变的特征进行分离表示,以面对不同的下游任务时可采用不同的侧重方,比如预测节点随时间不变的性质时可以采用稳定特征模块获取的稳定特征等。
-
-
-
-
-
-
-
-
-