-
公开(公告)号:CN105068988A
公开(公告)日:2015-11-18
申请号:CN201510431992.8
申请日:2015-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明涉及一种多维度和多粒度情感分析方法,包括:构建情感资源,即根据特定领域文本的类别体系构建其情感资源;选择情感倾向词,即选择每个类别下的情感词并确定其情感倾向;判别情感倾向性,包括:判断信息资源的类型;从信息资源中获取情感关键词;从信息资源中识别权威发布者,并获取该信息资源的情感分析结果;对社交类信息进行情感分析;对非专有类别社交类信息的情感倾向进行分析;针对专有类别的社交信息进行情感分析。本发明的情感分析方法能够从多维度、多粒度进行情感分析以提供较高的情感分析识别率和精度。
-
公开(公告)号:CN104809002A
公开(公告)日:2015-07-29
申请号:CN201510276076.1
申请日:2015-05-26
Applicant: 中国科学院自动化研究所
IPC: G06F9/44
Abstract: 本发明提供一种异构多核处理器多层应用程序的执行方法及处理器,所述方法包括:将所有任意第i层处理器程序中的可执行程序和控制流关系数据库装载到共享程序存储器中,生成并将第(i+1)层处理器的程序地址映射表存储在共享关系存储器中;判断第i层处理器是否需要对第(i+1)层处理器执行调用程序;若第i层处理器需要对第(i+1)层处理器执行调用程序,则判断(i+1)
-
公开(公告)号:CN104572029A
公开(公告)日:2015-04-29
申请号:CN201410836240.5
申请日:2014-12-26
Applicant: 中国科学院自动化研究所
CPC classification number: G06F9/38
Abstract: 本发明公开了一种状态机拼接规则判定方法,以及基于该方法的状态机判定装置。本方法均以状态块为判定对象,对于两个或多个状态块,判断它们是否具有可拼接性,以及拼接生成的复合状态块的类型,生成复合状态块的类型包括含有嵌套循环块的全循环块类型、非全顺序块类型、全顺序块类型、全循环块类型和全嵌套循环块类型。本发明的方法能够保证状态机拼接过程正确和高效地进行,本发明的装置作为合并状态机的重要子装置,更加方便拼接装置的调试和修改,以及功能的移植和增加。
-
公开(公告)号:CN103236903A
公开(公告)日:2013-08-07
申请号:CN201310138909.9
申请日:2013-04-19
Applicant: 中国科学院自动化研究所
IPC: H04L1/00
Abstract: 本发明提出了一种改变数据序列顺序的装置,其包括:输入单元,其用于接收指令操作码和输入操作数;译码控制部件,其用于根据指令操作码和输入操作数产生译码控制信号;硬件索引更新部件,其用于在硬件自动索引时,产生硬件索引操作数;索引操作数单元,其用于根据译码控制部件产生的译码控制信号选择硬件索引操作数或者用户输入的索引操作数作为索引操作数,并输出至交织网络部件;交织网络部件,其用于根据所述索引操作数执行改变输入操作数中源操作数序列顺序的操作。利用该装置可以对长向量数据中的各字节数据按照任意的顺序交织成新的向量数据;同时还对向量数据中的一个或多个字节数据进行复制和整体左串移,形成新的向量数据。
-
公开(公告)号:CN110059181B
公开(公告)日:2021-06-25
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN105740236B
公开(公告)日:2018-09-07
申请号:CN201610066957.5
申请日:2016-01-29
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明公开了一种结合写作特征和序列特征的中文情感新词识别方法和系统。该方法对于输入文本子句,基于情感词的作者写作特征和情感词的序列特征将文本子句表示为各种特征(如:字、词性等)的序列。然后,针对特征表示的文本子句,利用线性链条件随机场模型输出与文本子句对应的情感词标签序列。其中,线性链条件随机场模型基于包含传统情感词的文本训练得到。接着,基于文本子句中字的序列和情感词标签序列,利用有限状态自动机识别文本子句中的情感词,形成情感词集合。最后,利用中文旧词词库对情感词集合进行过滤,将未出现在中文旧词词库中的情感词作为中文情感新词。通过本发明实施例解决了如何提高情感新词识别精度和召回率的技术问题。
-
公开(公告)号:CN103455638A
公开(公告)日:2013-12-18
申请号:CN201310452292.8
申请日:2013-09-26
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明提出一种结合推理和半自动学习的行为知识提取方法和装置。本发明针对海量的开源文本,使用少量行为知识提取模板并利用行为知识间的语义关联,增量地从文本中获取行为前提、行为结果和行为间的时序关系三种主要的行为知识。本发明基于Bootstrapping分别获取上述三种行为知识,并基于行为知识间的语义关联,在Bootstrapping步骤中结合知识推理进行行为知识提取。本发明能够有效提高了行为知识提取的效率和质量,可在不同应用领域支持面向海量文本的行为自动建模和分析。
-
公开(公告)号:CN103235717A
公开(公告)日:2013-08-07
申请号:CN201310139290.3
申请日:2013-04-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种具有多态指令集体系结构的处理器,其包括一个标量处理单元(101)、至少一个多态指令处理单元(100)、至少一个多粒度并行存储器(102)和一个DMA控制器(103);多态指令处理单元(100)包括至少一个功能单元(202);多态指令处理单元(100)用于解释和执行多态指令,其功能单元(202)用于执行具体的数据操作任务;所述标量处理单元(101)用于调用多态指令并查询多态指令的执行状态;所述DMA控制器(103)用于传送多态指令的配置信息以及向所述多粒度存储器(102)传送多态指令所需数据。本发明的处理器在流片生产后,程序员仍可根据应用算法特点对处理器指令集进行重定义。
-
公开(公告)号:CN112287684B
公开(公告)日:2024-06-11
申请号:CN202011192254.X
申请日:2020-10-30
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/30
Abstract: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN112287684A
公开(公告)日:2021-01-29
申请号:CN202011192254.X
申请日:2020-10-30
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/30
Abstract: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
-
-
-
-
-
-
-
-