-
公开(公告)号:CN117217287A
公开(公告)日:2023-12-12
申请号:CN202311000674.7
申请日:2023-08-09
Applicant: 中国科学院自动化研究所 , 中国人民解放军军事科学院国防科技创新研究院
Abstract: 本发明提供一种面向分层强化学习的多元子策略生成模型的训练方法,方法包括:确定初始分层强化学习模型;基于所述初始分层强化学习模型选择进行强化学习时的各子策略;基于所述各子策略之间的瓦式距离,确定所述各子策略之间的子策略策略网络的第一损失;基于所述第一损失,对所述初始分层强化学习模型进行参数迭代,得到所述多元子策略生成模型。本发明提供的方法,通过在具有固定数量子策略的初始分层强化学习模型中加入基于瓦式距离正则项的方法,在不改变模型原有超参数的前提下,增加多元子策略生成模型学习到的子策略的多样性,进而提升多元子策略生成模型在离散和连续动作环境下的性能表现和样本效率。
-
公开(公告)号:CN116562299B
公开(公告)日:2023-11-14
申请号:CN202310143177.6
申请日:2023-02-08
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/211 , G06F40/295 , G06N3/0442
Abstract: 本发明提供一种文本信息的论元抽取方法、装置、设备及存储介质,方法包括:分析待处理的文本信息,得到文本信息对应的句法图;将句法图输入至预先设置的语义图生成模型中,得到语义图生成模型输出的文本信息对应的语义图;其中,语义图生成模型用于基于句法图中的向量特征构建语义图;将语义图和在文本信息中预先设置的触发词输入至预先设置的游走模型中,得到游走模型输出的目标路径和目标路径对应的论元抽取结果;其中,游走模型用于:以触发词对应的节点为起点,基于游走路径确定目标路径,并确定通过目标路径抽取的目标论元及其对应的类型,作为论元抽取结果。本发明实施例有效提高了模型的可解释性。
-
公开(公告)号:CN116306649B
公开(公告)日:2023-10-31
申请号:CN202310181570.4
申请日:2023-02-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/284 , G06F40/242
Abstract: 本发明提供一种词向量的生成方法、装置、电子设备及存储介质,该方法包括:获取至少一个目标词,所述目标词包括所述词典中的至少一个第一词汇,和/或,所述知识库中的至少一个头实体,所述知识库中包括至少两个用于表示知识的三元组数据;确定各所述目标词对应的至少一个释义词,所述释义词包括用于解释所述第一词汇的第二词汇,和/或,所述头实体对应的关系和尾实体;基于所述目标词和所述释义词,确定词向量矩阵,所述词向量矩阵的每一行表示一个词向量,所述词向量用于表征所述目标词或所述释义词的语义信息。本发明提供的词向量的生成方法、装置、电子设备及存储介质可以增强词向量的可解释性。
-
公开(公告)号:CN115827876B
公开(公告)日:2023-06-02
申请号:CN202310032603.9
申请日:2023-01-10
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F40/205
Abstract: 本申请提供一种未标注文本的确定方法、装置和电子设备,涉及数据处理技术领域。该方法包括:获取多个未标注文本、多个已标注文本以及多个已标注文本各自的类别标签;分别将多个未标注文本和多个已标注文本输入至文本类别分析模型的特征提取网络中,根据得到的多个未标注文本各自对应的特征向量和多个已标注文本各自对应的特征向量,从多个未标注文本中确定多个候选未标注文本;根据多个候选未标注文本各自对应的类别标签分布熵值,从多个候选未标注文本中确定目标未标注文本,目标未标注文本用于训练文本类别分析模型,可以准确地选择未标注文本,从而提高了训练得到的文本类别分析模型的泛化能力。
-
公开(公告)号:CN116187443A
公开(公告)日:2023-05-30
申请号:CN202310149607.5
申请日:2023-02-10
Applicant: 中国科学院自动化研究所
IPC: G06N5/022
Abstract: 本发明涉及数据处理技术领域,尤其涉及一种基于多维符号动力学的因果强度检测方法和检测装置。其中,因果强度检测方法包括,首先根据时间序列构建相空间中的吸引子,然后针对吸引子中的每个元素点,基于曼哈顿距离计算方法计算元素点的最近邻点,计算每个最近邻点对应的第一模式,对每个元素点的所有最近邻点的第一模式进行平均处理,得到每个元素点的平均模式,根据平均模式得到每个元素点的真实平均模式和预测平均模式,根据真实平均模式和预测平均模式计算因果强度值。依据本发明的因果强度检测方法可以提高因果强度值的检测效率。
-
公开(公告)号:CN115658910A
公开(公告)日:2023-01-31
申请号:CN202211074171.X
申请日:2022-09-02
Applicant: 中国科学院自动化研究所 , 天津中科智能识别有限公司
IPC: G06F16/36 , G06F16/332 , G06F16/335 , G06N5/02 , G06N5/04
Abstract: 本发明提供一种知识问答方法、装置、电子设备和可读存储介质,涉及计算机技术领域,该方法包括:基于原始知识图谱构建抽象知识图谱,抽象知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成;获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系;基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链;基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体,解决了现有技术中知识问答效率过低的缺陷。
-
公开(公告)号:CN108304502B
公开(公告)日:2020-10-02
申请号:CN201810044908.0
申请日:2018-01-17
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06K9/62
Abstract: 本发明涉及一种基于海量新闻数据的快速热点检测方法及系统,所述快速热点检测方法包括:对多个待处理新闻文本进行链式聚类,得到粗聚类集合;基于快速搜索和寻找密度峰值方法,对所述粗聚类集合进行搜索,得到细聚类集合;提取所述细聚类集合中的代表性短语,所述代表性短语为热点词语。本发明可直接对多个待处理新闻文本进行链式聚类,得到粗聚类集合;进一步基于快速搜索和寻找密度峰值方法,进行聚类,从而得到细聚类集合,并从中提取代表性短语,从而可快速捕捉到新闻文本中的热点词语,可提高计算效率和准确性。
-
公开(公告)号:CN110413787A
公开(公告)日:2019-11-05
申请号:CN201910687147.5
申请日:2019-07-26
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
Abstract: 本发明实施例公开了一种文本聚类方法、装置、终端和存储介质,其中,方法包括,获取媒体中的文本数据,并对文本数据进行标签分析处理,得到N个标签,根据N个标签中各个标签之间的相似度对N个标签进行聚类处理,得到M个标签集合,在检测到可视化事件时,显示M个标签集合中每一个标签集合对应的显示标识信息,通过实施上述方法,可以基于文本中标签的相似度对文本进行聚类,提升了对文本的聚类效率。
-
公开(公告)号:CN109948047A
公开(公告)日:2019-06-28
申请号:CN201910047874.5
申请日:2019-01-18
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明涉及信息检索领域,具体涉及一种基于转移熵的文化基因排序方法与系统及相关设备,目的在于降低计算的复杂度,并提高排序准确度。本发明的文化基因排序方法包括:针对待排序的每种文化基因,在参与该文化基因传播的所有用户中,根据预设的关联用户数量阈值,筛选出传播该文化基因的关键用户;针对每个关键用户,分别计算该关键用户的每个关联用户到该关键用户的转移熵,进而计算该关键用户的影响力值;根据关键用户的影响力值,分别计算每种文化基因的流行度值;根据每种文化基因的流行度值,分别计算每种文化基因的得分,并根据得分进行排序。本发明提供了一种对文化基因流行度自动排序的方法,降低了计算复杂度,具有较高的排序准确度。
-
公开(公告)号:CN108805254A
公开(公告)日:2018-11-13
申请号:CN201810393788.5
申请日:2018-04-27
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06N3/00
CPC classification number: G06N3/006
Abstract: 本发明属于时序预测技术领域,具体提供了一种时序预测的参数优选系统,旨在解决现有技术对先验知识要求高、可拓展途径较低、时间复杂度高、实际可行度低以及鲁棒性差的技术问题。为此目的,本发明提供的参数优化系统包括参数优化模块,参数优化模块配置为基于预先构建的参数优化模型对预先获取的时序预测模型进行参数优化。其中,参数优化模块包括空间调控单元以及收敛调控单元;空间调控单元配置为基于第一权重函数调控参数优化模块的空间搜索范围;收敛调控单元配置为基于第二权重函数调控参数优化模块的收敛速率。本发明的系统增加了分布式表现,各个个体可以高效交流、协作,且提高了算法的性能。
-
-
-
-
-
-
-
-
-