-
公开(公告)号:CN105653538B
公开(公告)日:2019-12-20
申请号:CN201410642239.9
申请日:2014-11-13
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 一种数据挖掘的方法,包括以下步骤:获取各个用户的行为序列,所述行为序列中包含多条按照行为执行时间顺序排列的行为节点,所述行为节点由行为与行为执行时间组成;搜索所述行为序列中对应的提升值满足预设的长期提升条件的行为节点作为所述行为序列中的行为频率提升点,所述行为节点对应的提升值为所述行为序列中该行为节点后的行为发生频率与所述行为序列中该行为节点前的行为发生频率的比值;获取发生时间满足行为频率提升点相关的时间条件的对应用户发生的事件作为行为频率提升因素。上述方法可挖掘出准确的用户行为频率提升因素。此外,还提供一种数据挖掘的装置。
-
公开(公告)号:CN103455638A
公开(公告)日:2013-12-18
申请号:CN201310452292.8
申请日:2013-09-26
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明提出一种结合推理和半自动学习的行为知识提取方法和装置。本发明针对海量的开源文本,使用少量行为知识提取模板并利用行为知识间的语义关联,增量地从文本中获取行为前提、行为结果和行为间的时序关系三种主要的行为知识。本发明基于Bootstrapping分别获取上述三种行为知识,并基于行为知识间的语义关联,在Bootstrapping步骤中结合知识推理进行行为知识提取。本发明能够有效提高了行为知识提取的效率和质量,可在不同应用领域支持面向海量文本的行为自动建模和分析。
-
公开(公告)号:CN102867224A
公开(公告)日:2013-01-09
申请号:CN201210322641.X
申请日:2012-09-03
Applicant: 中国科学院自动化研究所
IPC: G06Q10/04
Abstract: 本发明公开了一种预测行为规划的期望效用的方法,所述规划是指为达到一个目标的行为的集合,该方法根据所观察到的证据获得行为规划的期望效用值,所述方法包括:步骤S1.根据证据计算状态出现的概率,所述证据指的是对行为和状态的观察结果,所述状态指的是行为的前提和结果的出现情况;步骤S2.根据状态出现的概率计算行为发生的概率;步骤S3.根据行为出现的概率计算行为结果出现的概率和行为的期望效用值;步骤S4.根据行为结果出现的概率和行为的期望效用值计算行为规划结果本。出现的概率和行为规划的期望效用值。本发明能够用于分析行为意图。
-
公开(公告)号:CN118747526A
公开(公告)日:2024-10-08
申请号:CN202410763060.2
申请日:2024-06-13
Applicant: 中国科学院自动化研究所 , 国家电网有限公司客户服务中心 , 国网浙江省电力有限公司营销服务中心 , 中国电力科学研究院有限公司
IPC: G06N5/022 , G06F18/213 , G06F40/268 , G06F40/20 , G06F16/35
Abstract: 本发明提供一种基于增强提示的可控回复生成方法、装置及存储介质。该基于增强提示的可控回复生成方法包括:获取多轮对话历史文本;对所述多轮对话历史文本进行词级别的文本特征提取,获得词级别文本特征;基于所述词级别文本特征和大语言模型生成回复。本发明提供的基于增强提示的可控回复生成方法、装置及存储介质,对多轮对话历史进行词级别的文本特征提取,基于这些词级文本特征利用大语言模型可以生成上下文一致的回复,提高生成回复的情感属性控制准确率,使回复能够符合预定义控制属性要求,从而提升用户体验。
-
公开(公告)号:CN103810283A
公开(公告)日:2014-05-21
申请号:CN201410058585.2
申请日:2014-02-20
Applicant: 东莞中国科学院云计算产业技术创新与育成中心 , 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明涉及数据采集技术领域,尤其是一种基于用户关联关系的微博数据采集方法。本发明采用网络爬虫的方式对微博平台上包含特定关键词的微博信息进行采集,在采集的过程中以用户之间的关联关系作为微博爬虫的链接,首先根据指定的关键词获取微博爬虫的种子用户,然后通过抓取网页的方式获取用户的微博页面,采集其中包含关键词的微博信息,选取出具有潜力的用户,并同时采集有潜力用户的关联关系以获取微博爬虫的下一级链接,从而实现微博信息的自动搜索与采集。本发明解决了根据关键词在微博平台上自动采集包含该关键词的微博等问题,可用于商务智能、社情舆情、决策评估等领域对特定微博内容的获取。
-
公开(公告)号:CN105653538A
公开(公告)日:2016-06-08
申请号:CN201410642239.9
申请日:2014-11-13
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 一种数据挖掘的方法,包括以下步骤:获取各个用户的行为序列,所述行为序列中包含多条按照行为执行时间顺序排列的行为节点,所述行为节点由行为与行为执行时间组成;搜索所述行为序列中对应的提升值满足预设的长期提升条件的行为节点作为所述行为序列中的行为频率提升点,所述行为节点对应的提升值为所述行为序列中该行为节点后的行为发生频率与所述行为序列中该行为节点前的行为发生频率的比值;获取发生时间满足行为频率提升点相关的时间条件的对应用户发生的事件作为行为频率提升因素。上述方法可挖掘出准确的用户行为频率提升因素。此外,还提供一种数据挖掘的装置。
-
公开(公告)号:CN103440235A
公开(公告)日:2013-12-11
申请号:CN201310363414.6
申请日:2013-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于认知结构模型的文本情感类型识别方法及装置,该方法包括:对于输入的海量开源文本,基于通用语义词典和句法依存关系,采用统计方法自动构建情感维度词典;对所构建的情感维度词典进行求精,求精具体包括语义、情感倾向的不一致性处理和非情感词的过滤;基于求精后得到的高质量的情感维度词典,结合情感认知结构模型中情感维度值与情感类型的对应关系,得到相应的情感类型。本发明的上述方案设计思路、可解释性、使用灵活性及有效性上均明显优于已有方法,可用于商务智能、社情舆情、决策评估等领域面向文本的情感分析与识别。
-
-
-
-
-
-