-
公开(公告)号:CN107851121A
公开(公告)日:2018-03-27
申请号:CN201680043167.3
申请日:2016-07-05
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G16H10/60 , G06F17/271 , G06F17/2765 , G06F17/2785 , G06F17/28 , G06F17/30253 , G06F17/30401 , G06F19/00 , G06K9/00442 , G06K9/6201 , G06K9/6293 , G06K9/72 , G06K2209/01 , G06K2209/05 , G06T7/0014
Abstract: 计算机处理器可以接收包括报告和图像的医疗数据。计算机处理器可以使用自然语言处理来分析报告以识别状况和对应的标准。计算机处理器也可以使用图像处理模型来分析图像以生成图像分析。计算机处理器可以通过将图像分析与标准进行比较来确定报告是否存在潜在的问题。
-
公开(公告)号:CN107783958A
公开(公告)日:2018-03-09
申请号:CN201610792978.5
申请日:2016-08-31
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
CPC classification number: G06F17/2765 , G06F17/2785
Abstract: 本发明实施例提供了一种目标语句识别方法及装置,其中方法包括:获取待处理的文本,其中所述文本包含一条或多条自然语言语句;提取每条所述语句的识别特征,其中所述识别特征包括第一特征和\或第二特征,所述第一特征用于指示所述语句在语义方面的特征,所述第二特征用于指示所述语句在文字方面的特征;根据预先构建的目标语句识别模型及所述文本中每条所述语句的识别特征,识别出所述文本中的目标语句。本发明可自动发现属于目标语句(例如优美句子)的语句,从而大大提高了目标语句的识别效率;同时,本发明的识别标准是基于客观的特征及模型,使得识别结果也较为客观,从而避免了人工识别时的主观性问题。
-
公开(公告)号:CN103475779B
公开(公告)日:2018-01-09
申请号:CN201310394033.4
申请日:2009-04-14
IPC: G06F17/30
CPC classification number: G06F3/0481 , G06F17/211 , G06F17/24 , G06F17/2765 , G06F17/277 , G06F17/3064 , G06F2203/04803 , H04M1/2745 , H04M1/72522 , H04M1/72547 , H04M1/72552 , H04M1/72561 , H04M1/72566
Abstract: 公开了一种通信终端和为通信终端提供统一自然语言界面的方法。所述方法包括:经由通信终端的收发器接收短消息,该消息包含作为字符串的文本信息;响应于接收该消息,从文本信息中提取至少一个属性关键字,该属性关键字是识别文本信息的主题的字或语素;确定与至少一个提取的属性关键字匹配的至少一个功能;以及当执行至少一个功能时处理至少一个属性关键字作为该至少一个功能的输入。
-
公开(公告)号:CN107506475A
公开(公告)日:2017-12-22
申请号:CN201710803201.9
申请日:2017-09-08
Applicant: 国网辽宁省电力有限公司 , 国网辽宁省电力有限公司电力科学研究院 , 江苏瑞中数据股份有限公司 , 国家电网公司
CPC classification number: G06F17/30705 , G06F17/2735 , G06F17/2765 , G06F17/30194 , G06Q50/06
Abstract: 本发明涉及一种对客户服务文本的分类方法,特别是一种基于Spark的海量电力客户服务文本分类方法。随着智能电网技术的不断发展,电网企业发挥数据资源的战略资产作用,关键在于提升海量数据的管理和支撑能力,实现信息共享,为企业管理提供运营决策分析支持。本发明通过建立电力客户服务情感词典,对客服工单进行分词,分词后的数据存储至HDFS文件,运用Spark从中加载并转换成RDD,预处理后用改良的分类算法进行训练得出模型。本方法可以大幅提升工单数据的分类分析的准确性和高效性,以挖掘客户的真实诉求。
-
公开(公告)号:CN107464555A
公开(公告)日:2017-12-12
申请号:CN201710384118.2
申请日:2017-05-26
Applicant: 索尼移动通讯有限公司
Inventor: O·索恩
CPC classification number: G10L21/0202 , G06F17/2765 , G06F17/2785 , G06F17/279 , G06F17/30746 , G09B5/062 , G10L15/02 , G10L15/1822 , G10L15/24 , G10L15/26 , G10L15/265 , G10L17/26 , G10L21/02 , G10L25/48 , G10L25/63 , G10L25/87 , G11B27/031 , G10L13/08
Abstract: 向包含语音的音频数据添加背景声音。一种编辑方法(40)促成向包含语音的音频数据添加背景声音以增强收听体验的任务。所述编辑方法(40)由计算装置中的处理器执行,并且包括:获得(41)特征数据,所述特征数据通过主题和情感中的至少一个来表征所述音频数据中的时间段;针对所述音频数据中的相应时间段并且基于所述特征数据,获得(43)将在所述相应时间段被添加到所述音频数据的背景声音的期望的属性,以及提供(44)所述相应时间段的期望的属性,以使得能够在所述相应时间段内将所述音频数据与具有所述期望的属性的背景声音组合。可自动地或者通过手动用户干预来选择和添加背景声音。
-
公开(公告)号:CN107330627A
公开(公告)日:2017-11-07
申请号:CN201710543193.9
申请日:2017-07-05
Applicant: 山东大学
CPC classification number: G06Q10/0639 , G06F17/2765 , G06F17/2775 , G06F17/30734 , G06F17/30864
Abstract: 本发明公开了一种创新创意的大数据处理方法、服务器及系统,其中该方法在大数据处理服务器内完成,包括步骤1:爬取多源异构的创新大数据,并集合生成具有层次关联关系的创新知识网络;步骤2:接收客户端输入的创意需求描述,得到创新关键词,计算创新关键词与创新知识网络中的关键词的关联度和层次关联关系的紧密度,并进行相关信息标注,生成初始创新方案;步骤3:将初始创新方案发送至评价服务器,并在评价服务器内依据预设评分标准对初始创新方案进行评分;步骤4:接收评价服务器的评分并与方案合格评分阈值相比较,若前者大于后者,则初始创新方案为可行创新方案;否则,返回步骤2,直至得到可行创新方案。
-
公开(公告)号:CN107315775A
公开(公告)日:2017-11-03
申请号:CN201710391942.0
申请日:2017-05-27
Applicant: 国信优易数据有限公司
CPC classification number: G06F17/30864 , G06F17/2765 , G06F17/30734 , G06N3/04 , G06N3/08 , G06Q10/0639
Abstract: 本发明公开了一种指数计算平台,包括:数据获取模块,用于获取进行指数计算的数据;指标体系构建模块,用于基于获取的数据构建指标体系;特征选择模块,用于对指标体系确定的指标进行特征选择,确定指数计算使用的特征;权重确定模块,用于将确定的特征对应的特征值以及作为目标变量的初始指数值输入预设深度学习模型,采用深度神经网络进行迭代训练,得到各特征分别对应的权重;权重和指数调整模块,用于按照预设周期收集关于当前指数值的监督信息,并基于该监督信息来调整各特征的权重和得到新的当前指数值。本发明还提供一种指数计算方法。本发明确定的当前指数值能够准确的反映最新状态。
-
公开(公告)号:CN104866465B
公开(公告)日:2017-11-03
申请号:CN201410064854.6
申请日:2014-02-25
Applicant: 腾讯科技(深圳)有限公司
Inventor: 张红林
CPC classification number: G06F17/2775 , G06F16/313 , G06F16/35 , G06F17/2247 , G06F17/2765
Abstract: 本发明公开了一种敏感文本检测方法及装置,属于信息处理技术领域。方法包括:获取当前检测文本的特征文本字符串;根据预先建立的有限自动状态机对特征文本字符串进行检测,得到每个关键词在特征文本字符串中的出现频率;对于多个关键词类别中的每个关键词类别,基于关键词类别对应的每个关键词的出现频率及每个关键词的预设权重,计算关键词类别在文本中的权重;当至少一个关键词类别的权重大于预设阈值时,确定文本为敏感文本。本发明根据预先建立的有限自动状态机对特征文本字符串进行检测时,仅需进行一次从头至尾的扫描,所以提高了检测效率,加快了检测速度;且在确定敏感文本时,还需基于关键词的预设权重,所以提高了检测粒度。
-
公开(公告)号:CN107277269A
公开(公告)日:2017-10-20
申请号:CN201710584372.7
申请日:2017-07-17
Applicant: 北京泰迪熊移动科技有限公司
IPC: H04M1/725 , G06F17/30 , G06F17/27 , G06F3/0484
CPC classification number: H04M1/72552 , G06F3/0484 , G06F17/2765 , G06F17/30734 , G06F17/3089
Abstract: 本发明公开了一种信息内容的处理方法和装置。其中,该方法包括:获取信息中的内容,对内容进行分词处理,得到至少一个关键内容,使用预定的显示方式显示至少一个关键内容,接收到对关键内容的操作,响应于操作,调用配置的操作行为,其中,预定的显示方式用于提示关键内容能够被操作。本发明解决了对信息内容进行处理时操作复杂的技术问题。
-
公开(公告)号:CN106897422A
公开(公告)日:2017-06-27
申请号:CN201710102950.9
申请日:2017-02-23
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/30684 , G06F17/2765
Abstract: 本申请公开了文本处理方法、装置及服务器。该方法的一具体实施方式包括:查询目标文件的文本信息;通过预置的敏感词集合对文本信息进行筛选,确定文本信息中的敏感词;对所确定的敏感词进行文字扩展,生成敏感词的联想词,其中,联想词中包括了敏感词中的文字;将联想词中除敏感词中的文字之外的文字与文本信息进行文字对比,并根据对比结果对文本信息进行处理。该实施方式提高了对文本信息审核的准确性。
-
-
-
-
-
-
-
-
-