-
公开(公告)号:CN113766314A
公开(公告)日:2021-12-07
申请号:CN202111317971.5
申请日:2021-11-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/44 , H04N21/439 , H04N21/488 , G06K9/62 , G06K9/46 , G06K9/32 , G06K9/00
Abstract: 本公开涉及一种视频切分方法、装置、设备、系统及存储介质,该方法包括:获取目标视频的视频特征数据,视频特征数据包括音频数据、字幕数据和镜头数据;对音频数据进行切分,得到多个音频数据片段;基于镜头数据对字幕数据进行切分,得到多个字幕子数据;基于音频数据片段和字幕子数据对目标视频进行切分,得到多个视频片段。根据本公开实施例,实现了能够准确的切分目标视频,以进一步使得用户通过浏览目标视频切分后的视频片段,从目标视频中快速获取准确的信息,以准确且快速的浏览目标视频中所包含的信息。
-
公开(公告)号:CN113515648A
公开(公告)日:2021-10-19
申请号:CN202111070507.0
申请日:2021-09-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45
Abstract: 本公开涉及一种内容聚类方法及系统。该方法包括:获取待聚类的多媒体内容集,待聚类的多媒体内容集包括第一多媒体内容集和第二多媒体内容集,根据第一多媒体内容集中第一多媒体内容的多媒体特征生成第一聚类簇,多媒体特征包括语义特征、实体特征以及词语特征中的至少两种,以第一聚类簇中的簇中心为聚类中心,对第二多媒体内容集中第二多媒体内容进行聚类,得到目标聚类簇。通过上述技术方案,实现了准确且快速的对多媒体内容进行聚类,以满足自然语言处理场景的实际聚类需求。
-
公开(公告)号:CN113282754A
公开(公告)日:2021-08-20
申请号:CN202110646720.5
申请日:2021-06-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F40/205 , G06K9/62 , G06N3/04
Abstract: 本发明实施例公开了一种针对新闻事件的舆情检测方法、装置、设备和存储介质。该方法包括:获取待检测新闻事件的目标评论文章;将所述目标评论文章输入至舆情数据提取模型中,得到所述待检测新闻事件的舆情数据,所述舆情数据包括各评论者的评论者数据、观点数据和立场数据;根据所述舆情数据生成所述待检测新闻事件的舆情检测结果;显示所述舆情检测结果。本发明实施例通过采用上述技术方案,能够实现新闻事件舆情的深层次检测,提高新闻事件的舆情检测结果的准确性。
-
公开(公告)号:CN113052413A
公开(公告)日:2021-06-29
申请号:CN201911368970.6
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请提供了一种风险旅客评估方法,包括:获取多个待评估旅客的信息,每个待评估旅客的信息包括多个出行信息和多个属性信息;根据出行信息计算每个待评估旅客的第一风险值,并将第一风险值超过第一预设阈值的待评估旅客纳入第一候选旅客集合;将出行信息输入梯度提升决策树,输出待评估旅客的第二风险值,并将第二风险值超过第一预设阈值的待评估旅客纳入第二候选旅客集合;根据第一候选旅客集合与第二候选旅客集合得到第三候选旅客集合;根据第三候选旅客集合中的第三候选旅客的身份信息,计算第三风险值,并确定第三风险值超过第二预设阈值的第三候选旅客为风险旅客,采用多方信息和梯度提升决策树对风险旅客进行评估,增加了评估的准确性。
-
公开(公告)号:CN112329470A
公开(公告)日:2021-02-05
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN109409529B
公开(公告)日:2020-12-08
申请号:CN201811069882.1
申请日:2018-09-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06N3/04 , G06N3/08 , G06F16/9535
Abstract: 本发明涉及一种事件认知分析方法、系统及存储介质,分析方法包括:实时获取互联网数据,对互联网数据进行处理得到特征向量;建立多维分类标签库,基于多维分类标签库和机器学习算法训练得到数据标签模型;将特征向量输入数据标签模型得到分类标签;基于分类标签进行事件认知分析。本发明实施例通过对互联网数据进行处理得到互联网数据的特征向量,基于机器学习算法得到数据标签模型,通过数据标签模型对特征向量进行分析,得到相应的分类标签,通过对互联网数据进行智能处理,形成内容关系网络,通过机器学习算法实现事件认知分析。
-
公开(公告)号:CN110134942B
公开(公告)日:2020-10-23
申请号:CN201910260924.8
申请日:2019-04-01
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/289 , G06F16/951 , G06F16/9535 , G06F16/35
Abstract: 本发明实施例涉及一种文本热点提取方法及装置,包括:采用正则表达式对输入的至少一个文本数据按照设定规则进行分割处理,得到多个第一短文本数据;采用依存句法分析算法将第二短文本数据生成对应的第四短文本数据;将第三短文本数据和第四文短本数据进行向量化处理,得到对应的多个文本向量;基于相似度算法确定任意两个文本向量之间的相似度;将相似度大于相似度阈值的两个文本向量进行合并处理,句法分析抽取关系词而组成的短句提高了信息抽取的可观性和准确度,让用户可以更好的理解文本内容从而获取核心关键信息点,通过Word2vec将短句向量化进行相似度对比,保留词语之间的语义信息,从而保证了排重工作的准确性,尽可能的避免了热点信息的冗余。
-
公开(公告)号:CN108683693B
公开(公告)日:2020-10-23
申请号:CN201810225500.3
申请日:2018-03-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04L29/08
Abstract: 本发明涉及一种多元高效下载服务的实现方法及系统,该实现方法包括:获取下载服务的接口,通过最优下载方式调用接口进行下载;当最优下载方式下载失败时,根据其他普通下载方式调用接口进行下载;当出现普通下载方式下载成功时,停止下载,将最优下载方式和普通下载方式中权重值最大的下载方式作为新的最优下载方式。本发明实施例根据不同的接口对应的下载方式的权重值大小,依次根据最优下载方式或普通下载方式调用对应接口进行下载,保证了因接口的不同,选取最优的下载方式进行下载,快速完成该接口对应的下载任务,实现了通用、高效、可靠性高以及高扩展性的多元化高并发下载服务响应机制。
-
公开(公告)号:CN109840687A
公开(公告)日:2019-06-04
申请号:CN201811604779.2
申请日:2018-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q10/06
Abstract: 本发明涉及一种品牌影响力指数构建方法、系统及存储介质。现有品牌影响力指数构建方法效率低、误差大的问题,本发明获取企业影响力和产品影响力,并分别获取企业影响力权重和产品影响力权重,根据企业影响力、产品影响力和企业影响力权重和产品影响力权重计算品牌影响指数。本发明针对采集的品牌数据,采用机器的方法对设计的品牌影响指标定量评价并量化计算方法进行量化评估,从而大大提高品牌评估的准确性和有效性,可更好地服务于现有品牌的评估量化工作,准确性高,误差小,实用性强。
-
公开(公告)号:CN109783778A
公开(公告)日:2019-05-21
申请号:CN201811577909.8
申请日:2018-12-20
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。
-
-
-
-
-
-
-
-
-