-
公开(公告)号:CN113159874B
公开(公告)日:2024-07-23
申请号:CN202110570420.3
申请日:2021-05-25
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
IPC: G06Q30/04 , G06Q40/12 , G06Q10/0635 , G06Q30/018
Abstract: 本发明提供了一种增值税发票的检测方法、装置和可读存储介质。增值税发票的检测方法,包括获取数据,对数据进行数据处理,得到清洁数据;基于清洁数据,获取第一特征向量集合;基于第一特征向量集合,采用第一风险量化模型进行检测,得到第一风险量化值;基于企业关联关系拓扑图,获取风险扩散变量;基于风险扩散变量和第一风险量化值,获取第二特征向量集合;基于第二特征向量集合,采用第二风险量化模型进行检测,获取第二风险量化值。本发明提出了洗票风险扩散机制,对洗票风险在企业之间的扩散过程进行建模,实现了企业间风险扩散行为的精确捕获与计算,同时清晰地区分了正常企业与洗票嫌疑企业。
-
公开(公告)号:CN118227262A
公开(公告)日:2024-06-21
申请号:CN202410364624.5
申请日:2024-03-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请实施例提供了一种针对流式数据处理的弹性扩缩容方法及装置,涉及云原生技术领域,部署于Kubernetes平台中,通过监控指标参数集合中的各个指标,获取所述指标参数集合中各个指标对应的参数值;所述指标参数集合中包括至少一个关于流式数据任务的自定义指标;基于所述各个指标对应的参数值,结合预设告警规则生成告警消息;响应于所述告警消息,对所述各个指标对应的参数值进行分析,以生成目标资源的配置信息;所述目标资源为基于自定义资源定义CRD创建的自定义资源;基于所述目标资源的配置信息,对所述目标资源对应的Deployment进行扩缩容。本申请实施例用于在Kubernetes平台中处理流式数据业务时,提高业务处理的效率。
-
公开(公告)号:CN112613293B
公开(公告)日:2024-05-24
申请号:CN202011593291.1
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06V30/19
Abstract: 本发明实施例公开了一种摘要生成方法、装置、电子设备及存储介质,所述方法包括:获取摘要文本信息;分别确定预设图像集中至少一个图像与所述摘要文本信息的图文相似度;分别提取所述至少一个图像中的图像文本信息,并确定各所述图像的图像文本信息与所述摘要文本信息的文本相似度;基于各所述图像的图文相似度和文本相似度确定与所述摘要文本信息相匹配的摘要图像;基于所述摘要图像和所述摘要文本信息形成目标摘要。本发明实施例的技术方案实现了当用户阅读初始文本时,可以通过摘要图像直观的了解文本的大致内容,通过阅读摘要文本信息获知文本主旨内容,提高用户的阅读体验感。
-
公开(公告)号:CN113051918B
公开(公告)日:2024-05-14
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F18/214 , G06F18/25 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN117786465A
公开(公告)日:2024-03-29
申请号:CN202410199457.3
申请日:2024-02-23
Applicant: 北京中科闻歌科技股份有限公司 , 天津中科闻歌科技有限公司
IPC: G06F18/24 , G06F18/214 , G06N3/08
Abstract: 本发明公开了一种领域预训练模型数据构建方法和系统,包括:自动化数据质量筛选模块。本模块采用混合算法,结合领域专家知识和自定义规则,自动筛选用于标注的原始数据质量,对于低质量的文本数据在本环节直接排除掉。自定义的规则包括:文本信息熵筛查、困惑度筛查、重复度筛查、完整性筛查。本发明一种领域预训练模型数据构建系统及方法,能够提高数据集的质量和多样性,确保预训练模型在领域的应用场景中发挥出最佳的效能。
-
公开(公告)号:CN112685204B
公开(公告)日:2024-03-05
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN113672731B
公开(公告)日:2024-02-23
申请号:CN202110881327.4
申请日:2021-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/082
Abstract: 析结果的准确率。本公开实施例涉及一种基于领域信息的情感分析方法,该方法包括:对待分析的文本信息进行预处理,并获取领域信息;将待分析的文本信息输入到预先融合有领域信息的情感分类模型中,获取文本信息的情感类别;融合有领域信息的情感分类模型包括:全局情感语义模型、每一个领域的局部情感语义模型和对应每一个领域的情感融合策略;其中,基于与领域信息匹配的局部情感语义模型,获取局部情感概率值;基于全局情感语义模型,获取全局情感概率值;基于与领域信息匹配的情感融合策略,对局部情感
-
公开(公告)号:CN117033449B
公开(公告)日:2023-12-15
申请号:CN202311296035.X
申请日:2023-10-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/2455 , G06F16/28 , G06F16/22
Abstract: 本发明提供了一种基于kafka流的数据处理方法、电子设备和存储介质,包括:获取通过kafka流获取的m个用户的数据需求信息;将获取的m个数据需求信息通过消息组件发送给数据预处理节点,得到具有设定格式的目标数据需求信息;获取当前时刻t对应的原始数据集Dt;从Dt中获取DSti,并基于Ir对应的目标数据需求信息,确定DSti是否为Ir对应的关联数据,如果是,则将Dti标记为Ir对应的关联数据;基于Irfs,从MDrw中获取对应的字段作为Ir对应的目标数据。本发明能够从海量的数据中及时且准确的获取到多个用户所需求的数据。
-
公开(公告)号:CN116996630A
公开(公告)日:2023-11-03
申请号:CN202310964008.9
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N5/262 , G10L21/10 , G10L21/18 , H04N5/265 , G06N3/0475 , G06N3/094 , G06F16/332
Abstract: 本发明提供了一种实时问答虚拟人视频生成方法、电子设备及存储介质,方法包括:基于待播报信息获取对应的场景视频;对音频文件进行特征提取,得到对应的音频特征;基于场景视频和音频特征,生成口型与音频特征相匹配的场景视频,作为初始人脸驱动视频;基于场景视频中的目标图像以及初始驱动视频,获取对应的人脸关键点、人脸深度图和人脸的RGB编码特征;基于获取的人脸关键点、人脸深度图和人脸的RGB编码特征,得到目标人脸驱动视频;利用目标人脸驱动视频中的人脸替换场景视频中的人脸,得到虚拟人视频;将虚拟人视频和音频文件进行合成,得到待播报的虚拟人播报视频。本发明能够提高虚拟人视频的制作效率。
-
公开(公告)号:CN113496780B
公开(公告)日:2023-11-03
申请号:CN202010197391.6
申请日:2020-03-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: G16H50/80
Abstract: 本发明实施例提供了一种传染病确诊者数量预测方法、装置、服务器及存储介质,该方法包括:确定传染病预测天数、基本传染数、传染病潜伏周期,基于以下步骤进行迭代,直至传染病预测天数归零输出传染病第二累计确诊者数量:获取第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量;基于第一累计痊愈者数量、第一累计确诊者数量、基本传染数、传染病潜伏周期更新预设传染病预测模型中系数;基于第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量、经过更新的传染病预测模型,输出第二易感者数量、第二现存疑似者数量、第二累计确诊者数量、第二累计痊愈者数量;对传染病预测天数进行递减。
-
-
-
-
-
-
-
-
-