-
公开(公告)号:CN113269139B
公开(公告)日:2023-09-26
申请号:CN202110677796.4
申请日:2021-06-18
Applicant: 中电科大数据研究院有限公司
IPC: G06V20/52 , G06V10/26 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本发明提供了一种针对复杂场景的自学习大规模警员图像分类模型,通过优化警员图像数据集构建和模型训练过程,对大规模警员图像数据集进行筛选,结合图像主体区域检测模型减少数据中的噪声,增强了对复杂场景的识别,同时利用迁移学习方法降低了模型训练的难度,迭代训练了一个警员图像分类模型,进一步将模型运用在原始大规模警员图片数据集中,实现了警员图像分类模型自学习过程。相对于传统的直接在原始数据集上进行训练的图像分类模型,本方法解决了训练大规模警员图像分类模型缺少标注数据的问题,并针对警员图像数据场景复杂的特征进行了数据筛选与语义增强,从而能够更准确的实现对警员图像的分类与识别。
-
公开(公告)号:CN116775578A
公开(公告)日:2023-09-19
申请号:CN202311070192.9
申请日:2023-08-24
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种政策血缘网络构建方法及装置、政策分析方法及装置,所述方法包括:收集政策文件,并对所述政策文件进行分类编码管理;根据所述政策文件,构建不同粒度的文本向量;对所述文本向量进行聚类,得到各聚类中心点及该中心点对应的向量簇,所述向量簇包括多个文本向量、以及与所述文本向量相关的政策集合;构建对应各中心点的政策谱系树,由所述政策谱系树组成政策森林;根据所述政策森林中的所有政策谱系树构建政策血缘网络。利用本发明方案,可以高效地构建政策血缘网络,而且构建的政策血缘网络可以全面地呈现不同政策间的显性血缘关系和隐性血缘关系,为政策传播的分析提供有效支撑。
-
公开(公告)号:CN110245275B
公开(公告)日:2023-09-01
申请号:CN201910521164.1
申请日:2019-06-18
Applicant: 中电科大数据研究院有限公司 , 贵州华云创谷科技有限公司 , 长沙军民先进技术研究有限公司
IPC: G06F16/9032 , G06F16/951 , G06F16/9535
Abstract: 本发明公开了一种大规模相似新闻标题快速归一化方法,所述方法包括:S1、预处理新闻标题数据;S2、将与任意给定新闻标题相关的新闻标题数据进行排序;S3、计算相关新闻标题与该新闻标题之间相似度并排序;S4、比较相关新闻标题中最大相似度值与设定相似度阈值并判断索引中是否存在相似新闻标题,若存在则将最大相似度新闻标题MD5值作为该新闻标题归一化序列码,若不存在则进入步骤S5;S5、计算该新闻标题MD5值,作为其归一化序列码与其内容存入索引中;S6、重复步骤S2和S5,完成所有新闻标题的归一化映射。本发明可以快速找出相关的新闻标题并做出相似性判定,然后将相似新闻标题映射成唯一的归一化序列码,实现了大规模相似新闻标题的快速归一化。
-
公开(公告)号:CN110716925B
公开(公告)日:2023-08-04
申请号:CN201910837650.4
申请日:2019-09-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/2458 , G06F16/29 , H04W4/021 , G01S19/42
Abstract: 本发明公开了一种基于轨迹分析的跨境行为识别方法,包括以下步骤:(1)获取人员历史轨迹及边界地理围栏数据;(2)对人员历史轨迹数据进行数据预处理;(3)轨迹数据预分类;(4)对预分类的轨迹数据进行跨境行为识别;(5)输出跨境行为识别结果。本发明基于地理GIS数据及人员轨迹数据,统筹地理科学、计算机图形学、统计学、大数据等多学科理论与技术手段,可为智能交通、社会公共安全、智慧公安等领域应用提供技术支持。
-
公开(公告)号:CN116501875A
公开(公告)日:2023-07-28
申请号:CN202310486869.0
申请日:2023-04-28
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/35 , G06F16/31 , G06F16/34 , G06F40/289 , G06F40/216 , G06F40/253 , G06F40/186 , G06F16/28 , G06F16/901 , G06F18/23213 , G06N3/0442
Abstract: 本发明涉及信息处理领域,特别是一种基于自然语言和知识图谱的文档处理方法和系统,通过对主题关键词属性信息聚类分类处理;借助于权重值信息的赋值抽取出文档中的关键信息,对文档文本进行自动分词、自动分类、自动聚类处理,配置知识图谱获取到特定的语法与结构,形成自动填充模板,对法律文档配置填充格式,生成文档数据信息的自动摘要,能够快捷高效地向用户推送文档主题信息,提升了现有文档信息的处理效率。
-
公开(公告)号:CN116108165B
公开(公告)日:2023-06-13
申请号:CN202310347275.1
申请日:2023-04-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06F40/284
Abstract: 本发明提供了一种文本摘要生成方法、装置、存储介质及电子设备,其中,该方法包括:提取目标文本中的关键词;基于具有关键词的原始词序列中的关键词的重要程度对相应的关键词进行数量扩展,得到目标句子的有效词序列;根据有效词序列确定目标句子与其他目标句子之间的相关度;根据该相关度确定目标句子的影响权重;基于影响权重最高的多个目标句子形成目标文本的文本摘要。本发明实施例提供的技术方案,先提取出关键词,进而确定关键词数量扩展后的有效词序列,基于该有效词序列可以更准确地表示在需要提取文本摘要时所需的目标句子之间的相关度,从而可以更准确地确定目标句子的影响权重,进而能够更准确地提取出文本摘要。
-
公开(公告)号:CN116028192A
公开(公告)日:2023-04-28
申请号:CN202310315993.0
申请日:2023-03-29
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请公开了一种多源异构数据采集方法、装置和存储介质,旨在通过分布式系统实现通用式多源异构数据采集,提高数据处理效率。本申请方法包括:确定数据源的类型,并配置所述数据源的数据源信息;配置任务调度器,所述任务调度器用于定时执行任务、周期执行任务、确定服务节点以及确定执行策略;创建数据采集任务,所述数据采集任务包括数据来源、数据目标源以及数据采集策略;通过配置好的任务调度器,按照所述数据采集策略执行所述数据采集任务;输出数据采集结果。
-
公开(公告)号:CN115829371A
公开(公告)日:2023-03-21
申请号:CN202211387954.3
申请日:2022-11-07
Applicant: 中电科大数据研究院有限公司
IPC: G06Q10/0639 , G06Q50/26
Abstract: 本申请公开了一种应用于政务领域的数据质量评估方法及相关装置,用于用于使政务领域的数据质量评估可量化、可落地且可迭代。本申请方法包括:根据政务领域的业务场景确定数据质量评价指标;基于数据质量评价指标确定指标约束规则;根据数据质量评价指标及指标约束规则构建数据质量评估算法模型;获取待评估的政务领域的目标数据集,并确定目标数据集对应的目标数据质量评价指标及目标指标约束规则,政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;确定目标指标约束规则的目标权重值;将目标指标约束规则、目标权重值及目标数据集输入数据质量评估算法模型,获取目标数据集的数据质量评估结果。
-
公开(公告)号:CN110909881B
公开(公告)日:2022-11-04
申请号:CN201911061280.6
申请日:2019-11-01
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供了一种面向跨媒体知识推理任务的知识表示方法,该方法包括:抽取跨媒体知识图谱的RDF三元组信息,将跨媒体知识图谱RDF三元组数据表示为初始的低维向量;利用最大间隔成本函数训练正负例三元组样本之间的向量表示,同时挖掘正负例三元组样本间的相似性(或差异性),添加到最大间隔成本函数中,提高模型知识推理识别相似实体的能力。本发明能够对基于RDF构建的跨媒体知识图谱三元组进行知识表示和知识推理,利用本发明学习到的知识推理模型进行实体链接和知识分类,能够提高跨媒体知识图谱中的链接预测和三元组分类的准确度。
-
公开(公告)号:CN115277858A
公开(公告)日:2022-11-01
申请号:CN202211166164.2
申请日:2022-09-23
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: H04L67/60 , H04L67/561 , H04L67/563 , H04L47/50 , G06F16/13 , G06F16/172 , G06F16/182
Abstract: 本发明涉及信息处理领域,公开了一种大数据的数据处理方法和系统,所述方法包括设置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,将描述性元数据以列表形式存储在名称节点的内存中,响应于用户端对文件的访问请求,提供内部元数据服务;在所述名称节点处,设置有静态缓存队列,所述静态缓存队列,存储对应热点文件的分块访问数据,以及在数据节点设置重定向消息,将数据的访问和地址变更能够及时反馈到用户端,实现了用户对数据节点信息的访问的快捷性。
-
-
-
-
-
-
-
-
-