-
公开(公告)号:CN109739541B
公开(公告)日:2022-02-11
申请号:CN201811505870.9
申请日:2018-12-10
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供了一种双系统代码/文件管理平台架构,包括功能集合层、服务器层、两个权限系统层、算法和逻辑层、数据库层、两个双前端界面层和两个双后端系统层。本发明运用两套分别基于C/S架构和B/S架构的系统设计,通过共用部分数据库数据和代码文件等、两套权限系统和权限溢价系统、合理布局的云端服务器和本地服务器,实现代码/文件的管理功能、可视化、算法接口调用、算法搜索查询推荐、算法搭建、在线离线计算等功能,从而对传统的代码/文件管理系统进行功能扩展,降低使用难度、提升工作效率以及协同开发效率、避免大量重复性工作、提升使用体验,能够保证研发服务器资源不被额外占用、能够保证数据传输的速度以及安全性等。
-
公开(公告)号:CN113434610A
公开(公告)日:2021-09-24
申请号:CN202110764250.2
申请日:2021-07-06
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/28 , G06F16/23 , G06F16/2458 , G06F16/2455 , G06F16/215 , G06F11/14
Abstract: 本发明提供了一种基于命名规则和缓存机制的知识图谱构的操作方法,包括以下步骤:数据采集‑知识图谱schema设计‑制定缓存策略‑命名规则制定‑图谱数据管理模块开发‑实体关系数据抽取‑数据缓存及更新校对‑图谱生成及二次校对‑缓存数据备份及管理。本发明能够利用缓存机制提升海量数据情况下的知识图谱构建生成效率、降低知识图谱构建过程中的数据校对和日志生成管理难度、支撑知识图谱数据回滚功能的实现;能够利用合理的命名规则和功能模块降低知识图谱数据管理的难度并实现缓存文件的自动处理、对比、知识图谱数据导入更新以及回滚,从而降低图谱构建和管理的难度、提升图谱构建速度、支撑图谱构建使用全生命周期管理需求的实现。
-
公开(公告)号:CN111966944A
公开(公告)日:2020-11-20
申请号:CN202010825591.1
申请日:2020-08-17
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/958 , G06F16/33 , G06F16/35
Abstract: 本发明提供了一种多层级用户评论安全审核的模型构建方法,包括如下步骤:①构建词库:基于数据采集技术获取用户评论数据集;②构建正负样本:从用户评论数据集中构建评论正样本和评论负样本作为样本数据;③迭代优化:切分样本数据为训练集和测试集,以训练集的评论正样本和评论负样本作为训练数据进行多周期迭代训练用户评论审核模型;④输出审核结果。本发明采用敏感词库、情感极性分析、协同训练的多层级评论审核的方法,为用户评论内容的检测提供了新思路;基于敏感因子权重对敏感词库进行层级划分和评论检测,避免了传统敏感词过滤一次性匹配所带来的漏判和误判,有效提升了评论审核的精确率。
-
公开(公告)号:CN110716925B
公开(公告)日:2023-08-04
申请号:CN201910837650.4
申请日:2019-09-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/2458 , G06F16/29 , H04W4/021 , G01S19/42
Abstract: 本发明公开了一种基于轨迹分析的跨境行为识别方法,包括以下步骤:(1)获取人员历史轨迹及边界地理围栏数据;(2)对人员历史轨迹数据进行数据预处理;(3)轨迹数据预分类;(4)对预分类的轨迹数据进行跨境行为识别;(5)输出跨境行为识别结果。本发明基于地理GIS数据及人员轨迹数据,统筹地理科学、计算机图形学、统计学、大数据等多学科理论与技术手段,可为智能交通、社会公共安全、智慧公安等领域应用提供技术支持。
-
公开(公告)号:CN110716925A
公开(公告)日:2020-01-21
申请号:CN201910837650.4
申请日:2019-09-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/2458 , G06F16/29 , H04W4/021 , G01S19/42
Abstract: 本发明公开了一种基于轨迹分析的跨境行为识别方法,包括以下步骤:(1)获取人员历史轨迹及边界地理围栏数据;(2)对人员历史轨迹数据进行数据预处理;(3)轨迹数据预分类;(4)对预分类的轨迹数据进行跨境行为识别;(5)输出跨境行为识别结果。本发明基于地理GIS数据及人员轨迹数据,统筹地理科学、计算机图形学、统计学、大数据等多学科理论与技术手段,可为智能交通、社会公共安全、智慧公安等领域应用提供技术支持。
-
公开(公告)号:CN109766706A
公开(公告)日:2019-05-17
申请号:CN201811625074.9
申请日:2018-12-28
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供了一种数据的多权限管理系统,包括权限管理系统、粗粒度权限系统、细粒度权限系统、安全权限系统。本发明能够实现数据的精细化权限管理,并且通过粗粒度权限系统的设计提供更人性化的服务,通过细粒度权限系统严格保证数据的使用安全,通过安全权限系统满足数据更细致的保密需求,通过权限管理系统提供多个权限系统之间权限的智能切换,根据用户信息、数据信息、场景信息以及用户初始权限,利用权限智能映射分配算法,快速计算出用户在多种权限系统下拥有的权限,大大提升了数据管理的灵活性、人性化和安全性。
-
公开(公告)号:CN109697233A
公开(公告)日:2019-04-30
申请号:CN201811466407.8
申请日:2018-12-03
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/36
Abstract: 本发明提供了一种知识图谱体系搭建方法,包括以下步骤:数据采集-提取特征-表征特征-特征保存-获取知识图谱基础-构建知识图谱。本发明能够将多媒体数据关联起来构建知识图谱、进行多媒体数据统一管理和使用、解决训练数据不足的问题、提升知识图谱关键信息抽取准确度、提升知识图谱构建效率,并通过实体属性特征关联以及键值对存储的方式,将知识图谱和底层多模态数据关联起来,利用数据拆解定位算法进行快速检索,再通过闭环式的体系,实现整个体系的快速迭代进化和完善,从而为后期的各项应用提供有力的支撑。
-
公开(公告)号:CN113918663A
公开(公告)日:2022-01-11
申请号:CN202111369404.4
申请日:2021-11-18
Applicant: 中电科大数据研究院有限公司 , 中国雄安集团有限公司
IPC: G06F16/28 , G06F16/23 , G06F16/2458 , G06F16/2455 , G06F16/215 , G06F11/14
Abstract: 本发明提供了一种基于命名规则和缓存机制的知识图谱构的操作方法,包括以下步骤:数据采集‑知识图谱schema设计‑制定缓存策略‑命名规则制定‑图谱数据管理模块开发‑实体关系数据抽取‑数据缓存及更新校对‑图谱生成及二次校对‑缓存数据备份及管理。本发明能够利用缓存机制提升海量数据情况下的知识图谱构建生成效率、降低知识图谱构建过程中的数据校对和日志生成管理难度、支撑知识图谱数据回滚功能的实现;能够利用合理的命名规则和功能模块降低知识图谱数据管理的难度并实现缓存文件的自动处理、对比、知识图谱数据导入更新以及回滚,从而降低图谱构建和管理的难度、提升图谱构建速度、支撑图谱构建使用全生命周期管理需求的实现。
-
公开(公告)号:CN110826322A
公开(公告)日:2020-02-21
申请号:CN201911006906.3
申请日:2019-10-22
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/289 , G06N3/04
Abstract: 本发明提供了一种新词发现和词性预测及标注的方法,该方法包括以下步骤:(1)获取特定领域数据集;(2)文本预处理;(3)数据序列化;(4)提取字符序列;(5)成词判断,获得新词第一候选集;(6)过滤新词第一候选集,获得新词第二候选集;(7)基于评测指标,获取新词种子数据集;(8)新词二次筛选;(9)新词词性预测及标注;(10)新词词频对齐。本发明结合特定领域数据的特点,为特定领域的新词发现和词性预测及标注提供了思路,实现对语料中新词的筛选及通用词串、垃圾词串的过滤,从而为文本底层的词法分析、语言模型、句法分析和高层的语义理解、文本纠错、知识问答、机器翻译等任务和应用场景提供了支撑和保障。
-
公开(公告)号:CN109739541A
公开(公告)日:2019-05-10
申请号:CN201811505870.9
申请日:2018-12-10
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供了一种双系统代码/文件管理平台架构,包括功能集合层、服务器层、两个权限系统层、算法和逻辑层、数据库层、两个双前端界面层和两个双后端系统层。本发明运用两套分别基于C/S架构和B/S架构的系统设计,通过共用部分数据库数据和代码文件等、两套权限系统和权限溢价系统、合理布局的云端服务器和本地服务器,实现代码/文件的管理功能、可视化、算法接口调用、算法搜索查询推荐、算法搭建、在线离线计算等功能,从而对传统的代码/文件管理系统进行功能扩展,降低使用难度、提升工作效率以及协同开发效率、避免大量重复性工作、提升使用体验,能够保证研发服务器资源不被额外占用、能够保证数据传输的速度以及安全性等。
-
-
-
-
-
-
-
-
-