-
公开(公告)号:CN117391071B
公开(公告)日:2024-02-27
申请号:CN202311639781.4
申请日:2023-12-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/258 , G06F40/216 , G06F40/268 , G06F40/284 , G06F16/35
Abstract: 本申请公开了一种新闻话题数据挖掘方法、装置及存储介质,包括:采集新闻发稿量的时序数据,并通过预配置的时间窗口对时序数据进行划分;基于时间窗口的时间刻度,将时序数据转换为一维向量;计算一维向量的一阶差分向量;通过符号函数遍历一阶差分向量,生成趋势向量;从趋势向量的尾部进行遍历,根据预配置的修正规则对趋势向量中的零值进行修正;对修正后的趋势向量进行一阶差分计算,得到二阶差分值;根据二阶差分值对时序数据划分为多个独立的事件群;获取事件群中所有新闻的文本数据;将文本数据转换为TF‑IDF向量;对TF‑IDF向量进行基于密度的文本聚类,得到多个事件新闻群;(56)对比文件Zhang Tingting 等.Multi-dimensiontopic mining based on hierarchicalsemantic graph model《.IEEE access》.2020,第8卷64820-64835.Tang Dan 等.The detection of low-rateDoS attacks using the SADBSCAN algorithm.《Information Sciences》.2021,第565卷229-247.
-
公开(公告)号:CN116628682B
公开(公告)日:2023-11-14
申请号:CN202310907425.X
申请日:2023-07-24
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请实施例公开了一种基于数据沙盒的数据契约式开放方法及相关设备,可安全的对外开放数据,既保证数据安全,又能充分发挥数据的最大价值。所述数据契约式开放方法应用于沙盒服务端,所述沙盒服务端中包含有边界沙盒和计算沙盒,包括:沙盒服务端根据目标安全契约开启边界沙盒,目标安全契约用于制约边界沙盒和计算沙盒在沙盒服务端中的行为;边界沙盒接收来自于数据使用方提供的初始模型和数据提供方提供的数据样本;计算沙盒依据目标安全契约将数据样本输入初始模型进行训练生成数据分析模型;边界沙盒将数据分析模型上传至数据使用方;沙盒服务端销毁边界沙盒和计算沙盒。
-
公开(公告)号:CN117671945A
公开(公告)日:2024-03-08
申请号:CN202311595520.7
申请日:2023-11-27
Applicant: 中电科大数据研究院有限公司
IPC: G08G1/01 , G08G1/0967 , H04L67/12 , H04B1/713
Abstract: 本申请公开了本申请提供了一种智能交通信息通信方法、系统及存储介质,用于及时提供精准的交通信息。本申请方法包括:目标车辆的车载装置获取所述目标车辆的实时信息,并对所述实时信息进行预处理;车载装置将所述处理后的数据存入数据库,并通过跳频通信的方式传输至目标路侧装置;所述目标路侧装置将所述存入数据库的数据传输至中心控制器;所述中心控制器对所述存入数据库的数据进行分析和预测处理,获得预测数据并存入数据库,再推送至路侧装置;路侧装置将所述预测数据以跳频通信的方式推送至所述目标车辆或其他车辆的车载装置,以使得所述目标车辆或所述其他车辆的车载装置共享所述预测数据,并根据所述预测数据进行智能道路规划。
-
公开(公告)号:CN117828158A
公开(公告)日:2024-04-05
申请号:CN202410020784.8
申请日:2024-01-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/951 , G06F9/455 , G06F9/48 , G06F3/0484
Abstract: 本发明公开了一种网页数据采集装置及方法,该装置包括:任务配置模块、任务调度模块、采集模块和存储模块;所述任务配置模块,用于为用户提供可视化交互界面,以使用户通过所述可视化交互界面自定义采集任务脚本并配置任务调度信息;所述任务调度模块,用于根据所述任务调度信息为采集任务提供管理功能,所述管理功能包括:自动周期调度、单次调度、日志检查;所述采集模块,用于根据所述任务调试模块的触发基于所述采集任务脚本进行数据采集;所述存储模块,用于存储所述采集模块采集的数据。利用本发明方案,可以灵活方便地使用户实现多种网页数据的采集,满足不同场景下的网页数据采集需求。
-
公开(公告)号:CN117391071A
公开(公告)日:2024-01-12
申请号:CN202311639781.4
申请日:2023-12-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/258 , G06F40/216 , G06F40/268 , G06F40/284 , G06F16/35
Abstract: 本申请公开了一种新闻话题数据挖掘方法、装置及存储介质,包括:采集新闻发稿量的时序数据,并通过预配置的时间窗口对时序数据进行划分;基于时间窗口的时间刻度,将时序数据转换为一维向量;计算一维向量的一阶差分向量;通过符号函数遍历一阶差分向量,生成趋势向量;从趋势向量的尾部进行遍历,根据预配置的修正规则对趋势向量中的零值进行修正;对修正后的趋势向量进行一阶差分计算,得到二阶差分值;根据二阶差分值对时序数据划分为多个独立的事件群;获取事件群中所有新闻的文本数据;将文本数据转换为TF‑IDF向量;对TF‑IDF向量进行基于密度的文本聚类,得到多个事件新闻群;通过NLP工具进行词频词性分析,生成对应的事件标题。
-
公开(公告)号:CN116628682A
公开(公告)日:2023-08-22
申请号:CN202310907425.X
申请日:2023-07-24
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请实施例公开了一种基于数据沙盒的数据契约式开放方法及相关设备,可安全的对外开放数据,既保证数据安全,又能充分发挥数据的最大价值。所述数据契约式开放方法应用于沙盒服务端,所述沙盒服务端中包含有边界沙盒和计算沙盒,包括:沙盒服务端根据目标安全契约开启边界沙盒,目标安全契约用于制约边界沙盒和计算沙盒在沙盒服务端中的行为;边界沙盒接收来自于数据使用方提供的初始模型和数据提供方提供的数据样本;计算沙盒依据目标安全契约将数据样本输入初始模型进行训练生成数据分析模型;边界沙盒将数据分析模型上传至数据使用方;沙盒服务端销毁边界沙盒和计算沙盒。
-
-
-
-
-