-
公开(公告)号:CN115238688A
公开(公告)日:2022-10-25
申请号:CN202210973829.4
申请日:2022-08-15
申请人: 广州市刑事科学技术研究所 , 广州市公安局黄埔区分局 , 上海歆仁信息科技有限公司
IPC分类号: G06F40/289 , G06F16/22 , G06F16/31 , G06F16/36 , G06F40/30
摘要: 本发明公开了电子信息数据关联关系分析方法、装置、设备和存储介质,所述方法包括,构建NLP分词模型和NLP语义模型时,包括步骤:对已有的各分析对象的不同类型的电子信息数据,进行逆向解析和/或数据转换,生成对应的明文文本数据;将明文文本数据处理为结构化数据或半结构化数据,并根据预设的多层级的数据分类体系结构存储;根据明文文本数据中的特定数据生成关键信息并设定对应的标注信息;构建包括多个资料库的资料库集;以资料库集中的关键信息和明文文本数据为训练语料进行NLP分词模型的训练和NLP语义模型的训练。本发明可以提高针对风控或内审等场景下电子信息数据的关联、分析和研判的效率和分析结果的准确性和有效性。
-
公开(公告)号:CN115238688B
公开(公告)日:2023-08-01
申请号:CN202210973829.4
申请日:2022-08-15
申请人: 广州市刑事科学技术研究所 , 广州市公安局黄埔区分局 , 上海歆仁信息科技有限公司
IPC分类号: G06F40/289 , G06F16/22 , G06F16/31 , G06F16/36 , G06F40/30
摘要: 本发明公开了电子信息数据关联关系分析方法、装置、设备和存储介质,所述方法包括,构建NLP分词模型和NLP语义模型时,包括步骤:对已有的各分析对象的不同类型的电子信息数据,进行逆向解析和/或数据转换,生成对应的明文文本数据;将明文文本数据处理为结构化数据或半结构化数据,并根据预设的多层级的数据分类体系结构存储;根据明文文本数据中的特定数据生成关键信息并设定对应的标注信息;构建包括多个资料库的资料库集;以资料库集中的关键信息和明文文本数据为训练语料进行NLP分词模型的训练和NLP语义模型的训练。本发明可以提高针对风控或内审等场景下电子信息数据的关联、分析和研判的效率和分析结果的准确性和有效性。
-
公开(公告)号:CN115794749A
公开(公告)日:2023-03-14
申请号:CN202310044853.4
申请日:2023-01-30
申请人: 广州市刑事科学技术研究所 , 广州市公安局黄埔区分局 , 上海歆仁信息科技有限公司
IPC分类号: G06F16/16 , G06F16/172 , G06F16/174 , G06F16/61
摘要: 本发明公开了提取移动终端数据的方法、设备和存储介质,所述方法包括:获取所述目标目录中子目录的目录层级;当所述目录层级数大于预设层数时,在遍历缓存进行到预设进度后执行数据提取命令;当某一子目录中文件的碎片文件的数量和比例大于预设阈值时,在执行数据提取命令前将所述子目录中的所有文件进行打包。本发明根据现有技术中数据提取的效率低下的产生的多方面原因,采用了针对性的技术手段,包括:让遍历时间和数据提取时间相叠加,以充分利用遍历过程的时间;在进行数据提取前对数量巨大且碎片化严重的文件进行打包来减少握手次数,以提高传输效率。
-
公开(公告)号:CN113411222B
公开(公告)日:2021-11-19
申请号:CN202110878735.4
申请日:2021-08-02
申请人: 广州市刑事科学技术研究所 , 广州市高奈特网络科技有限公司
摘要: 本发明公开了存储器、APP服务器主机地址分析方法、装置和设备,其中所述方法,包括步骤:在安卓系统的环境下,捕获待分析APP的运行过程的网络数据包;从网络数据包中过滤出待分析APP的预设运行阶段的分段网络数据包;通过获取预设运行阶段的分段网络数据包中的远端主机HOST并去重,分别获取各预设运行阶段的初选远端主机HOST;通过对各预设运行阶段的初选远端主机HOST进行交集运算,以及,使用公用服务器字典从初选远端主机HOST剔除公用服务器主机地址,获取待分析APP的服务器主机地址。本发明能够有效的减少人工操作和人工分析,进而也就有效的减少了人工工作量、提高了工作效率。
-
公开(公告)号:CN113411222A
公开(公告)日:2021-09-17
申请号:CN202110878735.4
申请日:2021-08-02
申请人: 广州市刑事科学技术研究所 , 广州市高奈特网络科技有限公司
摘要: 本发明公开了存储器、APP服务器主机地址分析方法、装置和设备,其中所述方法,包括步骤:在安卓系统的环境下,捕获待分析APP的运行过程的网络数据包;从网络数据包中过滤出待分析APP的预设运行阶段的分段网络数据包;通过获取预设运行阶段的分段网络数据包中的远端主机HOST并去重,分别获取各预设运行阶段的初选远端主机HOST;通过对各预设运行阶段的初选远端主机HOST进行交集运算,以及,使用公用服务器字典从初选远端主机HOST剔除公用服务器主机地址,获取待分析APP的服务器主机地址。本发明能够有效的减少人工操作和人工分析,进而也就有效的减少了人工工作量、提高了工作效率。
-
-
-
-