基于COW训练数据管理方法、装置、系统、设备及介质

    公开(公告)号:CN117708061A

    公开(公告)日:2024-03-15

    申请号:CN202311724390.2

    申请日:2023-12-14

    Abstract: 本发明提供一种基于COW的训练数据管理方法、装置、设备及介质,所述方法包括:获取至少一个模型的训练任务,以及训练的样本文件;按照获取参数的控制要求,将所述样本文件进行分类,并放入到对应类别的队列中;在控制至少一个模型训练任务开始时,将每个队列中的样本文件分别生成对应的一份快照,存储到文件存储系统中,以使至少一个模型从文件存储系统中调用相关的一份或多份快照进行训练。本发明对样本文件进行分类,并在模型训练任务开始时,将分类的样本文件分别生成对应的快照供模型调用训练,优化了至少一个模型的训练任务调度时,可以有效控制样本文件管理的边界,提高了样本文件的管理效率和资源的利用率。

    基于潜在语义索引的上网行为分析方法、系统和介质

    公开(公告)号:CN112686050B

    公开(公告)日:2023-12-05

    申请号:CN202011571954.X

    申请日:2020-12-27

    Abstract: 本发明提供一种基于潜在语义索引的上网行为分析方法、系统和介质。所述方法包括:步骤S1、基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;步骤S2、利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以及步骤S3、根据所述行为链构建LSTM深度神经网络模型,以检测所述用户的异常上网行为。该方法能够有效对上网日志数据进行分析,对网址的特征进行相关性计算,刻画用户上网行为画像,构建上网异常行为链,并采用机器学习深度挖掘潜在特征,识别出数据中的异常行为,并能够不断迭代、优化和持续改进,从而实现了及时应急响应和处置。

    一种视频镜头切分方法、装置、电子设备及可读介质

    公开(公告)号:CN116248918B

    公开(公告)日:2023-12-01

    申请号:CN202310116222.9

    申请日:2023-02-08

    Abstract: 本发明实施例提供了一种视频镜头切分方法、装置、电子设备及可读介质,通过获取视频,视频包含若干按时间顺序排列的视频帧,根据预设的计算公式计算相邻的视频帧之间的相似度,得到基于视频帧时间顺序排列的相似度序列,判断相似度序列中是否存在连续预设数量的相似度具有相同的变化趋势,若是,则确定连续预设数量的相似度对应的视频帧之间存在切分点,依据切分点对所述视频进行切分得到视频镜头,从而不依赖人工设定的双阈值也能得到理想的视频镜头切分点,提高了视频镜头的边界划分效果,也节约了人力成本。

    数据同步方法、服务器、客户端、电子设备及存储介质

    公开(公告)号:CN117097737A

    公开(公告)日:2023-11-21

    申请号:CN202310896544.X

    申请日:2023-07-20

    Abstract: 本申请实施例提供了一种数据同步方法、服务器、客户端、电子设备及存储介质。其中,数据同步方法包括:服务器按照设定规则,将MySQL数据库中的同步数据写入SQLite数据库中的同步文件,并记录同步文件的版本号;接收到客户端发送的心跳信号后,判断心跳信号中包含的客户端中同步文件的版本号,与SQLite数据库中同步文件的最新版本号是否相同;在不相同的情况下,向客户端下发包含最新版本号的同步任务,以使客户端在接收到同步任务后,获取最新版本号对应的同步文件。本申请实施例中,采用文件同步的方式,减少了业务数据在传输过程中的数据差异问题,同时减少服务器和客户端对数据额外的存储转换过程,提高了数据同步的效率。

    一种软件文件外发管控方法、装置、电子设备及介质

    公开(公告)号:CN117034215A

    公开(公告)日:2023-11-10

    申请号:CN202310848872.2

    申请日:2023-07-11

    Abstract: 本申请提供了一种软件文件外发管控方法、装置、电子设备及介质。方法包括:首先配置目标进程的进程名和扫描规则至配置文件中,当监听到目标进程被启动时,在目标进程中注入hook模块,以对目标进程进行管控。当用户进行文件外发操作时,通过进行用户行为分析,确认该文件操作是否来自用户手动行为。对于来自用户手动操作行为的文件,根据扫描规则对该文件进行扫描,若命中扫描规则,则禁止打开文件,从而管控文件的外发。通过该方法,能够针对市场上大部分软件进程实现通用、有效的文件外发管控,保障企业数据的安全。

    文本分类方法、装置、电子设备和存储介质

    公开(公告)号:CN116127067B

    公开(公告)日:2023-10-20

    申请号:CN202211697914.9

    申请日:2022-12-28

    Abstract: 本发明实施例提供文本分类方法、装置、电子设备和存储介质,该方法包括:接收用户的预测请求;预测请求包括待预测文本和模型标识;从多个预测模型中确定与模型标识匹配的目标预测模型;从待预测文本中截取多个文字,并分别对多个文字进行转换,得到多个字典参数;将多个字典参数输入至目标预测模型中,通过目标预测模型根据多个字典参数预测待预测文本所属的目标类别信息;向用户返回针对预测请求的目标类别信息。本发明实施例通过预测模型实现文本类别的预测,可替代人工分类,从而大大提升分类效率,且预测模型是BERT模型,BERT模型所需的训练样本量可大大减小,训练出模型的准确性也有一定的提升。

    基于SM9算法的车辆身份认证方法、系统、装置及存储介质

    公开(公告)号:CN113852632B

    公开(公告)日:2023-10-20

    申请号:CN202111124163.7

    申请日:2021-09-24

    Abstract: 本申请实施例提供了一种基于SM9算法的车辆身份认证方法、系统、装置及存储介质,方法包括:根据第一车端的身份标识,生成第一车端的公钥,并基于第一车端的公钥对的验证信息进行加密并同第二车端的身份标识发送至第一车端,根据第二车端的身份标识,生成第二车端的公钥,再利用第二车端的公钥对验证信息进行加密并发送至第二车端;第二车端根据自身的私钥对验证信息进行解密,并与之前的验证信息进行比对,确定认证结果。在云端无需传统运维PKI系统,大幅降低了云端运营成本,采用对方身份标识基于SM9算法生成对方公钥证书,无须从云端同步车辆身份证书,解决了认证效率低、时延长的问题,并且不存在由于证书更新引发的身份假冒攻击风险。

    一种大附件邮件的多线程并发处理方法及装置

    公开(公告)号:CN112612619B

    公开(公告)日:2023-10-20

    申请号:CN202011299553.3

    申请日:2020-11-19

    Abstract: 本发明提供一种大附件邮件的多线程并发处理方法及装置,所述方法包括:将邮件信息传递到stmp‑filter进程;将邮件信息的头信息传输给Linux的消息队列;将邮件信息的头信息存储到Redis和第一阻塞队列中;File‑Process设置临界值,监控分配的内存资源的占用情况;将处理后的邮件信息的头信息及临时文件信息存储到第二阻塞队列中;从所述第二阻塞队列中获取邮件信息,TikaParser线程从第一阻塞队列中获取邮件的附件文件,由ParserEml线程和TikaParser线程分别进行解析,解析完成后,将解析得到的信息发送给策略匹配进程,并按预设策略处理解析过程中产生的临时文件。

    一种文件类型识别方法及装置

    公开(公告)号:CN115374075B

    公开(公告)日:2023-09-01

    申请号:CN202210917644.1

    申请日:2022-08-01

    Abstract: 本发明提供了一种文件类型识别方法、装置、电子设备及可读存储介质,通过获取待识别文件的头部字段与文件扩展名,与第一对应关系比较,确定待识别文件的文件类型,在第一对应关系无法确定文件类型时,将待识别文件的文件扩展名与第二对应关系中的文件扩展名匹配,在匹配时,通过待识别字段的头部数据与第二对应关系中的头部数据,确定待识别文件的魔鬼数字字段,将对应关系更新至第一对应关系中后,在下一次遇到与待识别文件的文件类型相同的文件时,即可以通过第一对应关系中保存的待识别文件的魔鬼数字字段与文件扩展名的对应关系确定文件类型,通过不断智能学习未知文件类型并更新第一对应关系,使对于自定义文件或未知文件均可以被识别。

    一种邮件检测方法及装置
    20.
    发明授权

    公开(公告)号:CN114726603B

    公开(公告)日:2023-09-01

    申请号:CN202210326753.6

    申请日:2022-03-30

    Abstract: 本发明实施例提供了一种邮件检测方法及装置,涉及信息安全技术领域。所述邮件检测方法包括:在敏感信息检测策略发生更新的情况下,获取预设范围内的历史邮件;检测所述历史邮件是否命中更新后的所述敏感信息检测策略;将命中更新后的所述敏感信息检测策略的历史邮件,标记为异常邮件;显示所述异常邮件的邮件信息。本发明实施例提供的技术方案解决了现有技术中在敏感信息检测策略发生更新的情况下,之前已通过原敏感信息检测策略的历史邮件,可能存在信息泄露风险的问题。

Patent Agency Ranking