-
公开(公告)号:CN106708926A
公开(公告)日:2017-05-24
申请号:CN201611001399.0
申请日:2016-11-14
Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种支持海量长文本数据分类的分析模型的实现方法,属于大数据文本分析技术领域。本发明采用HanLP分词工具中的标准分词并采用改进的CHI算法,一方面有效降低文本分类时每篇文章的词向量空间的维度,降低文本分类计算的时间复杂度,提升算法效率,满足大数据背景下海量长文本分类时的性能需求;同时最大程度低减少由于降低向量空间维度数而造成分类准确性降低。采用TFIDF算法能够有效消除了文本与向量之间的屏障,最后采用朴素贝叶斯分类算法,能够准确的将文本进行较好的训练,实现长文本的准确的分类。本发明能有效地解决在大数据环境下长文本分类的性能指标和准确性指标的矛盾性问题,具有广泛的应用前景。
-
公开(公告)号:CN117171392A
公开(公告)日:2023-12-05
申请号:CN202311094348.7
申请日:2023-08-28
Applicant: 北京赛思信安技术股份有限公司
IPC: G06F16/783 , G06V40/16 , G06V20/40 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于神经辐射场和隐属性的虚拟主播生成方法与系统,属于人工智能技术领域。根据需要确定虚拟主播的人物形象,并通过虚拟主播生成系统进行合成。首先通过人脸特征提取与构建模块合成虚拟主播的三维人脸。然后将需要播报的文本信息通过语音合成模块合成虚拟主播的语音。提取虚拟主播的语音、唇部运动、头部运动和眼睛眨动特征,并通过改进的NeRF网络模块结合各特征对虚拟主播的视频进行合成。最后替换合成视频的背景,合成最终的虚拟主播。本发明生成的虚拟主播具有高效稳定性和更高的真实度,能够适用于不同领域的虚拟主播制作。
-
公开(公告)号:CN116703586A
公开(公告)日:2023-09-05
申请号:CN202310638126.0
申请日:2023-05-31
Applicant: 北京赛思信安技术股份有限公司
Abstract: 本发明是一种应用于资金交易数据的多层级自动拓扑方法,属于金融数据分析监测技术领域。本发明方法包括:资金交易数据筛选,确定用于自动拓扑的关键字段;数据流向自动判定,确定资金交易数据是流向银行还是第三方机构;设置银行/第三方资金交易数据的多层级拓扑自关联规则,过滤出要分析的资金账号的交易数据,从中挖掘要定位的资金流向,建立资金交易账号节点拓扑图。本发明方法在实现对海量资金交易数据进行精准、重点关注数据的交易流向分析判定时,还通过执行多层级自动拓扑方法,能快速、自动的输出资金交易的多层数据流向,快速、全面、精准的绘制出资金交易流水的资金图谱,帮助使用方判定各类资金的最终去向。
-
公开(公告)号:CN116418583A
公开(公告)日:2023-07-11
申请号:CN202310403247.7
申请日:2023-04-14
Applicant: 北京赛思信安技术股份有限公司
IPC: H04L9/40
Abstract: 本发明提供了一种基于自定义语法描述的网络攻击行为精准判定方法,涉及数字信号的传输、网络通信安全等技术领域。本发明方法包括:设置自定义语法集合、网络攻击行为描述集合及细粒度函数集合;采用专用词法和语法解析器对网络攻击行为描述集合进行解析,对采集的实时网络数据包执行细粒度函数,为网络攻击行为判定模块提供判断的依据;采用人工迭代分析,对网络攻击行为描述集合进行正向反馈与调整。本发明方法能够灵活的对网络攻击行为进行准确描述,对判定结果进行迭代分析以及反馈调优,实现对网络攻击行为的精准识别。
-
公开(公告)号:CN116383318A
公开(公告)日:2023-07-04
申请号:CN202310403584.6
申请日:2023-04-14
Applicant: 北京赛思信安技术股份有限公司
Inventor: 冯加军
IPC: G06F16/28 , G06F16/27 , G06F16/901
Abstract: 本发明公开了一种面向海量结构化数据的知识图谱并行构建方法,属于计算机技术领域。本发明方法包括:将海量数据按照设定的元数据结构存入结构化数据库并进行分区;计算节点读取对应的结构化数据库分区中数据,存入不同RDD分区,设置数据同步写入阈值,各RDD分区抽取元数据的字段及字段值,生成实体及关系,当对当前RDD分区生成的实体和关系的数量达到写阈值时,触发数据同步写入;各计算节点并行对结构化数据抽取的实体与关系数据写入分布式存储系统,从该系统中获取数据构建知识图谱。本发明能够并行抽取海量结构化数据生成实体与关系,同时优化了写入的方式,实现了快速高效的知识图谱构建从而进行数据分析挖掘以及检索。
-
公开(公告)号:CN114579805B
公开(公告)日:2023-03-28
申请号:CN202210195639.4
申请日:2022-03-01
Applicant: 北京赛思信安技术股份有限公司
IPC: G06F16/783 , G06F16/78 , G06F16/71 , G06V20/40 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于注意力机制的卷积神经网络相似视频检索方法包括:检索视频的关键帧抽取,使用块结构思想代替连续结构思想。视频关键帧图像处理,引入去纯色算法和增强图像整体与局部特征。关键帧特征提取,使用改进的ResNet‑50对关键帧特征提取。检索视频关键帧特征相似检索,引入Faiss检索。帧间结果后处理,引入矫正机和Softmax机制。本发明主要解决了大规模相似视频检索的时间与精度问题,在不降低精度的同时有效的降低了检索时长,大幅度的提升了视频的检索性能。
-
公开(公告)号:CN115226155A
公开(公告)日:2022-10-21
申请号:CN202210791759.0
申请日:2022-07-05
Applicant: 北京赛思信安技术股份有限公司
Abstract: 本发明是一种移动通信基站和核心网间透明数据注入设备及方法,属于移动通信技术领域。本发明设备包括网络拓扑分析模块以及中间设备;中间设备上设置模拟基站模块、模拟核心网模块和信令数据修改构造模块。本发明方法首先采集网卡上的流量数据,获取合适的网络拓扑结构;然后构建中间系统,对于基站模拟核心网功能,对于核心网模拟基站功能,向核心网注入数据时,修改协议字段,按规则重新编码,构造新数据包,将数据注入到基站和核心网之间。数据注入后,对核心网和移动通信基站间的原始通信无任何影响。本发明同时满足了移动通信基站和核心网的通信要求,实现技术难度适中,注入效率高,极大节省了成本,能满足多种场景需求。
-
公开(公告)号:CN114565878A
公开(公告)日:2022-05-31
申请号:CN202210195633.7
申请日:2022-03-01
Applicant: 北京赛思信安技术股份有限公司
IPC: G06V20/40 , G06V10/22 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种支持类别可配置的视频标志物检测方法,属于视频数据分析领域。本发明将目标视频标志物进行标志物特征提取,对提取的目标视频标志物特征构建特征索引文件。对待检测的视频进行标志物的目标检测与定位,将检测出的视频标志物进行特征提取,对检测出的视频标志物特征与构建的目标视频标志物特征索引文件进行特征匹配,通过特征匹配后的距离阈值判断检测出的视频标志物是否为目标视频标志物。本发明采用对视频标志物智能检测的审核方式代替了人工视频审核方式,解决了现有的违规视频审核方式的自动化程度低,过分依赖人工等技术问题。有效的提高了视频审核的效率,降低了视频审核的人力物力的成本。
-
公开(公告)号:CN109739515B
公开(公告)日:2022-03-18
申请号:CN201811635956.3
申请日:2018-12-29
Applicant: 北京赛思信安技术股份有限公司
Abstract: 本发明提供了一种应用于互联网移动应用基础数据上报方法,属于移动终端技术领域。本发明通过对移动应用商店的原生移动应用数据进行整理,在管理侧制定出移动应用基础数据上报接口和移动应用数据更新接口,移动应用商店通过调用相应的接口将移动应用基础信息或变更信息上报给管理侧系统,管理侧系统对数据进行核验,将核验结果返回给移动应用商店,实现APP上架或更新。本发明实现了一种规范的移动应用上报接口和更新接口,保证了用户使用应用软件的安全性,同时管理侧系统收集到所有应用商店的移动应用基础数据,可进一步对移动应用基础数据进行计算、分析和统计。
-
公开(公告)号:CN108874971B
公开(公告)日:2021-09-24
申请号:CN201810582832.7
申请日:2018-06-07
Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种应用于海量标签化实体数据存储的工具和方法,属于海量数据存储、标签数据存储领域。该工具包括标签元数据模块、实体标签数据模块和统一存取API模块。用户输入用户名密码和请求,统一存取API模块根据用户名和密码,访问标签元数据模块并读取标签的元数据,按用户请求对元数据进行包装,转换成数据层的数据格式,传输到数据层的对应接口对标签数据执行操作,实体标签数据模块根据统一存取API模块发出的请求执行相应的操作,并对数据做持久化处理。同时实体标签数据模块将处理结果返回给统一存取API模块,统一存取API模块将数据进行包装按照规定格式返回到工具界面。本发明具有高针对性,可扩展性及持久性,支撑更高层次的业务需求。
-
-
-
-
-
-
-
-
-