一种用于中文句子语义相似度计算的方法,设备以及计算机可读存储介质

    公开(公告)号:CN109101494A

    公开(公告)日:2018-12-28

    申请号:CN201810909436.0

    申请日:2018-08-10

    Abstract: 本发明提供一种用于中文句子语义相似度计算的方法,设备以及计算机可读存储介质,对字级别词向量进行预训练;基于句子语义相似度训练集表示句子向量;提取手工特征;基于TCN的神经网络计算,输出句子之间的语义相似度结果。对中文句子不进行分词处理,构建字级别的词向量,用时间卷积网络分别对两个句子进行时间卷积操作提取特征向量,结合手工提取的特征,然后将两个句子的特征向量和手工特征拼接起来,最后计算出两个句子语义相似度。可以很好地避免分词结果的误差传播,也解决了lstm训练速度慢、cnn只有局部特征的问题,可以很好地完成中文句子语义相似度的计算。

    一种半自动化的垂直爬虫生成工具及方法

    公开(公告)号:CN104142985A

    公开(公告)日:2014-11-12

    申请号:CN201410352349.1

    申请日:2014-07-23

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了一种半自动化的垂直爬虫生成工具及方法,该半自动化的垂直爬虫生成方法包括:用户可以选择新建或采用lex-yacc技术打开模板,对模板文件进行词法与语法分析,维护符号表,构造出语法分析树;通过寻找词法与语法分析的规律,以及对整个分析过程中数据的存储与处理,根据模板内容构造出树形模板结构;根据要抽取的内容,在树形模板结构中增加、修改或删除模板节点,节点信息中包含跳转关系、XPath表达式、数据存储方式内容;保存模板;该半自动化的垂直爬虫生成工具包括:爬虫自动生成工具模块、爬虫模块。本发明由自动生成模板内容代替人工手动配置模板,使配置模板变得更加方便快捷,可以大大节省相关人员的工作量。

    轻量级车载T-BOX网络入侵检测探针
    16.
    发明公开

    公开(公告)号:CN116318825A

    公开(公告)日:2023-06-23

    申请号:CN202310031347.1

    申请日:2023-01-10

    Abstract: 本申请涉及车联网安全技术领域,具体为一种轻量级车载T‑BOX网络入侵检测探针,包括态势感知模块、日志管理模块、日志上报模块和配置管理模块,态势感知模块首先读入配置管理模块攻击检测相关配置,然后捕获T‑Box数据总线上的网络流量,态势感知模块检测网络流量中的可能的攻击行为,并将检测结果输送至日志管理模块。本申请支持DDoS攻击、恶意端口扫描等数十种网络入侵行为检测,检测灵活高效,占用计算和存储资源少;软件环境依赖少,交叉编译部署较为简单,为资源受限的硬件平台提供网络安全态势感知服务,进而为车辆联网、车联网智能化提供网络安全保障,应用前景十分广泛。

    一种基于图卷积网络的异常账户检测方法

    公开(公告)号:CN111882446B

    公开(公告)日:2023-05-16

    申请号:CN202010738675.1

    申请日:2020-07-28

    Abstract: 本发明涉及一种基于图卷积网络的异常账户检测方法,属于网络安全技术领域,通过对账户交易数据进行预处理,得到真正需要的有效数据。然后对交易数据按照一定标准进行聚类,得到高中低三种不同的消费能力人群,根据消费情况对人员分组来识别账户异常情况。分组处理后,构建金融网络,采用GCN对异常账户进行分类。分类处理后,得到异常账户和正常账户,应用KNN对异常账户进行识别,找到与该异常账户异常情况最为相似的现有异常账户,通过比对进行风险分析,确定异常情况和异常原因。能够快速、准确的识别出拥有异常交易行为的账户,并为之匹配异常行为最为相似的现有样本,帮助工作人员锁定目标,迅速判断账户风险。

    一种短文本框聚类方法、系统、设备及存储介质

    公开(公告)号:CN112860898B

    公开(公告)日:2022-05-27

    申请号:CN202110279525.3

    申请日:2021-03-16

    Abstract: 本发明涉及一种短文本框聚类方法、系统、设备及存储介质,该方法包括:对原始短文本进行预处理;提取短文本特征词;将短文本特征词转换为短文本特征向量;先初始化聚类中心,然后将聚类中心映射到LSH表中;再根据短文本到聚类中心的文本相似度,选择若干个候选类;根据哈希值选择短文本特征向量的簇集合;重新计算短文本特征向量的簇集合的新聚类中心;循环执行直到新聚类中心不再发生变化,输出文本聚类结果。本发明中,采用WMD‑IP距离作为文本相似度,考虑词向量的位置,这样便可更充分的利用词语的语义信息,减少中间计算过程的复杂度,提高短文本框聚类结果的精度。

Patent Agency Ranking