一种对稀疏矩阵进行压缩和查询的方法及系统

    公开(公告)号:CN104809161B

    公开(公告)日:2018-08-21

    申请号:CN201510152316.7

    申请日:2015-04-01

    Abstract: 本发明涉及一种对稀疏矩阵进行压缩和查询的方法及系统。该方法对k2‑tree方法进行了改进:一是rank操作的改变,二是对于一般矩阵和非零一矩阵的处理。首先对待处理的稀疏矩阵进行预处理,得到单元值为0或1且为方阵的稀疏矩阵A;然后采用k2‑tree算法得到数组T(tree)和L(leaves),根据T(tree)中的信息对Rank数组间隔固定位数进行存储,得出Rank(tree),并根据L(leaves)和对应的原稀疏矩阵得到V(leaves)和rank(leaves)值,输入查询单元的坐标后,可查询得出稀疏矩阵A中存储的数值。本发明可以有效地压缩稀疏矩阵,使查询速度更快,存储空间更节省。

    URL匹配方法、URL匹配设备及存储介质

    公开(公告)号:CN107402959A

    公开(公告)日:2017-11-28

    申请号:CN201710451043.5

    申请日:2017-06-15

    Abstract: 本发明提供URL匹配方法、URL匹配设备及存储介质,该方法通过将输入的待匹配的原始URL数据在URL结果缓存中查询是否已存储过其对应的信息,若是则查询标志位及已命中规则表得到以前是否匹配的信息,输出匹配结果;否则在模式匹配引擎中进行匹配,并进行存储URL数据。该方法对大量重复的URL数据去重,以降低URL数据重复匹配次数,提高匹配速度。同时本发明采用比实际串匹配复杂度低的多项式散列算法,但不仅限于多项式散列算法。在增添数据去重操作后可以减少重复的URL数据的匹配次数,达到去重和降低匹配时间的目的。

    一种基于多粒度情感的对话推荐方法及系统

    公开(公告)号:CN115630145A

    公开(公告)日:2023-01-20

    申请号:CN202211175448.8

    申请日:2022-09-26

    Abstract: 本发明公开了一种基于多粒度情感的对话推荐方法及系统。本方法为:1)利用对话推荐系统中的编码器对历史对话上下文语句进行语义编码;其中,所述语义编码包括历史对话上下文语义向量编码和多粒度情感感知向量编码;所述历史对话上下文语义向量编码方法为:使用词向量嵌入矩阵和位置嵌入矩阵将历史对话上下文中的每个文本单元表示为对应的文本单元语义向量,得到历史对话上下文的语义表示向量;所述多粒度情感感知向量编码方法为:对历史对话上下文中的情感词进行编码得到历史对话上下文的多粒度情感感知向量;2)对语义编码进行线性变换映射,并将映射结果与历史对话上下文进行拼接后输入对话推荐系统中的解码器,得到推荐的回复语句。

    一种并行的数据差分方法
    18.
    发明授权

    公开(公告)号:CN107016053B

    公开(公告)日:2020-05-22

    申请号:CN201710121255.7

    申请日:2017-03-02

    Abstract: 本发明提供一种并行的数据差分方法,步骤包括:(1)文件预处理:将源文件和目标文件初始化,生成源文件的后缀数组,创建补丁文件并初始化;(2)目标文件切分:根据线程数目切分目标文件,为切分后的每一部分目标文件增加一个线程进行独立处理;(3)线程处理过程:在每一线程中,初始化切分后的目标文件,创建patch文件,通过上述后缀数组比较源文件与目标文件生成差分数据,将该差分数据写入该patch文件;(4)主进程合并处理:将上述各线程的已写入差分数据的patch文件一起写入上述补丁文件。本方法采用多线程并行技术,来提高生成补丁的速度。

    一种增量式的自动机更新方法与系统

    公开(公告)号:CN107038026A

    公开(公告)日:2017-08-11

    申请号:CN201710112499.9

    申请日:2017-02-28

    CPC classification number: G06F8/658

    Abstract: 本发明涉及一种增量式的自动机更新方法与系统。该方法包括:1)配置处理机进行初始化操作,根据配置文件生成初始自动机,并将初始自动机发送到各扫描机;2)配置处理机根据新配置文件生成更新后的自动机,并对更新后的自动机和更新前的自动机进行数据差分,生成自动机增量;3)配置处理机将自动机增量发到各扫描机,各扫描机根据自动机增量和更新前的自动机生成更新后的自动机。本发明一方面可以尽量减少因为初始化自动机而漏掉的需要过滤的数据,同时还能应用一些初始化时间较长的新的效果比较好的串匹配算法;另一方面可以避免因为发送完整自动机而导致的网络拥塞问题。

    一种并行的数据差分方法
    20.
    发明公开

    公开(公告)号:CN107016053A

    公开(公告)日:2017-08-04

    申请号:CN201710121255.7

    申请日:2017-03-02

    Abstract: 本发明提供一种并行的数据差分方法,步骤包括:(1)文件预处理:将源文件和目标文件初始化,生成源文件的后缀数组,创建补丁文件并初始化;(2)目标文件切分:根据线程数目切分目标文件,为切分后的每一部分目标文件增加一个线程进行独立处理;(3)线程处理过程:在每一线程中,初始化切分后的目标文件,创建patch文件,通过上述后缀数组比较源文件与目标文件生成差分数据,将该差分数据写入该patch文件;(4)主进程合并处理:将上述各线程的已写入差分数据的patch文件一起写入上述补丁文件。本方法采用多线程并行技术,来提高生成补丁的速度。

Patent Agency Ranking